AI
文生图进入R1时代:港中文MMLab发布T2I-R1,让AI绘画“先推理再下笔”
“先推理、再作答”,语言大模型的Thinking模式,现在已经被拓展到了图片领域。 近日,港中文MMLab团队发布了第一个基于强化学习的推理增强文生图模型:T2I-R1。 大家都知道,OpenAI o1和DeepSeek-R1这类的大语言模型(LLMs),已经在解数学题和写代码这些需要“动脑筋”的事情上面展现出了较高的水平。
5/13/2025 1:54:41 PM
量子位
全球闲置算力训个模型,性能媲美R1,老黄天塌了!Karpathy曾投资它
一夜之间,老黄天塌了(doge)。 全球首个分布式RL训练模型INTELLECT-2发布,它仅通过整合全球闲置或分散的计算资源,就完成了模型的强化学习训练,训练成本大大降低。 其模型性能与DeepSeek-R1媲美!
5/13/2025 1:51:20 PM
AI无限生成《我的世界》,玩家动动键盘鼠标自主控制!国产交互式世界模型来了
用AI无限扩展《我的世界》,动动鼠标、键盘即可搞定! 一直前进、砍掉树木,后面别有洞天的世界,都是由用户与环境交互、AI实时生成的。 也就是说,在砍掉树木之前,树后面的内容还是不存在的。
5/13/2025 1:50:00 PM
OpenAI 高管:AI 未来可自主生成知识,商业与科研迎来革命
Pachocki强调,AI通过无监督预训练和强化学习(RLHF)构建“世界模型”,并将其转化为实用助手。他还预测,到本世纪末,AI将在自主研究领域取得重大进展,甚至可能在今年内实现近乎自主的软件开发。
5/13/2025 1:46:00 PM
故渊
Fox展示精简策略,借助AI工具提升广告价值
在最近的广告发布会上,Fox 媒体公司以其精简的业务结构引起了业界的关注。 与许多其他公司,如 NBCUniversal,正在努力削减因收视率下降而带来的线性资产不同,Fox 则明确表示,自己并不需要依赖传统的优质节目库存来吸引广告商。 根据 Fox 广告销售、市场营销与品牌合作总裁杰夫・柯林斯(Jeff Collins)的说法,Fox 已经主动剔除了那些不必要的内容,因此能够为广告商提供更高效的选择。
5/13/2025 12:00:52 PM
AI在线
全球首个设计Agent Lovart席卷全球,颠覆性功能与幕后团队揭秘
人工智能设计领域迎来了一场风暴。 一款名为Lovart的AI设计Agent横空出世,凭借其从文本提示到专业视觉设计的端到端能力,迅速席卷全球社交媒体,被誉为“全球首个设计Agent”。 从专业论坛到创意社区,Lovart的全链路设计能力和无缝创意体验引发了全球设计师的热烈讨论,重新定义了AI与设计的边界。
5/13/2025 12:00:52 PM
AI在线
AI开发更轻松!MCPHub简化MCP服务器接入,支持OpenAI、LangChain等
为进一步简化 AI 服务中的 Model Context Protocol(MCP)服务器集成流程,MCPHub 正式发布。 作为一款可嵌入式解决方案,MCPHub 为开发者提供了统一的配置、管理与连接方式,兼容多种主流 AI 框架,包括 OpenAI Agents、LangChain 和 Autogen。 在当前多模型、多框架并行演进的背景下,MCPHub 致力于打破服务集成复杂、部署门槛高的问题,通过统一接口与灵活配置,显著降低接入难度、提升效率。
5/13/2025 11:00:52 AM
AI在线
OpenAI 扩展 ChatGPT AI 深度研究连接器,集成微软 OneDrive 和 SharePoint
OpenAI 昨日(5 月 12 日)更新 ChatGPT 日志文件,宣布面向 ChatGPT Plus、Pro 和 Team 用户(EEA、瑞士和英国除外),扩展 ChatGPT AI 聊天机器人深度研究连接器,集成微软 OneDrive 和 SharePoint。
5/13/2025 10:25:31 AM
故渊
C++之父:重点没在下一个版本!而是如何写好现代版的C++
采访 | Tim Anderson整理 | 云昭出品 | 51CTO技术栈(微信号:blog51cto)上周,5月6-7日,于慕尼黑举行的Qt World Summit大会上,C 之父Bjarne Stroustrup在其《21世纪的C 》主题演讲前特别接受了外媒DevClass的专访,访谈中涉及到很多,比如:如何写出现代风格的C ? 为什么替代这门语言很难? AI潜在的风险,以及为何拥有多套略有差异的编译器反而是一件好事?
5/13/2025 10:17:40 AM
云昭
AI药物研发神器DiffSMol上线!3秒生成候选药物,成功率暴涨5倍!
5月12日,俄亥俄州立大学研究团队推出DiffSMol,一款生成式人工智能模型,专为生成候选药物的3D结构设计()。 DiffSMol通过分析已知配体(与蛋白质靶点结合的分子)的形状,仅需数秒即可生成具有优异结合特性的新型3D分子,成功率高达61.4%,远超此前研究仅12%的水平。 AIbase观察到,这一突破性进展有望重塑长达十年的药物研发流程,显著提升效率与成本效益。
5/13/2025 10:01:03 AM
AI在线
字节跳动发布统一图像定制框架DreamO:集成换装、换脸与风格迁移
字节跳动在Hugging Face平台正式开源了全新图像定制框架DreamO,这一框架集成了图像换装、换脸、造型调整、风格迁移以及多主体组合等多种功能,为AI图像编辑领域带来了全新的技术突破。 AIbase编辑部整理了最新信息,深入解析DreamO的核心亮点及其对行业的潜在影响。 框架亮点:一站式图像定制解决方案DreamO被设计为一个统一的图像定制框架,支持多样化的编辑任务,并通过灵活的参数设置实现无缝整合。
5/13/2025 10:01:02 AM
AI在线
全球首款设计Agent Lovart内测!一句话搞定Logo、视频、品牌全套
5月12日,Lovart AI正式宣布推出全球首款设计Agent,定位为文生图领域最具创新性的产品形态。 作为一款集成图像、视频和音乐模型的AI设计工具,Lovart通过自然语言指令实现从任务拆解到最终输出的全链路自动化设计,彻底颠覆传统设计工作流。 AIbase观察到,Lovart的Beta测试已在全球引发热烈反响,吸引了设计师、营销团队和初创企业的广泛关注。
5/13/2025 10:01:02 AM
AI在线
OpenAI 与软银的百亿 AI “星际之门”计划进展缓慢,融资难题悬而未决
在人工智能领域,OpenAI 与软银共同推出的星际之门(Stargate)项目一度引起了广泛关注。 该项目计划投资高达1000亿美元,目标是建立全球领先的人工智能基础设施,并希望在未来将投资额提升至5000亿美元。 然而,随着时间的推移,融资进展的缓慢和市场环境的变化使得这一宏伟计划面临挑战。
5/13/2025 10:01:02 AM
AI在线
OpenAI推出深度研究报告一键导出PDF功能
人工智能领域的领军企业OpenAI宣布,为其ChatGPT深度研究(Deep Research)工具新增了一项重要功能——一键将深度研究报告导出为PDF。 此功能不仅提升了研究报告的实用性,还进一步推动了AI在企业场景中的落地应用。 功能亮点:完整保留格式,专业输出OpenAI的深度研究工具能够通过多步骤网络搜索和信息整合,生成包含引用、表格和图片的详尽报告。
5/13/2025 10:01:02 AM
AI在线
Lovart震撼发布:全球首个设计Agent,一键从创意到成品
人工智能设计领域迎来里程碑式突破!一款名为Lovart的AI设计Agent于近日正式亮相,被誉为“全球首个设计Agent”。 这一产品以其从文本提示到专业视觉设计的端到端能力,引发了业内广泛关注。 产品亮点:一键从创意到成品Lovart的核心在于其全链路设计能力,能够将用户的模糊创意或简单文本描述转化为像素级精度的专业设计作品。
5/13/2025 10:01:02 AM
AI在线
LLM 学习笔记:最好的学习方法是带着问题去寻找答案
作者:huaxing知其然,然后知其所以然。 本文主要是对学习赛博活佛Andrej Karpathy 7个小时教学视频的总结和拓展阅读笔记,推荐去看原视频,很精彩,链接在文末。 从最常用的聊天应用过程分析开始,引入对话过程原理浅析,再到LLM训练过程;再结合当前主流的应用形式,在得知最新用法的同时,加深对LLM的理解;再谈谈AI的最新重大进展MCP;以及作为JAVAer,在Java领域有哪些前沿能力去整合LLM。
5/13/2025 9:42:46 AM
腾讯技术工程
200M参数吊打商业巨头!浙大-哈佛开源ICEdit,用1%资源实现图像编辑自由!一句指令生成海报级修图方案
浙江大学联合哈佛大学提出一种高效的基于指令的图像编辑框架ICEdit,与以往的方法相比,ICEdit仅需1%的可训练参数(200M)和0.1% 的训练数据(50k),就展现出强大的泛化能力,能够处理各种编辑任务。 相比 Gemini、GPT4o 等商业模型,我们更加开源,成本更低,速度更快(处理一幅图像大约需要 9 秒),性能强大。 使用ComfyUI-nunchaku,仅需 4 GB VRAM GPU 就足以尝试我们的模型!
5/13/2025 9:12:18 AM
AIGC Studio
Sam Altman最新万字专访:2025,Agent智能体应用大年
今天凌晨3点,全球著名投资机构红杉资本(Sequoia Capital)发布了,Sam Altman参加其举办的“2025 AI Ascent”大会。 OpenAI联合创始人兼首席执行官SamA ltaman作为特邀嘉宾,接受了32分钟的专访和现场提问。 Altaman回顾了OpenAI的创业历程、产品规划/发展、对AI行业的看法等。
5/13/2025 9:05:35 AM
资讯热榜
Microsoft Releases 700 Real AI Cases to Explore New Intelligent Work Models
微软发布 700 个真实 AI 案例,探索智能化工作新模式
Li Hang, head of ByteDance AI Lab, resigns; Seed team enters adjustment period
Former DeepSeek executive secretly starts new AI Agent project, already backed by top VC
OpenAI Upgrades ChatGPT Search Functionality to Provide More Precise and Smarter Responses
腾讯LeVo来袭!媲美Suno 4.5的AI唱歌模型,支持零样本音色克隆
Microsoft AI Unveils Code Researcher: 58% Crash Resolution Rate Stuns the Industry!
ChatGPT Sparks Conspiracy Theory Controversy, Accountant Nearly Loses Sanity After Believing It!
标签云
人工智能
AI
OpenAI
AIGC
模型
ChatGPT
DeepSeek
AI绘画
谷歌
数据
机器人
大模型
Midjourney
用户
智能
开源
微软
GPT
Meta
学习
图像
技术
AI创作
Gemini
论文
马斯克
Stable Diffusion
算法
代码
英伟达
Anthropic
芯片
开发者
生成式
蛋白质
腾讯
训练
智能体
神经网络
研究
3D
生成
苹果
计算
机器学习
Sora
Claude
AI设计
AI for Science
GPU
AI视频
人形机器人
搜索
华为
百度
场景
大语言模型
LLM
xAI
预测
伟达
深度学习
字节跳动
Transformer
Agent
工具
模态
视觉
神器推荐
具身智能
文本
RAG
LLaMA
算力
Copilot
大型语言模型
驾驶
API
应用
架构