AI在线 AI在线

模型

GPT‑5深夜发布:模型之战结束,Agent之战开始!

嘿,大家好! 这里是一个专注于前沿AI和智能体的频道~昨晚,Sam炒作了一个月的GPT-5正式发布了! 单纯卷参数和跑分的时代过去了,真正开箱即用的原生Agent时代,开始到来了。
8/8/2025 2:28:12 PM
猕猴桃

GPT-5:没有AGI,失望和天花板,最具竞争力的可能是定价

GPT-5 发布速记:刚看完GPT-5发布会,我对GPT-5整体感觉都已经在标题里了。 整个发布会一上来就出现多个错误图片,瞬间刷爆整个网络。 而Sam Altman 一直在发推说GPT-5有多好,比如代码能力远超vibecoding的范围。
8/8/2025 9:44:54 AM

GPT-5,AI的「登月时刻」来了!奥特曼现场发布,三位一体博士级智能体

刚刚,万众期待的GPT-5正式发布! 发布会仅仅20分钟后,我们断定,这就是「AI的登月时刻」。 GPT-5不仅仅是GPT-4的版本迭代,GPT-5是一场真正的智能范式跃迁!
8/8/2025 9:29:29 AM

AI修Bug新SOTA:SWE-Bench Lite60.33%修复率,像人一样能积累经验,中科院软件所出品

AI学会像人一样修Bug了! “这个Bug我上周刚修过”“这个报错怎么又来了”“新人怎么又在同一个地方踩坑”……如果你是程序员,是否经常遇到这些令人抓狂的场景? 现有的AI修复工具就像“金鱼”,只有7秒记忆,每次遇到问题都从零开始。
8/8/2025 9:16:00 AM

强化学习+MCP=王炸?开源框架教AI在MCP中玩转工具解决任务,实测效果超越GPT!

强化学习 任意一张牌,往往就是王炸。 专注于LLM RL的科技公司OpenPipe提出全新开源强化学习框架——MCP·RL。 只需一个MCP Server的地址,agent就能自动发现工具、生成任务,通过强化学习在闭环反馈中摸索出最优调用策略。
8/8/2025 9:15:00 AM

谷歌Genie3全网玩疯!画质飞跃720P,网友造出西幻RPG游戏

全网疯玩Genie3,惊叹:这才是真正的大世界! 距离上一代Genie2,才刚刚过去7个多月,谷歌世界模型就像开了倍速进化:原本啥也看不清,突然耳聪目明一跃来到720P画质,原来只有几十秒的限时体验,现在也直接拉长到好几分钟。 世界类型也真正实现多重宇宙折叠,自然、历史、奇幻应有尽有。
8/8/2025 9:13:00 AM

字节&MAP重塑大模型推理算法优化重点,强化学习重在高效探索助力LLM提升上限

强化学习(RL)范式虽然显著提升了大语言模型(LLM)在复杂任务中的表现,但其在实际应用中仍面临传统RL框架下固有的探索难题。 一个普遍存在的现象是:在训练过程中,模型的熵值迅速下降,推理路径趋于固化,导致“利用(exploitation)”远超“探索(exploration)”,严重失衡。 这种过早收敛不仅削弱了模型的多样性生成能力,也限制了其性能上限的进一步突破。
8/8/2025 9:02:00 AM

刚刚,GPT-5内测抢先泄露!推理强到离谱,智商被曝140超越人类天才

就在明天,GPT-5总算要靴子落地了。 周五凌晨,GPT-5、GPT-5 Mini和GPT-5 Nano将同时推出。 全网用户都可以立即通过API和ChatGPT访问这三个模型。
8/7/2025 4:21:27 PM

一夜颠覆Sora神话,H200单卡5秒出片!全华人团队开源AI引爆视频圈

单块H200,5秒即生一个5秒视频。 最近,UCSD、UC伯克利、MBZUAI三大机构联手,祭出FastWan系视频生成模型。 论文地址:「稀疏蒸馏」全新的训练方案,实现了高效生成,让视频去噪速度实现70倍飙升。
8/7/2025 4:18:35 PM

GPT-5内测抢先公布:日常推理首次击败人类,编程数学科学问题能力都很强

疑似GPT-5发布的预告才刚刚发出,内测体验已抢先释出。 推理能力首次超越人类,碾压所有大模型。 这来自一位网友的实测结果,他让所有模型开启推理模式做了10道题,只有GPT-5只错了一题,比人类的正确率还高。
8/7/2025 1:57:38 PM

OpenAI 开源了!五年首发gpt-oss,本地可跑,评分逼近自家商用o4!

8月6日凌晨1点,OpenAI打破五年沉默,首次在GPT-2之后再度开源语言模型。 这款名为gpt-oss的模型,并非一款,而是两个型号:gpt-oss-120b 和 gpt-oss-20b。 两者都是Mixture-of-Experts 架构的推理型模型,专注于逻辑推理、步骤分解与工具调用。
8/6/2025 2:09:40 PM

Claude Opus 4.1火速发布!坐稳编程之王,官方:马上还有大更新

还是Claude痛快,Claude Opus 4.1前脚曝光,今天这就正式发了。 编程性能再次突破天花板,超越Claude Opus 4,拿下SOTA。 此外在Agent任务和推理方面进一步升级。
8/6/2025 1:45:19 PM

震撼,世界模型第一次超真实地模拟了真实世界:谷歌Genie 3昨晚抢了OpenAI风头

昨晚十点,谷歌 DeepMind 重磅宣布其 Genie 世界模型系列正式来到了第 3 代。 「Genie 3 是我们突破性的世界模型,可以通过单个文本提示词创建交互式、可玩的环境。 从照片般逼真的风景到奇幻的境界,可能性无穷无尽。
8/6/2025 1:44:49 PM

AI将消灭中产阶级!前谷歌高管惊人预警:未来只剩金字塔尖0.1%和底层

就在刚刚,前谷歌X高管发出震撼警告——中产阶级,将彻底被AI消灭,从此只剩金字塔顶端的0.1%和底层民众两类人。 如果此预言为真,你会属于哪一类? 根据这位名为Mo Gawdat的高管预言:「AI地狱期」将从2027年开始爆发,一连持续15年!
8/6/2025 9:31:53 AM

鼠标的未来是手环?解码肌肉信号,Meta黑科技登上Nature

手腕表面肌电图(sEMG)能以侵入式手腕设备感知和解释肌肉激活,并以人机界面的形式作为计算机输入。 这项技术被Meta认为是下一代人机交互的革命性技术。 Meta在2024年已经分享了一系列的肌电信号研究和开源的肌电信号数据集,并发表了技术白皮书,如今这项技术登上了7月24日的Nature。
8/6/2025 9:22:44 AM

英伟达回应了!没有后门、没有终止开关、没有监控软件

就在刚刚,英伟达针对性地的回应了! 没有后门。 没有终止开关。
8/6/2025 9:19:31 AM

谷歌深夜放出「创世引擎」Genie 3!一句话秒生宇宙,终极模拟器觉醒

全球最强「世界AI模拟器」今夜诞生! 刚刚,谷歌DeepMind祭出新一代通用世界模型——Genie 3,能模拟出史无前例的丰富交互环境。 一句话,Genie 3即可生成一个动态世界。
8/6/2025 9:17:24 AM

科研写作神器,超越Mathpix的科学公式提取工具已开源

LaTeX 公式的光学字符识别(OCR)是科学文献数字化与智能处理的基础环节,尽管该领域取得了一定进展,现有方法在真实科学文献处理时仍面临诸多挑战:其一,主流方法及公开数据集多聚焦于结构简单、符号单一的公式,难以覆盖多学科、高难度的复杂公式;其二,实际文档中广泛存在的多行公式、长公式、分段公式及页面级复杂排版等情况尚未得到充分关注与处理;其三,大多数方法依赖专用模型,通常需要针对特定任务进行专门设计,难以实现通用性和扩展性。 针对上述挑战,DocTron 团队提出了系统性解决方案。 首先,针对现有数据集覆盖面有限、结构单一的问题,构建了涵盖多学科、多结构的大规模高难度数据集 CSFormula,包含行级、段落级和页面级的复杂排版。
8/6/2025 9:13:57 AM