模型
GPT‑5深夜发布:模型之战结束,Agent之战开始!
嘿,大家好! 这里是一个专注于前沿AI和智能体的频道~昨晚,Sam炒作了一个月的GPT-5正式发布了! 单纯卷参数和跑分的时代过去了,真正开箱即用的原生Agent时代,开始到来了。
8/8/2025 2:28:12 PM
猕猴桃
GPT-5:没有AGI,失望和天花板,最具竞争力的可能是定价
GPT-5 发布速记:刚看完GPT-5发布会,我对GPT-5整体感觉都已经在标题里了。 整个发布会一上来就出现多个错误图片,瞬间刷爆整个网络。 而Sam Altman 一直在发推说GPT-5有多好,比如代码能力远超vibecoding的范围。
8/8/2025 9:44:54 AM
GPT-5,AI的「登月时刻」来了!奥特曼现场发布,三位一体博士级智能体
刚刚,万众期待的GPT-5正式发布! 发布会仅仅20分钟后,我们断定,这就是「AI的登月时刻」。 GPT-5不仅仅是GPT-4的版本迭代,GPT-5是一场真正的智能范式跃迁!
8/8/2025 9:29:29 AM
AI修Bug新SOTA:SWE-Bench Lite60.33%修复率,像人一样能积累经验,中科院软件所出品
AI学会像人一样修Bug了! “这个Bug我上周刚修过”“这个报错怎么又来了”“新人怎么又在同一个地方踩坑”……如果你是程序员,是否经常遇到这些令人抓狂的场景? 现有的AI修复工具就像“金鱼”,只有7秒记忆,每次遇到问题都从零开始。
8/8/2025 9:16:00 AM
强化学习+MCP=王炸?开源框架教AI在MCP中玩转工具解决任务,实测效果超越GPT!
强化学习 任意一张牌,往往就是王炸。 专注于LLM RL的科技公司OpenPipe提出全新开源强化学习框架——MCP·RL。 只需一个MCP Server的地址,agent就能自动发现工具、生成任务,通过强化学习在闭环反馈中摸索出最优调用策略。
8/8/2025 9:15:00 AM
谷歌Genie3全网玩疯!画质飞跃720P,网友造出西幻RPG游戏
全网疯玩Genie3,惊叹:这才是真正的大世界! 距离上一代Genie2,才刚刚过去7个多月,谷歌世界模型就像开了倍速进化:原本啥也看不清,突然耳聪目明一跃来到720P画质,原来只有几十秒的限时体验,现在也直接拉长到好几分钟。 世界类型也真正实现多重宇宙折叠,自然、历史、奇幻应有尽有。
8/8/2025 9:13:00 AM
字节&MAP重塑大模型推理算法优化重点,强化学习重在高效探索助力LLM提升上限
强化学习(RL)范式虽然显著提升了大语言模型(LLM)在复杂任务中的表现,但其在实际应用中仍面临传统RL框架下固有的探索难题。 一个普遍存在的现象是:在训练过程中,模型的熵值迅速下降,推理路径趋于固化,导致“利用(exploitation)”远超“探索(exploration)”,严重失衡。 这种过早收敛不仅削弱了模型的多样性生成能力,也限制了其性能上限的进一步突破。
8/8/2025 9:02:00 AM
刚刚,GPT-5内测抢先泄露!推理强到离谱,智商被曝140超越人类天才
就在明天,GPT-5总算要靴子落地了。 周五凌晨,GPT-5、GPT-5 Mini和GPT-5 Nano将同时推出。 全网用户都可以立即通过API和ChatGPT访问这三个模型。
8/7/2025 4:21:27 PM
一夜颠覆Sora神话,H200单卡5秒出片!全华人团队开源AI引爆视频圈
单块H200,5秒即生一个5秒视频。 最近,UCSD、UC伯克利、MBZUAI三大机构联手,祭出FastWan系视频生成模型。 论文地址:「稀疏蒸馏」全新的训练方案,实现了高效生成,让视频去噪速度实现70倍飙升。
8/7/2025 4:18:35 PM
GPT-5内测抢先公布:日常推理首次击败人类,编程数学科学问题能力都很强
疑似GPT-5发布的预告才刚刚发出,内测体验已抢先释出。 推理能力首次超越人类,碾压所有大模型。 这来自一位网友的实测结果,他让所有模型开启推理模式做了10道题,只有GPT-5只错了一题,比人类的正确率还高。
8/7/2025 1:57:38 PM
OpenAI 开源了!五年首发gpt-oss,本地可跑,评分逼近自家商用o4!
8月6日凌晨1点,OpenAI打破五年沉默,首次在GPT-2之后再度开源语言模型。 这款名为gpt-oss的模型,并非一款,而是两个型号:gpt-oss-120b 和 gpt-oss-20b。 两者都是Mixture-of-Experts 架构的推理型模型,专注于逻辑推理、步骤分解与工具调用。
8/6/2025 2:09:40 PM
Claude Opus 4.1火速发布!坐稳编程之王,官方:马上还有大更新
还是Claude痛快,Claude Opus 4.1前脚曝光,今天这就正式发了。 编程性能再次突破天花板,超越Claude Opus 4,拿下SOTA。 此外在Agent任务和推理方面进一步升级。
8/6/2025 1:45:19 PM
震撼,世界模型第一次超真实地模拟了真实世界:谷歌Genie 3昨晚抢了OpenAI风头
昨晚十点,谷歌 DeepMind 重磅宣布其 Genie 世界模型系列正式来到了第 3 代。 「Genie 3 是我们突破性的世界模型,可以通过单个文本提示词创建交互式、可玩的环境。 从照片般逼真的风景到奇幻的境界,可能性无穷无尽。
8/6/2025 1:44:49 PM
AI将消灭中产阶级!前谷歌高管惊人预警:未来只剩金字塔尖0.1%和底层
就在刚刚,前谷歌X高管发出震撼警告——中产阶级,将彻底被AI消灭,从此只剩金字塔顶端的0.1%和底层民众两类人。 如果此预言为真,你会属于哪一类? 根据这位名为Mo Gawdat的高管预言:「AI地狱期」将从2027年开始爆发,一连持续15年!
8/6/2025 9:31:53 AM
鼠标的未来是手环?解码肌肉信号,Meta黑科技登上Nature
手腕表面肌电图(sEMG)能以侵入式手腕设备感知和解释肌肉激活,并以人机界面的形式作为计算机输入。 这项技术被Meta认为是下一代人机交互的革命性技术。 Meta在2024年已经分享了一系列的肌电信号研究和开源的肌电信号数据集,并发表了技术白皮书,如今这项技术登上了7月24日的Nature。
8/6/2025 9:22:44 AM
谷歌深夜放出「创世引擎」Genie 3!一句话秒生宇宙,终极模拟器觉醒
全球最强「世界AI模拟器」今夜诞生! 刚刚,谷歌DeepMind祭出新一代通用世界模型——Genie 3,能模拟出史无前例的丰富交互环境。 一句话,Genie 3即可生成一个动态世界。
8/6/2025 9:17:24 AM
科研写作神器,超越Mathpix的科学公式提取工具已开源
LaTeX 公式的光学字符识别(OCR)是科学文献数字化与智能处理的基础环节,尽管该领域取得了一定进展,现有方法在真实科学文献处理时仍面临诸多挑战:其一,主流方法及公开数据集多聚焦于结构简单、符号单一的公式,难以覆盖多学科、高难度的复杂公式;其二,实际文档中广泛存在的多行公式、长公式、分段公式及页面级复杂排版等情况尚未得到充分关注与处理;其三,大多数方法依赖专用模型,通常需要针对特定任务进行专门设计,难以实现通用性和扩展性。 针对上述挑战,DocTron 团队提出了系统性解决方案。 首先,针对现有数据集覆盖面有限、结构单一的问题,构建了涵盖多学科、多结构的大规模高难度数据集 CSFormula,包含行级、段落级和页面级的复杂排版。
8/6/2025 9:13:57 AM
资讯热榜
标签云
AI
人工智能
OpenAI
AIGC
模型
ChatGPT
DeepSeek
谷歌
AI绘画
数据
机器人
大模型
Midjourney
开源
Meta
智能
用户
微软
GPT
学习
AI新词
技术
智能体
马斯克
Gemini
图像
AI创作
英伟达
Anthropic
训练
论文
代码
LLM
算法
Stable Diffusion
芯片
腾讯
苹果
AI for Science
Claude
蛋白质
Agent
开发者
生成式
神经网络
xAI
机器学习
3D
研究
人形机器人
生成
AI视频
百度
工具
计算
RAG
大语言模型
GPU
华为
Sora
具身智能
AI设计
字节跳动
搜索
大型语言模型
AGI
场景
深度学习
视频生成
预测
视觉
架构
伟达
Transformer
DeepMind
编程
神器推荐
AI模型
亚马逊
特斯拉