模型
AI修Bug新SOTA:SWE-Bench Lite60.33%修复率,像人一样能积累经验,中科院软件所出品
AI学会像人一样修Bug了! “这个Bug我上周刚修过”“这个报错怎么又来了”“新人怎么又在同一个地方踩坑”……如果你是程序员,是否经常遇到这些令人抓狂的场景? 现有的AI修复工具就像“金鱼”,只有7秒记忆,每次遇到问题都从零开始。
8/8/2025 9:16:00 AM
强化学习+MCP=王炸?开源框架教AI在MCP中玩转工具解决任务,实测效果超越GPT!
强化学习 任意一张牌,往往就是王炸。 专注于LLM RL的科技公司OpenPipe提出全新开源强化学习框架——MCP·RL。 只需一个MCP Server的地址,agent就能自动发现工具、生成任务,通过强化学习在闭环反馈中摸索出最优调用策略。
8/8/2025 9:15:00 AM
谷歌Genie3全网玩疯!画质飞跃720P,网友造出西幻RPG游戏
全网疯玩Genie3,惊叹:这才是真正的大世界! 距离上一代Genie2,才刚刚过去7个多月,谷歌世界模型就像开了倍速进化:原本啥也看不清,突然耳聪目明一跃来到720P画质,原来只有几十秒的限时体验,现在也直接拉长到好几分钟。 世界类型也真正实现多重宇宙折叠,自然、历史、奇幻应有尽有。
8/8/2025 9:13:00 AM
字节&MAP重塑大模型推理算法优化重点,强化学习重在高效探索助力LLM提升上限
强化学习(RL)范式虽然显著提升了大语言模型(LLM)在复杂任务中的表现,但其在实际应用中仍面临传统RL框架下固有的探索难题。 一个普遍存在的现象是:在训练过程中,模型的熵值迅速下降,推理路径趋于固化,导致“利用(exploitation)”远超“探索(exploration)”,严重失衡。 这种过早收敛不仅削弱了模型的多样性生成能力,也限制了其性能上限的进一步突破。
8/8/2025 9:02:00 AM
刚刚,GPT-5内测抢先泄露!推理强到离谱,智商被曝140超越人类天才
就在明天,GPT-5总算要靴子落地了。 周五凌晨,GPT-5、GPT-5 Mini和GPT-5 Nano将同时推出。 全网用户都可以立即通过API和ChatGPT访问这三个模型。
8/7/2025 4:21:27 PM
一夜颠覆Sora神话,H200单卡5秒出片!全华人团队开源AI引爆视频圈
单块H200,5秒即生一个5秒视频。 最近,UCSD、UC伯克利、MBZUAI三大机构联手,祭出FastWan系视频生成模型。 论文地址:「稀疏蒸馏」全新的训练方案,实现了高效生成,让视频去噪速度实现70倍飙升。
8/7/2025 4:18:35 PM
GPT-5内测抢先公布:日常推理首次击败人类,编程数学科学问题能力都很强
疑似GPT-5发布的预告才刚刚发出,内测体验已抢先释出。 推理能力首次超越人类,碾压所有大模型。 这来自一位网友的实测结果,他让所有模型开启推理模式做了10道题,只有GPT-5只错了一题,比人类的正确率还高。
8/7/2025 1:57:38 PM
OpenAI 开源了!五年首发gpt-oss,本地可跑,评分逼近自家商用o4!
8月6日凌晨1点,OpenAI打破五年沉默,首次在GPT-2之后再度开源语言模型。 这款名为gpt-oss的模型,并非一款,而是两个型号:gpt-oss-120b 和 gpt-oss-20b。 两者都是Mixture-of-Experts 架构的推理型模型,专注于逻辑推理、步骤分解与工具调用。
8/6/2025 2:09:40 PM
Claude Opus 4.1火速发布!坐稳编程之王,官方:马上还有大更新
还是Claude痛快,Claude Opus 4.1前脚曝光,今天这就正式发了。 编程性能再次突破天花板,超越Claude Opus 4,拿下SOTA。 此外在Agent任务和推理方面进一步升级。
8/6/2025 1:45:19 PM
震撼,世界模型第一次超真实地模拟了真实世界:谷歌Genie 3昨晚抢了OpenAI风头
昨晚十点,谷歌 DeepMind 重磅宣布其 Genie 世界模型系列正式来到了第 3 代。 「Genie 3 是我们突破性的世界模型,可以通过单个文本提示词创建交互式、可玩的环境。 从照片般逼真的风景到奇幻的境界,可能性无穷无尽。
8/6/2025 1:44:49 PM
AI将消灭中产阶级!前谷歌高管惊人预警:未来只剩金字塔尖0.1%和底层
就在刚刚,前谷歌X高管发出震撼警告——中产阶级,将彻底被AI消灭,从此只剩金字塔顶端的0.1%和底层民众两类人。 如果此预言为真,你会属于哪一类? 根据这位名为Mo Gawdat的高管预言:「AI地狱期」将从2027年开始爆发,一连持续15年!
8/6/2025 9:31:53 AM
鼠标的未来是手环?解码肌肉信号,Meta黑科技登上Nature
手腕表面肌电图(sEMG)能以侵入式手腕设备感知和解释肌肉激活,并以人机界面的形式作为计算机输入。 这项技术被Meta认为是下一代人机交互的革命性技术。 Meta在2024年已经分享了一系列的肌电信号研究和开源的肌电信号数据集,并发表了技术白皮书,如今这项技术登上了7月24日的Nature。
8/6/2025 9:22:44 AM
谷歌深夜放出「创世引擎」Genie 3!一句话秒生宇宙,终极模拟器觉醒
全球最强「世界AI模拟器」今夜诞生! 刚刚,谷歌DeepMind祭出新一代通用世界模型——Genie 3,能模拟出史无前例的丰富交互环境。 一句话,Genie 3即可生成一个动态世界。
8/6/2025 9:17:24 AM
科研写作神器,超越Mathpix的科学公式提取工具已开源
LaTeX 公式的光学字符识别(OCR)是科学文献数字化与智能处理的基础环节,尽管该领域取得了一定进展,现有方法在真实科学文献处理时仍面临诸多挑战:其一,主流方法及公开数据集多聚焦于结构简单、符号单一的公式,难以覆盖多学科、高难度的复杂公式;其二,实际文档中广泛存在的多行公式、长公式、分段公式及页面级复杂排版等情况尚未得到充分关注与处理;其三,大多数方法依赖专用模型,通常需要针对特定任务进行专门设计,难以实现通用性和扩展性。 针对上述挑战,DocTron 团队提出了系统性解决方案。 首先,针对现有数据集覆盖面有限、结构单一的问题,构建了涵盖多学科、多结构的大规模高难度数据集 CSFormula,包含行级、段落级和页面级的复杂排版。
8/6/2025 9:13:57 AM
Discrete Tokenization:多模态大模型的关键基石,首个系统化综述发布
近年来,大语言模型(LLM)在语言理解、生成和泛化方面取得了突破性进展,并广泛应用于各种文本任务。 随着研究的深入,人们开始关注将 LLM 的能力扩展至非文本模态,例如图像、音频、视频、图结构、推荐系统等。 这为多模态统一建模带来了机遇,也提出了一个核心挑战:如何将各种模态信号转化为 LLM 可处理的离散表示。
8/6/2025 9:10:10 AM
面向6G环境感知通信!西电开源3Dx3D无线电地图数据集与生成式基准框架
面向6G的新一代通信系统,正在逐步从「连接万物」向「感知环境、理解空间」的智能化范式演进。 未来网络架构将不仅局限于地面基站和终端,而是向空天地一体化方向拓展,支持包括低轨卫星、高空无人机、智能车辆、楼宇通信等在内的高密度异构节点协同运行。 在这种多尺度、多层级的复杂传播环境中,传统依赖导频(pilot)的信道估计方法将面临开销高、泛化差、适应慢等瓶颈。
8/5/2025 2:59:50 PM
陶哲轩经费被断供,在线发帖自证数学有用
菲尔兹奖得主、UCLA数学教授陶哲轩(Terence Tao)这几天很无助,更多的还有是愤怒。 这位数学家中的天才,最近接连遭遇重创——先是他就职的UCLA有3.39亿美元的科研经费被冻结,陶的个人研究以及UCLA应用数学研究所IPAM失去资金支持,后续研究几近无枝可依。 紧接着,当陶哲轩在社交媒体上表达对这一举措的不理解后,招来了更猛烈的舆论争议——许多网友开始质疑陶的一些学术成果并不像宣传中所说的那么重要,“因为医学成像领域(以及其他领域,如地震学、天文学和统计学)的研究人员已经在不同时间通过实证发现了非常相似的算法”。
8/5/2025 2:54:39 PM
资讯热榜
标签云
AI
人工智能
OpenAI
AIGC
模型
ChatGPT
DeepSeek
谷歌
AI绘画
大模型
机器人
数据
Midjourney
开源
AI新词
Meta
微软
智能
用户
GPT
学习
技术
智能体
马斯克
Gemini
Anthropic
图像
英伟达
AI创作
训练
LLM
论文
代码
算法
AI for Science
Agent
苹果
Claude
芯片
腾讯
Stable Diffusion
蛋白质
开发者
xAI
生成式
神经网络
机器学习
3D
RAG
具身智能
AI视频
人形机器人
研究
大语言模型
百度
生成
GPU
Sora
工具
华为
计算
字节跳动
AI设计
大型语言模型
AGI
搜索
视频生成
场景
生成式AI
深度学习
DeepMind
架构
AI模型
亚马逊
特斯拉
Transformer
编程
视觉
MCP
预测