AI在线 AI在线

模型

阿里王牌Agent横扫SOTA,全栈开源力压OpenAI!博士级难题一键搞定

阿里又双叒叕上大分了! 就在昨天,阿里旗下首个深度研究Agent模型——通义DeepResearch正式开源。 在多项权威基准上,通义DeepResearch狂飙SOTA,仅依靠30B参数(激活3B)就能大杀四方!
9/18/2025 12:39:10 PM

通义DeepResearch震撼发布!性能比肩OpenAI,模型、框架、方案完全开源

通义 DeepResearch 重磅发布,让 AI 从 “能聊天” 跃迁到 “会做研究”。 在多项权威 Deep Research benchmark 上取得 SOTA,综合能力对标并跑赢海外旗舰模型,同时实现模型、框架、方案全面开源,把深度研究的生产力真正带到每个人手里。 相比于海外的旗舰模型昂贵和限制的调用,通义 DeepResearch 团队做到了完全开源!
9/18/2025 9:56:47 AM

震撼!OpenAI在2025国际大学生程序设计竞赛拿下满分夺得第一,谷歌也取得金牌成绩

在阿塞拜疆巴库举行的 2025年国际大学生程序设计竞赛(ICPC)全球总决赛中上,来自 100 多个国家的 139 支大学队伍在五小时内角逐解决 12 个算法问题,最终圣彼得堡国立大学凭借解决 11 个算法问题夺得人类冠军。 在相同约束条件下的并行 AI 赛道上,谷歌的 Gemini 2.5 Deep Think 模型解决了 10 个问题,获得了与金牌相当的成绩。 最震撼的是OpenAI 的内部推理模型获得了 12 /12的满分,超越了所有人类队伍,拿下第一值得注意的是OpenAI和谷歌的模型都解决了所有人类参赛队伍都没有解决的问题c。
9/18/2025 9:07:19 AM

给模型狂堆参数的“大力出奇迹”真的失效了吗?剑桥说:AI的真正潜力才刚开始

在人们都认为疯狂砸钱,拼命地把大语言模型的参数规模往上堆的Scaling Law已经到头了的时候。 一篇叫《递减收益的错觉:衡量LLMs中的长时程执行能力》的论文又给大家来了一剂“强心针”。 这篇报告由剑桥大学、斯图加特大学人工智能研究所、马克斯普朗克智能系统研究所以及图宾根ELLIS研究所的大神们联手发布。
9/18/2025 9:03:11 AM

终结数据荒!智源开源首个Deep Research数据合成框架InfoSeek

近日,北京智源人工智能研究院(简称「智源研究院」)发布开源数据集InfoSeek,成为首个面向深度研究(Deep Research)场景的大规模开源数据集。 在这一工作中,智源研究团队揭示了深度研究问题与层级约束满足问题(Hierarchical Constraint Satisfaction Problem)之间的数学等价关系,并由此提出了基于「扩散-回溯」过程的数据合成方法,实现了深度研究训练数据的大规模自动扩增。 利用上述方法,研究团队总计合成了包含5万条训练样本的数据集InfoSeek,并据此训练出参数规模仅3B的智能体模型。
9/17/2025 2:47:51 PM

来自MIT最强AI实验室:OpenAI天才华人研究员博士毕业了!

不到4年完成顶级AI实验室博士、顺便辅修了哲学、GPT图像生成核心5人研究团队成员、OpenAI视频生成模型Sora小组成员……刚刚,OpenAI华人研究科学家陈博远,完成了MIT博士论文答辩! 他激动地表示:我很兴奋能够在工业界继续推进世界模型的发展——现在加入了GPT图像生成和Sora视频团队。 没有什么比看到自己的研究改变领域范式更令人兴奋的事情了!
9/17/2025 2:46:05 PM

小扎豪掷143亿,却换不来AI燃料!数据之争下半场,中国冲出一匹黑马

2025年,大模型持续高速进化,科技巨头在为「燃料」——高质量数据,展开了激烈的角逐。 数据,不再是幕后的配角,而是直接决定AI成败的核心战场。 如今,全球AI圈的「数据大战」愈演愈烈。
9/17/2025 1:23:11 PM

技术大神用纯Rust从零构建了LLM,在GitHub上大火

Python凭借它“人生苦短,我用Python”的潇洒,还有背后庞大的生态库,稳坐AI界的头把交椅,从入门小哥到学术大牛,人人都爱它。 而Rust以其“内存安全、零成本抽象、无畏并发”三件法宝,正在受到大公司和开发者们的青睐。 一个用纯Rust从零开始实现完整大语言模型的项目RustGPT,在GitHub上火了,两天星标超过1.4k。
9/17/2025 9:30:40 AM

一周休4天!老黄、盖茨站台,网友炸锅:是AI福利,还是裁员信号?

每周工作三天? 刚刚,Fortune的一篇报道,把这个话题点着了,引发网友热议。 Zoom CEO袁征预测:AI聊天机器人和智能体,将带来3-4天工作制。
9/17/2025 9:03:00 AM

马斯克周末血裁xAI 500人

什么情况,帮马斯克训练大模型的人说失业就失业了? 上周四晚,xAI内部上演了一场突袭测试,还要求员工必须在第二天早上之前完成并提交。 这可不是一次简单的随堂测试——截至目前,本次xAI内部测试的淘汰率高达33%,已有超过500名员工被通知卷铺盖走人。
9/17/2025 8:50:00 AM

国产王炸!上海AI Lab开源Lumina-DiMOO,开创多模态理解与生成新范式

上海人工智能实验室,上海创新研究院,上海交大,南京大学,悉尼大学,港中大,清华,共同推出了被誉为新一代多模态生成与理解统一模型的Lumina-DiMOO。 “An Omni Diffusion Large Language Model for Multi-Modal Generation and Understanding”,翻译过来就是“面向多模态生成与理解的全方位扩散大语言模型”。 关键词:“全方位”。
9/16/2025 10:28:57 AM

GPT-5惨遭零分打脸,顶级AI全军覆没!奥特曼AI博士级能力神话破灭

奥特曼在GPT-5的发布会上曾说过一个结论。 「以后每个人的兜里都有一个博士级AI随时随地的提供建议」。 GPT-5的发布后也被全球的疯狂实测,API使用量暴增。
9/16/2025 9:13:00 AM

反转!LeCun刚转发「全球最快开源推理模型」,ETH苏黎世就直接打假

全球最快开源AI推理模型! 这个标签为K2‑Think带来轰动效果:福布斯、VentureBeat、Wired、CNBC等媒体争先报道,甚至图灵奖得主转发相关推文介绍! 然而,苏黎世联邦理工学院计算机科学系SRI实验室的研究者,却泼了一盆冷水:虽然K2-Think不错,但报告的性能被夸大了。
9/16/2025 9:12:00 AM

新世界首富:斥巨资求永生,TikTok收购案最可能买家,得OpenAI千亿订单

81岁的拉里·埃里森(Larry Ellison),好胜心极强,长期霸榜福布斯财富榜Top10,但他不满意,只想做第一。 就在上周,他终于凭借OpenAI千亿订单重大利好带飞了甲骨文股价,短暂成为了世界首富,完成了夙愿。 他创办了甲骨文(Oracle)公司,至今仍担任董事会主席,CEO职位也是做了37年才卸任。
9/16/2025 9:10:00 AM

面试不是考试,是表演!新晋OpenAI员工:重磅揭秘顶级AI岗通关密码

「所有面试,本质上都是表演。 」在历经数轮苛刻面试后,成功入职OpenAI后,Bas van Opheusden得出的终极结论。 你需要准备的不仅是完美的代码,还有一个能展现领导力的「失败故事」,一套应对「非正式聊天」的标准话术,甚至是一间光线完美的房间和两个显示器。
9/16/2025 9:06:00 AM

GPT-5编程专用版发布!独立连续编程7小时,简单任务提速10倍,VS Code就能用

OpenAI Codex编程智能体大升级:推出GPT-5-Codex特化版模型,支持独立连续编程7个小时。 还有IDE插件版,在VS Code、Cursor中都可以使用Codex了。 新模型最牛的地方在于“真·动态思考”能力。
9/16/2025 9:05:14 AM

马斯克的最快AI模型来了

最强不敢说,但最快实锤了! 刚刚,xAI发布Grok 4 Fast,生成速度高达每秒75个 token,比标准版快10倍! 从下面的动图中,我们可以直观地看出差距——当左边的Grok 4还在说“让我想一下的时候”,Grok 4 Fast已经在说:“下一个问题是什么了。
9/16/2025 9:02:00 AM

15年大佬深夜痛哭半小时!氛围编程巨坑曝光,95%程序员沦为「AI保姆」

爆火的「氛围编程」,如今让无数程序员沦为了「AI保姆」。 入行15年,Carla Rover用了Vibe Coding之后,不得不重启项目,爆哭半小时。 或许听起来太离谱,但这是真真实实发生的故事。
9/15/2025 2:49:58 PM