AI在线 AI在线

模型

老黄玩Nano Banana上瘾,拉着哈萨比斯大夸特夸,“不会有人不喜欢吧?”

英伟达CEO黄仁勋也被Nano Banana迷住了。 在伦敦,他面对一众记者,公开宣称自己是Nano Banana的忠实粉丝:怎么会有人不喜欢Nano Banana? 老黄还透露,他前一天也当着DeepMind CEO哈萨比斯的面对Nano Banana大夸特夸。
9/18/2025 12:47:05 PM

ChatGPT负责人深度复盘,爆4o复活内幕!过快下线是失误,将迭代模型人格

「还我GPT-4o! 」GPT-5发布后不到一周,在用户强大的反对声浪中,OpenAI不得不火速宣布GPT-4o等前代模型回归。 至此,大家才意识到:用户对4o等上一代模型,已经产生了深深的「依恋感」。
9/18/2025 12:44:33 PM

GPT-5攻入数学圈,证明定理快过博士生?网友热议AI新角色

9月初,一篇挂在arXiv的论文在学界扔下一颗炸弹——GPT-5被写进了数学研究成果里。 研究者在文中公开写道:GPT-5在他们的实验中完成了一项此前从未解决的数学工作,并将结果直接纳入正式稿件。 这是大型语言模型首次以「定理贡献者」的身份出现在数学研究论文中。
9/18/2025 12:41:22 PM

阿里王牌Agent横扫SOTA,全栈开源力压OpenAI!博士级难题一键搞定

阿里又双叒叕上大分了! 就在昨天,阿里旗下首个深度研究Agent模型——通义DeepResearch正式开源。 在多项权威基准上,通义DeepResearch狂飙SOTA,仅依靠30B参数(激活3B)就能大杀四方!
9/18/2025 12:39:10 PM

通义DeepResearch震撼发布!性能比肩OpenAI,模型、框架、方案完全开源

通义 DeepResearch 重磅发布,让 AI 从 “能聊天” 跃迁到 “会做研究”。 在多项权威 Deep Research benchmark 上取得 SOTA,综合能力对标并跑赢海外旗舰模型,同时实现模型、框架、方案全面开源,把深度研究的生产力真正带到每个人手里。 相比于海外的旗舰模型昂贵和限制的调用,通义 DeepResearch 团队做到了完全开源!
9/18/2025 9:56:47 AM

震撼!OpenAI在2025国际大学生程序设计竞赛拿下满分夺得第一,谷歌也取得金牌成绩

在阿塞拜疆巴库举行的 2025年国际大学生程序设计竞赛(ICPC)全球总决赛中上,来自 100 多个国家的 139 支大学队伍在五小时内角逐解决 12 个算法问题,最终圣彼得堡国立大学凭借解决 11 个算法问题夺得人类冠军。 在相同约束条件下的并行 AI 赛道上,谷歌的 Gemini 2.5 Deep Think 模型解决了 10 个问题,获得了与金牌相当的成绩。 最震撼的是OpenAI 的内部推理模型获得了 12 /12的满分,超越了所有人类队伍,拿下第一值得注意的是OpenAI和谷歌的模型都解决了所有人类参赛队伍都没有解决的问题c。
9/18/2025 9:07:19 AM

给模型狂堆参数的“大力出奇迹”真的失效了吗?剑桥说:AI的真正潜力才刚开始

在人们都认为疯狂砸钱,拼命地把大语言模型的参数规模往上堆的Scaling Law已经到头了的时候。 一篇叫《递减收益的错觉:衡量LLMs中的长时程执行能力》的论文又给大家来了一剂“强心针”。 这篇报告由剑桥大学、斯图加特大学人工智能研究所、马克斯普朗克智能系统研究所以及图宾根ELLIS研究所的大神们联手发布。
9/18/2025 9:03:11 AM

终结数据荒!智源开源首个Deep Research数据合成框架InfoSeek

近日,北京智源人工智能研究院(简称「智源研究院」)发布开源数据集InfoSeek,成为首个面向深度研究(Deep Research)场景的大规模开源数据集。 在这一工作中,智源研究团队揭示了深度研究问题与层级约束满足问题(Hierarchical Constraint Satisfaction Problem)之间的数学等价关系,并由此提出了基于「扩散-回溯」过程的数据合成方法,实现了深度研究训练数据的大规模自动扩增。 利用上述方法,研究团队总计合成了包含5万条训练样本的数据集InfoSeek,并据此训练出参数规模仅3B的智能体模型。
9/17/2025 2:47:51 PM

来自MIT最强AI实验室:OpenAI天才华人研究员博士毕业了!

不到4年完成顶级AI实验室博士、顺便辅修了哲学、GPT图像生成核心5人研究团队成员、OpenAI视频生成模型Sora小组成员……刚刚,OpenAI华人研究科学家陈博远,完成了MIT博士论文答辩! 他激动地表示:我很兴奋能够在工业界继续推进世界模型的发展——现在加入了GPT图像生成和Sora视频团队。 没有什么比看到自己的研究改变领域范式更令人兴奋的事情了!
9/17/2025 2:46:05 PM

小扎豪掷143亿,却换不来AI燃料!数据之争下半场,中国冲出一匹黑马

2025年,大模型持续高速进化,科技巨头在为「燃料」——高质量数据,展开了激烈的角逐。 数据,不再是幕后的配角,而是直接决定AI成败的核心战场。 如今,全球AI圈的「数据大战」愈演愈烈。
9/17/2025 1:23:11 PM

技术大神用纯Rust从零构建了LLM,在GitHub上大火

Python凭借它“人生苦短,我用Python”的潇洒,还有背后庞大的生态库,稳坐AI界的头把交椅,从入门小哥到学术大牛,人人都爱它。 而Rust以其“内存安全、零成本抽象、无畏并发”三件法宝,正在受到大公司和开发者们的青睐。 一个用纯Rust从零开始实现完整大语言模型的项目RustGPT,在GitHub上火了,两天星标超过1.4k。
9/17/2025 9:30:40 AM

一周休4天!老黄、盖茨站台,网友炸锅:是AI福利,还是裁员信号?

每周工作三天? 刚刚,Fortune的一篇报道,把这个话题点着了,引发网友热议。 Zoom CEO袁征预测:AI聊天机器人和智能体,将带来3-4天工作制。
9/17/2025 9:03:00 AM

马斯克周末血裁xAI 500人

什么情况,帮马斯克训练大模型的人说失业就失业了? 上周四晚,xAI内部上演了一场突袭测试,还要求员工必须在第二天早上之前完成并提交。 这可不是一次简单的随堂测试——截至目前,本次xAI内部测试的淘汰率高达33%,已有超过500名员工被通知卷铺盖走人。
9/17/2025 8:50:00 AM

国产王炸!上海AI Lab开源Lumina-DiMOO,开创多模态理解与生成新范式

上海人工智能实验室,上海创新研究院,上海交大,南京大学,悉尼大学,港中大,清华,共同推出了被誉为新一代多模态生成与理解统一模型的Lumina-DiMOO。 “An Omni Diffusion Large Language Model for Multi-Modal Generation and Understanding”,翻译过来就是“面向多模态生成与理解的全方位扩散大语言模型”。 关键词:“全方位”。
9/16/2025 10:28:57 AM

GPT-5惨遭零分打脸,顶级AI全军覆没!奥特曼AI博士级能力神话破灭

奥特曼在GPT-5的发布会上曾说过一个结论。 「以后每个人的兜里都有一个博士级AI随时随地的提供建议」。 GPT-5的发布后也被全球的疯狂实测,API使用量暴增。
9/16/2025 9:13:00 AM

反转!LeCun刚转发「全球最快开源推理模型」,ETH苏黎世就直接打假

全球最快开源AI推理模型! 这个标签为K2‑Think带来轰动效果:福布斯、VentureBeat、Wired、CNBC等媒体争先报道,甚至图灵奖得主转发相关推文介绍! 然而,苏黎世联邦理工学院计算机科学系SRI实验室的研究者,却泼了一盆冷水:虽然K2-Think不错,但报告的性能被夸大了。
9/16/2025 9:12:00 AM

新世界首富:斥巨资求永生,TikTok收购案最可能买家,得OpenAI千亿订单

81岁的拉里·埃里森(Larry Ellison),好胜心极强,长期霸榜福布斯财富榜Top10,但他不满意,只想做第一。 就在上周,他终于凭借OpenAI千亿订单重大利好带飞了甲骨文股价,短暂成为了世界首富,完成了夙愿。 他创办了甲骨文(Oracle)公司,至今仍担任董事会主席,CEO职位也是做了37年才卸任。
9/16/2025 9:10:00 AM

面试不是考试,是表演!新晋OpenAI员工:重磅揭秘顶级AI岗通关密码

「所有面试,本质上都是表演。 」在历经数轮苛刻面试后,成功入职OpenAI后,Bas van Opheusden得出的终极结论。 你需要准备的不仅是完美的代码,还有一个能展现领导力的「失败故事」,一套应对「非正式聊天」的标准话术,甚至是一间光线完美的房间和两个显示器。
9/16/2025 9:06:00 AM