模型
阿里王牌Agent横扫SOTA,全栈开源力压OpenAI!博士级难题一键搞定
阿里又双叒叕上大分了! 就在昨天,阿里旗下首个深度研究Agent模型——通义DeepResearch正式开源。 在多项权威基准上,通义DeepResearch狂飙SOTA,仅依靠30B参数(激活3B)就能大杀四方!
9/18/2025 12:39:10 PM
通义DeepResearch震撼发布!性能比肩OpenAI,模型、框架、方案完全开源
通义 DeepResearch 重磅发布,让 AI 从 “能聊天” 跃迁到 “会做研究”。 在多项权威 Deep Research benchmark 上取得 SOTA,综合能力对标并跑赢海外旗舰模型,同时实现模型、框架、方案全面开源,把深度研究的生产力真正带到每个人手里。 相比于海外的旗舰模型昂贵和限制的调用,通义 DeepResearch 团队做到了完全开源!
9/18/2025 9:56:47 AM
震撼!OpenAI在2025国际大学生程序设计竞赛拿下满分夺得第一,谷歌也取得金牌成绩
在阿塞拜疆巴库举行的 2025年国际大学生程序设计竞赛(ICPC)全球总决赛中上,来自 100 多个国家的 139 支大学队伍在五小时内角逐解决 12 个算法问题,最终圣彼得堡国立大学凭借解决 11 个算法问题夺得人类冠军。 在相同约束条件下的并行 AI 赛道上,谷歌的 Gemini 2.5 Deep Think 模型解决了 10 个问题,获得了与金牌相当的成绩。 最震撼的是OpenAI 的内部推理模型获得了 12 /12的满分,超越了所有人类队伍,拿下第一值得注意的是OpenAI和谷歌的模型都解决了所有人类参赛队伍都没有解决的问题c。
9/18/2025 9:07:19 AM
给模型狂堆参数的“大力出奇迹”真的失效了吗?剑桥说:AI的真正潜力才刚开始
在人们都认为疯狂砸钱,拼命地把大语言模型的参数规模往上堆的Scaling Law已经到头了的时候。 一篇叫《递减收益的错觉:衡量LLMs中的长时程执行能力》的论文又给大家来了一剂“强心针”。 这篇报告由剑桥大学、斯图加特大学人工智能研究所、马克斯普朗克智能系统研究所以及图宾根ELLIS研究所的大神们联手发布。
9/18/2025 9:03:11 AM
终结数据荒!智源开源首个Deep Research数据合成框架InfoSeek
近日,北京智源人工智能研究院(简称「智源研究院」)发布开源数据集InfoSeek,成为首个面向深度研究(Deep Research)场景的大规模开源数据集。 在这一工作中,智源研究团队揭示了深度研究问题与层级约束满足问题(Hierarchical Constraint Satisfaction Problem)之间的数学等价关系,并由此提出了基于「扩散-回溯」过程的数据合成方法,实现了深度研究训练数据的大规模自动扩增。 利用上述方法,研究团队总计合成了包含5万条训练样本的数据集InfoSeek,并据此训练出参数规模仅3B的智能体模型。
9/17/2025 2:47:51 PM
来自MIT最强AI实验室:OpenAI天才华人研究员博士毕业了!
不到4年完成顶级AI实验室博士、顺便辅修了哲学、GPT图像生成核心5人研究团队成员、OpenAI视频生成模型Sora小组成员……刚刚,OpenAI华人研究科学家陈博远,完成了MIT博士论文答辩! 他激动地表示:我很兴奋能够在工业界继续推进世界模型的发展——现在加入了GPT图像生成和Sora视频团队。 没有什么比看到自己的研究改变领域范式更令人兴奋的事情了!
9/17/2025 2:46:05 PM
小扎豪掷143亿,却换不来AI燃料!数据之争下半场,中国冲出一匹黑马
2025年,大模型持续高速进化,科技巨头在为「燃料」——高质量数据,展开了激烈的角逐。 数据,不再是幕后的配角,而是直接决定AI成败的核心战场。 如今,全球AI圈的「数据大战」愈演愈烈。
9/17/2025 1:23:11 PM
技术大神用纯Rust从零构建了LLM,在GitHub上大火
Python凭借它“人生苦短,我用Python”的潇洒,还有背后庞大的生态库,稳坐AI界的头把交椅,从入门小哥到学术大牛,人人都爱它。 而Rust以其“内存安全、零成本抽象、无畏并发”三件法宝,正在受到大公司和开发者们的青睐。 一个用纯Rust从零开始实现完整大语言模型的项目RustGPT,在GitHub上火了,两天星标超过1.4k。
9/17/2025 9:30:40 AM
一周休4天!老黄、盖茨站台,网友炸锅:是AI福利,还是裁员信号?
每周工作三天? 刚刚,Fortune的一篇报道,把这个话题点着了,引发网友热议。 Zoom CEO袁征预测:AI聊天机器人和智能体,将带来3-4天工作制。
9/17/2025 9:03:00 AM
马斯克周末血裁xAI 500人
什么情况,帮马斯克训练大模型的人说失业就失业了? 上周四晚,xAI内部上演了一场突袭测试,还要求员工必须在第二天早上之前完成并提交。 这可不是一次简单的随堂测试——截至目前,本次xAI内部测试的淘汰率高达33%,已有超过500名员工被通知卷铺盖走人。
9/17/2025 8:50:00 AM
国产王炸!上海AI Lab开源Lumina-DiMOO,开创多模态理解与生成新范式
上海人工智能实验室,上海创新研究院,上海交大,南京大学,悉尼大学,港中大,清华,共同推出了被誉为新一代多模态生成与理解统一模型的Lumina-DiMOO。 “An Omni Diffusion Large Language Model for Multi-Modal Generation and Understanding”,翻译过来就是“面向多模态生成与理解的全方位扩散大语言模型”。 关键词:“全方位”。
9/16/2025 10:28:57 AM
GPT-5惨遭零分打脸,顶级AI全军覆没!奥特曼AI博士级能力神话破灭
奥特曼在GPT-5的发布会上曾说过一个结论。 「以后每个人的兜里都有一个博士级AI随时随地的提供建议」。 GPT-5的发布后也被全球的疯狂实测,API使用量暴增。
9/16/2025 9:13:00 AM
反转!LeCun刚转发「全球最快开源推理模型」,ETH苏黎世就直接打假
全球最快开源AI推理模型! 这个标签为K2‑Think带来轰动效果:福布斯、VentureBeat、Wired、CNBC等媒体争先报道,甚至图灵奖得主转发相关推文介绍! 然而,苏黎世联邦理工学院计算机科学系SRI实验室的研究者,却泼了一盆冷水:虽然K2-Think不错,但报告的性能被夸大了。
9/16/2025 9:12:00 AM
新世界首富:斥巨资求永生,TikTok收购案最可能买家,得OpenAI千亿订单
81岁的拉里·埃里森(Larry Ellison),好胜心极强,长期霸榜福布斯财富榜Top10,但他不满意,只想做第一。 就在上周,他终于凭借OpenAI千亿订单重大利好带飞了甲骨文股价,短暂成为了世界首富,完成了夙愿。 他创办了甲骨文(Oracle)公司,至今仍担任董事会主席,CEO职位也是做了37年才卸任。
9/16/2025 9:10:00 AM
面试不是考试,是表演!新晋OpenAI员工:重磅揭秘顶级AI岗通关密码
「所有面试,本质上都是表演。 」在历经数轮苛刻面试后,成功入职OpenAI后,Bas van Opheusden得出的终极结论。 你需要准备的不仅是完美的代码,还有一个能展现领导力的「失败故事」,一套应对「非正式聊天」的标准话术,甚至是一间光线完美的房间和两个显示器。
9/16/2025 9:06:00 AM
GPT-5编程专用版发布!独立连续编程7小时,简单任务提速10倍,VS Code就能用
OpenAI Codex编程智能体大升级:推出GPT-5-Codex特化版模型,支持独立连续编程7个小时。 还有IDE插件版,在VS Code、Cursor中都可以使用Codex了。 新模型最牛的地方在于“真·动态思考”能力。
9/16/2025 9:05:14 AM
马斯克的最快AI模型来了
最强不敢说,但最快实锤了! 刚刚,xAI发布Grok 4 Fast,生成速度高达每秒75个 token,比标准版快10倍! 从下面的动图中,我们可以直观地看出差距——当左边的Grok 4还在说“让我想一下的时候”,Grok 4 Fast已经在说:“下一个问题是什么了。
9/16/2025 9:02:00 AM
15年大佬深夜痛哭半小时!氛围编程巨坑曝光,95%程序员沦为「AI保姆」
爆火的「氛围编程」,如今让无数程序员沦为了「AI保姆」。 入行15年,Carla Rover用了Vibe Coding之后,不得不重启项目,爆哭半小时。 或许听起来太离谱,但这是真真实实发生的故事。
9/15/2025 2:49:58 PM
资讯热榜
标签云
AI
人工智能
OpenAI
AIGC
模型
ChatGPT
DeepSeek
谷歌
AI绘画
大模型
机器人
数据
Midjourney
开源
AI新词
Meta
微软
智能
用户
GPT
学习
技术
智能体
马斯克
Gemini
Anthropic
图像
英伟达
AI创作
训练
LLM
论文
代码
算法
AI for Science
Agent
苹果
Claude
芯片
腾讯
Stable Diffusion
蛋白质
开发者
xAI
生成式
神经网络
机器学习
3D
RAG
具身智能
AI视频
人形机器人
研究
大语言模型
百度
生成
GPU
Sora
工具
华为
计算
字节跳动
AI设计
大型语言模型
AGI
搜索
视频生成
场景
生成式AI
深度学习
DeepMind
架构
AI模型
亚马逊
特斯拉
Transformer
编程
视觉
MCP
预测