AI在线 AI在线

资讯列表

DeepMind夺得IMO官方「唯一」金牌,却成为OpenAI大型社死现场

刚刚,谷歌 DeepMind 宣布,其新一代 Gemini 进阶版模型在 IMO 竞赛中正式达到金牌得主水平,成功解决了六道超高难度试题中的五道,拿下 35 分(满分 42 分),成为首个获得奥赛组委会官方认定为金牌的AI系统。 更重要的是,该系统首次证明人工智能无需依赖专业编程语言,仅通过自然语言理解即可攻克复杂数学难题。 谷歌 DeepMind 首席执行官哈萨比斯在社交媒体平台 X 上强调:这是官方结果!
7/22/2025 1:22:00 PM
机器之心

行业新突破:行为基础模型可实现高效的人形机器人全身控制

人形机器人作为用于复杂运动控制、人机交互和通用物理智能的多功能平台,正受到前所未有的关注。 然而,由于其复杂的动力学、欠驱动和多样化的任务需求,实现高效的人形机器人全身控制 (Whole-Body Control,WBC) 仍然是一项根本性的挑战。 虽然基于强化学习等方法的控制器在特定任务中展现出优越的性能,但它们往往只具有有限的泛化性能,在面向新场景时需要进行复杂且成本高昂的再训练。
7/22/2025 1:18:00 PM
机器之心

聊聊AI Coding的现状与未来|沙龙招募

Vibe Coding的概念让更多人能够以更低的门槛,将想法变为现实。 但我们更想关注——AI Coding到底多大程度提升了生产力? 从插件到AI原生IDE,从补全代码到自主编程,AI Coding已经以不同方式与形态嵌入到了工作流中。
7/22/2025 1:07:05 PM
林樾

Qwen3小升级即SOTA,开源大模型王座快变中国内部赛了

开源大模型正在进入中国时间。 Kimi K2风头正盛,然而不到一周,Qwen3就迎来最新升级,235B总参数量仅占Kimi K2 1T规模的四分之一。 基准测试性能上却超越了Kimi K2。
7/22/2025 1:05:00 PM
闻乐

Cursor 新定价方案引发用户强烈不满

最近,Cursor 的开发商 nysphere 推出了每月 200 美元的高端订阅计划,但这不仅仅是新增了昂贵套餐,还在悄悄削弱了现有的 Pro 计划。 曾经承诺的 500 次请求保障,如今被标榜为“无限请求”却伴随着随意的限流规则。 据 Cursor 用户反馈,新推出的 “Ultra” 计划提供了比 20 美元的 Pro 方案高 20 倍的 AI 模型使用额度,但 Pro 用户的体验却大打折扣,甚至被描述为“完全无法生成内容”。
7/22/2025 12:58:26 PM
前端小智

MiniMax M1全球技术闭门会实录:RL、混合架构、长上下文的下一步

MiniMax面向全球最新举办M1技术探讨会。 作为中国团队,现场,来自十几个国家地区的观众从世界各地加入,与M1团队和全球学者进行了技术交流。 M1团队与来自香港科技大学、滑铁卢大学、Anthropic、Hugging Face、SGLang、vLLM、RL领域的研究者及业界嘉宾在模型架构创新、RL训练、长上下文应用等领域探讨了当前的前沿话题。
7/22/2025 12:44:18 PM
西风

机器人高层指挥低层做,“坐标系转移接口”一次演示实现泛化学习 | ICML2025

如何让AI像人一样,仅凭少量演示,就能稳健适应复杂多变的真实场景? 美国东北大学和波士顿动力RAI提出了HEP(Hierarchical Equivariant Policy via Frame Transfer)框架,首创“坐标系转移接口”,让机器人学习更高效、泛化更灵活。 总的来说,HEP框架具有以下亮点:极简高效的分层结构高层负责全局目标设定,低层自主在本地坐标下优化动作,显著提升操作的灵活性与效率;空间对称性自然泛化模型自动适应目标平移、旋转等变化,极大降低泛化对数据量的依赖;创新型体素编码器三维视觉信息高效表达,兼顾细节还原与计算速度。
7/22/2025 12:42:53 PM

零一万物发布万智企业大模型平台2.0及“万仔”Agent定制解决方案

今日,零一万物CEO、创新工场董事长李开复在媒体沟通会上宣布,万智企业大模型平台2.0正式升级发布,并同步推出创新成果——超级员工企业Agent定制解决方案“万仔”。 这一方案旨在通过高效、可靠的AI能力,与行业客户共同探索企业价值新边界。 “万仔”具备五大核心功能:**超级能干**,快速理解用户意图,整合内外部知识与工具,跨部门高效交付任务;**超级靠谱**,通过先进技术降低模型“幻觉”,确保结果准确;**自主晋升**,从错误中学习,持续优化性能;**超级装备**,基于万智平台,连接企业服务,实现系统互通;**可快速上岗**,部署便捷,快速投入使用。
7/22/2025 12:12:37 PM
AI在线

TRAE推出SOLO模式,业内首个「Context Engineer」来了

7 月 21 日,TRAE 宣布全新推出SOLO模式。 该功能是业内首个基于「Context Engineering」理念的AI开发助手,能够结合多模态上下文进行需求感知、任务分解、工具调度与执行反馈,并完整交付软件结果,旨在提供从任务理解到自动执行完整闭环的工程化实践体验。 SOLO 模式提供了一种高度自动化的开发方式,可自动规划并执行从需求理解、代码生成、测试,到成果预览的全流程。
7/22/2025 11:56:44 AM
十三

OpenAI 亲自下场!全能ChatGPT Agent发布,Manus们危险了

昨天,OpenAI在凌晨正式推出了全新的“ChatGPT Agent”,这一产品整合了此前的Operator和DeepResearch两大系统。 图片Operator善于网页互动,能像人一样浏览网站、点击按钮、填写表单,但它读文章太慢,需要慢慢滚动。 DeepResearch擅长信息挖掘,能从全网抓取材料、整合分析并生成研究报告,但它基本不会和网页互动。
7/22/2025 11:56:26 AM

微软发布《与AI共事》:被AI影响的不是程序员,而是销售和媒体人!

微软研究院发布了一份名为《与AI共事》的报告,发现知识工作、沟通和销售类岗位,正处在被人工智能影响的最前沿。 图片地址: Copilot用户对话进行了分析,从用户意图和AI操作两个维度,评估AI在实际工作场景中的应用情况。 这些对话被映射到O*NET数据库,这是美国对所有职业的标准分类工具,涵盖每项工作的核心活动与职责。
7/22/2025 11:54:47 AM

35分斩金!Gemini 成首个 IMO 认证 AI 金牌 ,OpenAI 未获许可强蹭 IMO 热度

Gemini Deep Think正式跨入国际数学奥林匹克(IMO)金牌行列。 谷歌DeepMind宣布,其搭载Deep Think模式的先进版本Gemini,在2025年IMO中斩获35分,成功达到了金牌标准。 这一成绩来自对6道题中的5道完美解答,评分标准、比赛时间、参赛流程与人类选手完全一致。
7/22/2025 11:53:05 AM

AI原生创业公司的典范。他们15个人,做了5款产品,目前自负盈亏

我强烈建议所有的老板和团队管理者都看看这期内容,看完之后,让我真正理解了什么才是 AI 原生公司。 AI 创业公司 Every 的 CEO Dan Shipper 完整分享了自己团队使用 AI 的经验。 Every 是一家专注于 AI 领域的创业公司,目前团队只有 15 人,但业务覆盖非常广。
7/22/2025 11:45:12 AM
阿颖

应用综述 | 今年WAIC怎么玩?三大AI环线,一天玩遍城市未来感!

在人工智能加速走出实验室、走下展台的当下,AI的真正价值,不仅是技术突破的前沿话题,也在于它能否真正渗透到城市的肌理里。 在WAIC 2025,观展不只是走走看看,而是一场沉浸式的“环游记”。 今天就让“我”,也就是你的智能导览小伙伴——Hi!
7/22/2025 11:45:00 AM
新闻助手

中国AI新王者?Kimi K2正在突破Claude的编程壁垒

一个明显的趋势是,中国的开源AI模型正在悄悄改写全球AI竞争格局。 继DeepSeek引发硅谷震动后,Moonshot AI刚刚发布的Kimi K2,再次证明了这个判断。 这次真的不一样了。
7/22/2025 11:38:38 AM
阿丸笔记

Agentic Enterprise:把 AI 从神坛拉回用户办公桌

大家好,我是肆〇柒,AI 的蓬勃发展正以前所未有的速度渗透到人类生活的各方面。 而在商业领域,AI 的影响力更是不容小觑,尤其在企业决策这一关键环节。 企业各职能、任务和运营都离不开高效的决策,而 AI 正展现出助力企业提升决策效能的巨大潜力。
7/22/2025 11:24:32 AM
肆零柒

展览综述|AI不止会聊天,还会陪你逛展!HI! WAIC带你揭秘四大展馆暗藏科技彩蛋!

这个夏天,来WAIC 2025解锁一场AI科技的沉浸式盛宴。 四大主题展馆,3000余件前沿展品、800多家企业同台竞技,7万平方米展区让你一次看尽全球AI产业的全景演练。 想在这么大的展览里逛得有收获、拍得尽兴,可不仅靠“随便走走”。
7/22/2025 11:24:00 AM
新闻助手

AI奥赛金牌战:OpenAI与谷歌DeepMind上演“气氛”对决,谁是真赢家?

近日,人工智能领域两大巨头OpenAI和谷歌DeepMind相继宣布,其AI模型在2025年国际数学奥林匹克竞赛(IMO)中荣获金牌。 这一成就不仅彰显了人工智能系统惊人的发展速度,也意外点燃了两家公司之间一场关乎“领先地位”认知的激烈竞争。 IMO作为全球历史最悠久、最具挑战性的高中数学竞赛之一,其结果被视为衡量人工智能推理能力的重要基准。
7/22/2025 11:03:07 AM
AI在线