AI在线 AI在线

模型

小扎自曝挖人秘诀:小团队我亲自带,豪掷数百亿建GW集群,大家不图天价薪酬只为“造神”

快把硅谷大厂挖成筛子的小扎,终于站出来正面回应了:大把研究人员因为天价薪资被打动来了Meta? 这个说法基本不对哦,lol~他们加入Meta,并非贪图金钱,而是为了造神——build god。 他嘴皮子一秃噜滑,全都招了,Meta超级智能实验室为顶尖AI人才提供超乎想象的强大支持:直接向小扎汇报,并且最强GPU无上限随!
7/15/2025 4:28:35 PM

放世界任务成功率82%!美的攻克机器人泛化控制难题

还在担心机器人只能机械执行、不会灵活应变? 美的AI研究院和华东师范大学联合提出ChatVLA-2——一个具有开放世界具身推理能力的视觉-语言-动作模型(VLA)模型。 它引入动态混合专家架构,并结合双阶段训练流程,不仅最大程度保留了视觉-语言模型(VLM)的多模态认知和推理能力,还能将推理结果真正转化为可执行的动作。
7/15/2025 4:28:05 PM

卡帕西预言成真!华人团队开源全AI操作系统:神经网络模拟Windows,预测下一帧屏幕图像

疯狂,太疯狂了~大神卡帕西预测的「下一代GUI系统」这就水灵灵地实现了? 玩法相当easy,当你移动鼠标、点击图标或敲键盘时,这个完全由神经网络驱动的操作系统就和咱们平时的电脑一样,能在屏幕上实时显示对应的图形界面。 就是说,AI现在能完全模拟Windows,直接预测下一帧屏幕图像。
7/15/2025 4:26:16 PM

硅谷大戏!Scale AI刚卖身就被集体拉黑,谷歌OpenAI无情断供

听说了吗? 不久前,Meta花费143亿美元收购了28岁少年Alexandr Wang创办的数据标注公司Scale AI近一半的股份。 别小看这个数据标注公司,这一笔交易让Meta在AI竞赛中直接提升了实力,瞬间成为焦点。
7/15/2025 9:47:22 AM

比Adam更有效,POET从谱不变原理出发,让LLM训练又稳又快

Zeju Qiu和Tim Z. Xiao是德国马普所博士生,Simon Buchholz和Maximilian Dax担任德国马普所博士后研究员,Bernhard Schölkopf是德国马普所所长,Weiyang Liu是香港中文大学计算机系助理教授。 随着大型语言模型(LLM)推动人工智能领域取得突破性进展,如何实现高效、稳定的超大规模模型训练,始终是该领域最富挑战性的核心议题之一。
7/15/2025 9:27:29 AM

谷歌发布首个嵌入模型:MTEB排行榜第一,超过OpenAI

今天凌晨1点,谷歌发布了首个Gemini嵌入模型刷新了MTEB榜单记录成为第一,并且价格很便宜每100万token只要0.15美元,已经开放API。 根据谷歌在多文本嵌入基准测试平台MTEB上的测试结果显示,Gemini嵌入模型平均分达到了68.37,大幅度超过了OpenAI文本嵌入模型的58.93分。 在双语挖掘、分类、聚类、指令检索、多标签分类、配对分类、重排、检索、语义文本相似性等测试中,全部都非常出色成为目前最强嵌入模型。
7/15/2025 9:07:00 AM

ICCV 2025 | 清华&腾讯混元X发现「视觉头」机制:仅5%注意力头负责多模态视觉理解

本文的主要作者来自清华大学智能视觉实验室(i-Vision Group)、腾讯混元 X 组。 本文的共同第一作者为清华大学自动化系本科生王嘉辉和博士生刘祖炎,本文的通讯作者为清华大学自动化系鲁继文教授。 多模态大模型通常是在大型预训练语言模型(LLM)的基础上扩展而来。
7/15/2025 9:00:00 AM

谷歌T5Gemma重燃架构之战!「套壳」反杀Gemma本尊,9B推理快得离谱

2023年以来,大模型的战场由decoder-only架构一统江湖。 从GPT家族到LLaMA、Gemma、Mistral,再到Claude、Command-R、Yi系列,能叫得出名字的主流LLM,几乎都是清一色的「纯解码器」(decoder-only)。 但今天,Google带着T5Gemma杀回来了——不仅重启了encoder-decoder的技术路线,还略施小技就让它原地起飞,暴打原版Gemma 2。
7/15/2025 8:58:00 AM

MIT满分学霸掏空AI初创,谷歌24亿收购黑幕曝光!数百员工血本无归

OpenAI收购Windsurf在即,突然半路杀出个谷歌!  但这波可不是收购,而是釜底抽薪:谷歌直接挖走了整个Windsurf领导层 前30位核心AI工程师! 为了这次挖角,谷歌豪掷24亿美元!
7/15/2025 8:52:00 AM

具身智能大脑+首个SaaS开源框架,智源研究院刷新10项测评基准,加速群体智能新范式

具身智能大脑 全球首个具身智能SaaS开源框架,智源研究院在具身智能领域发力了——“通用具身大脑”RoboBrain 2.0,面向真实物理环境,集感知、推理与规划于一体。 全新32B版本凭借时空认知能力的突破,在多项权威具身智能基准上全面刷新纪录。 RoboOS 2.0,作为全球首个具身智能SaaS开源框架,创新性集成MCP协议与无服务器架构,实现轻量化部署,打通智能大脑与异构本体协同通路。
7/15/2025 8:45:00 AM

首次综述「边-云协同计算」,分布式智能与模型优化的最新进展

随着物联网(IoT)设备的激增和实时应用需求的增长,传统云计算面临延迟高、带宽受限等问题,促使边缘计算的兴起。 边缘-云协同计算(Edge-Cloud Collaborative Computing, ECCC)通过整合边缘节点和云端资源,构建了一个分布式计算范式,旨在实现高效、低延迟的智能处理。 人工智能(AI),特别是深度学习和大语言模型(LLMs)的快速发展,进一步推动了ECCC在分布式智能和模型优化领域的应用。
7/14/2025 4:19:54 PM

AI有味觉了:分辨可乐和咖啡,只需“尝一尝”丨Nature

AI现在有味觉了! 近日,科学家研发出一种人工味觉系统,不仅感知酸、甜、苦、咸准确率高达90%,甚至能分辨可乐和咖啡。 相关研究已发表于《美国国家科学院院刊》(PNAS),并作为新闻报道登上了《Nature》官网。
7/14/2025 2:44:50 PM

12人团队打造AI陪伴神器,半年内斩获3000万美元投资

靠AI陪伴,一个诞生才半年的APP就获得了3000万美元(约2.15亿人民币)融资? 这个APP名叫Tolan,今年2月才正式上线,而且整个公司只有12人。 自推出以来,Tolan的下载量已超过300万次,每月收入超过100万美元,累计10万付费用户。
7/14/2025 2:44:19 PM

英伟达&MIT等推出Long-RL,长视频训练速度翻倍

请想象……一个 AI—— 它要完整看完一场几十分钟的世界杯决赛,不只是数球门数,更要跨越上百个镜头的线索、情绪、战术细节,甚至要像人一样推断:谁会赢点球大战? 足球比赛预测分析预测《星际争霸 2》这样的即时战略游戏同样需要考虑许多不同的变量,难度也非常巨大。 星际争霸 2 比赛预测分析再换个场景:同样是 AI,在一场紧张的德州扑克超级豪客赛上,面对职业牌手的每一次下注、加注、弃牌,能否像一个顶尖牌手一样,推理出对手藏在手里的那两张底牌?
7/14/2025 2:38:45 PM

用动作分块突破RL极限,伯克利引入模仿学习,超越离线/在线SOTA

如今,强化学习(Reinforcement Learning,RL)在多个领域已取得显著成果。 在实际应用中,具有长时间跨度和稀疏奖励特征的任务非常常见,而强化学习方法在这类任务中的表现仍难令人满意。 传统强化学习方法在此类任务中的探索能力常常不足,因为只有在执行一系列较长的动作序列后才能获得奖励,这导致合理时间内找到有效策略变得极其困难。
7/14/2025 1:47:29 PM

碾压DeepSeek V3!开源AI Agent专属模型,1万亿参数、工具使用能力超强

国内知名大模型平台月之暗面(MoonshotAI)开源了最新模型Kimi-K2。 Kimi-K2是一个混合专家模型,总参数1万亿,320亿参数处于激活状态,训练数据高达15.5Ttoken,有基础和微调两种模型。 除了常规的问答功能之外,Kimi-K2特意针对AIAgent进行了大幅度优化,非常擅长使用各种工具,能帮助开发者打造特定不同领域的智能体。
7/14/2025 9:23:45 AM

陶哲轩看傻:三破18年数学纪录!谷歌推出「AI爱迪生」,科研不再靠灵感?

5月中旬,谷歌在科学和计算领域投下了重磅炸弹:AlphaEvolve。 利用Gemini模型,它发现全新的算法。 比如说,仅用30天,AlphaEvolve与人类联手三度攻克一项封尘18年的数学难题!
7/14/2025 9:20:00 AM

AI失忆术!只需3个注意力头,就能让大模型忘记「狗会叫」

大模型在预训练阶段「读万卷书」,几乎囊括了全网的知识与语料。 但你有没有想过:我们能否让它「选择性遗忘」某些事实,甚至是常识性事实,比如「狗会叫」? 近日,Meta和纽约大学的研究团队发布了突破性论文《From Concepts to Components》,首次揭示了在 Transformer架构下,精准定位并控制AI认知模块的突破性方法。
7/14/2025 9:20:00 AM