Meta
Meta FAIR田渊栋唯一作者发文:拆解模型「顿悟时刻」
早在 2021 年,研究人员就已经发现了深度神经网络常常表现出一种令人困惑的现象,模型在早期训练阶段对训练数据的记忆能力较弱,但随着持续训练,在某一个时间点,会突然从记忆转向强泛化。 类似于「顿悟时刻」,模型在某一刻突然理解了数据的内在规律。 这种现象被称为「grokking(延迟泛化)」。
10/5/2025 8:09:00 PM
机器之心
推理token减少46%!Meta新方法缩短思维链,告别重复推导
时令 发自 凹非寺. 量子位 | 公众号 QbitAI大模型老走重复步骤,导致思维链越来越长怎么办? Meta、Mila-Quebec AI Institute、蒙特利尔大学和普林斯顿大学联合提出元认知复用(Metacognitive Reuse) 机制。
10/5/2025 4:59:54 PM
时令
Meta内部混乱持续:FAIR自由不再,LeCun考虑辞职
Meta 内部混战又有新剧情了,这次主角是 FAIR 实验室。 据 The Information 报道,两位知情人士透露,Meta 最近对 FAIR 实验室施加了一项新政策:所有研究成果在公开发表前,必须通过额外的内部审查。 这项政策在 FAIR 内部引起了轩然大波。
10/3/2025 3:01:00 PM
机器之心
又一推理新范式:将LLM自身视作「改进操作符」,突破长思维链极限
推理训练促使大语言模型(LLM)生成长思维链(long CoT),这在某些方面有助于它们探索解决策略并进行自我检查。 虽然这种方式提高了准确性,但也增加了上下文长度、token / 计算成本和答案延迟。 因此,问题来了:当前的模型能否利用其元认知能力,在这一帕累托前沿上提供其他组合策略,例如在降低上下文长度和 / 或延迟的情况下提高准确性?
10/3/2025 2:56:00 PM
机器之心
下一代推荐系统长这样,Meta最新研究RecoWorld,从「猜你喜欢」到「听你指令」
大家每天都在和推荐系统打交道。 无论是刷短视频、逛电商、听音乐还是看新闻,背后都有一套「聪明」的算法在猜测你可能喜欢什么。 但你是不是偶尔觉得推荐内容千篇一律?
9/28/2025 6:41:00 PM
机器之心
刚刚,Meta挖走OpenAI清华校友宋飏,任超级智能实验室研究负责人
Meta 的 AI 梦之队组成了? 扎克伯格又从 OpenAI 挖走了一位华人科学家,而且这位称得上是「超级大脑」。 本周四午间传来消息,原 OpenAI 战略探索团队负责人宋飏(Yang Song)加入 Meta,他成为了新成立的 Meta 超级智能实验室(MSL)研究负责人。
9/25/2025 6:25:00 PM
机器之心
首个代码世界模型引爆AI圈,能让智能体学会「真推理」,Meta开源
大模型的架构,要彻底进化了? 昨晚开始,AI 圈都在研究一个神奇的新物种 ——Code World Model(CWM)。 Meta 重组后的 AI 部门推出的首个重磅研究,是一个世界模型,用来写代码的。
9/25/2025 11:52:00 AM
机器之心
Meta打开AI元认知,让AI不止会解题,还会总结套路了
大语言模型记性不太好。 具体来说,它们在解决需要多个步骤的复杂问题时,经常“顾尾不顾头”。 比如它刚辛辛苦苦推导出一个几何级数求和公式解了一道题,下一道题遇到类似的问题,它就把刚才的功夫忘得一干二净,又从头开始重新推导一遍。
9/25/2025 9:02:00 AM
Meta 成立超级政治行动委员会 抗击 AI 监管政策
根据 Axios 的报道,Meta 公司最近加大了在这方面的投入,成立了一个新的超级政治行动委员会(super PAC),并计划投入数千万美元以应对各州可能出台的人工智能监管政策。 这个新委员会名为 “美国技术卓越计划”(American Technology Excellence Project),旨在抵制不利于 AI 发展的政策。 Meta 此举是为了维护其在科技行业的地位,反映了其对未来人工智能技术发展的重视。
9/24/2025 9:56:53 AM
AI在线
Meta为Facebook Dating引入AI助手,约会应用行业AI竞赛升温
在数字化浪潮的席卷下,恋爱与约会的方式正经历着翻天覆地的变革。 近期,Meta 公司宣布一项重大举措,将为旗下的 Facebook Dating 引入人工智能助手,这一创新之举旨在助力用户寻觅到更契合自身需求的理想伴侣,为在线交友体验注入全新活力。 facebook-dating-scaled-1170x550.jpegMeta 推出的这款 AI助手,犹如一位贴心的恋爱顾问,通过深度剖析用户的偏好信息与行为习惯,从而给出极具针对性的匹配建议。
9/23/2025 10:23:59 AM
小菲
Meta向约会界投下AI炸弹:Facebook Dating新功能让机器人帮你找真爱
爱情市场正在经历一场由人工智能驱动的革命。 Meta刚刚宣布为Facebook Dating引入AI助手功能,这个数字红娘将彻底改变人们寻找另一半的方式。 这个聊天机器人的使命远不止简单的配对推荐,它更像是一位贴身的爱情顾问,能够精准理解用户的真实需求。
9/23/2025 9:56:38 AM
AI在线
甲骨文与 Meta 洽谈价值 200 亿美元的云计算协议
甲骨文(Oracle)目前正在与 Meta 平台进行高级别的谈判,商讨一项价值约200亿美元的多年度云计算协议。 这项协议将使甲骨文能够为 Meta 提供大量的计算能力,以支持其人工智能模型的训练和部署,从而进一步补充 Meta 现有的云基础设施投资。 图源备注:图片由AI生成,图片授权服务商Midjourney这一潜在的合作伙伴关系标志着科技行业在人工智能基础设施方面的快速变化。
9/22/2025 12:51:26 PM
AI在线
马斯克的 xAI 超算 Colossus2计划有望超越 Meta 和 Anthropic,但仍落后于 OpenAI
近日,xAI 公司宣布其正在开发一款名为 Colossus2的超级计算机,计划在2025年第三季度超越 Meta 和 Anthropic 的计算能力。 根据 Semianalysis 的报告,这一系统的推出将使 xAI 在原始计算能力上领先于这些竞争对手。 然而,报告同时指出,即使有了 Colossus2,xAI 与 OpenAI 之间的差距依然很大,后者预计仍将保持领先地位。
9/22/2025 9:00:55 AM
AI在线
Meta 悄然成立超级政治行动委员会,以保护其 AI 利益
在今年八月底,美国出现了两个支持人工智能(AI)的超级政治行动委员会(super PAC)。 其中一个比较传统,通过华丽的新闻发布会宣布,由多个大型行业参与者共同出资,计划投入超过1亿美元,支持那些支持 AI 发展的候选人。 另一边,Meta 却选择了一条不同寻常的路。
9/17/2025 5:01:49 PM
AI在线
Meta开源MobileLLM-R1模型,不到1B参数,用1/10的训练就超越了Qwen3
与其他全开源模型相比,性能提升2-5倍。 小参数模型也进入了 R1 时代,这次开源出新技术的是 Meta。 本周五,Meta AI 团队正式发布了 MobileLLM-R1。
9/13/2025 6:23:00 PM
机器之心
Meta超级智能实验室新论文陷争议!被指忽略大量前人研究
Meta超级智能实验室(MSL)又被送上争议的风口浪尖了。 不过,这次不是人事风波,而是他们的第二篇论文《Language Self-Play For Data-Free Training》被质疑忽视前人研究、缺乏创新。 图片究竟是啥论文?
9/12/2025 9:11:54 AM
AI 训练初创公司 Mercor 欲争取超 100 亿美元估值
Mercor 是一家成立仅两年的初创公司,专注于为像 OpenAI 和 Meta 这样的企业提供所需的领域专家,以帮助训练和优化其基础 AI 模型。 根据 TechCrunch 获取的一份市场文件和知情人士的说法,Mercor 目前正在与投资者讨论进行第三轮融资(Series C)。 该公司目前的目标是将估值提升至100亿美元或以上,较几个月前讨论的80亿美元估值有所上升。
9/10/2025 10:41:44 AM
AI在线
扎克伯格的豪赌初见成效?Meta新方法让LLM长上下文处理提速30倍
经历了前段时间的鸡飞狗跳,扎克伯格的投资似乎终于初见成效。 近期,Meta Superintelligence Labs 联合提出了一个名为 REFRAG 的高效解码框架,旨在解决 LLM 在处理长上下文输入时面临的效率瓶颈,尤其是在 RAG 等应用场景下。 论文标题:REFRAG:Rethinking RAG based Decoding论文地址:?
9/8/2025 2:45:00 PM
机器之心
资讯热榜
标签云
AI
人工智能
OpenAI
AIGC
模型
ChatGPT
DeepSeek
谷歌
AI绘画
大模型
机器人
数据
Midjourney
AI新词
开源
Meta
微软
智能
用户
GPT
学习
技术
智能体
马斯克
Gemini
Anthropic
英伟达
图像
AI创作
训练
LLM
论文
代码
算法
AI for Science
Agent
苹果
Claude
芯片
腾讯
Stable Diffusion
蛋白质
开发者
xAI
具身智能
生成式
神经网络
机器学习
3D
RAG
AI视频
人形机器人
研究
大语言模型
百度
生成
Sora
GPU
工具
华为
计算
字节跳动
AI设计
AGI
大型语言模型
搜索
视频生成
生成式AI
场景
DeepMind
深度学习
AI模型
特斯拉
架构
MCP
亚马逊
Transformer
编程
视觉
预测