资讯列表
Perplexity CEO 称赞 Kimi K2 模型,或将进行后续训练
近日,美国人工智能初创公司 Perplexity 的首席执行官阿拉温德(Aravind Srinivas)在社交媒体上发布了一则重要信息。 他表示,该公司对 “月之暗面” 推出的 Kimi K2模型表现出了高度的赞赏,并表示未来有可能会基于 K2进行进一步的训练。 这一消息引发了广泛关注。
7/14/2025 10:12:06 AM
AI在线
强化学习也遇到了“天花板”?Andrej Karpathy构建了一个新算法
RL还行不行? 表面上很风光,但真实情况怎样呢? 大神Karpathy提出了一种超越当前RL范式、更接近人类学习机制的新思路强化学习的强大与局限Karpathy首先肯定了强化学习的巨大价值。
7/14/2025 9:26:45 AM
碾压DeepSeek V3!开源AI Agent专属模型,1万亿参数、工具使用能力超强
国内知名大模型平台月之暗面(MoonshotAI)开源了最新模型Kimi-K2。 Kimi-K2是一个混合专家模型,总参数1万亿,320亿参数处于激活状态,训练数据高达15.5Ttoken,有基础和微调两种模型。 除了常规的问答功能之外,Kimi-K2特意针对AIAgent进行了大幅度优化,非常擅长使用各种工具,能帮助开发者打造特定不同领域的智能体。
7/14/2025 9:23:45 AM
AI失忆术!只需3个注意力头,就能让大模型忘记「狗会叫」
大模型在预训练阶段「读万卷书」,几乎囊括了全网的知识与语料。 但你有没有想过:我们能否让它「选择性遗忘」某些事实,甚至是常识性事实,比如「狗会叫」? 近日,Meta和纽约大学的研究团队发布了突破性论文《From Concepts to Components》,首次揭示了在 Transformer架构下,精准定位并控制AI认知模块的突破性方法。
7/14/2025 9:20:00 AM
陶哲轩看傻:三破18年数学纪录!谷歌推出「AI爱迪生」,科研不再靠灵感?
5月中旬,谷歌在科学和计算领域投下了重磅炸弹:AlphaEvolve。 利用Gemini模型,它发现全新的算法。 比如说,仅用30天,AlphaEvolve与人类联手三度攻克一项封尘18年的数学难题!
7/14/2025 9:20:00 AM
这个AI精准模拟人类行为大脑状态,上Nature了
首个能跨领域精准预测人类认知的基础模型诞生! 不仅可以完全预判你的行为,还能知道你是如何思考、以及为什么思考。 这是一项最新登上Nature的突破性研究,来自德国的研究团队只用了5天训练时间就开发出人类认知的通用计算模型——Centaur。
7/14/2025 9:18:26 AM
马斯克20亿送Grok 4上火星!20万GPU造宇宙大脑,一句话生成3D黑洞
1条指令生成整段动画,2分钟内部署一款游戏!Grok 4发布仅仅12小时后,AI开发者Mckay Wrigley体验之后,直呼「强得疯狂」! 在一次请求中,Grok 4 Heavy就生成了完整动画,从人群行走到鸟瞰镜头无缝切换,展现惊人理解与执行力,而其他模型完全无法匹敌。 提示词:Create an animation of a crowd of people walking to form 「Hello world, I am Grok」 as camera changes to birds-eye.还能表现得像阅兵一样,整齐划一地行进:这款3D视频,全网爆火,浏览量破350万。
7/14/2025 9:16:00 AM
VLA 推理新范式!一致性模型 CEED-VLA 实现四倍加速!
本文第一作者为香港科技大学(广州)机器人系一年级博士生宋文轩,主要研究方向为VLA模型,共同第一作者是来自香港科技大学广州的研究助理陈家毅,项目leader为浙江大学和西湖大学联合培养博士生丁鹏翔,他们也是具身智能领域开源项目OpenHelix以及LLaVA-VLA的研究团队。 通讯作者为香港科技大学广州的李昊昂教授,他是今年的CVPR2025 Best Paper Candidate的获得者。 近年来,视觉 - 语言 - 动作(Vision-Language-Action, VLA)模型因其出色的多模态理解与泛化能力,已成为机器人领域的重要研究方向。
7/14/2025 9:14:00 AM
奥特曼气到快失眠?OpenAI前大佬力挺:小扎砸钱挖墙脚,1亿美元很合理
最近,Meta不断从竞争对手那里挖走顶尖AI人才,开出的签约薪酬包更是令人咋舌! 比如,庞若鸣跳槽到Meta,总薪酬包高达惊人的2亿美元。 为了挖走OpenAI的人才,小扎支付了1亿美元签下了Jiahui Yu。
7/14/2025 9:14:00 AM
「流匹配」成ICML 2025超热门主题!网友:都说了学物理的不准转计算机
众所周知,第 42 届国际机器学习大会(ICML)将于 7 月 13 日至 19 日在加拿大温哥华盛大举行。 在生成式 AI 领域,最新的前沿热点已经转向探索更高质量,更稳定,更简洁,更通用的模型形态。 流匹配(Flow Matching)技术正完美的踩中了每一个热点要素。
7/14/2025 9:12:00 AM
SpaceX 投资20亿美元助力 xAI,加速追赶 OpenAI
SpaceX 近日宣布将向其子公司 xAI 投资20亿美元,这笔资金是其50亿美元股权融资计划的一部分。 此举表明,马斯克旗下的 xAI 正在加速发展,以追赶其竞争对手 OpenAI。 随着 xAI 与社交媒体平台 X 的合并完成,合并后公司的估值已高达1130亿美元。
7/14/2025 9:11:52 AM
AI在线
“反向收购”再现:谷歌24亿拿下 Windsurf 部分技术与核心团队
据 The Verge 报道,OpenAI 以30亿美元收购病毒式 AI 编码初创公司 Windsurf 的交易已于上周五告吹。 令人震惊的是,谷歌 DeepMind 迅速出手,成功吸纳了 Windsurf 首席执行官 Varun Mohan、联合创始人 Douglas Chen 以及该公司的一些顶尖研究人员。 谷歌发言人克里斯·帕帕斯(Chris Pappas)在给 TechCrunch 的声明中证实了这一消息,表示:“我们很高兴欢迎 Windsurf 团队的一些顶尖 AI 编码人才加入 Google DeepMind,以推进我们在代理编码方面的工作。
7/14/2025 9:11:51 AM
AI在线
ChatGPT助力揭露500万美元遗产欺诈,AI成法律维权新武器!
在一起长达十年的遗产纠纷案中,ChatGPT 成为了受害者 Rejeana Leatherwood 的得力助手,成功帮助她揭露了潜在的500万美元遗产欺诈。 故事的开端可以追溯到2015年,Rejeana 的父亲在墨西哥去世,随后,一位名叫 Irma 的女子声称自己是他的合法妻子,试图独占父亲的遗产。 在父亲去世后,Rejeana 和她的姐妹在毫不知情的情况下,被 Irma 迅速占有了父亲的遗产。
7/14/2025 9:11:46 AM
AI在线
Meta 收购语音 AI 初创公司 Play AI
Meta 证实已收购 Play AI,一家专注于利用人工智能生成人类声音的初创公司。 此举将进一步强化 Meta 在 AI 领域的布局,尤其是在其日益增长的 AI 角色、Meta AI、可穿戴设备和音频内容创作等项目上的能力。 据彭博社报道,Meta 发言人证实了此次收购。
7/14/2025 9:11:46 AM
AI在线
重磅发布!月之暗面推出万亿参数开源大模型Kimi K2
中国人工智能企业月之暗面近日重磅推出其最新的开源大语言模型 ——Kimi K2。 这一模型采用了混合专家架构,总参数量达到了惊人的1万亿,其中激活参数为320亿,表现出色,成为业内关注的焦点。 Kimi K2不仅在参数规模上令人惊叹,其智能体能力也十分强大。
7/14/2025 9:11:45 AM
AI在线
AI编程「反直觉」调研引300万围观!开发者坚信提速20%,实测反慢19%
随着大模型的崛起,AI编程领域正在发生翻天覆地的变化。 各种编程大模型、编程工具涌现,通过自动补全代码、自动 debug 等实用的功能为开发者的日常工作提供极大便利,并在一定程度上提升了开发效率。 不过,问题来了,AI 编程工具带来的影响真是如此吗?
7/14/2025 9:10:00 AM
从OpenAI叛逃谷歌!这位27岁小哥,成了奥特曼最忌惮的「秘密武器」
27岁的Logan Kilpatrick,堪称谷歌与开发者之间的「超级联络员」。 2024年,Kilpatrick从OpenAI跳槽谷歌,摇身一变成为谷歌AI赛道上的「秘密武器」。 这位年轻的技术天才,不仅掌管谷歌AI Studio,还以超强的个人魅力和开发者洞察力,成了谷歌AI的流量密码。
7/14/2025 9:03:00 AM
Lora微调实操演示(下):五次训练详解(免费GPU)
五月底写过一篇 Lora 微调的概念铺垫文章,这篇来结合阿里云的一个开源项目和免费试用 GPU 来做个完整的训练过程演示。 Lora微调实操教程(上):人话版概念详解(附案例)注:本篇演示的脚本部分在参考 aliyun_acp_learning 开源项目基础上有部分删减和调整。 后文相关配置和训练过程中的实际耗时也会进行标注说明。
7/14/2025 9:00:13 AM
韦东东