资讯列表

分类

标签

碾压DeepSeek V3！开源AI Agent专属模型，1万亿参数、工具使用能力超强

国内知名大模型平台月之暗面（MoonshotAI）开源了最新模型Kimi-K2。 Kimi-K2是一个混合专家模型，总参数1万亿，320亿参数处于激活状态，训练数据高达15.5Ttoken，有基础和微调两种模型。除了常规的问答功能之外，Kimi-K2特意针对AIAgent进行了大幅度优化，非常擅长使用各种工具，能帮助开发者打造特定不同领域的智能体。

7/14/2025 9:23:45 AM

陶哲轩看傻：三破18年数学纪录！谷歌推出「AI爱迪生」，科研不再靠灵感？

5月中旬，谷歌在科学和计算领域投下了重磅炸弹：AlphaEvolve。利用Gemini模型，它发现全新的算法。比如说，仅用30天，AlphaEvolve与人类联手三度攻克一项封尘18年的数学难题！

7/14/2025 9:20:00 AM

AI失忆术！只需3个注意力头，就能让大模型忘记「狗会叫」

大模型在预训练阶段「读万卷书」，几乎囊括了全网的知识与语料。但你有没有想过：我们能否让它「选择性遗忘」某些事实，甚至是常识性事实，比如「狗会叫」？近日，Meta和纽约大学的研究团队发布了突破性论文《From Concepts to Components》，首次揭示了在 Transformer架构下，精准定位并控制AI认知模块的突破性方法。

7/14/2025 9:20:00 AM

这个AI精准模拟人类行为大脑状态，上Nature了

首个能跨领域精准预测人类认知的基础模型诞生！不仅可以完全预判你的行为，还能知道你是如何思考、以及为什么思考。这是一项最新登上Nature的突破性研究，来自德国的研究团队只用了5天训练时间就开发出人类认知的通用计算模型——Centaur。

7/14/2025 9:18:26 AM

马斯克20亿送Grok 4上火星！20万GPU造宇宙大脑，一句话生成3D黑洞

1条指令生成整段动画，2分钟内部署一款游戏!Grok 4发布仅仅12小时后，AI开发者Mckay Wrigley体验之后，直呼「强得疯狂」！在一次请求中，Grok 4 Heavy就生成了完整动画，从人群行走到鸟瞰镜头无缝切换，展现惊人理解与执行力，而其他模型完全无法匹敌。提示词：Create an animation of a crowd of people walking to form 「Hello world, I am Grok」 as camera changes to birds-eye.还能表现得像阅兵一样，整齐划一地行进：这款3D视频，全网爆火，浏览量破350万。

7/14/2025 9:16:00 AM

VLA 推理新范式！一致性模型 CEED-VLA 实现四倍加速！

本文第一作者为香港科技大学（广州）机器人系一年级博士生宋文轩，主要研究方向为VLA模型，共同第一作者是来自香港科技大学广州的研究助理陈家毅，项目leader为浙江大学和西湖大学联合培养博士生丁鹏翔，他们也是具身智能领域开源项目OpenHelix以及LLaVA-VLA的研究团队。通讯作者为香港科技大学广州的李昊昂教授，他是今年的CVPR2025 Best Paper Candidate的获得者。近年来，视觉 - 语言 - 动作（Vision-Language-Action, VLA）模型因其出色的多模态理解与泛化能力，已成为机器人领域的重要研究方向。

7/14/2025 9:14:00 AM

奥特曼气到快失眠？OpenAI前大佬力挺：小扎砸钱挖墙脚，1亿美元很合理

最近，Meta不断从竞争对手那里挖走顶尖AI人才，开出的签约薪酬包更是令人咋舌！比如，庞若鸣跳槽到Meta，总薪酬包高达惊人的2亿美元。为了挖走OpenAI的人才，小扎支付了1亿美元签下了Jiahui Yu。

7/14/2025 9:14:00 AM

「流匹配」成ICML 2025超热门主题！网友：都说了学物理的不准转计算机

众所周知，第 42 届国际机器学习大会（ICML）将于 7 月 13 日至 19 日在加拿大温哥华盛大举行。在生成式 AI 领域，最新的前沿热点已经转向探索更高质量，更稳定，更简洁，更通用的模型形态。流匹配（Flow Matching）技术正完美的踩中了每一个热点要素。

7/14/2025 9:12:00 AM

SpaceX 投资20亿美元助力 xAI，加速追赶 OpenAI

SpaceX 近日宣布将向其子公司 xAI 投资20亿美元，这笔资金是其50亿美元股权融资计划的一部分。此举表明，马斯克旗下的 xAI 正在加速发展，以追赶其竞争对手 OpenAI。随着 xAI 与社交媒体平台 X 的合并完成，合并后公司的估值已高达1130亿美元。

7/14/2025 9:11:52 AM AI在线

“反向收购”再现:谷歌24亿拿下 Windsurf 部分技术与核心团队

据 The Verge 报道，OpenAI 以30亿美元收购病毒式 AI 编码初创公司 Windsurf 的交易已于上周五告吹。令人震惊的是，谷歌 DeepMind 迅速出手，成功吸纳了 Windsurf 首席执行官 Varun Mohan、联合创始人 Douglas Chen 以及该公司的一些顶尖研究人员。谷歌发言人克里斯·帕帕斯（Chris Pappas）在给 TechCrunch 的声明中证实了这一消息，表示:“我们很高兴欢迎 Windsurf 团队的一些顶尖 AI 编码人才加入 Google DeepMind，以推进我们在代理编码方面的工作。

7/14/2025 9:11:51 AM AI在线

Meta 收购语音 AI 初创公司 Play AI

Meta 证实已收购 Play AI，一家专注于利用人工智能生成人类声音的初创公司。此举将进一步强化 Meta 在 AI 领域的布局，尤其是在其日益增长的 AI 角色、Meta AI、可穿戴设备和音频内容创作等项目上的能力。据彭博社报道，Meta 发言人证实了此次收购。

7/14/2025 9:11:46 AM AI在线

ChatGPT助力揭露500万美元遗产欺诈，AI成法律维权新武器！

在一起长达十年的遗产纠纷案中，ChatGPT 成为了受害者 Rejeana Leatherwood 的得力助手，成功帮助她揭露了潜在的500万美元遗产欺诈。故事的开端可以追溯到2015年，Rejeana 的父亲在墨西哥去世，随后，一位名叫 Irma 的女子声称自己是他的合法妻子，试图独占父亲的遗产。在父亲去世后，Rejeana 和她的姐妹在毫不知情的情况下，被 Irma 迅速占有了父亲的遗产。

7/14/2025 9:11:46 AM AI在线

重磅发布！月之暗面推出万亿参数开源大模型Kimi K2

中国人工智能企业月之暗面近日重磅推出其最新的开源大语言模型 ——Kimi K2。这一模型采用了混合专家架构，总参数量达到了惊人的1万亿，其中激活参数为320亿，表现出色，成为业内关注的焦点。 Kimi K2不仅在参数规模上令人惊叹，其智能体能力也十分强大。

7/14/2025 9:11:45 AM AI在线

AI编程「反直觉」调研引300万围观！开发者坚信提速20%，实测反慢19%

随着大模型的崛起，AI编程领域正在发生翻天覆地的变化。各种编程大模型、编程工具涌现，通过自动补全代码、自动 debug 等实用的功能为开发者的日常工作提供极大便利，并在一定程度上提升了开发效率。不过，问题来了，AI 编程工具带来的影响真是如此吗？

7/14/2025 9:10:00 AM

从OpenAI叛逃谷歌！这位27岁小哥，成了奥特曼最忌惮的「秘密武器」

27岁的Logan Kilpatrick，堪称谷歌与开发者之间的「超级联络员」。 2024年，Kilpatrick从OpenAI跳槽谷歌，摇身一变成为谷歌AI赛道上的「秘密武器」。这位年轻的技术天才，不仅掌管谷歌AI Studio，还以超强的个人魅力和开发者洞察力，成了谷歌AI的流量密码。

7/14/2025 9:03:00 AM

Lora微调实操演示（下）：五次训练详解（免费GPU)

五月底写过一篇 Lora 微调的概念铺垫文章，这篇来结合阿里云的一个开源项目和免费试用 GPU 来做个完整的训练过程演示。 Lora微调实操教程（上）：人话版概念详解（附案例）注：本篇演示的脚本部分在参考 aliyun_acp_learning 开源项目基础上有部分删减和调整。后文相关配置和训练过程中的实际耗时也会进行标注说明。

7/14/2025 9:00:13 AM 韦东东

7B模型对标GPT-4o，全球首个医疗代码生成大模型训练平台来了

医疗AI场景复杂，需要“又懂医疗又懂编程”的agent。但像GPT这样现成的大模型难以直接部署，该如何突破技术壁垒？答案是：打造一个统一的训练平台，专门训练能够生成医疗代码的大模型。

7/14/2025 9:00:00 AM

攻克「恶意投毒」攻击！华南理工联合霍普金斯和UCSD，连登TPAMI、TIFS顶刊

虽然无法彻底解决维度诅咒带来的问题，根据理论证明，曼哈顿距离在高维空间中的识别能力要远远好于常用的欧式距离，可以缓解维度诅咒效应。方法框架即便曼哈顿距离有着更好的识别效力，但是研究人员也不认为在识别后门攻击的时候曼哈顿就能完全替代欧氏距离。除此以外，先前的工作已经表明[3]，有的后门攻击会在欧氏距离上表现区分度，有的则会在余弦相似度（Cos 距离）上表现差异。

7/14/2025 8:57:00 AM

资讯热榜

标签云

AI 人工智能 OpenAI AIGC 模型 ChatGPT 谷歌 DeepSeek AI新词 AI绘画大模型机器人数据 Midjourney 开源 Meta 微软智能用户 GPT 学习英伟达 Gemini 智能体技术马斯克 Anthropic 图像 AI创作训练 LLM 论文 AI for Science 代码腾讯苹果算法 Agent Claude 芯片具身智能 Stable Diffusion xAI 蛋白质人形机器人开发者生成式神经网络机器学习 AI视频 3D 字节跳动大语言模型 RAG Sora 百度研究 GPU 生成华为工具 AGI 计算生成式AI AI设计大型语言模型搜索亚马逊 AI模型视频生成特斯拉 DeepMind 场景 Copilot 深度学习 Transformer 架构 MCP 编程视觉