模型

其实，扩散语言模型在最终解码之前很久，就已确定最终答案

随着扩散语言模型（DLM）在各个领域的快速发展，其已成为自回归（AR）模型有力的替代方案。与 AR 模型相比，DLMs 的主要优势包括但不限于：高效的并行解码和灵活的生成顺序。尽管 DLMs 具有加速潜力，但在实际应用中，其推理速度仍慢于 AR 模型，原因在于缺乏 KV-cache 机制，以及快速并行解码所带来的显著性能下降。

9/3/2025 1:59:34 PM

只会「氛围编程」，永远成不了真正工程师！还差这几个关键环节

Cursor等智能IDE相继推出，带来了更智能的编程体验。与此同时，Claude 4等基座大模型的编码性能不断提升。再加上Andrej Karpathy的大力推广，Vibe Coding迅速走红，已成野火燎原之势。

9/3/2025 9:10:00 AM

别误会00后了！美国千人调查揭秘：85%学生都用AI，首要目的不是偷懒

GenAI席卷全球，高校课堂成为最前沿的实验场。有人担心学位贬值、课堂失守；有人则看到新技术催生的新机遇。刚刚，国外的「Inside Higher Ed」发布了最新的调查。

9/2/2025 5:42:47 PM

14B打败671B！微软rStar2-Agent在数学推理上超过DeepSeek-R1

现在，LLM 已经可以获得非常强大的推理能力，而其中关键便是测试时扩展（test-time scaling）。通常而言，延长思维链（CoT）就可以延长「思考时间」，从而显著提升性能，尤其是当使用大规模强化学习和可验证奖励 (RLVR) 进行优化时。然而，对于容易出现细微中间错误或需要创造性推理转变的难题，较长的思维链仍然存在根本性的局限性。

9/2/2025 10:20:10 AM

刚刚，DeepSeek最新发文！V3/R1训练细节全公开，信息量巨大

今天，网信办《人工智能生成合成内容标识办法》正式生效。其中，第四条要求：对符合要求的AI生成合成内容添加显式标识。紧跟最新政策，DeepSeek出手了。

9/2/2025 10:17:07 AM

腾讯开源WMT2025冠军大模型：拿下30个第一，同类最佳

昨晚，腾讯开源了2025年世界机器翻译大会（WMT2025）上斩获佳绩的翻译大模型Hunyuan-MT-7B。根据比赛成绩显示，Hunyuan-MT-7B在中文、英文、法语、德语、马拉地语、爱沙尼亚语、冰岛语、芬兰语、匈牙利语、罗马尼亚语、波斯语、印地语、孟加拉语、泰米尔语、乌尔都语、僧伽罗语等31种主流、小众语言测试中，拿下30个语种第一。 Hunyuan-MT-7B在面对不同语言的复杂语法规则、独特词汇体系以及丰富文化内涵时，均展现出强大的适应能力与翻译水准，成为同类最佳开源模型。

9/2/2025 9:02:08 AM

炸了！Google新发图片大模型简直逆天！

如果说 ChatGPT 真正的开创了聊天时代的智能对话，那么这次 Google 发布的 Nano Gemini 2.5 Flash Image（Nano Banana）将真正开启了图片智能生成的时代。先来看看他的生成效果吧。 1.生成3D手办2.旧照片修复3.换装不需要手工 PS 了。

9/1/2025 5:18:55 PM 磊哥

Meta和Scale AI闹翻！砸143亿买的高管跑路，业务也合作不下去

两个多月前，Meta豪掷143亿美元收购Scale AI 49%的股份。这才过去多久，两家不和的消息就被摆上了明面？据TechCrunch报道，双方目前正在团队融合、业务合作方面产生一系列纠葛：跟随Alexandr Wang（Scale AI前CEO）一起去Meta的重要高管已经火速跑路了；Meta老员工和从Scale AI过来的人摩擦不断；Meta内部研究人员抱怨Scale AI数据质量太低，并采用了Scale AI对家数据；……u1s1，虽然这些摩擦的出现并不意外，但对比之前的“风光”，落差还是有点明显了。

9/1/2025 5:17:42 PM

NeurIPS近3万投稿爆仓，强拒400篇论文！博士疯狂内卷，AI顶会噩梦来袭

AI顶会，一场「爆仓危机」正在上演。由于会议场地限制，NeurIPS 2025正通知「高级领域主席」（SAC），拒收已被录用的论文。一位SAC爆料，大约400篇论文直接被砍掉，即便是三位审稿人和AC已通过初审。

9/1/2025 5:09:21 PM

王兴一鸣惊人！美团首个开源大模型追平DeepSeek-V3.1

9/1/2025 2:22:03 PM

143亿美金买来一场空！小扎向谷歌OpenAI低头，史上最大AI赌注失速

自从Llama 4发布后，Meta深陷「性能评测造假」丑闻，声誉跌落神坛。之后，小扎坐不住了，斥143亿美元（约1000亿元）收购Scale AI，同时大举用九位数年薪挖角AI顶尖人才。然而，近日Meta爆出离职潮，大批人才甚至还未入职便决定告别Meta。

9/1/2025 9:15:00 AM

Hinton神预言！斯坦福惊人实锤：00后20%初级IT岗蒸发，AI失业潮来了

9/1/2025 9:13:00 AM

R-Zero 深度解析：无需人类数据，AI 如何实现自我进化？

本文第一作者黄呈松 (Chengsong Huang) 是圣路易斯华盛顿大学的博士生，Google scholar citation 五百多次，目前的研究的兴趣是强化学习和大语言模型。机器之心曾经报道过其之前工作 Lorahub 已经被引超过 250 次。大型语言模型（LLM）的发展长期以来受限于对大规模、高质量人工标注数据的依赖，这不仅成本高昂，也从根本上限制了 AI 超越人类知识边界的潜力。

9/1/2025 9:09:00 AM

谷歌"香蕉"模型震撼发布！图像编辑能力一骑绝尘

最近有个感觉特别强烈：AI图像生成领域正在迎来一个全新的时代。谷歌悄悄发布了代号为"Nano Banana"的Gemini 2.5 Flash Image模型，这个有着可爱名字的模型，可能要彻底改写图像编辑的游戏规则。说实话，刚看到"香蕉"这个名字时，我还以为谷歌是在开玩笑。

9/1/2025 9:08:41 AM 阿丸笔记

DeepSeek、GPT-5带头转向混合推理，一个token也不能浪费

在最近的一档脱口秀节目中，演员张俊调侃 DeepSeek 是一款非常「内耗」的 AI，连个「1 加 1 等于几」都要斟酌半天。在 AI 领域，这种情况被称为「过度思考」。它的存在让 AI 大模型公司非常头疼，因为实在是太浪费算力了，那点订阅费根本 cover 不住。

9/1/2025 8:59:00 AM

比Claude好用10倍，便宜10倍！世界上最快的Agentic编程模型！刚刚，xAI发布全新模型，免费用！网友：抽卡任务有奇效

编辑｜云昭昨天凌晨，马斯克之前预告的全新编程模型终于发布了！距离 xAI 推出 Grok Code 不到三天，马斯克又带着一款大杀器来跟奥特曼的 GPT-5 来打（抬）擂（杠）了！ “感觉比 Claude 好用 10 倍，速度也快 10 倍！

9/1/2025 2:11:00 AM 云昭

突发！微软与OpenAI同日开火：语音之战+通用大模型，AI霸权决战打响

8/29/2025 2:41:52 PM

今夜，语音模型第一次超越人类！OpenAI再现Her时刻，95后华人研究员坐镇

今天凌晨1点，OpenAI接连扔出AI语音能力的两个重磅更新。一个是Realtime API，可支持生产级的实时智能体。另一个是最先进的语音到语音模型gpt-realtime。

8/29/2025 2:38:42 PM

资讯热榜

免费！让图片放大不失真的位图转矢量图神器 Tmttool AI应用新纪元：2025中国AI应用排行榜榜单揭晓丨2025年1月 GGUF 是什么？一文看懂大模型里最火的模型格式最火、最全的Agent记忆综述，NUS、人大、复旦、北大等联合出品 6秒视频10秒生成！全新AI视频神器 Grok Imagine 深度体验+元提示词分享 Sora、可灵、即梦哪家强？AI视频软件深度测评！免注册免费用！17种AI绘图模型一站式体验平台LMArena 可灵、即梦、海螺、Vidu哪家强？4大AI视频神器深度测评

标签云

AI 人工智能 OpenAI AIGC 模型 ChatGPT 谷歌 DeepSeek AI绘画 AI新词大模型机器人数据 Midjourney 开源 Meta 微软智能用户 GPT 学习智能体技术 Gemini 英伟达马斯克 Anthropic 图像 AI创作训练 LLM 论文代码 AI for Science 苹果腾讯算法 Agent Claude 芯片 Stable Diffusion 具身智能 xAI 蛋白质开发者人形机器人生成式神经网络机器学习 AI视频 3D RAG 大语言模型字节跳动 Sora 百度研究 GPU 生成工具华为 AGI 计算 AI设计生成式AI 大型语言模型搜索视频生成亚马逊特斯拉 AI模型 DeepMind 场景深度学习 Copilot Transformer 架构 MCP 编程视觉