AI在线 AI在线

AI

最新发现!每参数3.6比特,语言模型最多能记住这么多

最新发现!每参数3.6比特,语言模型最多能记住这么多

语言模型到底能记住多少信息? Meta、DeepMind、康奈尔大学和英伟达的一项测量结果显示:每个参数大约 3.6 比特。 一旦达到这个极限,它们就会停止记忆并开始泛化。
6/4/2025 1:56:51 PM
冲击自回归,扩散模型正在改写下一代通用模型范式

冲击自回归,扩散模型正在改写下一代通用模型范式

上个月 21 号,Google I/O 2025 开发者大会可说是吸睛无数,各种 AI 模型、技术、工具、服务、应用让人目不暇接。 在这其中,Gemini Diffusion 绝对算是最让人兴奋的进步之一。 从名字看得出来,这是一个采用了扩散模型的 AI 模型,而这个模型却并非我们通常看到的扩散式视觉生成模型,而是一个地地道道的语言模型!
6/4/2025 1:55:03 PM
Meta新突破!跨模态生成告别噪声:流匹配实现任意模态无缝流转

Meta新突破!跨模态生成告别噪声:流匹配实现任意模态无缝流转

本文第一作者为刘启昊,约翰霍普金斯大学计算机科学博士四年级学生,师从 Alan Yuille 教授,研究方向涉及模型鲁棒性、生成模型与 3D 视觉。 通讯作者为 Mannat Singh,Meta GenAI 研究员,近期的研究主要涉及视频生成领域创新工作,包括 Emu Video、MovieGen 等项目。 在人工智能领域,跨模态生成(如文本到图像、图像到文本)一直是技术发展的前沿方向。
6/4/2025 1:53:57 PM
GPT-4o连验证码都解不了?SOTA模型成功率仅40%

GPT-4o连验证码都解不了?SOTA模型成功率仅40%

当前最强多模态Agent连验证码都解不了? MetaAgentX团队推出首个专注于“多模态交互智能体×CAPTCHA(人机验证)问题”的开放式研究平台——Open CaptchaWorld。 该平台专门用于测试Agent解验证码的能力。
6/4/2025 1:53:22 PM
“AI 教父”本希奥宣布开发“诚信”系统,防范智能体欺骗人类

“AI 教父”本希奥宣布开发“诚信”系统,防范智能体欺骗人类

“AI 教父”约书亚・本希奥(Yoshua Bengio)成立 LawZero 非营利组织,致力于开发“诚实”的 AI 系统,用以识别“流氓”AI 系统。
6/4/2025 1:51:01 PM 故渊
让AI像人类一样认知真实世界!UCLA谷歌强强联手,长时记忆+3D空间理解超越基线16.5%

让AI像人类一样认知真实世界!UCLA谷歌强强联手,长时记忆+3D空间理解超越基线16.5%

想象一下,你在一个陌生的房子里寻找合适的礼物盒包装泰迪熊,需要记住每个房间里的物品特征、位置关系,并根据反馈调整行动。 这一系列过程依赖人类强大的空间-时间长时记忆。 图片如何让AI在3D环境中像人类一样思考,一直是具身智能领域的难题。
6/4/2025 11:08:28 AM
OpenAI CEO警示:AI智能体正重塑职场格局,基层岗位面临结构性冲击

OpenAI CEO警示:AI智能体正重塑职场格局,基层岗位面临结构性冲击

在 2025 年 Snowflake Summit 主题演讲中,OpenAI 首席执行官山姆・奥尔特曼(Sam Altman)抛出震撼观点:AI 智能体正以惊人速度渗透企业运营,其角色已从工具演变为 "数字基层员工",直接引发职场结构的根本性变革。 智能体崛起:从工具到 "数字员工" 的质变奥尔特曼指出,当前诸多企业已将 AI智能体纳入日常工作流,承担数据整理、报告生成、流程审批等标准化任务。 员工的核心职能逐渐转向 "智能体管理者"—— .
6/4/2025 11:06:01 AM
解读:AI智能体时代的实用指南——吴恩达与LangChain创始人的深度对话

解读:AI智能体时代的实用指南——吴恩达与LangChain创始人的深度对话

Hi,大家好,我叫秋水,专注商用 AI Agent(智能体),帮企业用AI自动化业务,提升效率。 在刚刚结束的一场AI技术峰会上,深度学习领域的传奇人物吴恩达与LangChain创始人Harrison进行了一场精彩的谈话。 这场对话不仅揭示了AI智能体技术的最新趋势,更为普通人和企业指明了在AI时代如何抓住机遇的实用路径。
6/4/2025 11:04:03 AM 秋水
著名 AI 研究者 Yoshua Bengio 创办 LawZero,致力于开发安全的 AI 系统

著名 AI 研究者 Yoshua Bengio 创办 LawZero,致力于开发安全的 AI 系统

Yoshua Bengio 是 Turing 奖得主,近期宣布成立非营利组织 LawZero,旨在开发安全的人工智能(AI)系统。 他的决定源于对当前 AI 发展方向的深切担忧。 LawZero 的使命是采用 “安全设计” 的方法进行 AI 研究和实施,力求在没有商业压力的环境下推进工作。
6/4/2025 10:01:29 AM AI在线
DeepSeek 等模型训练所依赖的合成数据,BARE 提出了新思路

DeepSeek 等模型训练所依赖的合成数据,BARE 提出了新思路

大家好,我是肆〇柒,在AI圈,大型语言模型(LLM)的训练对高质量、多样化数据的需求日益增长。 从去年到现在,一些模型在发布的时候,会有论文或者技术报告,里面多多少少都会提及合成数据,并且在多数情况下,合成数据的效果并不差。 比如,我所看到的报告中,使用了合成数据的模型如下盘点(应该会有遗漏,它并不完整)。
6/4/2025 9:15:16 AM 肆零柒
ChatGPT普通会员能用编程神器Codex了!支持联网,奥特曼:更多更新在路上

ChatGPT普通会员能用编程神器Codex了!支持联网,奥特曼:更多更新在路上

一觉醒来,ChatGPT又完成了一些“小”更新! 总结起来就是等等党胜利。 首先,刚发没多久的AI编程神器CodeX,现在可使用的用户群体扩展至了Plus用户。
6/4/2025 9:03:40 AM
论文秒变海报!开源框架PosterAgent一键生成顶会级学术Poster

论文秒变海报!开源框架PosterAgent一键生成顶会级学术Poster

你好研究僧,听说刚刚中了顶会,却还在愁怎么做Poster(学术海报)? 别急,容在下为你推荐一款新时代科研党神器——PosterAgent,帮你一键从paper.pdf跳转poster.pptx。 相比GPT-4o,PosterAgent生成指标更优,同时token使用量减少87%,还只需要0.0045美元,就可将22页的论文转化为可编辑的 “.pptx” 终稿海报。
6/4/2025 9:03:00 AM
Anthropic 推出​Claude Explains 博客项目,探索 AI 与人类专家协作新模式

Anthropic 推出​Claude Explains 博客项目,探索 AI 与人类专家协作新模式

科技公司 Anthropic 悄然推出了名为 “Claude Explains” 的博客项目,旨在展示其人工智能(AI)模型 Claude 在内容创作中的能力。 该博客的内容主要由 Claude AI 生成,并经过人类专家团队的编辑和增强,涵盖了多种技术主题。 据悉,Claude Explains 博客的内容不仅仅是 AI 的自动生成,而是经过了一系列严格的编辑流程。
6/4/2025 9:01:04 AM AI在线
谷歌 DeepMind 负责人:AI 变革邮箱管理、对抗内容算法推荐,通用人工智能未来 5~10 年实现

谷歌 DeepMind 负责人:AI 变革邮箱管理、对抗内容算法推荐,通用人工智能未来 5~10 年实现

在 SXSW 伦敦站活动中,谷歌 DeepMind 首席执行官戴密斯・哈萨比斯(Demis Hassabis)表示,人工智能(AI)在迅猛发展下,其引发的巨大变革,不亚于互联网诞生或工业革命。
6/4/2025 8:48:37 AM 故渊
真实评估!北理发布全球首个「全场景教育」基准,支持4000+情境

真实评估!北理发布全球首个「全场景教育」基准,支持4000+情境

为什么发展教育大模型需要新的数据和Eval体系? AI赋能教育教学,需要从「经验导向」迈向「证据导向」,真正将AI数据驱动思想赋能到教育场景中,这是核心动力。 教育场景复杂不仅涉及知识深度(基础教育到高等教育)、知识广度(涵盖不同学科),还涉及认知水平不同、个性化需求多样、教学决策性要求等。
6/4/2025 8:40:00 AM
ACL2025 | 传统符号语言传递知识太低效?探索LLM高效参数迁移可行性

ACL2025 | 传统符号语言传递知识太低效?探索LLM高效参数迁移可行性

论文第一作者谭宇乔来自中国科学院自动化研究所的自然语言处理和知识工程研究组,导师为何世柱老师。 目前研究方向主要在利用大语言模型参数知识增强大模型能力。 1 跨规模参数知识迁移 PKT 的全面分析人类的思维是非透明的,没有继承的记忆,因此需要通过语言交流的环境来学习。
6/4/2025 8:35:00 AM
思维链也会「跳帧」?浙大团队提出CoT-Bridge,显著提升数学推理性能

思维链也会「跳帧」?浙大团队提出CoT-Bridge,显著提升数学推理性能

本文的共同第一作者是徐皓雷和颜聿辰。 徐皓雷是浙江大学的一年级硕士生,主要研究兴趣集中在大模型推理和可解释性研究;颜聿辰是浙江大学博士三年级研究生,主要研究兴趣集中在大模型推理和智能体。 本文通讯作者是浙江大学鲁伟明教授和沈永亮研究员。
6/4/2025 8:35:00 AM
无需 3D 模型 / 物理引擎:谷歌 DeepMind 联合开发力提示技术,AI 生成视频可模拟真实运动

无需 3D 模型 / 物理引擎:谷歌 DeepMind 联合开发力提示技术,AI 生成视频可模拟真实运动

谷歌 DeepMind 团队携手布朗大学,为视频生成模型开发“力提示”(force prompting)技术,可以在无需 3D 模型或物理引擎的情况下,生成逼真的运动效果。
6/4/2025 8:30:08 AM 故渊