AI在线 AI在线

研究

港科大Apple新研究:Tokens使用量减少,模型推理还更强了

1 1等于几? 现在的大推理模型(LRMs)已经展现出了非凡的推理能力。 但是面对这样最简单的数学问题,现有的LRMs仍需要花费1400 的tokens来思考。
5/29/2025 9:20:00 AM

全球顶尖AI做物理,被人类按地摩擦?不懂推理大翻车,本科生碾压

大模型,真的懂物理推理吗? 就在刚刚,港大、密歇根大学、多伦多大学等机构的研究者用3000道物理题,给全球顶尖大模型来了一场大拷问。 结果,这些顶尖AI,毫无例外全部翻车了!
5/28/2025 11:44:24 AM

最新研究:ChatGPT 助力中小学生学习成效提升近87%

《Nature》子刊的研究表明,利用 ChatGPT 等大型语言模型可以显著提升 K12阶段(即中小学生)的学习成绩,整体学习效果提升达86.7%。 这项研究汇总了59项相关研究,揭示了 AI 在教育中的巨大潜力。 研究团队经过严谨的筛选和分析,最终选定51项相关研究进行元分析,这些研究都采用了随机双盲实验方法,并公开了实验数据,以确保结论的科学性和可靠性。
5/26/2025 10:01:01 AM
AI在线

研究称, AI 能独立自发组成社会,形成自己的规范和习俗

近日,伦敦大学城市学院与哥本哈根信息技术大学的研究人员进行了一项引人注目的实验,结果表明,人工智能(AI)能够在没有外界干预的情况下,自发形成类似人类的社会规范和习俗。 这项研究的成果已于5月14日发表在《Science Advances》杂志上,标志着 AI 群体行为研究的新进展。 图源备注:图片由AI生成,图片授权服务商Midjourney在这项实验中,研究团队将多种 AI 智能体置于去中心化的交流环境中,模拟了人类社会中的群体互动。
5/19/2025 10:01:10 AM
AI在线

研究:AI 聊天机器人在数据总结能力上愈加糟糕,关键细节常被遗漏

随着人工智能技术的迅猛发展,各大 AI 创业公司不断宣称其产品将工作方式和知识获取的方式。 然而,最近一项发表在《皇家学会》上的研究却揭示了新一代 AI 模型在总结文本时存在严重问题,令人担忧。 研究显示,新款 AI 聊天机器人在提供信息时,有高达73% 的概率会遗漏关键信息。
5/19/2025 10:01:05 AM
AI在线

通义千问推出 “深入研究” 功能,助力科研高效进行

通义千问官方近日在其公众号上宣布了一项令人兴奋的新功能 ——“深入研究”(Deep Research)智能助理系统。 这个系统的上线,旨在为科研人员和广泛用户提供高效、便捷的研究支持。 通过该系统,用户可以快速生成条理清晰、数据可信的研究报告,大大缩短了以往繁琐的研究过程。
5/15/2025 11:02:25 AM
AI在线

免费开放!通义千问Qwen上线「深入研究」Deep Research功能

在数字化时代,面对海量信息和高强度的任务压力,系统地研究一件事变得费时且难以聚焦。 为了解决这一问题,Qwen团队推出了一款名为“Deep Research”的智能助理系统,旨在帮助用户梳理复杂问题,快速理清头绪,并生成条理清晰、数据可信的研究报告。 “Deep Research”是一个强大的智能助理系统,它能够逐步规划复杂的研究任务,综合大量在线信息,并协助用户完成复杂的科研任务。
5/14/2025 8:00:42 AM
AI在线

开源社区新添利器:DeerFlow深度研究框架融合AI与专业工具

DeerFlow,一个由社区驱动的全新深度研究框架日前发布,旨在将语言模型与专业工具相结合,为开源社区提供强大的自动化研究解决方案。 这款基于LangGraph构建的模块化多智能体系统,秉持"源于开源,回馈开源"的理念,为研究人员和开发者提供了一套完整的工具链。 DeerFlow的核心优势在于其全面的功能整合。
5/9/2025 11:04:20 AM
AI在线

​Meta任命前谷歌DeepMind主管为AI研究实验室新负责人

根据彭博社的报道,Meta 公司已任命 Robert Fergus 为其基础 AI 研究实验室(FAIR)的新负责人,接替于四月宣布离职的 Joelle Pineau。 Fergus 在担任 Meta 新职务之前,曾在 Google DeepMind 工作了约五年,担任研究总监。 在此之前,他还曾在 Meta 担任研究科学家。
5/9/2025 10:01:50 AM
AI在线

ICML 2025 | 注意力机制中的极大值:破解大语言模型上下文理解的关键

大型语言模型(LLMs)在上下文知识理解方面取得了令人瞩目的成功。 近日,一项来自 ICML 2025 的新研究《Massive Values in Self-Attention Modules are the Key to Contextual Knowledge Understanding》揭示了大型语言模型中一个重要现象:在注意力机制的查询 (Q) 和键 (K) 表示中存在非常集中的极大值,而在值 (V) 表示中却没有这种模式。 这一现象在使用旋转位置编码 (RoPE) 的现代 Transformer 模型中普遍存在,对我们理解 LLM 内部工作机制具有重要意义。
5/7/2025 9:12:00 AM

​Anthropic 推出 AI for Science 计划,助力科研人员加速科学发现

AI 技术公司 Anthropic 于5月6日宣布推出一项名为 “AI for Science” 的新计划,旨在为生命科学等领域的研究人员提供免费 API 积分,以帮助他们加速科学研究和发现。 该计划希望借助先进的人工智能技术,提升科研效率,减少科学发现所需的时间和资源。 图源备注:图片由AI生成,图片授权服务商MidjourneyAnthropic 相信,AI 的推理和语言处理能力可以极大地推动科学进步。
5/6/2025 10:01:12 AM
AI在线

Anthropic 推出 AI for Science 计划,助力生命科学研究者实现更快科学发现

AI 公司 Anthropic 于5月6日正式宣布启动其全新计划 ——AI for Science。 这一项目旨在为选定的研究人员提供大量免费的 API 积分,以促进科学研究与发现的进展。 Anthropic 认为,人工智能的先进推理和语言能力能够极大地加速科学进步。
5/6/2025 10:01:11 AM
AI在线

微软1bit LLM新研究:原生4bit激活值量化,可充分利用新一代GPU对4bit计算的原生支持

微软又有“1 bit LLM”新成果了——发布BitNet v2框架,为1 bit LLM实现了原生4 bit激活值量化,由此可充分利用新一代GPU(如GB200)对4 bit计算的原生支持能力。 同时减少内存带宽&提升计算效率。 之前,微软持续研究BitNet b1.58,把LLM的权重量化到1.58-bit,显著降低延迟、内存占用等推理成本。
4/30/2025 9:16:00 AM
量子位

​瑞士研究人员承认在 Reddit 上秘密发布 AI 生成内容,涉嫌违反伦理

瑞士苏黎世大学的研究人员承认,他们在著名的 Reddit 社区 r/changemyview 上秘密发布了由人工智能生成的帖子,目的是为了科学研究。 研究人员在一份草稿报告中指出,r/changemyview 是一个用户分享各种观点的地方,旨在通过提出论据和反论据来挑战他人的观点,从而进行文明的讨论。 研究者希望通过该平台探讨大型语言模型(LLM)生成的内容是否能够改变读者的看法,因此他们以半自动化的 AI 账户参与了讨论。
4/29/2025 6:00:40 PM
AI在线

瑞士大学在 Reddit 上进行 AI 实验引发伦理争议

近期,瑞士苏黎世大学的一项实验在 Reddit 论坛引起了轩然大波。 研究团队悄悄在 r/ChangeMyView(CMV)这个社区中发布了由人工智能生成的评论,旨在研究大型语言模型(LLM)对改变观点的影响。 然而,这一行为遭到了广泛的批评,主要原因是未获得参与者的知情同意。
4/29/2025 3:00:40 PM
AI在线

研究发现人们对 AI 的即时风险忧虑高于远期生存威胁

近日,瑞士大学的一项新研究表明,大多数人对人工智能(AI)带来的即时风险,比如偏见、虚假信息和失业问题,表现出更强烈的关注,而对未来可能出现的生存威胁却显得相对冷漠。 这项研究涉及超过一万名来自美国和英国的参与者,揭示了公众对于 AI 风险的不同看法。 研究中,科学家们将参与者分为几组,一部分人阅读了关于 AI 可能引发的灾难性后果的文章,另一部分则关注当下的现实问题,如歧视和虚假信息,第三组则接触到 AI 的潜在好处。
4/29/2025 12:01:00 PM
AI在线

采样越多越聪明?隐式扩展颠覆认知,采样搜索如何挑出完美解

先让模型生成多个候选答案,再通过自我验证挑出「真金」。 基于采样的搜索在许多推理任务中表现优异,可关于它的扩展趋势,还有许多未解之谜。 随着采样数量的增加,模型的推理性能能否继续提升?
4/22/2025 8:50:00 AM
新智元

7B小模型写好学术论文,新框架告别AI引用幻觉,实测100%学生认可引用质量

学术写作通常需要花费大量精力查询文献引用,而以ChatGPT、GPT-4等为代表的通用大语言模型(LLM)虽然能够生成流畅文本,但经常出现“引用幻觉”(Citation Hallucination),即模型凭空捏造文献引用。 这种现象严重影响了学术论文的可信度与专业性。 现在,加拿大滑铁卢大学与卡内基梅隆大学的华人研究团队,提出了一种名为 ScholarCopilot 的智能学术写作大模型框架,专门针对学术场景,致力于精准地生成带有准确引用的学术文本。
4/11/2025 9:12:21 AM
量子位