研究
谢赛宁敲响学界警钟!AI研究可能陷入一场注定失败的有限游戏
凌晨三点的 AI 实验室,键盘敲击声在空荡的房间回响。 屏幕上,博士生小王、小李、小赵正疯狂调整模型参数,只为在 NeurIPS 截稿前将准确率从 98.2% 刷到 98.5%。 这样的场景,在如今的 AI 学术圈早已见怪不怪。
6/16/2025 8:53:00 AM
港科大Apple新研究:Tokens使用量减少,模型推理还更强了
1 1等于几? 现在的大推理模型(LRMs)已经展现出了非凡的推理能力。 但是面对这样最简单的数学问题,现有的LRMs仍需要花费1400 的tokens来思考。
5/29/2025 9:20:00 AM
全球顶尖AI做物理,被人类按地摩擦?不懂推理大翻车,本科生碾压
大模型,真的懂物理推理吗? 就在刚刚,港大、密歇根大学、多伦多大学等机构的研究者用3000道物理题,给全球顶尖大模型来了一场大拷问。 结果,这些顶尖AI,毫无例外全部翻车了!
5/28/2025 11:44:24 AM
最新研究:ChatGPT 助力中小学生学习成效提升近87%
《Nature》子刊的研究表明,利用 ChatGPT 等大型语言模型可以显著提升 K12阶段(即中小学生)的学习成绩,整体学习效果提升达86.7%。 这项研究汇总了59项相关研究,揭示了 AI 在教育中的巨大潜力。 研究团队经过严谨的筛选和分析,最终选定51项相关研究进行元分析,这些研究都采用了随机双盲实验方法,并公开了实验数据,以确保结论的科学性和可靠性。
5/26/2025 10:01:01 AM
AI在线
研究称, AI 能独立自发组成社会,形成自己的规范和习俗
近日,伦敦大学城市学院与哥本哈根信息技术大学的研究人员进行了一项引人注目的实验,结果表明,人工智能(AI)能够在没有外界干预的情况下,自发形成类似人类的社会规范和习俗。 这项研究的成果已于5月14日发表在《Science Advances》杂志上,标志着 AI 群体行为研究的新进展。 图源备注:图片由AI生成,图片授权服务商Midjourney在这项实验中,研究团队将多种 AI 智能体置于去中心化的交流环境中,模拟了人类社会中的群体互动。
5/19/2025 10:01:10 AM
AI在线
研究:AI 聊天机器人在数据总结能力上愈加糟糕,关键细节常被遗漏
随着人工智能技术的迅猛发展,各大 AI 创业公司不断宣称其产品将工作方式和知识获取的方式。 然而,最近一项发表在《皇家学会》上的研究却揭示了新一代 AI 模型在总结文本时存在严重问题,令人担忧。 研究显示,新款 AI 聊天机器人在提供信息时,有高达73% 的概率会遗漏关键信息。
5/19/2025 10:01:05 AM
AI在线
通义千问推出 “深入研究” 功能,助力科研高效进行
通义千问官方近日在其公众号上宣布了一项令人兴奋的新功能 ——“深入研究”(Deep Research)智能助理系统。 这个系统的上线,旨在为科研人员和广泛用户提供高效、便捷的研究支持。 通过该系统,用户可以快速生成条理清晰、数据可信的研究报告,大大缩短了以往繁琐的研究过程。
5/15/2025 11:02:25 AM
AI在线
免费开放!通义千问Qwen上线「深入研究」Deep Research功能
在数字化时代,面对海量信息和高强度的任务压力,系统地研究一件事变得费时且难以聚焦。 为了解决这一问题,Qwen团队推出了一款名为“Deep Research”的智能助理系统,旨在帮助用户梳理复杂问题,快速理清头绪,并生成条理清晰、数据可信的研究报告。 “Deep Research”是一个强大的智能助理系统,它能够逐步规划复杂的研究任务,综合大量在线信息,并协助用户完成复杂的科研任务。
5/14/2025 8:00:42 AM
AI在线
开源社区新添利器:DeerFlow深度研究框架融合AI与专业工具
DeerFlow,一个由社区驱动的全新深度研究框架日前发布,旨在将语言模型与专业工具相结合,为开源社区提供强大的自动化研究解决方案。 这款基于LangGraph构建的模块化多智能体系统,秉持"源于开源,回馈开源"的理念,为研究人员和开发者提供了一套完整的工具链。 DeerFlow的核心优势在于其全面的功能整合。
5/9/2025 11:04:20 AM
AI在线
Meta任命前谷歌DeepMind主管为AI研究实验室新负责人
根据彭博社的报道,Meta 公司已任命 Robert Fergus 为其基础 AI 研究实验室(FAIR)的新负责人,接替于四月宣布离职的 Joelle Pineau。 Fergus 在担任 Meta 新职务之前,曾在 Google DeepMind 工作了约五年,担任研究总监。 在此之前,他还曾在 Meta 担任研究科学家。
5/9/2025 10:01:50 AM
AI在线
ICML 2025 | 注意力机制中的极大值:破解大语言模型上下文理解的关键
大型语言模型(LLMs)在上下文知识理解方面取得了令人瞩目的成功。 近日,一项来自 ICML 2025 的新研究《Massive Values in Self-Attention Modules are the Key to Contextual Knowledge Understanding》揭示了大型语言模型中一个重要现象:在注意力机制的查询 (Q) 和键 (K) 表示中存在非常集中的极大值,而在值 (V) 表示中却没有这种模式。 这一现象在使用旋转位置编码 (RoPE) 的现代 Transformer 模型中普遍存在,对我们理解 LLM 内部工作机制具有重要意义。
5/7/2025 9:12:00 AM
Anthropic 推出 AI for Science 计划,助力科研人员加速科学发现
AI 技术公司 Anthropic 于5月6日宣布推出一项名为 “AI for Science” 的新计划,旨在为生命科学等领域的研究人员提供免费 API 积分,以帮助他们加速科学研究和发现。 该计划希望借助先进的人工智能技术,提升科研效率,减少科学发现所需的时间和资源。 图源备注:图片由AI生成,图片授权服务商MidjourneyAnthropic 相信,AI 的推理和语言处理能力可以极大地推动科学进步。
5/6/2025 10:01:12 AM
AI在线
Anthropic 推出 AI for Science 计划,助力生命科学研究者实现更快科学发现
AI 公司 Anthropic 于5月6日正式宣布启动其全新计划 ——AI for Science。 这一项目旨在为选定的研究人员提供大量免费的 API 积分,以促进科学研究与发现的进展。 Anthropic 认为,人工智能的先进推理和语言能力能够极大地加速科学进步。
5/6/2025 10:01:11 AM
AI在线
微软1bit LLM新研究:原生4bit激活值量化,可充分利用新一代GPU对4bit计算的原生支持
微软又有“1 bit LLM”新成果了——发布BitNet v2框架,为1 bit LLM实现了原生4 bit激活值量化,由此可充分利用新一代GPU(如GB200)对4 bit计算的原生支持能力。 同时减少内存带宽&提升计算效率。 之前,微软持续研究BitNet b1.58,把LLM的权重量化到1.58-bit,显著降低延迟、内存占用等推理成本。
4/30/2025 9:16:00 AM
量子位
瑞士研究人员承认在 Reddit 上秘密发布 AI 生成内容,涉嫌违反伦理
瑞士苏黎世大学的研究人员承认,他们在著名的 Reddit 社区 r/changemyview 上秘密发布了由人工智能生成的帖子,目的是为了科学研究。 研究人员在一份草稿报告中指出,r/changemyview 是一个用户分享各种观点的地方,旨在通过提出论据和反论据来挑战他人的观点,从而进行文明的讨论。 研究者希望通过该平台探讨大型语言模型(LLM)生成的内容是否能够改变读者的看法,因此他们以半自动化的 AI 账户参与了讨论。
4/29/2025 6:00:40 PM
AI在线
瑞士大学在 Reddit 上进行 AI 实验引发伦理争议
近期,瑞士苏黎世大学的一项实验在 Reddit 论坛引起了轩然大波。 研究团队悄悄在 r/ChangeMyView(CMV)这个社区中发布了由人工智能生成的评论,旨在研究大型语言模型(LLM)对改变观点的影响。 然而,这一行为遭到了广泛的批评,主要原因是未获得参与者的知情同意。
4/29/2025 3:00:40 PM
AI在线
研究发现人们对 AI 的即时风险忧虑高于远期生存威胁
近日,瑞士大学的一项新研究表明,大多数人对人工智能(AI)带来的即时风险,比如偏见、虚假信息和失业问题,表现出更强烈的关注,而对未来可能出现的生存威胁却显得相对冷漠。 这项研究涉及超过一万名来自美国和英国的参与者,揭示了公众对于 AI 风险的不同看法。 研究中,科学家们将参与者分为几组,一部分人阅读了关于 AI 可能引发的灾难性后果的文章,另一部分则关注当下的现实问题,如歧视和虚假信息,第三组则接触到 AI 的潜在好处。
4/29/2025 12:01:00 PM
AI在线
采样越多越聪明?隐式扩展颠覆认知,采样搜索如何挑出完美解
先让模型生成多个候选答案,再通过自我验证挑出「真金」。 基于采样的搜索在许多推理任务中表现优异,可关于它的扩展趋势,还有许多未解之谜。 随着采样数量的增加,模型的推理性能能否继续提升?
4/22/2025 8:50:00 AM
新智元
资讯热榜
腾讯混元推出业界首个美术级 3D 生成大模型 Hunyuan3D-PolyGen,建模效率提升超七成
OpenAI 重申今夏推出最强模型 GPT-5,具备完整多模态 AI 能力
ChatGPT 商业推荐被曝引用不可靠信息来源,专家提醒用户勿盲目信任
ChatGPT 又遇“奶奶漏洞”,网友成功让 GPT-4o 主动生成“Win7 密钥”
刷新复杂Agent推理记录!阿里通义开源网络智能体超越DeepSeek R1,Grok-3
月之暗面 Kimi K2 发布并开源,擅长代码与 Agentic 任务
ChatGPT 推出“一起学习”功能:不直接给答案,引导用户自主思考
OpenAI 筹划进军硬件市场,CEO 奥尔特曼曾称 AI 革命不一定需要新硬件
标签云
人工智能
AI
OpenAI
AIGC
模型
ChatGPT
DeepSeek
AI绘画
谷歌
数据
机器人
大模型
Midjourney
用户
智能
开源
微软
Meta
GPT
学习
图像
技术
Gemini
AI创作
马斯克
论文
Anthropic
代码
英伟达
算法
Stable Diffusion
智能体
芯片
训练
开发者
生成式
腾讯
蛋白质
苹果
AI新词
神经网络
3D
Claude
研究
生成
LLM
机器学习
计算
Sora
人形机器人
AI视频
AI设计
GPU
AI for Science
xAI
华为
百度
搜索
大语言模型
Agent
场景
字节跳动
预测
深度学习
伟达
大型语言模型
工具
Transformer
RAG
视觉
神器推荐
具身智能
Copilot
模态
亚马逊
AGI
LLaMA
文本
算力
驾驶