AI在线 AI在线

应用

AI解数学题只靠最后一个token

AI解数学题只靠最后一个token

henry 发自 凹非寺. 量子位 | 公众号 QbitAI大语言模型在解心算题时,只依赖最后一个token? 最近,来自加州大学圣克鲁兹分校、乔治·梅森大学和Datadog的研究人员发现:在心算任务中,几乎所有实际的数学计算都集中在序列的最后一个token上完成,而不是分散在所有token中。
9/14/2025 1:37:10 PM henry
为这一个Tab键,我愿意单独付费:Cursor用在线强化学习优化代码建议,护城河有了?

为这一个Tab键,我愿意单独付费:Cursor用在线强化学习优化代码建议,护城河有了?

Cursor Tab 是 Cursor 的核心功能之一,它通过分析开发者的编码行为,智能预测并推荐后续代码,开发者仅需按下 Tab 键即可采纳。 然而,它也面临着一个 AI 普遍存在的难题:「过度热情」。 有时,它提出的建议不仅毫无用处,甚至会打断开发者的思路。
9/14/2025 1:32:00 PM 机器之心
用同一组提示词,横向测评30+热门AI绘画平台(中)

用同一组提示词,横向测评30+热门AI绘画平台(中)

前言. 常见的 AI 生图模型大概有以下这些:黑森林的 flux kontext、flux krea、flux dev、flux pro、flux krea、flux1.1,谷歌的 imagen-4、nano-banana,OpenAI 的 Gpt-4o,以及国内的 Dreamina3.1、Qwen3、Wan2.2、星流,还有就是老牌的 Midjourney、Ideogram、即梦、豆包、可灵、海螺等其他平台。 当有设计需求,无论是要出主图还是找创意灵感时,我习惯根据具体使用场景,把提示词放到对应的平台上尝试。
9/14/2025 1:06:09 AM AI设计师Lena
2025北京文化论坛AI沙龙重磅举办!海淀率先破「百模」规模,105款大模型占全国五分之一

2025北京文化论坛AI沙龙重磅举办!海淀率先破「百模」规模,105款大模型占全国五分之一

人工智能正在深刻改写文化生产方式,而数字艺术正成为最鲜活的见证。 9月13日,2025北京文化论坛平行论坛首场沙龙在海淀成功举办,聚焦“AI重塑数字内容生产”主题。 本次活动由北京市委网信办承办,海淀区委网信办、东升镇人民政府、快手联合协办。
9/13/2025 9:56:59 PM 思邈
Arm拥抱AI:五倍性能,三倍能效

Arm拥抱AI:五倍性能,三倍能效

构建芯片架构的 Arm,也全面拥抱 AI 了。 9 月 10 日,在上海举行的活动上,Arm 全新 Arm Lumex 计算子系统(Compute Subsystem,CSS)平台正式全球发布。 作为每年全球新款手机 SoC 的核心,今年的 Arm 解决方案重磅更新,让人们不得不关注。
9/13/2025 8:31:00 PM 李泽南
Meta开源MobileLLM-R1模型,不到1B参数,用1/10的训练就超越了Qwen3

Meta开源MobileLLM-R1模型,不到1B参数,用1/10的训练就超越了Qwen3

与其他全开源模型相比,性能提升2-5倍。 小参数模型也进入了 R1 时代,这次开源出新技术的是 Meta。 本周五,Meta AI 团队正式发布了 MobileLLM-R1。
9/13/2025 6:23:00 PM 机器之心
数据与AI双引擎驱动智能未来,2025外滩大会论数据进化之道

数据与AI双引擎驱动智能未来,2025外滩大会论数据进化之道

可供大模型训练的人类数据越来越少,Scaling Law正在缓慢失效,智能的上限,如何再次突破? 9月12日,在2025 Inclusion·外滩大会“Data meets AI:智能时代的双引擎”见解论坛上,产学界的多位权威专家给出了新解法:数据驱动了AI发展,AI也让数据迎来了新一轮的进化,双引擎融合驱动才是演进方向。 论坛由中国人工智能学会、上海交通大学与蚂蚁集团联合主办。
9/13/2025 4:55:00 PM 新闻助手
攻克强化学习「最慢一环」!交大字节联手,RL训练速度飙升2.6倍

攻克强化学习「最慢一环」!交大字节联手,RL训练速度飙升2.6倍

强化学习的训练效率,实在是太低了! 随着DeepSeek、GPT-4o、Gemini等模型的激烈角逐,大模型“深度思考”能力的背后,强化学习(RL)无疑是那把最关键的密钥。 然而,这场竞赛的背后,一个巨大的瓶颈正悄然限制着所有玩家的速度——相较于预训练和推理,RL训练更像一个效率低下的“手工作坊”,投入巨大但产出缓慢。
9/13/2025 4:45:23 PM 鹭羽
他同时参与创办OpenAI/DeepMind,还写了哈利波特同人小说

他同时参与创办OpenAI/DeepMind,还写了哈利波特同人小说

这是硅谷版世界末日传教士Eliezer Yudkowsky的最新论点。 Yudkowsky用现在的话说,是个不折不扣的斜杠青年,是MIRI创始人,也是著名的哈利波特同人文作者。 但最引人注目的身份则是一手缔造OpenAI和谷歌DeepMind的中之人。
9/13/2025 4:43:06 PM 鹭羽
AI水论文还得AI治:西湖大学首次模拟人类专家思考链,AI审稿分钟级给出全面反馈

AI水论文还得AI治:西湖大学首次模拟人类专家思考链,AI审稿分钟级给出全面反馈

审稿不用再等了,高质量的AI审稿平台来了! 如今,AI生成的论文数量激增,如何从海量的AI “水文”中筛选出真正高质量的研究成果,已经成为学术界必须直面的难题。 为此,西湖大学自然语言处理实验室推出了首个AI生成学术成果的开放预印本平台AiraXiv,以及首个模拟人类专家思考链的AI审稿人系统DeepReview。
9/13/2025 2:10:27 PM 梦晨
扩散语言模型也有MoE版本了!蚂蚁&人大从头训练LLaDA-MoE,即将完全开源

扩散语言模型也有MoE版本了!蚂蚁&人大从头训练LLaDA-MoE,即将完全开源

挑战自回归的扩散语言模型刚刚迎来了一个新里程碑:蚂蚁集团和人大联合团队用 20T 数据,从零训练出了业界首个原生 MoE 架构扩散语言模型 LLaDA-MoE。 该模型虽然激活参数仅 1.4B,但性能可以比肩参数更多的自回归稠密模型 Qwen2.5-3B,而且推理速度更快。 这为扩散语言模型的技术可行性提供了关键验证。
9/12/2025 9:34:00 PM 机器之心
高德AI出行智能体“小高老师”月活突破4亿

高德AI出行智能体“小高老师”月活突破4亿

在近日召开“高德扫街榜”产品发布会上,高德地图对外宣布,其面向出行生活打造的智能体(Agent)“小高老师”单日调用量已达12亿次。 最新数据显示,上线不到一个月,“小高老师”的月活跃用户数已突破4亿,同时它也成为高德连接用户与生活服务的重要载体。 目前,高德地图上每天有1.2亿次生活服务AI搜索,而“小高老师”日均推荐的生活服务类点位超6300万个。
9/12/2025 8:49:01 PM 量子位的朋友们
医学教育革命来袭!复旦中山医院推出AI教学大模型,培养有温度的未来医生

医学教育革命来袭!复旦中山医院推出AI教学大模型,培养有温度的未来医生

医学这门古老而神圣的学科,正在经历一场前所未有的教育变革。 知识爆炸式增长,临床实践日益复杂,传统的医学教育模式已经难以跟上时代的步伐。 面对这些挑战,复旦大学附属中山医院在9月12日交出了一份令人瞩目的答卷。
9/12/2025 5:36:07 PM AI在线
​支付宝推出 AI 智能皮肤检测:轻松拍脸获取肤质报告与护理建议

​支付宝推出 AI 智能皮肤检测:轻松拍脸获取肤质报告与护理建议

在2025Inclusion 外滩大会上,支付宝的蚂蚁 AI 健康管家 AQ 发布了多项新功能。 其中最引人注目的便是全新上线的 “AI 智能皮肤检测” 功能。 用户只需拍摄自己的脸部照片,便能迅速获得一份详细的肤质检测报告和个性化的护理建议。
9/12/2025 5:36:07 PM AI在线
外滩大会嘉宾锐评AGI即将“撞墙”,正在向数字与物理世界进化

外滩大会嘉宾锐评AGI即将“撞墙”,正在向数字与物理世界进化

9月11日,2025 Inclusion·外滩大会“AGI:数字与物理世界的共同进化”见解论坛成功举办。 本次论坛由蚂蚁集团主办,中国信通院华东分院承办,智源社区与智东西支持,汇聚了来自学术界、产业界的十余位顶尖专家,共同探讨人工智能技术的最新进展和实际应用。 大模型参数破万亿后,Scaling Law边际收益递减,“单点暴力”已难撬动通用智能。
9/12/2025 5:17:00 PM 新闻助手
清华首次提出数据驱动控制新形式,算法效率直翻三倍

清华首次提出数据驱动控制新形式,算法效率直翻三倍

当大数据席卷各行各业,控制理论也迎来新的拐点:从依赖模型到依赖数据。 但是,在数据驱动控制领域,却缺乏一种标准化的数据表示形式。 针对这一问题,清华大学李升波教授课题组(iDLab)首次将现代控制理论中的标准型概念引入数据驱动控制(datatic control)范式,提出了一种基于数据的系统描述新形式。
9/12/2025 5:03:51 PM 时令
倒计时1天 | 来服贸会参加一场贯穿AI与算力全景生态的活动

倒计时1天 | 来服贸会参加一场贯穿AI与算力全景生态的活动

2025年,AI技术演进正呈指数级加速,当我们惊叹于AIGC的创造力时,你是否想过,我们日常接触的AI应用,或许只是整个庞大技术体系中的冰山一角? 应用之下,是由算力、数据、模型和基础设施共同构筑的庞大基石。 吴恩达教授在最近的公开发言中也指出,AI技术栈从底层的半导体,到云平台,再到基础模型,环环相扣,最大的机会存在于应用层。
9/12/2025 5:00:17 PM 量子位的朋友们
实测!Qwen下一代基础架构突袭!秒解AIME数学竞赛题,提速10倍+性价比提升10倍

实测!Qwen下一代基础架构突袭!秒解AIME数学竞赛题,提速10倍+性价比提升10倍

时令 发自 凹非寺. 量子位 | 公众号 QbitAIQwen下一代模型架构,抢先来袭! Qwen3-Next发布,Qwen团队负责人林俊旸说,这就是Qwen3.5的抢先预览版。
9/12/2025 4:51:17 PM 时令