AI在线 AI在线

理论

Muon作者仅用一篇博客,就被OpenAI看中了

「许多博士(包括过去的我)都陷入了这样一个误区:认为只有在顶级会议上发表论文才是终极目标。 」AI 云服务商 Hyperbolic CEO Yuchen Jin 如是说。 但现在,发表论文并不与学术影响力直接画等号了。
6/16/2025 2:43:38 PM

20瓦就能运行下一代AI?科学家瞄上了神经形态计算

「西部世界」真的要来了! 科学家们正试图为AI装上人类大脑。 最新进展由美国国家实验室主导。
6/16/2025 2:42:12 PM

10% KV Cache实现无损数学推理!这个开源方法解决推理大模型「记忆过载」难题

推理大模型虽好,但一个简单的算数问题能推理整整三页,还都是重复的“废话”,找不到重点……一种可以把大模型的“碎碎念”转化为可控记忆条目的高效压缩方法,出现了! R-KV开源登场:显存↓90%、吞吐×6.6、准确率=100%。 它可以通过实时对token进行排序,兼顾重要性和非冗余性,仅保留信息丰富且多样化的token,从而解决大模型推理时的冗余问题。
6/16/2025 2:41:07 PM

网页智能体新突破!引入协同进化世界模型,腾讯AI Lab提出新框架

让网页智能体自演进突破性能天花板! 腾讯AI Lab提出WebEvolver框架,通过引入协同进化的世界模型(World Model),让智能体在真实网页环境中实现10%的性能提升。 由此突破现有基于大语言模型(LLM)的网页智能体“自我迭代演进的性能最终会停滞”的瓶颈。
6/16/2025 2:40:40 PM

如何选择最佳多模态大模型压缩方案?哈工大、度小满开源EFFIVLM-BENCH基准测试框架

在金融科技智能化转型进程中,大语言模型以及多模态大模型(LVLM)正成为核心技术驱动力。 尽管 LVLM 展现出卓越的跨模态认知能力,其部署却长期受限于显著的算力瓶颈 —— 大小中等的模型一次多图推理可能需要 100 G 的显存空间,严重制约产业落地。 针对这一技术痛点,哈工大团队联合度小满金融科技正式发布 EFFIVLM-BENCH,业界首个支持跨场景统一评估的多模态大模型高效化基准框架,为学术界提供可复现的压缩方案对比基准,同时赋能工业界实现最优部署策略遴选。
6/16/2025 2:39:56 PM

AI 黑话太多看不懂?一文帮你打通:AI, 机器学习, 大模型, LLM, Agent 都是啥关系?

最近是不是感觉整个世界都在聊AI? 从ChatGPT、Sora、到Cursor… 人工智能正以前所未有的速度和广度渗透进我们的生活和工作。 伴随而来的是一堆高频词汇:大模型(Large Model)、LLM(Large Language Model)、机器学习(Machine Learning)、深度学习(Deep Learning,虽然你没问,但它太重要了,我们也会提一下)、还有最新的智能体(Agent)……哎呀,听得多了,感觉脑袋都成了一锅粥。
6/16/2025 10:05:00 AM
徐述

Thinkless框架:让LLM学会“聪明偷懒”的智慧

大家好,我是肆〇柒。 今天,我想和大家聊一下,我看到关于自适应思考的另外一片论文,它介绍了Thinkless 框架,并且还有开源仓库。 今天我们要了解的 Thinkless 这个框架,由新加坡国立大学的研究人员提出,它能够巧妙地解决当前推理语言模型(LLM)在处理简单问题时过度推理、浪费资源的难题。
6/16/2025 9:40:48 AM
肆零柒

React 正式接入 AI,你知道吗?

最近,React 官方在其 GitHub 仓库中引入了一个实验性项目 —— React MCP Server,通过 MCP 将大模型与 React 编译工具链连接起来。 简单来说,它使 AI 助手不仅能够生成代码,还能以“工具调用”的方式直接参与 React 代码的编译优化和文档查询。 MCP Server 实现了 MCP 协议,并定义了两个主要工具供 AI 使用:编译工具:通过集成 babel-plugin-react-compiler,该工具允许 AI 对传入的 React 组件代码进行编译优化。
6/16/2025 9:36:18 AM
CUGGZ

迈向人工智能的认识论:涌现能力和思路链的忠实性

一、涌现能力:真实现象还是测量幻象过去几年中一个有趣的观察是,随着我们扩大模型规模(在参数和训练数据方面),它们开始展现出较小模型所不具备的全新定性能力。 Wei 等人(2022 年)将这些能力称为涌现能力,并将这种能力定义为“如果某种能力在较小模型中不存在,但在较大模型中存在,则为涌现能力”,以至于“不能简单地通过推断较小模型的性能来预测它”。 换句话说,这种技能不是平稳的改进,而是在模型超过某个规模阈值后突然出现。
6/16/2025 9:28:09 AM
晓晓

全球首次,Transformer「混血」速度狂飙65倍!英伟达已下注

扩散方法打入语言模型领域! 最近,康奈尔博士生Subham Sahoo,在X介绍了扩散大语言模型的最新工作。 这项研究引发了AI研究领域的思考。
6/16/2025 9:13:00 AM

12年博士研究,AI两天爆肝完成!科研效率狂飙3000倍,惊动学术圈

多伦多大学、哈佛MIT等机构联手AI,短短2天内,竟干完了科学家12年的活! 研究一出,在全网掀起了巨震。 沃顿商学院CS教授Ethan Mollick大受震撼,「AI综述论文体量越来越大,而准确性超越了人类」。
6/16/2025 9:12:00 AM

破解三大数据库AI难题!北大&亚马逊推出全球首个图中心RDB基础模型

在企业系统和科学研究中普遍存在、结构复杂的关系型数据库(Relational DataBase, RDB)场景中,基础模型的探索仍处于早期阶段。 这是因为RDB中的多表交互和异质特征,使传统通用大模型在此类结构化环境下难以直接发挥效能。 基于此,北京大学张牧涵团队联合亚马逊云科技共同提出了Griffin:一个具有开创性的、以图为中心的RDB基础模型。
6/16/2025 9:10:00 AM

刚刚!陶哲轩3小时对话流出:AI抢攻菲尔兹奖倒计时

昨天,陶哲轩公开表示:在未来,AI有可能获得菲尔兹奖。 在时长3小时14分钟的节目中,他还讨论了数学和物理学中最难的问题:纳维–斯托克斯问题  万有理论  广义相对论  孪生素数猜想  费马大定理  考拉兹猜想  P=NP 问题一开始,陶哲轩就认为统一物理理论(比如量子力学与广义相对论)之所以难以进展,是因为还没有找到正确的数学语言。 而AI可能帮助人类实现「大统一理论」,至少也是发现过程中的一部分。
6/16/2025 9:07:00 AM

全球程序员炸锅!老黄伦敦放豪言:编程语言的未来是「Human」

你知道人类目前的编程语言到底有多少种? C、C 、C#、Java、Python、PHP、JavaScript、Go、Rust……但不论有多少种,这些都不重要了。 未来也许只会剩下唯一一种编程语言,AI将彻底改写人机交互的定义。
6/16/2025 9:03:00 AM

AI改变世界!微软发布700个真实AI Agent、Copilot应用案例

我们经常会听到AI改变世界的观点,但除了问答、查询、总结之外,似乎很少会看到其他真实的AI应用案例。 所以,微软作为全球AI领导者之一,发布了700个真实的Agent智能体、Microsoft Copilot应用案例,来帮助大家真实地了解到底AI是如何改变我们的工作模式。 这些客户有世界500强企业,有各领域的独角兽,也有世界常青藤名校,业务范围涵盖金融、医疗、科技、教育、汽车制造、零售、电商、能源、航空航天等众多领域。
6/16/2025 9:02:00 AM

比马斯克Neuralink工艺更先进!我国成功开展首例侵入式脑机接口临床试验

用意念操控万物的“脑机接口”,就这样离我们更近了? 据央妈最新报道,我国已成功开展首例侵入式脑机接口临床试验——一位因意外事故导致四肢截肢的男子,现在仅凭意念就能玩五子棋游戏、发短信等等。 这项研究由中国科学院脑科学与智能技术卓越创新中心,联合复旦大学附属华山医院以及相关企业合作完成。
6/16/2025 9:00:00 AM

AI ASMR突然火爆全网!3天狂揽近10万粉丝,一条切水果视频播放量破1650万

短视频平台熬夜冲浪的我突然发现,AI ASMR突然火了? ! 大家可以打开声音欣赏一下这条切割浆果的视频,它拿下了16500000的浏览量。
6/16/2025 8:54:00 AM

谢赛宁敲响学界警钟!AI研究可能陷入一场注定失败的有限游戏

凌晨三点的 AI 实验室,键盘敲击声在空荡的房间回响。 屏幕上,博士生小王、小李、小赵正疯狂调整模型参数,只为在 NeurIPS 截稿前将准确率从 98.2% 刷到 98.5%。 这样的场景,在如今的 AI 学术圈早已见怪不怪。
6/16/2025 8:53:00 AM