理论
网页智能体新突破!引入协同进化世界模型,腾讯AI Lab提出新框架
让网页智能体自演进突破性能天花板! 腾讯AI Lab提出WebEvolver框架,通过引入协同进化的世界模型(World Model),让智能体在真实网页环境中实现10%的性能提升。 由此突破现有基于大语言模型(LLM)的网页智能体“自我迭代演进的性能最终会停滞”的瓶颈。
6/16/2025 2:40:40 PM
如何选择最佳多模态大模型压缩方案?哈工大、度小满开源EFFIVLM-BENCH基准测试框架
在金融科技智能化转型进程中,大语言模型以及多模态大模型(LVLM)正成为核心技术驱动力。 尽管 LVLM 展现出卓越的跨模态认知能力,其部署却长期受限于显著的算力瓶颈 —— 大小中等的模型一次多图推理可能需要 100 G 的显存空间,严重制约产业落地。 针对这一技术痛点,哈工大团队联合度小满金融科技正式发布 EFFIVLM-BENCH,业界首个支持跨场景统一评估的多模态大模型高效化基准框架,为学术界提供可复现的压缩方案对比基准,同时赋能工业界实现最优部署策略遴选。
6/16/2025 2:39:56 PM
AI 黑话太多看不懂?一文帮你打通:AI, 机器学习, 大模型, LLM, Agent 都是啥关系?
最近是不是感觉整个世界都在聊AI? 从ChatGPT、Sora、到Cursor… 人工智能正以前所未有的速度和广度渗透进我们的生活和工作。 伴随而来的是一堆高频词汇:大模型(Large Model)、LLM(Large Language Model)、机器学习(Machine Learning)、深度学习(Deep Learning,虽然你没问,但它太重要了,我们也会提一下)、还有最新的智能体(Agent)……哎呀,听得多了,感觉脑袋都成了一锅粥。
6/16/2025 10:05:00 AM
徐述
Thinkless框架:让LLM学会“聪明偷懒”的智慧
大家好,我是肆〇柒。 今天,我想和大家聊一下,我看到关于自适应思考的另外一片论文,它介绍了Thinkless 框架,并且还有开源仓库。 今天我们要了解的 Thinkless 这个框架,由新加坡国立大学的研究人员提出,它能够巧妙地解决当前推理语言模型(LLM)在处理简单问题时过度推理、浪费资源的难题。
6/16/2025 9:40:48 AM
肆零柒
React 正式接入 AI,你知道吗?
最近,React 官方在其 GitHub 仓库中引入了一个实验性项目 —— React MCP Server,通过 MCP 将大模型与 React 编译工具链连接起来。 简单来说,它使 AI 助手不仅能够生成代码,还能以“工具调用”的方式直接参与 React 代码的编译优化和文档查询。 MCP Server 实现了 MCP 协议,并定义了两个主要工具供 AI 使用:编译工具:通过集成 babel-plugin-react-compiler,该工具允许 AI 对传入的 React 组件代码进行编译优化。
6/16/2025 9:36:18 AM
CUGGZ
迈向人工智能的认识论:涌现能力和思路链的忠实性
一、涌现能力:真实现象还是测量幻象过去几年中一个有趣的观察是,随着我们扩大模型规模(在参数和训练数据方面),它们开始展现出较小模型所不具备的全新定性能力。 Wei 等人(2022 年)将这些能力称为涌现能力,并将这种能力定义为“如果某种能力在较小模型中不存在,但在较大模型中存在,则为涌现能力”,以至于“不能简单地通过推断较小模型的性能来预测它”。 换句话说,这种技能不是平稳的改进,而是在模型超过某个规模阈值后突然出现。
6/16/2025 9:28:09 AM
晓晓
全球首次,Transformer「混血」速度狂飙65倍!英伟达已下注
扩散方法打入语言模型领域! 最近,康奈尔博士生Subham Sahoo,在X介绍了扩散大语言模型的最新工作。 这项研究引发了AI研究领域的思考。
6/16/2025 9:13:00 AM
12年博士研究,AI两天爆肝完成!科研效率狂飙3000倍,惊动学术圈
多伦多大学、哈佛MIT等机构联手AI,短短2天内,竟干完了科学家12年的活! 研究一出,在全网掀起了巨震。 沃顿商学院CS教授Ethan Mollick大受震撼,「AI综述论文体量越来越大,而准确性超越了人类」。
6/16/2025 9:12:00 AM
破解三大数据库AI难题!北大&亚马逊推出全球首个图中心RDB基础模型
在企业系统和科学研究中普遍存在、结构复杂的关系型数据库(Relational DataBase, RDB)场景中,基础模型的探索仍处于早期阶段。 这是因为RDB中的多表交互和异质特征,使传统通用大模型在此类结构化环境下难以直接发挥效能。 基于此,北京大学张牧涵团队联合亚马逊云科技共同提出了Griffin:一个具有开创性的、以图为中心的RDB基础模型。
6/16/2025 9:10:00 AM
刚刚!陶哲轩3小时对话流出:AI抢攻菲尔兹奖倒计时
昨天,陶哲轩公开表示:在未来,AI有可能获得菲尔兹奖。 在时长3小时14分钟的节目中,他还讨论了数学和物理学中最难的问题:纳维–斯托克斯问题 万有理论 广义相对论 孪生素数猜想 费马大定理 考拉兹猜想 P=NP 问题一开始,陶哲轩就认为统一物理理论(比如量子力学与广义相对论)之所以难以进展,是因为还没有找到正确的数学语言。 而AI可能帮助人类实现「大统一理论」,至少也是发现过程中的一部分。
6/16/2025 9:07:00 AM
全球程序员炸锅!老黄伦敦放豪言:编程语言的未来是「Human」
你知道人类目前的编程语言到底有多少种? C、C 、C#、Java、Python、PHP、JavaScript、Go、Rust……但不论有多少种,这些都不重要了。 未来也许只会剩下唯一一种编程语言,AI将彻底改写人机交互的定义。
6/16/2025 9:03:00 AM
AI改变世界!微软发布700个真实AI Agent、Copilot应用案例
我们经常会听到AI改变世界的观点,但除了问答、查询、总结之外,似乎很少会看到其他真实的AI应用案例。 所以,微软作为全球AI领导者之一,发布了700个真实的Agent智能体、Microsoft Copilot应用案例,来帮助大家真实地了解到底AI是如何改变我们的工作模式。 这些客户有世界500强企业,有各领域的独角兽,也有世界常青藤名校,业务范围涵盖金融、医疗、科技、教育、汽车制造、零售、电商、能源、航空航天等众多领域。
6/16/2025 9:02:00 AM
比马斯克Neuralink工艺更先进!我国成功开展首例侵入式脑机接口临床试验
用意念操控万物的“脑机接口”,就这样离我们更近了? 据央妈最新报道,我国已成功开展首例侵入式脑机接口临床试验——一位因意外事故导致四肢截肢的男子,现在仅凭意念就能玩五子棋游戏、发短信等等。 这项研究由中国科学院脑科学与智能技术卓越创新中心,联合复旦大学附属华山医院以及相关企业合作完成。
6/16/2025 9:00:00 AM
AI ASMR突然火爆全网!3天狂揽近10万粉丝,一条切水果视频播放量破1650万
短视频平台熬夜冲浪的我突然发现,AI ASMR突然火了? ! 大家可以打开声音欣赏一下这条切割浆果的视频,它拿下了16500000的浏览量。
6/16/2025 8:54:00 AM
谢赛宁敲响学界警钟!AI研究可能陷入一场注定失败的有限游戏
凌晨三点的 AI 实验室,键盘敲击声在空荡的房间回响。 屏幕上,博士生小王、小李、小赵正疯狂调整模型参数,只为在 NeurIPS 截稿前将准确率从 98.2% 刷到 98.5%。 这样的场景,在如今的 AI 学术圈早已见怪不怪。
6/16/2025 8:53:00 AM
首个统一的图像与视频AIGC可解释性检测框架,多榜单SOTA性能
想象一下:你正在浏览社交媒体,看到一张震撼的图片或一段令人震撼的视频。 它栩栩如生,细节丰富,让你不禁信以为真。 但它究竟是真实记录,还是由顶尖 AI 精心炮制的「杰作」?
6/16/2025 8:51:00 AM
突破125年世纪难题!北大校友联手科大少年班才子破解希尔伯特第六问题
1900年,数学大师希尔伯特提出23个数学难题,其中第六个问题——“物理学的公理化”,被称为数学物理的终极挑战。 125年后,北大校友邓煜、中科大少年班马骁与陶哲轩高徒扎赫尔・哈尼终于在这一问题上取得重大突破。 在20世纪,关于第六问题,希尔伯特追问:能否像欧几里得几何一样,为物理学构建严格的数学基础?
6/16/2025 8:49:00 AM
苹果《思考的错觉》再挨批,Claude与人类共著论文指出其三大关键缺陷
几天前,苹果一篇《思考的错觉》论文吸睛无数又争议不断,其中研究了当今「推理模型」究竟真正能否「推理」的问题,而这里的结论是否定的。 论文中写到:「我们的研究表明,最先进的 LRM(例如 o3-mini、DeepSeek-R1、Claude-3.7-Sonnet-Thinking)仍然未能发展出可泛化的解决问题能力 —— 在不同环境中,当达到一定复杂度时,准确度最终会崩溃至零。 」不过,这篇论文的研究方法也受到了不少质疑,比如我们的一位读者就认为「给数学题题干加无关内容,发现大模型更容易答错,而质疑大模型不会推理」的做法并不十分合理。
6/16/2025 8:48:00 AM
资讯热榜
标签云
AI
人工智能
OpenAI
AIGC
模型
ChatGPT
DeepSeek
谷歌
AI绘画
机器人
数据
大模型
Midjourney
开源
智能
Meta
用户
微软
GPT
学习
技术
AI新词
图像
Gemini
智能体
马斯克
AI创作
Anthropic
英伟达
论文
训练
代码
算法
LLM
Stable Diffusion
芯片
腾讯
苹果
蛋白质
Claude
开发者
AI for Science
Agent
生成式
神经网络
机器学习
3D
xAI
研究
人形机器人
生成
AI视频
百度
工具
计算
Sora
GPU
华为
大语言模型
RAG
具身智能
AI设计
字节跳动
搜索
大型语言模型
场景
AGI
深度学习
视频生成
预测
视觉
伟达
架构
Transformer
编程
神器推荐
DeepMind
亚马逊
特斯拉
AI模型