资讯列表
CoT推理大溃败?哈佛华人揭秘:LLM一思考,立刻就「失智」
DeepSeek-R1火了,推理模型火了,思维链(Chain-of-Thought,CoT)火了! 模型很聪明,问题是:它还听你的话吗? 思维链很好,但代价呢?
谷歌发布新型 Android XR 眼镜原型:轻巧设计与强大 AI 助手的完美结合
在刚刚结束的2025年 I/O 开发者大会上,谷歌向我们展示了其最新的 Android XR 眼镜原型。 与市场上已有的 AR 设备相比,这款眼镜在设计和功能上都展现出了新的高度。 虽然官方尚未公布具体的销售计划,但谷歌透露,他们将与知名品牌 Warby Parker 和 Gentle Monster 合作,推出搭载 Gemini AI 的时尚 AR 智能眼镜。
面壁智能获新一轮数亿元融资 推动「端侧大脑」规模化应用
面壁智能宣布完成新一轮数亿元融资,本轮融资由洪泰基金、国中资本、清控金信和茅台基金联合投资。 这一融资的完成,将为面壁智能在高效大模型技术、产品壁垒、行业赋能与生态拓展方面奠定坚实基础,推动“端侧大脑”在千行百业的规模化应用。 面壁智能是一家专注于打造高效大模型的公司,以“高效”为第一性原理,致力于在同等参数下实现更高的性能、更低的成本、更低的功耗和更快的速度。
谷歌Gemini Live正式登陆iPhone:让AI“看懂”你的屏幕与摄像头!
近日,在2025年 I/O 开发者大会上,谷歌宣布其最新功能 Gemini Live 正式向 iOS 和安卓用户开放。 这项革命性的功能可以实时识别并回应用户手机摄像头和屏幕上的内容,进一步提升了人机交互的体验。 最初,Gemini Live 只面向 Gemini Advanced 高级用户,但谷歌在今年4月宣布计划扩大其覆盖范围,现在,这一功能已经成功引入到 iOS 平台,成为所有用户的新玩具。
百度文心 X1 Turbo 大放异彩,斩获信通院最高评级!
在5月20日举行的百度 AI Day 上,中国信息通信研究院(信通院)公布了最新的大模型推理能力评估结果,令众多科技爱好者为之振奋。 百度的文心大模型 X1Turbo 成为国内首个获得 “4 级” 最高评级的大模型,这一成就让人刮目相看。 此次评估共涵盖24项能力,X1Turbo 在其中表现不凡,16项能力满分达到5分,展示了其强大的技术实力。
美图与阿里巴巴达成战略合作 获得2.5亿美元投资
2025年5月20日,美图公司宣布与阿里巴巴达成战略合作,并获得2.5亿美元的投资。 这一合作标志着双方将在电商平台、AI技术、云计算等多个领域展开深度合作,共同推动技术创新和业务发展。 根据公告,阿里巴巴以可转债的形式对美图公司进行投资,投资总额为2.5亿美元,净筹资额约为2.496亿美元。
全球首款Android XR旗舰AR眼镜发布,Google与XREAL共筑AR新生态
在Google I/O开发者大会上,Google宣布与中国AR科技公司XREAL达成深度战略合作,联合发布全球首款专为Android XR平台打造的旗舰级AR眼镜——Project Aura。 该产品采用光学透视(OST)技术,标志着AR产业正式迈入“安卓时刻”。 Project Aura是Google在XR平台生态战略中的关键部署,也再次巩固了XREAL在全球AR技术领域的领先地位。
从文本到电影!谷歌Veo3 震撼发布:4K画质、音视频一体生成
在2025年5月20日举办的Google I/O开发者大会上,谷歌正式发布了其最新一代视频生成模型Veo3,标志着人工智能视频生成技术迈向新高峰。 Veo3不仅在画质和真实感上显著提升,还首次集成了原生音频生成功能,为视频创作者提供了前所未有的创作可能性。 以下是AIbase整理的关于Veo3的核心亮点与技术突破。
UC伯克利5千美元造全开源人形机器人,网友:这作业抄定了
仅需5000美元就能实现人形机器人3D打印? UC伯克利这次又又又整新活了! 注意看,画面中这个正在认真写名字的小家伙,就是来自UC伯克利的最新作品——人形机器人Berkeley Humanoid Lite (BHL)。
ICRA 2025|通用多机器人长时任务规划框架破解任务分配难题,成功率+105%、效率+36%
2025 年 5 月,美国加州大学河滨分校 (UC Riverside) 与宾夕法尼亚州立大学 (Penn State University) 联合团队在机器人领域顶级会议 ICRA 2025 上发布最新研究成果 LaMMA-P(Generalizable Multi-Agent Long-Horizon Task Allocation and Planning with LM-Driven PDDL Planner)。 LaMMA-P 首次将大型语言模型与 PDDL 规划器深度融合,解决了异构多机器人系统中长时任务的自动分解与分配难题,大幅提升多机器人协同规划的智能水平。 该技术在全新基准数据集上经过大量模拟实验验证,相比现有最先进方法 SMART-LLM,任务成功率提高 105%,执行效率提升 36%,在复杂长程任务规划上取得了突破性进展,为异构多机器人协同完成复杂任务提供了全新解决方案。
ICML 2025 Spotlight | 多模态大模型暴露短板?EMMA基准深度揭秘多模态推理能力
「三个点电荷 Q、-2Q 和 3Q 等距放置,哪个向量最能描述作用在 Q 电荷上的净电力方向? 」在解这道题时,我们可以通过绘制受力分析草图轻松解决。 但即使是先进的多模态大语言模型,如 GPT-4o,也可能在理解「同性相斥」的基本物理原则时,错误地判断斥力的方向(例如,错误地将 3Q 对 Q 的斥力方向判断为右下方而非正确的左上方)。
代码、多模态检索全面登顶SOTA!智源BGE向量模型三连击,并全面开放
检索增强技术在代码及多模态场景中的发挥着重要作用,而向量模型是检索增强体系中的重要组成部分。 针对这一需求,近日,智源研究院联合多所高校研发了三款向量模型,包括代码向量模型 BGE-Code-v1,多模态向量模型 BGE-VL-v1.5 以及视觉化文档向量模型 BGE-VL-Screenshot。 这些模型取得了代码及多模态检索的最佳效果,并以较大优势登顶 CoIR、Code-RAG、MMEB、MVRB 等领域内主要测试基准。
MCP或将成为AI界的HTTP
译者 | 陈峻审校 | 重楼由Claude 人工智能(AI)模型家族背后的公司--Anthropic推出的通信协议MCP(模型上下文协议,Model Context Protocol)可谓2025年的流行协议。 目前,包括Google和OpenAI在内的几乎所有主要AI公司都接受了MCP,并使之正在成为AI模型的标准化通信方式。 下面,我将向你详细介绍什么是MCP,如何构建一个基础的MCP服务器,及其工作原理。
继 Vite 之后,ESLint 也接入了 AI!
在之前的文章中有分享过 Vite 是首个接入 AI 能力的构建工具,而现在 ESLint 也紧随其后,使用 AI 来管理代码规范! 作为一名前端开发,咱们平时写代码的时候,代码规范这事儿一直挺让人头疼的吧。 不过现在好消息来了!
骄傲藏不住!谷歌CEO劈柴哥5.20深夜开大:15项重磅炸弹,两大Gemini前沿方向!中国队Xreal成为谷歌XR原型机代表
编辑 | 云昭北京时间5月21日凌晨1点,谷歌 CEO Sundar Pichai 准点走进坐落于加州山景城的著名露天圆形剧场 Shoreline Amphitheatre,发表了 Google IO 2025 大会的主题演讲。 全程一部定影的时间, 115 分钟,可谓是给 5.20 的深夜奉上了一场别样的谷歌之声。 先说整体感受,整体上如大部分媒体所预料的:Andriod 已经退出焦点,AI 可以说是全部。
一些银行高管预测,GenAI可能承担高达40%的工作量
根据毕马威四月份发布的一项调查,60%的银行高管将GenAI列为今年的首要投资重点。 毕马威最近对银行高管进行的一项调查显示,近一半的受访者预计,到今年年底,GenAI将能够处理其团队21%至40%的日常任务。 银行在AI方面的投入巨大:根据毕马威四月份发布的一份报告,60%的银行高管表示,尽管经济存在不确定性,GenAI仍是他们今年的首要投资重点。
第二波!2025年5月精选实用设计干货合集
大家好,这是 2025 年 5 月第二波干货合集! 这一期的干货合集还是从设计工具合集网站开始的,有非常好用可靠的在线 logo 生成工具,面向非程序员的在线开发 AI 工具,对于设计师同学而言也是不可多得的好东西,此外还有专门生成 Airbnb 风格的等轴测图标的 AI 工具,以及生成自定义渐变背景的工具,以及高品质免费背景素材合集。 当然,在继续阅读下去之前,记得看看往期干货中有没有你感兴趣的素材:.
RAG与微调,大语言模型的“大脑升级”,该选哪条路?(小白科普)
最近在做项目时,我发现有些甲方对RAG和模型微调分区的不太清楚,明明大语言模型(LLM)加挂RAG就可以解决的问题,却坚持要微调,但是具体沟通后发现,其实只是不太了解二者的实际用途。 其实,Retrieval-Augmented Generation (RAG) 和微调 (Fine-Tuning) 是两种最常用的LLM的“大脑升级”技术,虽然它们都能提升模型的性能,但工作原理和适用场景却大相径庭。 今天,我就来深入聊聊这两种技术,弄清楚在不同情况下,到底该选 RAG 还是微调。