资讯列表
百度文心 X1 Turbo 大放异彩,斩获信通院最高评级!
在5月20日举行的百度 AI Day 上,中国信息通信研究院(信通院)公布了最新的大模型推理能力评估结果,令众多科技爱好者为之振奋。 百度的文心大模型 X1Turbo 成为国内首个获得 “4 级” 最高评级的大模型,这一成就让人刮目相看。 此次评估共涵盖24项能力,X1Turbo 在其中表现不凡,16项能力满分达到5分,展示了其强大的技术实力。
5/21/2025 9:01:06 AM
AI在线
从文本到电影!谷歌Veo3 震撼发布:4K画质、音视频一体生成
在2025年5月20日举办的Google I/O开发者大会上,谷歌正式发布了其最新一代视频生成模型Veo3,标志着人工智能视频生成技术迈向新高峰。 Veo3不仅在画质和真实感上显著提升,还首次集成了原生音频生成功能,为视频创作者提供了前所未有的创作可能性。 以下是AIbase整理的关于Veo3的核心亮点与技术突破。
5/21/2025 9:01:05 AM
AI在线
全球首款Android XR旗舰AR眼镜发布,Google与XREAL共筑AR新生态
在Google I/O开发者大会上,Google宣布与中国AR科技公司XREAL达成深度战略合作,联合发布全球首款专为Android XR平台打造的旗舰级AR眼镜——Project Aura。 该产品采用光学透视(OST)技术,标志着AR产业正式迈入“安卓时刻”。 Project Aura是Google在XR平台生态战略中的关键部署,也再次巩固了XREAL在全球AR技术领域的领先地位。
5/21/2025 9:01:05 AM
AI在线
UC伯克利5千美元造全开源人形机器人,网友:这作业抄定了
仅需5000美元就能实现人形机器人3D打印? UC伯克利这次又又又整新活了! 注意看,画面中这个正在认真写名字的小家伙,就是来自UC伯克利的最新作品——人形机器人Berkeley Humanoid Lite (BHL)。
5/21/2025 8:53:00 AM
ICRA 2025|通用多机器人长时任务规划框架破解任务分配难题,成功率+105%、效率+36%
2025 年 5 月,美国加州大学河滨分校 (UC Riverside) 与宾夕法尼亚州立大学 (Penn State University) 联合团队在机器人领域顶级会议 ICRA 2025 上发布最新研究成果 LaMMA-P(Generalizable Multi-Agent Long-Horizon Task Allocation and Planning with LM-Driven PDDL Planner)。 LaMMA-P 首次将大型语言模型与 PDDL 规划器深度融合,解决了异构多机器人系统中长时任务的自动分解与分配难题,大幅提升多机器人协同规划的智能水平。 该技术在全新基准数据集上经过大量模拟实验验证,相比现有最先进方法 SMART-LLM,任务成功率提高 105%,执行效率提升 36%,在复杂长程任务规划上取得了突破性进展,为异构多机器人协同完成复杂任务提供了全新解决方案。
5/21/2025 8:52:00 AM
ICML 2025 Spotlight | 多模态大模型暴露短板?EMMA基准深度揭秘多模态推理能力
「三个点电荷 Q、-2Q 和 3Q 等距放置,哪个向量最能描述作用在 Q 电荷上的净电力方向? 」在解这道题时,我们可以通过绘制受力分析草图轻松解决。 但即使是先进的多模态大语言模型,如 GPT-4o,也可能在理解「同性相斥」的基本物理原则时,错误地判断斥力的方向(例如,错误地将 3Q 对 Q 的斥力方向判断为右下方而非正确的左上方)。
5/21/2025 8:47:00 AM
代码、多模态检索全面登顶SOTA!智源BGE向量模型三连击,并全面开放
检索增强技术在代码及多模态场景中的发挥着重要作用,而向量模型是检索增强体系中的重要组成部分。 针对这一需求,近日,智源研究院联合多所高校研发了三款向量模型,包括代码向量模型 BGE-Code-v1,多模态向量模型 BGE-VL-v1.5 以及视觉化文档向量模型 BGE-VL-Screenshot。 这些模型取得了代码及多模态检索的最佳效果,并以较大优势登顶 CoIR、Code-RAG、MMEB、MVRB 等领域内主要测试基准。
5/21/2025 8:35:00 AM
MCP或将成为AI界的HTTP
译者 | 陈峻审校 | 重楼由Claude 人工智能(AI)模型家族背后的公司--Anthropic推出的通信协议MCP(模型上下文协议,Model Context Protocol)可谓2025年的流行协议。 目前,包括Google和OpenAI在内的几乎所有主要AI公司都接受了MCP,并使之正在成为AI模型的标准化通信方式。 下面,我将向你详细介绍什么是MCP,如何构建一个基础的MCP服务器,及其工作原理。
5/21/2025 8:27:54 AM
陈峻
继 Vite 之后,ESLint 也接入了 AI!
在之前的文章中有分享过 Vite 是首个接入 AI 能力的构建工具,而现在 ESLint 也紧随其后,使用 AI 来管理代码规范! 作为一名前端开发,咱们平时写代码的时候,代码规范这事儿一直挺让人头疼的吧。 不过现在好消息来了!
5/21/2025 8:10:00 AM
小4子
骄傲藏不住!谷歌CEO劈柴哥5.20深夜开大:15项重磅炸弹,两大Gemini前沿方向!中国队Xreal成为谷歌XR原型机代表
编辑 | 云昭北京时间5月21日凌晨1点,谷歌 CEO Sundar Pichai 准点走进坐落于加州山景城的著名露天圆形剧场 Shoreline Amphitheatre,发表了 Google IO 2025 大会的主题演讲。 全程一部定影的时间, 115 分钟,可谓是给 5.20 的深夜奉上了一场别样的谷歌之声。 先说整体感受,整体上如大部分媒体所预料的:Andriod 已经退出焦点,AI 可以说是全部。
5/21/2025 7:45:43 AM
云昭
一些银行高管预测,GenAI可能承担高达40%的工作量
根据毕马威四月份发布的一项调查,60%的银行高管将GenAI列为今年的首要投资重点。 毕马威最近对银行高管进行的一项调查显示,近一半的受访者预计,到今年年底,GenAI将能够处理其团队21%至40%的日常任务。 银行在AI方面的投入巨大:根据毕马威四月份发布的一份报告,60%的银行高管表示,尽管经济存在不确定性,GenAI仍是他们今年的首要投资重点。
5/21/2025 7:05:00 AM
Caitlin
第二波!2025年5月精选实用设计干货合集
大家好,这是 2025 年 5 月第二波干货合集! 这一期的干货合集还是从设计工具合集网站开始的,有非常好用可靠的在线 logo 生成工具,面向非程序员的在线开发 AI 工具,对于设计师同学而言也是不可多得的好东西,此外还有专门生成 Airbnb 风格的等轴测图标的 AI 工具,以及生成自定义渐变背景的工具,以及高品质免费背景素材合集。 当然,在继续阅读下去之前,记得看看往期干货中有没有你感兴趣的素材:.
5/21/2025 5:46:33 AM
陈子木
RAG与微调,大语言模型的“大脑升级”,该选哪条路?(小白科普)
最近在做项目时,我发现有些甲方对RAG和模型微调分区的不太清楚,明明大语言模型(LLM)加挂RAG就可以解决的问题,却坚持要微调,但是具体沟通后发现,其实只是不太了解二者的实际用途。 其实,Retrieval-Augmented Generation (RAG) 和微调 (Fine-Tuning) 是两种最常用的LLM的“大脑升级”技术,虽然它们都能提升模型的性能,但工作原理和适用场景却大相径庭。 今天,我就来深入聊聊这两种技术,弄清楚在不同情况下,到底该选 RAG 还是微调。
5/21/2025 3:00:00 AM
贝塔街的万事屋
谷歌 AI Pro 和 AI Ultra 订阅计划公布,每月 19.99 美元起
Google AI Pro 订阅价格为每月 19.99 美元(IT之家注:现汇率约合 144 元人民币),包括 Gemini 2.5 Pro、视频生成模式 Veo 2,以及 2TB 云存储。
5/21/2025 2:43:28 AM
汪淼
谷歌最强视频生成 AI 模型 Veo3 亮相:制作背景音、人物对话都不在话下
在今年的I/O开发者大会上,谷歌发布新一代视频生成模型Veo3,这也是其首个可生成视频背景音效的模型。它不仅能合成画面,还能为鸟鸣或街头交通等场景配上相应的音效。
5/21/2025 2:32:44 AM
清源
谷歌最强文生图 AI 模型 Imagen 4 亮相:比上一代快 10 倍,文字效果更好
magen 4 生成的图像更精致,细节更丰富,AI 味道也更少。此外,Imagen 4 可以更好地生成文字、排版设计。
5/21/2025 2:25:36 AM
汪淼
网上买衣服可虚拟试穿,谷歌 AI 搜索新功能亮相
如果用户对衣服满意,谷歌搜索还可以使用智能体功能去自动购买连衣裙。用户可以设定一个目标价格,智能体就会去跟踪网络上的价格,并在价格下降时通知用户,随后用户只需在通知中点击“替我购买”,即可完成下单。
5/21/2025 2:17:01 AM
汪淼
AI 拍“大片”:谷歌发布电影创作应用 Flow,脚本、分镜、镜头控制都能做
Flow 还内置了一整套视频制作工具,用户不仅能控制“摄像机”运动轨迹、调整拍摄角度,还能编辑与延展镜头,并为 AI 视频添加多种转场效果。
5/21/2025 2:11:49 AM
清源