AI
谷歌年度大招:所有AI模型全升级一遍!Gemini2.5大杯中杯霸榜前二,新版视频/图像模型亮相
原生多模态输入输出、智能体、联网搜索……所有前沿AI能力集成在一起会怎么样? 谷歌最新版Project Astra展示了终极AI助手的能力:以下视频来源于谷歌黑板报实时观察周围环境,搜索资料指导小哥修自行车,零件不够还能自动电话询问周边商店有没有货。 在最新的I/O大会上,谷歌连续放大招,就好像大招不要钱。
5/21/2025 9:04:00 AM
百度文心 X1 Turbo 大放异彩,斩获信通院最高评级!
在5月20日举行的百度 AI Day 上,中国信息通信研究院(信通院)公布了最新的大模型推理能力评估结果,令众多科技爱好者为之振奋。 百度的文心大模型 X1Turbo 成为国内首个获得 “4 级” 最高评级的大模型,这一成就让人刮目相看。 此次评估共涵盖24项能力,X1Turbo 在其中表现不凡,16项能力满分达到5分,展示了其强大的技术实力。
5/21/2025 9:01:06 AM
AI在线
美图与阿里巴巴达成战略合作 获得2.5亿美元投资
2025年5月20日,美图公司宣布与阿里巴巴达成战略合作,并获得2.5亿美元的投资。 这一合作标志着双方将在电商平台、AI技术、云计算等多个领域展开深度合作,共同推动技术创新和业务发展。 根据公告,阿里巴巴以可转债的形式对美图公司进行投资,投资总额为2.5亿美元,净筹资额约为2.496亿美元。
5/21/2025 9:01:06 AM
AI在线
谷歌Gemini Live正式登陆iPhone:让AI“看懂”你的屏幕与摄像头!
近日,在2025年 I/O 开发者大会上,谷歌宣布其最新功能 Gemini Live 正式向 iOS 和安卓用户开放。 这项革命性的功能可以实时识别并回应用户手机摄像头和屏幕上的内容,进一步提升了人机交互的体验。 最初,Gemini Live 只面向 Gemini Advanced 高级用户,但谷歌在今年4月宣布计划扩大其覆盖范围,现在,这一功能已经成功引入到 iOS 平台,成为所有用户的新玩具。
5/21/2025 9:01:06 AM
AI在线
从文本到电影!谷歌Veo3 震撼发布:4K画质、音视频一体生成
在2025年5月20日举办的Google I/O开发者大会上,谷歌正式发布了其最新一代视频生成模型Veo3,标志着人工智能视频生成技术迈向新高峰。 Veo3不仅在画质和真实感上显著提升,还首次集成了原生音频生成功能,为视频创作者提供了前所未有的创作可能性。 以下是AIbase整理的关于Veo3的核心亮点与技术突破。
5/21/2025 9:01:05 AM
AI在线
UC伯克利5千美元造全开源人形机器人,网友:这作业抄定了
仅需5000美元就能实现人形机器人3D打印? UC伯克利这次又又又整新活了! 注意看,画面中这个正在认真写名字的小家伙,就是来自UC伯克利的最新作品——人形机器人Berkeley Humanoid Lite (BHL)。
5/21/2025 8:53:00 AM
ICRA 2025|通用多机器人长时任务规划框架破解任务分配难题,成功率+105%、效率+36%
2025 年 5 月,美国加州大学河滨分校 (UC Riverside) 与宾夕法尼亚州立大学 (Penn State University) 联合团队在机器人领域顶级会议 ICRA 2025 上发布最新研究成果 LaMMA-P(Generalizable Multi-Agent Long-Horizon Task Allocation and Planning with LM-Driven PDDL Planner)。 LaMMA-P 首次将大型语言模型与 PDDL 规划器深度融合,解决了异构多机器人系统中长时任务的自动分解与分配难题,大幅提升多机器人协同规划的智能水平。 该技术在全新基准数据集上经过大量模拟实验验证,相比现有最先进方法 SMART-LLM,任务成功率提高 105%,执行效率提升 36%,在复杂长程任务规划上取得了突破性进展,为异构多机器人协同完成复杂任务提供了全新解决方案。
5/21/2025 8:52:00 AM
ICML 2025 Spotlight | 多模态大模型暴露短板?EMMA基准深度揭秘多模态推理能力
「三个点电荷 Q、-2Q 和 3Q 等距放置,哪个向量最能描述作用在 Q 电荷上的净电力方向? 」在解这道题时,我们可以通过绘制受力分析草图轻松解决。 但即使是先进的多模态大语言模型,如 GPT-4o,也可能在理解「同性相斥」的基本物理原则时,错误地判断斥力的方向(例如,错误地将 3Q 对 Q 的斥力方向判断为右下方而非正确的左上方)。
5/21/2025 8:47:00 AM
代码、多模态检索全面登顶SOTA!智源BGE向量模型三连击,并全面开放
检索增强技术在代码及多模态场景中的发挥着重要作用,而向量模型是检索增强体系中的重要组成部分。 针对这一需求,近日,智源研究院联合多所高校研发了三款向量模型,包括代码向量模型 BGE-Code-v1,多模态向量模型 BGE-VL-v1.5 以及视觉化文档向量模型 BGE-VL-Screenshot。 这些模型取得了代码及多模态检索的最佳效果,并以较大优势登顶 CoIR、Code-RAG、MMEB、MVRB 等领域内主要测试基准。
5/21/2025 8:35:00 AM
继 Vite 之后,ESLint 也接入了 AI!
在之前的文章中有分享过 Vite 是首个接入 AI 能力的构建工具,而现在 ESLint 也紧随其后,使用 AI 来管理代码规范! 作为一名前端开发,咱们平时写代码的时候,代码规范这事儿一直挺让人头疼的吧。 不过现在好消息来了!
5/21/2025 8:10:00 AM
小4子
一些银行高管预测,GenAI可能承担高达40%的工作量
根据毕马威四月份发布的一项调查,60%的银行高管将GenAI列为今年的首要投资重点。 毕马威最近对银行高管进行的一项调查显示,近一半的受访者预计,到今年年底,GenAI将能够处理其团队21%至40%的日常任务。 银行在AI方面的投入巨大:根据毕马威四月份发布的一份报告,60%的银行高管表示,尽管经济存在不确定性,GenAI仍是他们今年的首要投资重点。
5/21/2025 7:05:00 AM
Caitlin
AI幻觉引爆网络安全危机 专家揭示了三大防御策略
对现实世界的影响“如果一家公司的智能体利用了过时或不准确的数据,AI幻觉可能会虚构出并不存在的漏洞,或错误解读威胁情报,导致不必要的警报或忽视真正的风险。 此类错误可能会分散对真正威胁的注意力,创造新的漏洞,并浪费本已紧张的安全运营团队资源。 ”Tanium的AI副总裁HarmanKaur在接受采访时表示。
5/21/2025 1:00:00 AM
Mirko Zorz
谷歌Imagen 4与Imagen 4 Fast亮相GCP Vertex配额菜单,AI图像生成迈向新高度
谷歌云平台(GCP)Vertex AI的配额下拉菜单中新增了Imagen4和Imagen4Fast选项,预示着这两款下一代AI图像生成模型即将迎来更广泛的推广。 继Imagen3的成功后,Imagen4系列以更强大的多模态生成能力和低延迟特性,为开发者与企业用户带来了前所未有的视觉创作体验。 AIbase综合最新社交媒体动态,深入解析Imagen4的技术亮点及其对AI图像生成领域的深远影响。
5/20/2025 6:00:45 PM
AI在线
Flowith NEO发布!全球首款无限步骤、上下文与工具的AI Agent
Flowith正式发布Agent NEO,号称全球首个支持无限步骤、无限上下文、无限工具的AI智能代理。 这款由10人小团队在云南Vibe Hackathon中诞生的创新产品,凭借其强大的云端执行能力和多模态协作功能,迅速引发全球开发者社区的热议。 AIbase综合最新社交媒体动态,深入解析Agent NEO的技术突破及其对AI生产力工具领域的深远影响。
5/20/2025 5:00:45 PM
AI在线
Public “Generated Assets”重磅上线!AI一键生成投资指数
投资平台Public宣布推出全新AI驱动产品“Generated Assets”,允许用户通过简单文本输入投资理念,即可生成定制化的投资指数,并提供历史回报对比和实时表现跟踪。 这一功能因其类似“氛围投资”的创新模式引发热议,被认为是零售投资领域的重大突破。 AIbase综合最新社交媒体动态,深入解析Generated Assets的技术亮点及其对投资市场的深远影响。
5/20/2025 4:00:45 PM
AI在线
60+头部企业关于AI的思想碰撞,都在这场大会里
最近由150位全球顶尖AI创始人参与的红杉资本AI峰会刷爆AI产业圈,关于大热的智能体经济、大模型、机器人商业化...来自OpenAI、英伟达、谷歌等公司的AI大佬们给出了他们的洞察——AI不再卖工具,而是卖收益。 它正在从“技术产品”进化为一种新的经济运行方式。 这一观点通俗来讲,就是客户不会因为你的AI产品功能好不好来买单,他们只为能帮他挣钱的产品买单。
5/20/2025 3:36:54 PM
手机流畅处理128K长文本,vivo端侧新算法突破内存限制 | ACL 2025
在端侧设备上处理长文本常常面临计算和内存瓶颈。 vivo AI研究院推出的EdgeInfinite算法专为端侧设备设计,让设备处理超长文本时更加高效流畅,该方法能够在不到10GB GPU内存的设备上处理长达128K tokens的输入。 该研究成果已中稿ACL 2025。
5/20/2025 3:14:39 PM
微软宣布Windows11原生支持MCP
微软宣布对 Windows 系统进行重大升级,以支持一种名为模型上下文协议(MCP)的新标准。 这一标准由 Anthropic 于去年推出,常被称为 “AI 应用的 USB-C 端口”。 MCP 的引入,将使得开发者能够更加便捷地让他们的 AI 应用与其他应用、网络服务及 Windows 的各个部分进行互动。
5/20/2025 3:00:45 PM
AI在线
资讯热榜
Microsoft Releases 700 Real AI Cases to Explore New Intelligent Work Models
微软发布 700 个真实 AI 案例,探索智能化工作新模式
Li Hang, head of ByteDance AI Lab, resigns; Seed team enters adjustment period
Former DeepSeek executive secretly starts new AI Agent project, already backed by top VC
OpenAI Upgrades ChatGPT Search Functionality to Provide More Precise and Smarter Responses
消息称 OpenAI 已同谷歌敲定一份云 AI 算力交易,减少对微软依赖
MiniMax-M1开源!1M超长上下文推理,AI新王者仅53万美元打造!
突破传统!FUDOKI 模型让多模态生成与理解更灵活、更高效
标签云
人工智能
AI
OpenAI
AIGC
模型
ChatGPT
DeepSeek
AI绘画
谷歌
数据
机器人
大模型
Midjourney
用户
智能
开源
微软
GPT
Meta
学习
图像
技术
AI创作
Gemini
论文
马斯克
Stable Diffusion
算法
代码
英伟达
Anthropic
芯片
开发者
生成式
蛋白质
腾讯
训练
神经网络
智能体
研究
3D
生成
苹果
计算
机器学习
Sora
Claude
AI设计
AI for Science
GPU
AI视频
人形机器人
搜索
华为
百度
场景
大语言模型
xAI
LLM
预测
伟达
深度学习
字节跳动
Transformer
Agent
工具
模态
视觉
神器推荐
具身智能
文本
RAG
LLaMA
算力
Copilot
大型语言模型
驾驶
API
应用
架构