应用
谷歌发布新型 Android XR 眼镜原型:轻巧设计与强大 AI 助手的完美结合
在刚刚结束的2025年 I/O 开发者大会上,谷歌向我们展示了其最新的 Android XR 眼镜原型。 与市场上已有的 AR 设备相比,这款眼镜在设计和功能上都展现出了新的高度。 虽然官方尚未公布具体的销售计划,但谷歌透露,他们将与知名品牌 Warby Parker 和 Gentle Monster 合作,推出搭载 Gemini AI 的时尚 AR 智能眼镜。
百度文心 X1 Turbo 大放异彩,斩获信通院最高评级!
在5月20日举行的百度 AI Day 上,中国信息通信研究院(信通院)公布了最新的大模型推理能力评估结果,令众多科技爱好者为之振奋。 百度的文心大模型 X1Turbo 成为国内首个获得 “4 级” 最高评级的大模型,这一成就让人刮目相看。 此次评估共涵盖24项能力,X1Turbo 在其中表现不凡,16项能力满分达到5分,展示了其强大的技术实力。
美图与阿里巴巴达成战略合作 获得2.5亿美元投资
2025年5月20日,美图公司宣布与阿里巴巴达成战略合作,并获得2.5亿美元的投资。 这一合作标志着双方将在电商平台、AI技术、云计算等多个领域展开深度合作,共同推动技术创新和业务发展。 根据公告,阿里巴巴以可转债的形式对美图公司进行投资,投资总额为2.5亿美元,净筹资额约为2.496亿美元。
谷歌Gemini Live正式登陆iPhone:让AI“看懂”你的屏幕与摄像头!
近日,在2025年 I/O 开发者大会上,谷歌宣布其最新功能 Gemini Live 正式向 iOS 和安卓用户开放。 这项革命性的功能可以实时识别并回应用户手机摄像头和屏幕上的内容,进一步提升了人机交互的体验。 最初,Gemini Live 只面向 Gemini Advanced 高级用户,但谷歌在今年4月宣布计划扩大其覆盖范围,现在,这一功能已经成功引入到 iOS 平台,成为所有用户的新玩具。
面壁智能获新一轮数亿元融资 推动「端侧大脑」规模化应用
面壁智能宣布完成新一轮数亿元融资,本轮融资由洪泰基金、国中资本、清控金信和茅台基金联合投资。 这一融资的完成,将为面壁智能在高效大模型技术、产品壁垒、行业赋能与生态拓展方面奠定坚实基础,推动“端侧大脑”在千行百业的规模化应用。 面壁智能是一家专注于打造高效大模型的公司,以“高效”为第一性原理,致力于在同等参数下实现更高的性能、更低的成本、更低的功耗和更快的速度。
全球首款Android XR旗舰AR眼镜发布,Google与XREAL共筑AR新生态
在Google I/O开发者大会上,Google宣布与中国AR科技公司XREAL达成深度战略合作,联合发布全球首款专为Android XR平台打造的旗舰级AR眼镜——Project Aura。 该产品采用光学透视(OST)技术,标志着AR产业正式迈入“安卓时刻”。 Project Aura是Google在XR平台生态战略中的关键部署,也再次巩固了XREAL在全球AR技术领域的领先地位。
从文本到电影!谷歌Veo3 震撼发布:4K画质、音视频一体生成
在2025年5月20日举办的Google I/O开发者大会上,谷歌正式发布了其最新一代视频生成模型Veo3,标志着人工智能视频生成技术迈向新高峰。 Veo3不仅在画质和真实感上显著提升,还首次集成了原生音频生成功能,为视频创作者提供了前所未有的创作可能性。 以下是AIbase整理的关于Veo3的核心亮点与技术突破。
第二波!2025年5月精选实用设计干货合集
大家好,这是 2025 年 5 月第二波干货合集! 这一期的干货合集还是从设计工具合集网站开始的,有非常好用可靠的在线 logo 生成工具,面向非程序员的在线开发 AI 工具,对于设计师同学而言也是不可多得的好东西,此外还有专门生成 Airbnb 风格的等轴测图标的 AI 工具,以及生成自定义渐变背景的工具,以及高品质免费背景素材合集。 当然,在继续阅读下去之前,记得看看往期干货中有没有你感兴趣的素材:.
谷歌 AI Pro 和 AI Ultra 订阅计划公布,每月 19.99 美元起
Google AI Pro 订阅价格为每月 19.99 美元(IT之家注:现汇率约合 144 元人民币),包括 Gemini 2.5 Pro、视频生成模式 Veo 2,以及 2TB 云存储。
谷歌最强视频生成 AI 模型 Veo3 亮相:制作背景音、人物对话都不在话下
在今年的I/O开发者大会上,谷歌发布新一代视频生成模型Veo3,这也是其首个可生成视频背景音效的模型。它不仅能合成画面,还能为鸟鸣或街头交通等场景配上相应的音效。
谷歌最强文生图 AI 模型 Imagen 4 亮相:比上一代快 10 倍,文字效果更好
magen 4 生成的图像更精致,细节更丰富,AI 味道也更少。此外,Imagen 4 可以更好地生成文字、排版设计。
网上买衣服可虚拟试穿,谷歌 AI 搜索新功能亮相
如果用户对衣服满意,谷歌搜索还可以使用智能体功能去自动购买连衣裙。用户可以设定一个目标价格,智能体就会去跟踪网络上的价格,并在价格下降时通知用户,随后用户只需在通知中点击“替我购买”,即可完成下单。
AI 拍“大片”:谷歌发布电影创作应用 Flow,脚本、分镜、镜头控制都能做
Flow 还内置了一整套视频制作工具,用户不仅能控制“摄像机”运动轨迹、调整拍摄角度,还能编辑与延展镜头,并为 AI 视频添加多种转场效果。
谷歌搜索全新 AI 模式亮相:Gemini 2.5、个性化回答、深度搜索等
谷歌今日官宣,谷歌搜索正式迎来 AI 模式,该功能从今日起逐步在美国市场推出。
谷歌 Gemini 2.5 Flash 轻量级模型官宣 6 月到来,2.5 Pro 随后将至
Gemini 2.5 系列模型将获得一项新的文本转语音功能,听起来更自然,甚至可以做到像耳语一样。它还可以使用同一种声音在不同的语言之间切换。
谷歌 Project Mariner 公布,AI 智能体将全面上线 Chrome、搜索、Gemini
该项目此前命名为 Jarvis(贾维斯),在去年年底进行过测试,如今迎来新的进展。
谷歌 Meet 视频会议平台将上线 Gemini“AI 同传”,可还原声音、语气、情感
在今日的 I/O 大会上,谷歌宣布将语音翻译功能引入 Meet视频会议平台。该技术借助 Gemini 人工智能,可将用户语音实时翻译成对方所使用的语言。
蚂蚁武威:下一代「推理」模型范式大猜想
R1 之后,长思维链成为研究下一代基础模型中 “推理”(Reasoning)能力的热门方向。 一方面,R1 证明了大模型深度思考的可行性;与此同时,尽管 R1 展现出了强大的性能,大模型推理的序幕实则才刚刚拉开。 此外,R1 在海外掀桌也给国内人工智能的研究带来一个显著影响,即:越来越多的研究者敢于站在更高视角思考,提出前瞻引领的技术思想。
资讯热榜
标签云
AI
人工智能
OpenAI
AIGC
模型
ChatGPT
谷歌
DeepSeek
AI新词
AI绘画
大模型
机器人
数据
Midjourney
开源
Meta
微软
智能
用户
GPT
学习
英伟达
Gemini
智能体
技术
马斯克
Anthropic
图像
AI创作
训练
LLM
论文
AI for Science
代码
腾讯
苹果
算法
Agent
Claude
芯片
具身智能
Stable Diffusion
xAI
蛋白质
人形机器人
开发者
生成式
神经网络
机器学习
AI视频
3D
字节跳动
大语言模型
RAG
Sora
百度
研究
GPU
生成
华为
工具
AGI
计算
生成式AI
AI设计
大型语言模型
搜索
亚马逊
AI模型
视频生成
特斯拉
DeepMind
场景
Copilot
深度学习
Transformer
架构
MCP
编程
视觉