AI在线 AI在线

谷歌

Gemini2.5版本发布原生音频功能,AI 对话更加自然

在最近的开发更新中,谷歌更新了 Gemini2.5版本,标志着 AI 音频对话和生成技术的重大进步。 Gemini2.5是一个多模态的 AI 系统,能够原生理解和生成文本、图像、音频、视频和代码,提升了用户与 AI 的互动体验。 Gemini2.5的实时音频对话功能使得人机交流变得更加自然。
6/5/2025 6:00:55 PM
AI在线

重视安全成金字招牌,报告称 Anthropic 持续成功挖角谷歌及 OpenAI 高层

风险投资公司SignalFire基于领英数据的最新报告显示,OpenAI工程师跳槽至Anthropic的人数远多于反向跳槽者,比例高达8:1;而谷歌DeepMind部门的情况更加突出,这一比例达到11:1。
6/5/2025 1:49:18 PM
清源

谷歌 CEO 皮查伊:公司在加大投入 AI 的同时将继续扩招工程师

皮查伊说,未来一段时间谷歌将在工程领域持续投资。“我预计我们当前的工程团队明年还会扩大,因为这让我们能够更充分把握各种机遇。我认为这将极大提升工程师的效率,帮助他们摆脱许多繁琐事务。”
6/5/2025 11:22:15 AM
清源

深度研究白菜化?谷歌将Gemini级AI研究能力开源

谷歌太良心了,推出"gemini-fullstack-langgraph-quickstart"的开源项目,这个项目用Gemini 2.5模型与LangGraph框架的结合,主打快速构建一个能够本地运行的自主进行深度研究的智能代理系统目前github已经飙升到3.5k星了,地址:"研究型AI代理",能够像人类研究员一样工作:它会根据用户的问题动态生成搜索关键词,通过Google搜索获取信息,分析结果中的知识空白,然后迭代地优化搜索策略,最终提供有充分引用支持的答案技术架构:前后端分离的现代设计前端:React与现代开发体验项目采用了React配合Vite构建工具的前端架构。 Vite的选择体现了对开发效率的重视——它提供了极快的热重载功能,让开发者能够实时看到代码改动的效果。 这种即时反馈对于调试复杂的AI交互界面特别重要,因为你需要频繁测试不同的用户输入场景后端:LangGraph的强大编排能力后端使用了LangGraph框架,这是一个专门为构建复杂AI工作流而设计的工具。
6/5/2025 9:05:36 AM

让AI像人类一样认知真实世界!UCLA谷歌强强联手,长时记忆+3D空间理解超越基线16.5%

想象一下,你在一个陌生的房子里寻找合适的礼物盒包装泰迪熊,需要记住每个房间里的物品特征、位置关系,并根据反馈调整行动。 这一系列过程依赖人类强大的空间-时间长时记忆。 图片如何让AI在3D环境中像人类一样思考,一直是具身智能领域的难题。
6/4/2025 11:08:28 AM

谷歌暂停推出 AI 驱动的 “Ask Photos” 功能,以解决性能问题

根据最新消息,谷歌已经暂停了其在 Google Photos 中推出的 AI 驱动 “Ask Photos” 功能。 该功能自去年秋季以来逐步扩展,但目前并未达到预期的效果。 谷歌 Photos 的产品经理 Jamie Aspinall 在社交平台 X 上表示:“询问照片功能还未达到我们希望的水平。
6/4/2025 10:01:25 AM
AI在线

谷歌 DeepMind 负责人:AI 变革邮箱管理、对抗内容算法推荐,通用人工智能未来 5~10 年实现

在 SXSW 伦敦站活动中,谷歌 DeepMind 首席执行官戴密斯・哈萨比斯(Demis Hassabis)表示,人工智能(AI)在迅猛发展下,其引发的巨大变革,不亚于互联网诞生或工业革命。
6/4/2025 8:48:37 AM
故渊

​谷歌推出AI Edge Gallery应用,实现离线智能手机AI处理

谷歌近期悄然推出了一款名为 AI Edge Gallery 的实验性 Android 应用,允许用户在不连接互联网的情况下直接在智能手机上运行复杂的人工智能模型。 这标志着谷歌在边缘计算和隐私保护方面迈出了重要一步。 AI Edge Gallery 应用支持用户从知名的 Hugging Face 平台下载和执行 AI 模型,能够实现图像分析、文本生成、编程辅助和多轮对话等功能,且所有数据处理均在本地完成,增强了用户的隐私保护。
6/3/2025 10:01:09 AM
AI在线

谷歌 Gemini Live 功能正式登陆 iOS 平台,开启 AI 识别新体验

近日,谷歌宣布其创新的 Gemini Live 功能现已正式上线苹果 iOS 和 iPadOS 平台,但目前仅限于美国地区的用户体验。 这项新功能允许用户通过 Gemini App,轻松享受 AI 识别场景和屏幕内容的便利。 令人惊喜的是,这一切都是免费的,无需额外的订阅费用。
6/3/2025 9:01:10 AM
AI在线

谷歌 Gemini Live 功能登陆苹果 iOS / iPadOS 平台,美区可体验 AI 识屏识场景

谷歌宣布Gemini Live功能已登陆iOS平台(需美区),用户可通过Gemini App体验AI识别场景和屏幕内容。只需点击摄像头按钮,Gemini Live即可调用设备后置摄像头进行AI识别,快速回应并提出见解。#谷歌AI# #iOS新功能#
6/3/2025 7:51:09 AM
漾仔

谷歌悄然推出“AI Edge Gallery”应用:可在手机本地运行 AI 模型

谷歌发布Google AI Edge Gallery应用,支持手机离线运行Hugging Face的AI模型,可生成图像、回答问题等。无需联网,直接利用手机处理器计算。目前为实验性Alpha版本,安卓可用,iOS即将推出。#AI应用# #谷歌黑科技#
6/1/2025 7:06:39 AM
远洋

谷歌野心藏不住!劈柴哥放话:AI比互联网更颠覆!智能体将打造新的中间平台生态;记者:Chrome被卖了咋办?

出品 | 51CTO技术栈(微信号:blog51cto)I/O大会,谷歌用Gmini 2.5 Pro、Veo 3证明了自己在AI领域的绝对实力。 刚刚,知名科技媒体Verge放出了谷歌CEO劈柴哥的采访,看完发现——谷歌的AI逆袭绝非偶然! 在24年,谷歌还在被OpenAI追着打的时候,劈柴哥就曾表示大厂的AI竞争并非一朝一夕之功,如果眼光放长远些,短期内谁领先、谁落后,其实并不重要。
5/31/2025 9:32:35 PM
伊风

谷歌 Veo 视频生成模型走红后,国外网友开始上传“人扮 AI”内容博取关注

TikTok 等社交平台迅速被大量 AI 视频充斥。这款模型可在短短几秒内生成高度真实的八秒钟短片,配备音效与对口对白,内容涵盖挑战视频、虚构新闻,甚至是超现实短剧,引发用户广泛尝试与转发。
5/31/2025 7:57:19 PM
清源

谷歌 DeepMind 最强 AI 手语翻译模型:SignGemma 登场,打破手语沟通壁垒

谷歌 DeepMind 团队于 5 月 27 日宣布推出 SignGemma,是其迄今为止最强大的手语翻译模型,可将手语转化为口语文本,该开源模型将于今年晚些时候加入 Gemma 模型家族。
5/31/2025 11:24:22 AM
故渊

谷歌联合创始人 Sergey Brin 揭秘:AI 爱吃“罚酒”,受威胁后反而提升性能

在出席迈阿密举办的 All-In-Live 活动中,谷歌联合创始人谢尔盖・布林(Sergey Brin)抛出新观点,有时候恐吓人工智能(AI)模型,反而能刺激提升其表现。
5/31/2025 10:43:01 AM
故渊

谷歌 AI 概览被指无法正确回答“今年是哪一年”,官方紧急修复

谷歌发言人表示:“和所有搜索功能一样,我们会持续改进,并通过这类案例更新系统。绝大多数 AI 概览都能提供有用且准确的信息,我们正着手修复这一类问题。”
5/30/2025 7:54:20 PM
清源

谷歌联合创始人谢尔盖・布林:AI 颠覆搜索,从导航工具升级为洞见提供者

在最新访谈节目中,谷歌联合创始人谢尔盖・布林(Sergey Brin)分享了对未来人工智能(AI)的观点,他认为 AI 彻底改变在线搜索,从根本上改变“搜索”的定义。
5/30/2025 2:23:52 PM
故渊

​谷歌推出 AI 购物新功能,实现虚拟试穿与个性化购物体验

在刚刚结束的2025年谷歌 IO 大会上,谷歌宣布推出一系列全新的 AI 购物功能,这标志着 AI 在零售领域应用的重大转变。 此次新功能包括为在线顾客提供的虚拟试穿、个性化价格跟踪以及结合 Gemini 技术和谷歌购物图谱的新视觉面板,后者为用户提供超过500亿个产品的访问权限。 AI 购物模式最早于三月在搜索实验室推出,而此次公告中,该功能将在美国全面商用。
5/30/2025 10:01:19 AM
AI在线