AI在线 AI在线

谷歌

Jeff Dean演讲回顾LLM发展史,Transformer、蒸馏、MoE、思维链等技术都来自谷歌

4 月 14 日,谷歌首席科学家 Jeff Dean 在苏黎世联邦理工学院举办的信息学研讨会上发表了一场演讲,主题为「AI 的重要趋势:我们是如何走到今天的,我们现在能做什么,以及我们如何塑造 AI 的未来? 」在这场演讲中,Jeff Dean 首先以谷歌多年来的重要研究成果为脉络,展现了 AI 近十五年来的发展轨迹,之后又分享了 Gemini 系列模型的发展历史,最后展望了 AI 将给我们这个世界带来的积极改变。 AI在线将在本文中对 Jeff Dean 的演讲内容进行总结性梳理,其中尤其会关注演讲的第一部分,即谷歌过去这些年对 AI 领域做出的奠基性研究贡献。
4/18/2025 1:14:00 PM
机器之心

谷歌大模型“性价比之王”来了!混合推理模型,思考深度可自由控制,竞技场排名仅次于自家Pro

紧跟o4-mini,谷歌上新了Gemini 2.5 Flash preview版本。 作为更注重效率的Flash,在大模型竞技场上排名并列第二,第一是自家的Gemini 2.5 Pro。 这样的表现,让Gemini 2.5 Flash的性价比直接拉满。
4/18/2025 10:43:23 AM

谷歌也要“送 AI 进校园”:美国大学生可限时免费订阅 Google One AI Premium 计划

这一订阅方案不仅提供2TB云存储空间,还包含多项 AI 工具,帮助学生“更高效地学习”。其中,Gemini 2.5 Pro 驱动的 Gemini Advanced,是谷歌为对抗 ChatGPT Plus 推出的旗舰级产品。
4/18/2025 7:39:43 AM
清源

谷歌提出Transformer架构中,表示崩塌、过度压缩的五个解决方法

Transformer架构的出现极大推动了生成式AI的发展,在此基础之上开发出了ChatGPT、Copilot、讯飞星火、文心一言、Midjourney等一大批知名产品。 但Transformer架构并非完美还存在不少问题,例如,在执行需要计数或复制输入序列元素的任务经常会出错。 而这些操作是推理的基本组件,对于解决日常任务至关重要。
4/17/2025 9:53:49 AM
AIGC开放社区

谷歌 Gemini Live 功能全面开放,安卓用户迎来新体验

近日,谷歌宣布其 Gemini 应用中的 Gemini Live 功能将免费向所有安卓用户开放。 这一功能最早于本月早些时候仅限于 Pixel9和三星 Galaxy S25用户,通过 Gemini Advanced 订阅才能使用。 然而,随着用户对 Gemini Live 功能的积极反馈,谷歌决定改变策略,推动这一功能的普及。
4/17/2025 9:01:05 AM
AI在线

AI“立功”:谷歌去年封停了 3920 万个广告账号,超 2023 年三倍

谷歌表示,借助大语言模型和通过识别诸如商业冒充、非法支付信息等信号,目前公司能够在广告投放前就暂停“大多数”广告账户。
4/17/2025 7:42:28 AM
清源

可实时识别屏幕内容,谷歌 Gemini Live 功能向所有安卓用户免费开放

谷歌宣布Gemini Live功能免费向所有安卓用户开放,可实时识别摄像头和屏幕内容并回应。此前仅限Pixel 9和Galaxy S25用户订阅使用。微软同日也推出类似AI工具Copilot Vision。#谷歌Gemini #AI工具
4/17/2025 6:57:40 AM
远洋

Claude终于能Research了!打通谷歌全家桶,工作效率10倍提升

今天凌晨,Anthropic官方推出了两个重磅新功能:Research以及与Google Workspace集成。 Anthropic称Research功能是与Claude合作的新方式。 它能从多个角度分析问题,自动搜索信息,几分钟之内给出答案。
4/16/2025 1:51:29 PM
新智元

英国 AI 版权法规或导致模型偏见与创作者收益减少

近日,政策专家对的 AI 版权法规表示担忧,认为如果不提供全面的文本和数据挖掘豁免,可能会导致 AI 模型质量下降,进而影响创新。 专家指出,禁止像 OpenAI、谷歌和 Meta 这样的公司在英国使用版权材料进行 AI 训练,可能会导致模型输出的偏见,从而削弱其有效性。 英国政府于2024年12月开启了一项咨询,旨在探索如何在使用创意内容训练 AI 模型时保护艺术家、作家和作曲家的权益。
4/16/2025 11:01:34 AM
AI在线

谷歌 Veo 2 视频生成模型入驻 Gemini,用户可创建 8 秒 720p 视频

谷歌宣布将Veo 2视频生成AI模型引入Gemini Advanced订阅服务,用户可创作8秒720p视频并分享至社交平台。同时,Google Labs整合Veo 2推出Whisk Animate功能,静态图秒变动画。AI视频工具崛起也引发创意行业担忧。#谷歌AI##视频生成#
4/16/2025 7:31:28 AM
远洋

认识谷歌 A2A:将颠覆多智能体 AI 系统的协议

近日谷歌在 Cloud Next 25 大会上开源的 Agent2Agent(A2A)协议,无疑成为了该领域一颗耀眼的新星,引发了广泛关注和热议。 这一协议被寄予厚望,有望如同一把神奇的钥匙,开启多智能体 AI 系统高效协作的全新大门,彻底改变当前人工智能应用的格局。 多智能体系统协作之困多智能体系统由多个能够感知环境、自主做出决策并相互协作的智能代理构成,宛如一个庞大而复杂的智能网络。
4/16/2025 12:00:00 AM
大模型之路

谷歌发布 DolphinGemma:AI破译海豚语言:Pixel手机变身“翻译器”

谷歌近日发布了一款开创性的人工智能模型——DolphinGemma,旨在深入理解野生大西洋斑点海豚的交流模式。 该项目由谷歌与野生海豚项目 (WDP) 和佐治亚理工学院的研究人员合作开发,利用WDP近40年来在巴哈马群岛积累的庞大海豚音频和视频记录数据库。 DolphinGemma基于这些珍贵数据进行训练,并采用谷歌先进的音频技术SoundStream分词器将海豚的声音转化为数字格式。
4/15/2025 10:01:28 AM
AI在线

海豚语言被谷歌大模型破译!跨物种交流大门打开,哈萨比斯:下一个是狗

神奇! 人类和海豚真的能实现跨物种交流了? !
4/15/2025 9:53:52 AM
量子位

谷歌 DeepMind 开发 DolphinGemma AI 模型,助力海豚“语言”研究

谷歌DeepMind推出DolphinGemma AI模型,可生成海豚声音序列,助力科学家研究海豚沟通方式。该模型基于Gemma系列构建,训练数据来自Wild Dolphin Project,甚至能在手机上运行。今夏WDP将用Pixel 9搭建平台,进一步提升研究效率。#AI科技# #动物行为研究#
4/15/2025 7:51:50 AM
远洋

谷歌计划融合 Gemini 与 Veo 模型,打造全能 AI 助手

谷歌DeepMind CEO透露,计划将Gemini AI与Veo视频生成模型融合,提升AI对物理世界的理解能力。Gemini已支持多模态,可生成图像、文本和音频,行业正朝“全能”模型发展。#AI技术##谷歌Gemini#
4/13/2025 8:53:57 AM
远洋

谷歌 Gemini AI 新功能 Circle Screen 曝光:圈选截屏特定区域,实现精准搜索

谷歌Gemini AI新功能Circle Screen曝光,用户可圈选屏幕特定区域实现精准搜索,提升交互体验。类似安卓旗舰机的Circle to Search功能,但更聚焦于某一对象。#谷歌Gemini##AI新功能#
4/12/2025 8:45:30 AM
故渊

谷歌进军“AI 影视圈”野心大:推出专项计划鼓励制作人机关系主题影片

谷歌宣布将与Range Media联合启动该计划,邀请具有远见的电影人创作原创叙事作品,深入呈现人类与 AI 之间复杂的互动。
4/11/2025 11:03:28 AM
清源

Grok-3四档定价揭秘:低至0.3美元/百万token,硬刚谷歌Meta

GenAI竞争,越来越激烈了。 据Similar  Web统计,在日活跃用户方面,Grok与Gemini展开了激烈竞争。 两者都已经超过50万日活跃用户,差距不足5万。
4/11/2025 9:29:15 AM
新智元