谷歌

美国新闻媒体联盟致信贸易委员会、司法部，要求调查谷歌在新闻领域的垄断行为

美国“新闻 / 媒体联盟”（News / Media Alliance）本周致信美国联邦贸易委员会和美国司法部，敦促两部门调查谷歌垄断数字新闻出版的行为，并要求阻止谷歌通过其“无处不在”的搜索产品中使用生成式 AI 进行进一步扩张。“新闻 / 媒体联盟”关注的焦点是谷歌最新推出的“AI Overviews（AI 概述）”，并声称这一功能擅自利用出版商内容对用户的查询作全面回应，因而引起人们的警惕。该机构表示，谷歌通过利用出版商的专有资料，不仅有可能使内容创作者失去重要的流量，还破坏了数字新闻传播的基本完整性。“新闻

6/2/2024 11:20:09 PM 清源

谷歌：正在修复“吃胶水”等奇怪 AI 摘要，数据空缺及用户“恶搞”系主因

谷歌搜索部门主管 Liz Reid 当地时间 30 日发长文，针对近期出现的 AI Overviews 搜索给出的重大事实错误内容作进一步的回应。Liz Reid 解释说，诸如“吃胶水”“吃石头”等奇怪的建议，是数据空缺和用户的“恶搞”所造成的。“此外，还有大量伪造的截图被广泛传播，其中一些伪造的结果显而易见且十分愚蠢。另一些则暗示我们为诸如将狗留在车内、孕妇吸烟和抑郁症等话题提供了危险的结果。这些 AI 概述从未出现过。因此，我们鼓励任何遇到这些截图的人亲自进行搜索以进行验证。”例如“我应该吃多少块石头”的回答，

5/31/2024 8:17:17 PM 清源

2D头像生成3D虚拟人开视频会，谷歌新作让人难绷

未来人与人的交流，难道是这个样？开视频远程会议的时候，很多人都不喜欢打开摄像头。即使开了，在界面上大家也都被框在不同的窗口里。虽然这种形式操作起来很方便，但总是缺乏点临场感。最近，谷歌提出了一项研究旨在解决这个问题，这个名叫 ChatDirector 的技术可以使用静态的 2D 头像生成 3D 虚拟人，让大家一同「坐在会议室里」开会，只是看起来样子有点夸张： ChatDirector 通过空间化视频头像、虚拟环境和自动布局转换，构建了一个拟真的虚拟环境。虽说只是

5/31/2024 3:13:00 PM 机器之心

Chromebook Plus 笔记本迎来谷歌 Gemini 加持，AI 功能助力写作、图片处理等

谷歌今日宣布将把 Gemini 人工智能以及该公司其他设备上的 AI 功能引入 Chromebook Plus 笔记本电脑，其中包括华硕、惠普已经在售的机型，以及宏碁即将推出的新品。这些现有和未来的 Chromebook Plus 机型都将支持谷歌的“帮助我写作”等新功能，以及使用生成式 AI 创建自定义壁纸的功能。谷歌相册的魔法编辑器（Magic Editor）也将在 Chromebook Plus 上可用，该功能此前已登陆部分老款安卓设备。IT之家注意到，谷歌在应用 Dock 栏上添加了 Gemini 图标，以

5/28/2024 10:52:51 PM 远洋

谷歌 CEO 皮查伊：未来几年的 AI 可能会给人一种“具备意识”的假象

谷歌 CEO 桑达尔・皮查伊近日接受 YouTube 科技创作者 Hayls World 采访，讨论了当下正如火如荼的 AI 革命的方方面面，并透露了谷歌对 AI 的愿景。IT之家汇总部分问答如下：在马斯克提出 AI 将使大部分工作变得“可有可无”不久后，皮查伊也表达了类似的观点，强调了 AI 的普遍影响。采访一开始，主持人便问皮查伊“为什么要使用谷歌的 AI”，皮查伊回答说，AI 将为我们所做的一切带来极大影响。“使用 AI 的原因有很多种，它会让你的体验变得更好，它会帮你总结一些内容，帮你节省时间，你还可以和

5/27/2024 9:27:49 PM 清源

荣耀即将推出首款搭载谷歌 Gemini AI 的智能手机，预计面向海外市场

感谢荣耀终端有限公司宣布，即将推出首款搭载谷歌 Gemini AI 及相关功能的智能手机。IT之家援引 CNBC 消息，荣耀一位发言人透露，即将推出的设备将集成谷歌 Gemini AI、文本到图像生成工具 Imagen 2 等生成式 AI 服务，并且由 Google Cloud 提供相关的服务支持。今年初，荣耀终端有限公司推出其新一代的 MagicOS 8.0 中已经嵌入了自研端侧 7B “魔法大模型”，搭配内置的 YOYO 助理，已经实现了场景感知、意图决策、用户理解能力，支持自然语言、语音、图片、手势、眼动等多

5/27/2024 5:25:14 PM 满河（实习）

谷歌 CEO 承认 AI 摘要功能存在“幻觉”问题：尚无解决方案

谷歌搜索新推出的“AI 摘要（AI Overviews）”功能近日备受诟病，原因是该功能经常提供严重错误的搜索结果信息，例如，该功能曾建议用户使用胶水来防止披萨上的奶酪滑落。图源 Pexels本周早些时候，据科技媒体 The Verge 报道，谷歌首席执行官桑达尔・皮查伊在接受采访时承认，这些“AI 摘要”功能产生的“幻觉”是大型语言模型（LLM）的“固有缺陷”，而大型语言模型正是“AI 摘要”功能的核心技术。皮查伊表示，这个问题目前尚无解决方案（is still an unsolved problem）。这意味着

5/26/2024 8:26:17 PM 远洋

披萨上涂胶水、建议用户吃石头、毒蘑菇……谷歌又被大模型带沟里

继「把马斯克画成黑人」后，谷歌 AI 再度闯祸。近日，有网友使用谷歌的 AI Overview 功能进行搜索，却得到了一堆离谱的回答。例如，告诉用户在披萨上涂胶水，或者建议他们吃石头等。谷歌 AI「满嘴跑火车」的回答迅速在社交媒体上发酵，甚至有网友发出了「谷歌已死」的慨叹。为此，谷歌不得不争分夺秒地手动禁用某些搜索的 AI Overview 功能，对这些问题进行修复和优化。谷歌的 AI Overviews 是一个增强搜索引擎结果的功能，利用人工智能技术，在搜索结果顶部提供 AI 生成的答案。在美国地区，谷歌主要和

5/25/2024 6:11:00 PM 机器之心

谷歌回应 AI 搜索建议网友吃石头、毒蘑菇等重大事实错误内容

谷歌今天通过 NeoWin 媒体，针对近期出现的 AI Overviews 搜索给出的重大事实错误内容，发布相关声明，表示会继续改进相关算法进行修正。IT之家翻译谷歌官方声明内容如下：绝大多数人工智能概述都提供了高质量的信息，并附有深入挖掘的网络链接。基于我们的观测情况，网友分享的很多示例并非常见查询，且部分示例存在被篡改或无法重现的情况。我们在推出 AI Overviews 之前，也按照现有搜索新功能的测试方法，已经进行了广泛的测试，我们感谢大家的反馈。我们将根据内容政策迅速采取适当措施，并利用这些示例对我们的系

5/25/2024 8:48:18 AM 故渊

谷歌 AI 搜索闯大祸：建议网友吃石头、毒蘑菇，把胶水加到披萨上

感谢IT之家网友 Coje_He 的线索投递！谷歌 AI 又闯大祸！没认出毒蘑菇、建议用户吃石头、把胶水加到披萨上，瞬间招来海量批评。事情是这样的：有网友在谷歌搜索寻找“芝士和披萨粘不到一块”的解决办法。AI 直接在顶部给出总结指导，看似有模有样，却暗藏陷阱。你还可以把 1/8 杯的无毒胶水加到酱料里，使其更黏。本来大家还只当是寻常的“AI 幻觉”问题，毕竟都加胶水了确实黏啊，逻辑没毛病。真正引爆舆论焦点的，是有人挖出这个建议确实有出处：来自 11 年前网友在“美国贴吧”Reddit 论坛披萨板块的恶搞留言。对比原

5/24/2024 6:57:42 PM 清源

Adobe 预告安卓版 Acrobat 新功能：本地调用 Gemini Nano 汇总 PDF 文档内容

开发者米沙尔・拉赫曼（Mishaal Rahman）昨日发布博文，表示 Adobe 公司将充分利用 Gemini Nano 模型，计划在安卓新版 Acrobat 中实现汇总文档内容等 AI 功能。谷歌推出了名为 AICore 的全新工具，可以让应用开发者调用 Gemini Nano 本地模型。谷歌基本解决所有的技术问题，因开发人员可以专注于为他们的应用程序构建新功能。IT之家从报道中获悉，在谷歌 I / O 主题演讲中，Adobe 表示已着手利用该工具改造 Acrobat 应用程序，实现快速总结 PDF 文件内容，

5/23/2024 8:34:01 AM 故渊

三句不离 AI：谷歌 2024 I / O 开发者大会一文汇总，Gemini、Veo、Imagen 大模型深夜炸场

2024 年谷歌 I / O 开发者大会在公司总部附近的海岸线圆形剧场如期召开。此次大会上出现频率最高的词便是 AI，据谷歌 Gemini AI 模型的统计，整个演说中 AI 一词被提到了 121 次，但实际上可能远不止于此。在这场开发者大会上，谷歌推出了多个引人注目的大模型和 AI 新功能。1、Gemini AI 系列模型在本次开发者大会上发布了包括 Gemini 1.5 Pro、轻量级 Gemini 1.5 Flash 和 Gemini Nano 在内新版本的 Gemini AI 系列模型。Gemini 1.5

5/21/2024 9:59:37 AM 满河（实习）

谷歌Gemini 1.5技术报告：轻松证明奥数题，Flash版比GPT-4 Turbo快5倍

谷歌表示，Gemini 1.5 相比 Claude 3.0 和 GPT-4 Turbo 实现了代际提升。今年 2 月，谷歌上线了多模态大模型 Gemini1.5，通过工程和基础设施优化、MoE 架构等策略大幅提升了性能和速度。拥有更长的上下文，更强推理能力，可以更好地处理跨模态内容。本周五，Google DeepMind 正式发布了 Gemini 1.5 的技术报告，内容覆盖 Flash 版等最近升级，该文档长达 153 页。技术报告链接：，谷歌介绍了 Gemini 1.5 系列模型，它是代表了下一代高计算效率的多

5/18/2024 4:09:00 PM 机器之心

谷歌联合创始人谢尔盖・布林称谷歌眼镜问世“过早”，在 AI 时代将是完美选择

感谢综合 Business Insider、CNET 报道，谷歌联合创始人谢尔盖・布林在今年的谷歌 I / O 大会结束后，接受采访时谈到了智能眼镜相关话题。谢尔盖・布林表示，此次展示的神秘眼镜产品 Project Astra 是 AI 眼镜的“完美硬件”。“这很有趣，因为它就像完美的硬件，它就像十年之后的杀手级应用。”IT之家注：谢尔盖・布林在 2012 年谷歌 I / O 大会上首次展示了谷歌眼镜（Google Glass），2013 年向部分测试者提供，2014 年开始大范围销售，售价 1500 美元。这款眼

5/17/2024 10:45:13 PM 清源

谷歌 CEO 皮查伊：若 OpenAI 用 YouTube 训练 AI ，公司将采取法律行动

感谢CNBC 消息，谷歌公司 CEO 桑达尔・皮查伊表示：如果确定微软支持的 OpenAI 依赖 YouTube 内容来训练能够生成视频的人工智能模型，谷歌将“解决这个问题”（采取法律行动）。IT之家此前报道，OpenAI 首席技术官在接受采访时语焉不详，无法明确说明 Sora 的训练数据来源。当记者追问具体来源是否包含 YouTube 视频时，她竟然表示“我实际上并不确定（I'm actually not sure about that）”。皮查伊在被问及 OpenAI 是否可能违反谷歌的条款和条件时，皮查伊答道

5/17/2024 10:30:31 AM 沛霖（实习）

谷歌 2 小时复仇硬刚 GPT-4o：Gemini 颠覆搜索，视频 AI 对抗 Sora

【新智元导读】被 OpenAI 提前截胡的谷歌，昨天不甘示弱地开启反击！大杀器 Project Astra 效果不输 GPT-4o，文生视频模型 Veo 硬刚 Sora，用 AI 彻底颠覆谷歌搜索，Gemini 1.5 Pro 达到 200 万 token 上下文…… 谷歌轰出一连串武器，对 OpenAI 贴脸开大。谷歌 I / O 2024 如期来了，眼花缭乱地发布了一堆更新。跟 OpenAI 半小时的「小而美」发布会相比，谷歌显然准备得更加充分，当然，时间也相当之长……▲ 2 个多小时的发布会也是挑战着观众们的

5/16/2024 1:24:48 PM 汪淼

谷歌 AI 视频搜索功能演示又翻车，Gemini 给出错误维修建议

在今天的谷歌 I / O 大会上，谷歌大肆宣传其名为 Gemini 的人工智能将接管搜索引擎领域。然而，在其炫酷的演示环节中，Gemini 却再次暴露了所有大型语言模型至今为止都存在的致命缺陷：自信满满地给出错误答案。在 “Gemini 时代下的搜索” 演示片段中，谷歌展示了其视频搜索功能，用户可以通过拍摄短视频并用语音提问进行搜索。演示的例子是一个卡住的胶片相机过片杆，用户询问“为什么扳杆无法移动到底”，Gemini 则识别出问题并提供了维修建议。然而问题在于，Gemini 给出的答案整体而言令人啼笑皆非。谷歌

5/15/2024 4:28:24 PM 远洋

谷歌 Calendar、Tasks 和 Keep 等服务将集成 Gemini

谷歌公司在今天召开的 I / O 2024 开发者大会上，宣布在 Google Calendar、Tasks 和 Keep 应用中整合 Gemini 模型，为用户带来更丰富的 AI 功能。谷歌在开发者大会上表示，Gemini 聊天机器人支持网页或者移动 App 中上传图片操作，IT之家附上谷歌官方例子如下，拍一张学校活动列表的照片，然后让 Gemini 把它们添加到你的个人 Google Calendar 中。谷歌提供的另一个例子是让 Gemini 将食谱中的项目添加到谷歌 Keep 购物清单中。Gemini 负责

5/15/2024 4:06:11 AM 故渊

资讯热榜

标签云

AI 人工智能 OpenAI AIGC 模型 ChatGPT 谷歌 DeepSeek AI新词 AI绘画大模型机器人数据 Midjourney 开源 Meta 微软智能用户 GPT 学习英伟达 Gemini 智能体技术马斯克 Anthropic 图像 AI创作训练 LLM 论文 AI for Science 代码腾讯苹果算法 Agent Claude 芯片具身智能 Stable Diffusion xAI 蛋白质人形机器人开发者生成式神经网络机器学习 AI视频 3D 字节跳动大语言模型 RAG Sora 百度研究 GPU 生成华为工具 AGI 计算生成式AI AI设计大型语言模型搜索亚马逊 AI模型视频生成特斯拉 DeepMind 场景 Copilot 深度学习 Transformer 架构 MCP 编程视觉