Gemini
力压DeepSeek-R1!谷歌Gemini 2.0系列集体上新,全员跻身大模型竞技场前10
终于,谷歌DeepMind坐不住了,出手就是超越DeepSeek-R1! 劈柴哥亲自官宣Gemini 2.0家族更新,分别是Gemini 2.0 Flash、Gemini 2.0 Pro、Gemini 2.0 Flash-Lite。 同时,稳居大模型竞技场第1名的推理模型Gemini 2.0 Flash Thinking,已在Gemini App中推出。
Gemini 回复存虚假信息,谷歌超级碗广告“翻车”
在谷歌威斯康星州的广告中,一位奶酪商请求 Gemini 为“Smoked Gouda(烟熏高达奶酪)”撰写一段吸引奶酪爱好者的描述。谷歌的 AI 模型确实生成了一段文案,但这段文案中出现了“全球超过一半的奶酪消费是高达奶酪”这样的说法。即使是普通消费者,也能轻易察觉到这一说法的可疑之处。尽管高达奶酪确实美味,但其在全球奶酪消费中的占比远没有广告中所说的那么高,人们更常听到的奶酪种类是切达奶酪或马苏里拉奶酪。
谷歌 Gemini 2.0 Flash 系列 AI 模型登场,编程和推理性能迈上新台阶
谷歌公司昨日(2 月 5 日)发布博文,邀请所有 Gemini 应用用户,访问最新 Gemini 2.0 Flash 应用模型,并放开 2.0 Flash Thinking 推理实验模型。
搅动推理 AI 模型风云:谷歌被曝 1 月 23 日发布增强版 Gemini 2.0 Flash Thinking
消息源 @sir04680280 于 1 月 19 日发布博文,报道称观看谷歌黑客马拉松直播时,发现谷歌升级版 Gemini AI 模型“Gemini 2.0 Flash Thinking Exp-0123”,暗示 1 月 23 日发布。
人类全程没碰一个字,谷歌 Gemini 不到 4 小时写完 10 万字商业战略书籍
初创公司 DeepWriter 宣布:世界第一部完全由 AI 写作的 10 万字商业竞争书籍诞生了!全程没有人类参与工作,不到 4 小时,即可完成约 10 万单词的商业书籍创作。
谷歌 CEO 皮查伊认为 Gemini 能力“市面最强”,已超越竞争对手
据《华尔街日报》今日报道,谷歌CEO桑达尔·皮查伊认为,自家的AI技术在市场上处于领先地位,但要想让消费者真正关注仍需更多努力。
基于谷歌Gemini多模态模型实现PDF文档自动化处理
译者 | 朱先忠审校 | 重楼引言近年来,自动化文档处理成为ChatGPT革命的最大赢家之一,因为LLM能够在零样本设置中处理广泛的主题和任务,这意味着无需域内标记的训练数据。 这使得构建AI驱动的应用程序来处理、解析和自动理解任意文档变得更加容易。 虽然使用LLM的简单方法仍然受到非文本上下文(例如图形、图像和表格)的阻碍,但是这正是我们将在本文中尝试解决的问题,而且我们特别关注PDF文件格式。
谷歌 CEO 皮查伊:明年风险高、赌注大,推广 Gemini 是首要任务
皮查伊表示,“我认为2025年将是关键的一年。我们需要深刻认识到当前的紧迫性,并加快公司步伐。这是一个具有颠覆性影响的时刻,我们必须专注于推动技术带来的变革,解决用户的实际问题。”
谷歌被曝正使用 Anthropic 的 Claude 模型来改进其 Gemini AI
据 TechCrunch 获得的内部通信内容显示,参与改进谷歌 Gemini 人工智能模型的承包商正在将其答案与 Anthropic 的竞品模型 Claude 的输出进行比较。此举引发了谷歌是否获得 Anthropic 授权使用 Claude 进行测试的合规性质疑。
谷歌“新技能”陆续推送:Gemini 帮你快速总结 PDF 内容
使用“询问此PDF”功能需要拥有 Gemini Advanced 订阅、将 Gemini 设置为安卓手机的默认助手,并且设备需要运行 Android 15 系统。
谷歌拓展 Gemini AI 深度研究模式,支持中文等 40+ 语言
谷歌公司本周五发布公告,宣布旗下 Gemini AI 的深度研究模式(in-depth research mode),现在已支持中文等 40 多种语言。
谷歌首个通用推理模型登场:揭秘 AI 推理“黑匣子”,登顶 Arena LLM 排行榜
谷歌 AI Studio 平台昨日(12 月 19 日)发布实验性的“Gemini 2.0 Flash Thinking”模型,主打“清晰展现思考过程”,是谷歌第一个通用推理模型。
谷歌新规引担忧:消息称外包人员被迫评估自己不擅长的 Gemini 回复
据 TechCrunch 报道,谷歌针对其大型语言模型 Gemini 回复的外包评估流程进行了一项调整,引发了外界对其在敏感领域信息准确性的担忧。这项调整要求外包评估员不得再像以往那样,因自身专业知识不足而跳过某些特定的评估任务,这或将导致 Gemini 在医疗保健等高度专业性领域的信息输出出现偏差。
谷歌 Gemini 2.0 成“P 图神器”,各种 P 图只需一句话
输入指令“把这辆车改装成敞篷车”,它就能立马将文字指令和图片结合起来,完成一键 P 图。
谷歌:“AI 概览”功能计划明年面向更多国家、更多语言开放
谷歌首席执行官桑达尔·皮查伊表示,会将Gemini 2.0的高级推理能力融入AI Overviews(AI概览),未来将能够处理“更复杂的主题”以及“多模态”和“多步骤”的搜索,包括高级数学问题和编程问题。
谷歌测试 Gemini AI 游戏助手:实时分析屏幕以提供游戏建议
谷歌今日发布了 Gemini 2.0,并透露正在探索如何利用该模型构建 AI 游戏助手来理解视频游戏规则,从而为用户提供帮助。谷歌 DeepMind 首席执行官 Demis Hassabis 和首席技术官 Koray Kavukcuoglu 在一篇博文中表示,这些 AI 助手能够“仅基于屏幕上的画面对游戏进行推理,并通过实时对话为玩家提供后续操作建议。”他们还提到,这些助手还可以“利用谷歌搜索,将玩家与网络上丰富的游戏知识连接起来。”
谷歌深夜炸场:Gemini 2.0 正式发布,号称迄今智能体时代最有能力的 AI 模型
谷歌正式发布Gemini 2.0,号称迄今为止为智能体时代最有能力的AI模型,带来了增强的性能、更多的多模态性和新的原生工具使用。
YouTube 自动配音功能推广至更多知识类频道,借助 AI 生成视频多语言配音
YouTube当地时间周二宣布,其自动配音功能已开始推广至更多的频道,创作者可为其视频生成多种语言的翻译音频。此前,这项功能仅限于少数创作者进行测试。