AI在线 AI在线

Gemini

​谷歌被指用 ChatGPT 提升 Gemini,Scale AI 坚决否认

根据近期的报道,谷歌在生成式人工智能领域的竞争似乎正面临新的挑战。 尽管谷歌拥有强大的云计算能力和丰富的人才资源,但在与微软和 OpenAI 的竞争中,谷歌常常被视为处于劣势地位。 微软首席执行官萨提亚・纳德拉曾指出,谷歌在人工智能领域错失了良机,这引发了谷歌母公司 Alphabet 的首席执行官桑达尔・皮查伊的强烈回应。
6/17/2025 9:02:17 AM
AI在线

谷歌被曝用 ChatGPT 训练 Gemini,Scale AI 否认

有文件显示谷歌承包商或用 ChatGPT 训练改进 Bard(现谷歌 Gemini),Scale AI 否认。同时,Meta 拟 143 亿美元部分收购 Scale AI,谷歌不满或终止合作。#谷歌 #Gemini #ChatGPT
6/17/2025 8:11:50 AM
远洋

谷歌搜索推出音频概览功能:AI 生成播客式总结

谷歌搜索推出音频概览功能,利用Gemini模型生成AI播客式总结,两位虚拟主持人互动讲解搜索结果。用户可调整音量和播放速度,还能进一步探索信息来源。#谷歌新功能# #AI应用#
6/15/2025 2:16:47 PM
远洋

谷歌首次增设“首席 AI 架构师”职位,大力加码人工智能战略

谷歌近年来持续整合 DeepMind 与公司整体架构,并试图将其AI技术商业化。不过,尽管行业内技术快速演进,AI仍未为多数公司带来显著回报。与此同时,资本支出却持续攀升。
6/12/2025 11:56:33 AM
清源

刚刚!OpenAI 上线 o3-pro,性能碾压 Gemini 与 Claude,重新定义“模型”

OpenAI发布了它自称“迄今为止最强大”的模型:o3-pro。   ——这是此前发布的推理模型 o3 的“加强版”。 图片o3-pro属于“推理模型”,它可以一步步拆解问题、逻辑严密地得出结论。
6/11/2025 2:48:11 PM

o3 pro一手真体验!上下文喂到断供!大神:o3 pro不会聊天,上帝渴望上下文,认知能力降维打击Gemini、Claude

编辑 | 云昭出品 | 51CTO技术栈(微信号:blog51cto)经历了 5 月份的“买买买”的节奏之后,6月的 OpenAI 终于开始对谷歌的Gemini 2.5 Pro 发起了反击。 今天凌晨,Sam Altman 动作非常密集。 先是宣布 o3 价格“截肢”(价格直接降至 1/5 ),紧接着不到 2 小时后就发布了 o3-pro。
6/11/2025 12:44:40 PM
云昭

​谷歌 Gemini 应用月下载量超越 ChatGPT,用户活跃度仍显不足

自2025年4月底以来,谷歌的 Gemini 应用在全球 Android 下载量上超过了 ChatGPT,每周的安装量达到了600万以上。 然而,ChatGPT 在同一时期的下载量则下降到了300万以下。 这一变化可能得益于谷歌通过其搜索引擎及其他服务的广泛推广,从而为 Gemini 吸引了大量用户。
6/9/2025 11:01:00 AM
AI在线

每天自动获取日历邮件摘要:谷歌 Gemini 安卓版应用新增“Scheduled Actions”功能

谷歌Gemini安卓版应用新增“计划操作”功能,支持预设指令自动执行任务,如获取日历邮件摘要、生成小说大纲等。即日起向Google AI Pro/Ultra会员开放。#谷歌Gemini# #自动化任务#
6/7/2025 9:34:56 AM
漾仔

谷歌 Gemini 上线“计划操作”功能:动动手就能让“AI 秘书”帮你完成任务

“计划操作”目前仅向订阅 Gemini 付费服务的用户开放,包括 Google AI Pro、Ultra,以及 Google Workspace 的商业和教育版用户。
6/7/2025 8:35:43 AM
清源

基于Gemini与Qdrant构建生产级RAG管道:设计指南与代码实践

一、RAG技术的核心价值与应用场景在人工智能领域,检索增强生成(Retrieval-Augmented Generation, RAG)正成为解决大语言模型(LLM)知识更新滞后、生成内容不可追溯等问题的关键技术。 传统的微调(Fine-Tuning)方法将知识固化在模型参数中,难以应对动态领域的快速变化;而RAG通过将检索与生成解耦,实现了知识的实时更新与可追溯性,尤其适用于政策频繁变动、对准确性要求极高的场景,如医疗、法律和航空管理。 本文以构建机场智能助理为例,结合Google的Gemini多模态模型与Qdrant向量数据库,详细阐述如何设计并实现一个高可靠、可扩展的生产级RAG管道。
6/3/2025 2:55:00 AM
大模型之路

实测 Google Veo 3:AI 视频终于能开口“说话”了 (附白嫖攻略+提示词技巧)

大家好,我是言川。 Google 在上周还整了个大活:在 I/O 大会上正式发布了全新的视频生成模型——Veo 3。 说实话,当我第一次看到它的演示视频时,脑子里冒出来的第一个词就是:离谱。
5/29/2025 7:57:37 AM
言川Artie

8秒出大片!10个案例实测谷歌Veo 3视频生成功能

前几天的 2025 年 Google I/O 开发者大会上,谷歌发布了一系列先进的图像和视频生成工具,好玩的太多了,我还没来得及一一体验,今天先尝试一下最近超级火的 Veo 3 视频生成。 后续再尝试下 Imagen 4 和 Flow 平台和大家分享。 先简单介绍一下。
5/27/2025 7:31:45 AM
阿真Irene

谷歌通过 Gemini 应用扩展了其热门新视频机型 Veo 3 的访问权限

谷歌在其AI视频生成工具Veo3发布仅100小时后,迅速将其推广至全球71个新国家用户使用。 不过,这一波扩展仍未包括欧盟国家。 这一消息由谷歌Gemini副总裁Josh Woodward在X平台宣布。
5/26/2025 10:01:00 AM
AI在线

如何使用Google Gemini模型完成计算机视觉任务?

译者 | 李睿审校 | 重楼自从人工智能聊天机器人兴起以来,Google Gemini脱颖而出,已经成为推动智能系统进化的主要参与者之一。 除了强大的会话能力之外,Gemini还释放了计算机视觉实际应用的潜力,让它们能够看到、解释和描述周围的世界。 本文将逐步讲解如何利用Google Gemini完成计算机视觉任务,其中包括如何设置环境,发送带有指令的图像以及解释模型的输出以进行对象检测、字幕生成和OCR,还将探讨数据注释工具(例如YOLO中使用的工具),为自定义训练场景提供上下文。
5/26/2025 8:36:25 AM
李睿

大语言模型究竟为何会在对话中“迷失”​

译者 | 张哲刚审校 | 重楼微软研究院和 Salesforce的一篇新论文发现,即使是功能最强大的大型语言模型,如果面临的指令是分阶段而非一次性给出,往往也会表现不佳。 该文作者运行六项任务进行研究,最终发现:当提示被拆分成多个回合时,大语言模型的性能平均下降了39%。 单轮次对话(左图)可获得最佳结果,但对最终用户而言显得并不自然。
5/23/2025 8:18:52 AM
张哲刚

谷歌创意利器 Canvas 升级 Gemini 2.5:降低开发门槛,AI 多样化呈现文本内容

谷歌在I/O开发者大会上宣布Canvas平台升级至Gemini 2.5模型,能将文档和代码转化为动态网页、信息图表、测验和播客,支持45种语言。用户无需编写代码,通过自然语言对话即可创建互动网页应用。#谷歌Canvas# #Gemini2.5#
5/22/2025 12:30:36 PM
故渊

谷歌CEO宣布:Gemini AI月活用户突破4亿,覆盖15亿全球用户

在最近的一次公开讲话中,谷歌的 CEO 桑达尔・皮查伊透露,公司的 Gemini AI 应用程序的月活跃用户数量已经超过4亿。 这一数据的公布无疑为 Gemini AI 的成功增添了光彩,并显示出消费者对这一人工智能技术的强烈兴趣。 Gemini AI 不仅在用户量上取得了显著的成绩,还在全球范围内实现了广泛的覆盖。
5/22/2025 10:00:55 AM
AI在线

​每月249.99美元!谷歌推出 AI Ultra 订阅计划,畅享最强大 AI 模型与高级功能

谷歌宣布推出全新的 AI Ultra 订阅计划,旨在为用户提供最高级别的 AI 模型访问和丰富的高级功能。 随着人工智能技术的迅速发展,谷歌希望通过这一新计划,让更多用户能够利用其先进的 AI 能力来提升知识、创造力和工作效率。 AI Ultra 计划适合电影制作人、开发者、创意专业人士,或者任何追求最佳 AI 体验的用户,可以看作是进入谷歌 AI 世界的 “贵宾通行证”。
5/21/2025 10:01:51 AM
AI在线