AI在线 AI在线

谷歌

谷歌 2 小时复仇硬刚 GPT-4o:Gemini 颠覆搜索,视频 AI 对抗 Sora

【新智元导读】被 OpenAI 提前截胡的谷歌,昨天不甘示弱地开启反击!大杀器 Project Astra 效果不输 GPT-4o,文生视频模型 Veo 硬刚 Sora,用 AI 彻底颠覆谷歌搜索,Gemini 1.5 Pro 达到 200 万 token 上下文…… 谷歌轰出一连串武器,对 OpenAI 贴脸开大。谷歌 I / O 2024 如期来了,眼花缭乱地发布了一堆更新。跟 OpenAI 半小时的「小而美」发布会相比,谷歌显然准备得更加充分,当然,时间也相当之长……▲ 2 个多小时的发布会也是挑战着观众们的
5/16/2024 1:24:48 PM
汪淼

谷歌 AI 视频搜索功能演示又翻车,Gemini 给出错误维修建议

在今天的谷歌 I / O 大会上,谷歌大肆宣传其名为 Gemini 的人工智能将接管搜索引擎领域。然而,在其炫酷的演示环节中,Gemini 却再次暴露了所有大型语言模型至今为止都存在的致命缺陷:自信满满地给出错误答案。在 “Gemini 时代下的搜索” 演示片段中,谷歌展示了其视频搜索功能,用户可以通过拍摄短视频并用语音提问进行搜索。演示的例子是一个卡住的胶片相机过片杆,用户询问“为什么扳杆无法移动到底”,Gemini 则识别出问题并提供了维修建议。 然而问题在于,Gemini 给出的答案整体而言令人啼笑皆非。谷歌
5/15/2024 4:28:24 PM
远洋

谷歌 Calendar、Tasks 和 Keep 等服务将集成 Gemini

谷歌公司在今天召开的 I / O 2024 开发者大会上,宣布在 Google Calendar、Tasks 和 Keep 应用中整合 Gemini 模型,为用户带来更丰富的 AI 功能。谷歌在开发者大会上表示,Gemini 聊天机器人支持网页或者移动 App 中上传图片操作,IT之家附上谷歌官方例子如下,拍一张学校活动列表的照片,然后让 Gemini 把它们添加到你的个人 Google Calendar 中。谷歌提供的另一个例子是让 Gemini 将食谱中的项目添加到谷歌 Keep 购物清单中。Gemini 负责
5/15/2024 4:06:11 AM
故渊

谷歌 Workspace 办公套件整合 Gemini:可总结邮件内容、梳理会议要点等

谷歌公司在今天召开的 I / O 2024 开发者大会上,宣布 Google Workspace 将进一步整合 Gemini,在侧面板中将推出基于 Gemini 1.5 Pro 的诸多技能。谷歌表示 Workspace 整合 Gemini 的作用,是为用户节省从多个应用程序中挖掘文件、电子邮件和其他数据的时间和精力。谷歌 Workspace 副总裁阿帕纳・帕普(Aparna Pappu)在会上说:“Gemini 时代的 Workspace 将开启完成工作的新方式”。IT之家注:谷歌 Workspace 的 Gmai
5/15/2024 3:45:19 AM
故渊

谷歌 Gemini 解锁旅行规划技能,几秒内帮你妥当安排行程

谷歌公司在今天召开的 I / O 2024 开发者大会上,宣布为 Gemini 引入旅行规划功能,结合个人信息和公共出行信息,帮用户规划预订航班、酒店等等。谷歌表示 Gemini 可以基于用户的提示,挖掘航班时间和酒店预订等具体细节,在几秒钟内制定出合适的度假行程。谷歌副总裁兼 Gemini 总经理 Sissie Hsiao 表示,用户手动规划一次旅行可能需要数小时、数天甚至数周的时间,而 Gemini 几乎可以瞬间完成。Hsiao 表示 Gemini 的规划是动态的,用户可以根据后期提示和其它要求进一步调整规划。
5/15/2024 3:28:56 AM
故渊

你的助手你决定,谷歌推出 Gems 功能:由用户定制 Gemini 角色

谷歌公司在今天召开的 I / O 2024 开发者大会上,宣布为 Gemini 推出名为“Gems”的个性化选项,可以让用户定制 Gemini 助手角色。Gems 功能可以让用户迭代的聊天机器人,在保留指定特征的情况下帮助你完成某些任务。Gems 感觉类似于 OpenAI 的 GPT Store,可以让你制作定制的 ChatGPT 聊天机器人。该功能也有点像在 Character.AI 中创建自己的机器人,Character.AI 可以让你与虚拟的流行人物和名人甚至假冒的心理医生交谈。谷歌表示,用户通过 Gems
5/15/2024 3:12:28 AM
故渊

哪里不会圈哪里,谷歌赋予“圈选即搜”新技能:帮你解数学题

谷歌在今天召开的 I / O 2024 开发者大会上,宣布进一步增强安卓手机端的“圈选即搜”(Circle to Search)技能,可以用于解答数学、物理等问题。谷歌表示学生可以使用安卓手机或平板电脑,通过“圈选即搜”功能解决家庭作业中的数学、物理问题。该功能将帮助解题,并列出学生需要做什么才能得到正确答案。根据谷歌的说法,它不会真的帮你做作业,只会帮助你解决问题。IT之家从报道中获悉,谷歌还表示将会继续升级“圈选即搜”技能,后续将支持公式、图表、图形等复杂数学方程式,谷歌正在使用经过学习微调的新人工智能模型 L
5/15/2024 3:04:01 AM
故渊

文生图技能再进化,谷歌推出 Imagen 3:更准确、更具创造性

谷歌公司在今天召开的 I / O 2024 开发者大会上,宣布推出了 Imagen 3,进一步增强了文本生成图片的技术能力。谷歌人工智能研究部门 DeepMind 负责人德米斯-哈萨比斯(Demis Hassabis)说,与前代产品 Imagen 2 相比,Imagen 3 能更准确地理解文字提示,并将其转化为图像,而且其生成的图像更具“创造性和细节”,且模型产生的干扰元素和错误也更少。为了打消人们对 Deepfake 可能性的担忧,谷歌表示,Imagen 3 将使用 DeepMind 开发的 SynthID 方法
5/15/2024 2:36:36 AM
故渊

剑指 Sora,谷歌推出 Veo 文生视频模型:时长超 1 分钟、最高 1080P,支持电影手法

感谢OpenAI 三个月前推出文本转视频 Sora,引发了网友、媒体以及圈内人士的广泛讨论。谷歌在今天召开的 2024 I / O 开发者大会上,也推出了对标产品-- Veo,可以生成长度超过 1 分钟,分辨率最高 1080P 的“高质量”视频,并具有多种视觉和电影风格。根据谷歌官方新闻稿,Veo 具备对自然语言有先进的理解能力,能够理解“延时摄影”、“航拍风景”等电影术语。用户可以使用文本、图像或视频提示来指导他们所需的输出,谷歌表示,这样产生的视频“更加连贯一致”,在整个镜头中人物、动物和物体的动作也更加逼真。
5/15/2024 2:27:03 AM
故渊

对轰 GPT-4o,谷歌推出 Astra 项目:手机镜头内低延迟聊天交互

谷歌公司在今天召开的 2024 年 I / O 开发者大会上,推出了全新的 Project Astra 项目,基于 Gemini,可以本地运行在 Pixel 手机上,可以说是对标 OpenAI GPT-4o 的最新模型。谷歌表示 Project Astra 是最新的多模态 AI 项目,用户打开摄像头,该多模态项目可以直接解释用户画面中物品。该公司刚刚用一段令人印象深刻的视频演示了它的功能,在一个不间断的镜头中,它能正确识别几件物品,回忆起它在哪里看到了主人的眼镜(靠近桌子上的一个红苹果),还能解释屏幕上的代码。IT
5/15/2024 2:13:49 AM
故渊

谷歌今夏推“Ask Photos”功能,聊天方式更快找到照片和视频

谷歌公司在今天召开的 2024 年 I / O 开发者大会上,宣布今年夏季将为 Google Photos 推出“Ask Photos”辅助服务,带来更贴心的搜索体验。谷歌首席执行官桑达尔・皮查伊现场演示,询问 Google Photos 应用:“我的车牌号是多少来着?”此前用户搜索车牌需要滚动浏览许多不同汽车的照片,而在演示中 Google Photos 能根据位置、多年来在照片中出现的次数和其他数据,找出哪辆车才是要找的车牌号,并以文字回复的形式提供了实际车牌号,同时还提供了一张验证车牌号的图片。皮查伊表示 A
5/15/2024 2:05:48 AM
故渊

谷歌 Gemini 家族添 Flash 新成员:平衡规模和能力、支持多模态,单次可分析 3 万行代码

谷歌公司今天扩充 Gemini 家族成员,推出了全新的 Gemini 1.5 Flash 模型,重点优化了该模型的速度和效率。谷歌 DeepMind 首席执行官德米斯・哈萨比斯(Demis Hassabis)在一篇博客文章中写道:Gemini 1.5 Flash 擅长摘要、聊天应用、图像和视频字幕、从长文档和表格中提取数据等。哈萨比斯补充说,谷歌之所以创建 Gemini 1.5 Flash,是因为开发人员需要一个比谷歌今年 2 月发布的 Gemini 1.5 Pro 更轻便、更便宜的模型。IT之家注:Gemini
5/15/2024 1:47:17 AM
故渊

AI 聊天机器人大战升温:谷歌 Gemini 预告片展示惊艳语音视频交互能力

人工智能聊天机器人领域烽烟再起,谷歌和 OpenAI 之间激烈的竞争态势愈演愈烈。就在谷歌一年一度的 I / O 开发者大会召开前夕,这家科技巨头发布了一段视频,展示了疑似经过升级的 Gemini 聊天机器人。视频中,Gemini 可以同时实时处理来自视频和语音的输入。这段视频貌似是在 I / O 大会搭建现场拍摄的,视频展示了 Gemini 在一台 Pixel 手机上流畅地处理实时视频和语音提问,并准确地提供信息。当被问到正在进行的布置工作时,Gemini 正确识别出这是为一个重要活动做的准备。 整个对话过程自然
5/14/2024 6:06:23 PM
远洋

“面对面通话”指日可待,谷歌、惠普明年将推动全息视频聊天技术商业化

谷歌今日通过新闻稿宣布,将与惠普于 2025 年开始推动全息视频聊天技术 Project Starline 的商业化。谷歌表示,Project Starline 是一个突破性的技术项目,可以让朋友、家人和同事在任何距离都感觉对方近在咫尺。该项目利用先进的 AI、三维成像和其他技术,可以使用户在通话时就像与对方“同处一室”一样。 未来,这项技术将会走出实验室,将从明年开始在 Google Meet 或 Zoom 等视频会议服务中启用这种体验。惠普个人系统总裁 Alex Cho 表示,“一半以上的意义和意图是通过肢体语
5/13/2024 10:56:53 PM
清源

多模态AI是医学的未来,谷歌推出三个新模型,Med-Gemini迎来大升级

编辑 | 白菜叶许多临床任务需要了解专业数据,例如医学图像、基因组学,这类专业知识信息在通用多模态大模型的训练中通常不存在。在上一篇论文的描述中,Med-Gemini 在各种医学成像任务上超越 GPT-4 系列模型实现了 SOTA!在这里,Google DeepMind 撰写了第二篇关于 Med-Gemini 的论文。在 Gemini 的多模态模型的基础上,该团队为 Med-Gemini 系列开发了多个模型。这些模型继承了 Gemini 的核心功能,并通过 2D 和 3D 放射学、组织病理学、眼科、皮肤病学和基因组
5/13/2024 3:58:00 PM
ScienceAI

知情人士称 OpenAI 人工智能搜索产品有望于下周一推出

感谢路透社援引两位知情人士的话称,OpenAI 计划于下周一(5 月 13 日)正式公布其人工智能搜索产品,不过报道中强调具体公告日期可能发生变化。OpenAI 拒绝对路透社的报道置评。外媒 The Information 在今年 2 月的报道中指出,OpenAI 一直在秘密开发其自家网络搜索服务,并将获得来自微软 Bing(必应)搜索引擎的支持。微软在去年就已在 Bing 中集成了来自 OpenAI 的技术。5 月 13 日的时间点正好早于谷歌本年度的 I / O 开发者大会。谷歌预计将在开发者大会上宣布一系列人
5/10/2024 9:06:10 AM
溯波(实习)

硅谷 AI 工程师内卷崩溃记:996 写代码项目被砍,连续熬夜只为讨好投资人

【新智元导读】亚马逊工程师一个周末辛苦写出的代码,因为项目最终被降级而白白浪费了。AI 爆火的背面,是一众硅谷大厂员工的疯狂内耗。越来越密集的活动日程表,越来越不可思议的 deadline,为董事会准备毫无用途的 AI 产品展示…… 被迫「内卷」的大厂 AI 工程师们,已经感到窒息。AI 爆火之后,硅谷的工程师们已经被「内卷」搞得精疲力竭,苦不堪言!放弃整个周末休息辛苦写出的代码,因为项目降低优先级全部白费。大家你追我赶,争取比竞家更快发布产品,一切都向速度看齐。领导疯狂发号施令,但对项目的实际影响漠不关心。为了赶
5/5/2024 4:02:17 PM
清源

挑战谷歌巨头地位?消息称 OpenAI 于 5 月 9 日发布 ChatGPT 版搜索引擎

谷歌 Gemini 和微软 Copilot 之间的 AI 大战继续升级,最新消息称 OpenAI 有望今年 5 月 9 日推出基于 ChatGPT 的全新搜索产品,进一步挑战谷歌的传统搜索巨头地位。Reddit 网友近日发帖,表示 search.chatgpt.com 域名和相关的 SSL 证书已经被创建,网友 @nonmayorpete 发布推文称该域名将于 5 月 9 日上线。IT之家现在访问该域名,跳出的结果是“Not found”信息,而不是 404 或者域名错误,进一步间接证明了上述猜测。OpenAI 首
5/3/2024 8:39:35 AM
故渊