AI在线 AI在线

谷歌

谷歌 NotebookLM 新增 Audio Overview 功能:生成 2 位 AI 主播,围绕用户文档展开播客式交流

科技媒体 maginative 昨日(9 月 11 日)报道,谷歌公司升级旗下笔记应用 NotebookLM,新增 Audio Overview 功能,可以围绕着用户上传的文档,生成两位 AI 主持人,并通过播客方式展开讨论。NotebookLM 简介NotebookLM 基于谷歌 Gemini 1.5 Pro AI 模型,是一款个性化人工智能研究助手。用户可以上传 Google Docs、Google Slides、PDF 文件以及网页 URL 地址,该应用能够研究这些文档内容,为用户提供更有洞察力的回答。Aud
9/12/2024 1:41:55 PM
故渊

任意论文一键变播客,谷歌正式发布Illuminate,它能重构研究者的学习方式吗?

像听书一样「读」论文。‍先来听一段英文播客,内容是不是很熟悉?是的,这俩人就是在聊那篇《Attention is All You Need》。在 4 分半的对话里,他们介绍了论文的核心内容,一问一答,听上去相当自然。播客原址:,播客中对谈的双方都是 AI,生成这段四分钟音频内容的产品是 Illuminate,来自谷歌。Illuminate 是一个将学术论文转化为人工智能生成的音频讨论的项目。已有用户晒出自己的试用结果,效果不错:谷歌实验室在邀请用户尝试「前沿技术」方面有着悠久的历史。Illuminate 最早在今年
9/9/2024 2:42:00 PM
机器之心

谷歌 AI 攻克连衣裙,数百品牌商品任你虚拟试穿

谷歌公司于 9 月 5 日周四发布新闻稿,宣布扩充和增强 AI 虚拟试穿工具,现支持用户虚拟试穿来自 Boden、Maje、Sandro、Simkhai 和 Staud 等数百个品牌的数千件连衣裙。谷歌表示连衣裙是该工具搜索次数最多的服装类别之一,但由于连衣裙相比较其它服装更细致和复杂,现有的 AI 扩散技术难以捕捉花卉或几何图案等印花细节,存在较大的挑战。此外,由于连衣裙通常覆盖身体的大部分,并有不同的长度(如中裙、大裙和迷你裙),给人穿上虚拟连衣裙往往会导致身体细节模糊不清。谷歌公司去年发布 AI 虚拟试穿工具
9/7/2024 2:16:27 PM
故渊

万人测试 OpenAI 搜索引擎:活动规划等表现出色,存在“幻觉”等不足

华盛顿邮报昨日(9 月 4 日)发布博文,表示从初期 1 万名用户反馈来看,被很多人视为“谷歌杀手”、来自 OpenAI 的 SearchGPT 搜索引擎虽然有很多亮点功能,但要撼动谷歌搜索地位仍有很长的路要走。部分功能非常优秀AI在线注:SearchGPT 并非通过搜索结果列表,而是通过提供简洁、有条理的回答,简化用户的搜索体验。SearchGPT 利用必应和其他来源的数据编制答案,OpenAI 将其视为用户搜索信息的综合资源。SearchGPT 初期用户反馈褒贬不一,在规划活动、编程、总结信息等特定查询方面,S
9/5/2024 9:13:07 AM
故渊

谷歌升级 Gemini 1.5 Flash 模型,AI 聊天响应速度最高提 50%

谷歌公司于今年推出 Gemini 1.5 Flash AI 模型,官方承诺提供更快的响应速度、能应对更复杂的用户查询。在最新版本更新中,谷歌宣布采用 Gemini 1.5 Flash 的 Gemini 大幅提升响应速度,增幅最高可以达到 50%。AI在线附上谷歌官方支持文档内容如下:Gemini 给出回答的速度大幅提升更新内容:过去几周以来,我们在改善延迟方面取得了重大进步,采用 1.5 Flash 模型的 Gemini 给出回答的速度现在大幅提升,升幅最高达 50%。更新原因:通过让 Gemini 快速给出回答,
9/4/2024 11:41:51 AM
故渊

扩散模型做游戏引擎,单TPU 20 FPS模拟毁灭战士,谷歌最新GameNGen太博眼球了

GameNGen 是第一个完全由神经模型驱动的游戏引擎。谷歌在人工智能领域又一次取得了重大进展。在最新发表的一篇论文中,研究者创建了一个神经网络,可以在不使用传统游戏引擎的情况下为经典射击游戏《毁灭战士》生成实时游戏画面。这个名为 GameNGen 的系统标志着人工智能领域向前迈出了重要一步,它在一个芯片上以每秒 20 帧的速度生成可玩的游戏画面,每帧画面都由扩散模型进行预测。可以说,这是第一个完全由神经模型驱动的游戏引擎,可以高质量地在长轨迹上与复杂环境进行实时交互。这一成就标志着人工智能首次完全模拟了一款复杂的
8/29/2024 11:39:00 AM
机器之心

谷歌将重新开放 Gemini 生成人物图像功能,此前因“种族描述不当”引争议

感谢北京时间 29(今)日,据彭博社报道,谷歌宣布将恢复 AI 模型 Gemini 生成人物图像的功能,部分消费者将可以重新使用。谷歌表示,将开始向订阅 Gemini Advanced 套餐的英语用户推出生成人物图像功能。企业也将能够使用该工具,该功能将在未来几天内上线。谷歌产品管理高级总监戴夫・西特伦(Dave Citron)表示,该公司在通过 Imagen 3 生成人物描写方面取得了“重大进展”。“我们一直在努力对产品进行技术改进,并改进了评估集、红队练习和明确的产品原则。当然,Gemini 创建的每张图像都不
8/29/2024 10:26:42 AM
清源

Jim Gao:曾助谷歌节能40%的AI专家,如今致力打造“虚拟工厂操作员”

只是使用了AI就让工厂能耗降低40%是的,你没有看错,就是降低了整整40%,几乎将能耗砍半! 这是Jim Gao在Google大型数据中心的一次尝试。 这位华人机械工程师巧妙地使用了AI系统辅助控制数据中心的复杂的工业系统,AI在实现了预期系统优化的基础上,还做到了他从没幻想过的超低冷却能耗。
8/27/2024 11:23:00 AM
刘洁

Midjourney 地位不稳?AI 绘图又一黑马出现,附 4 款产品一手实测

AI 圈,再次开卷图像生成。一连串进展扎堆:8 月 21 日,Ideogram 正式推出 2.0 版本,声称文本渲染能力更强。没错,就是那个成立于去年 8 月,由谷歌 AI 绘画 4 大牛集体离职创业的项目,曾获得过一众 AI 大佬投资。此番 Ideogram 还公开叫板 Flux,官方自信表示其人类评估明显优于 Flux Pro。要知道,Flux 由 Stable Diffusion 原班人马打造,最近正在因生成以假乱真的 TED 演讲“照片”而走红各大网络。除此之外,一周前,谷歌正式放出了 Imagen 3,在
8/25/2024 1:35:02 PM
远洋

重返谷歌的Transformer作者,开始掌管Gemini AI

Noam Shazeer 2021 年离职谷歌,3 年后又以特殊方式重回谷歌。本月初,初创公司 Character.AI 宣布了一则重磅消息,约 25 亿美元「卖身」谷歌,并授予谷歌获得 Character.AI 大型语言模型(LLM)技术的非独家许可。Character.AI 的联合创始人 Noam Shazeer 和 Daniel De Freitas 也将重返谷歌。其中,Noam Shazeer 是 Character.AI 的创始人、CEO,也是 Transformer 论文作者之一,他曾在谷歌任首席软件工
8/23/2024 2:50:00 PM
机器之心

原 Character.AI CEO 诺姆・沙泽尔“回家”后履新,消息称将任谷歌 Gemini 联合技术负责人

据 The Information 北京时间今天晨间报道,谷歌发送给员工的消息显示,本月重返谷歌的 Character.AI 联合创始人兼原 CEO 诺姆・沙泽尔(Noam Shazeer)将担任谷歌 AI 项目 Gemini 的联合技术负责人。沙泽尔将与谷歌长期从事人工智能研究的杰夫・迪恩(Jeff Dean)和奥里奥尔・维尼亚尔斯(Oriol Vinyals)一起开发 Gemini,其目标是与 OpenAI 的大语言模型 GPT 竞争。本月初,初创公司 Character.AI 宣布,该公司已与谷歌母公司 Al
8/23/2024 7:50:59 AM
清源

谷歌 Pixel 9 手机的 AI 图像生成工具“放飞自我”,或成“造假利器”

谷歌上周发布了 Pixel 9 系列智能手机,其中包含一系列以人工智能为核心的新功能。所有 Pixel 9 手机均支持 Gemini 人工智能,谷歌还加入了基于人工智能的图像生成和编辑工具。然而,评测人员测试了这些新功能后发现,人工智能图像生成很可能会成为谷歌的公关噩梦。据AI在线了解,谷歌为 Pixel 手机推出了一个名为 Pixel Studio 的人工智能图像生成应用,其能够通过文本提示创建贴纸和图像,功能与苹果计划推出的 Image Playground 非常相似。目前,评测人员能够使用 Pixel Stu
8/22/2024 6:59:00 AM
远洋

谷歌开放 HeAR AI 模型 API:1 亿条咳嗽声训练,辅助筛查、诊断和监测肺结核

谷歌公司于 8 月 19 日发布博文,宣布通过 Google Cloud API,目前已经向研究人员开放健康声学表征(Health Acoustic Representations,简称 HeAR)AI 模型。AI在线曾于今年 3 月报道,谷歌 HeAR AI 模型可以帮助人类诊断疾病,可以通过分析人的咳嗽和呼吸,诊断出疾病。谷歌表示 HeAR 在各项任务中的表现均由于其它模型,在捕捉健康相关声学数据中的有意义模式方面表现出了卓越的能力。 重要的是,使用 HeAR 训练的模型只需较少的训练数据就能获得较高的性能,在
8/21/2024 10:17:02 AM
故渊

Perplexity 热度爆表,单月搜索量达 2.5 亿是去年一半,AI 搜索让谷歌掉队?

AI 搜索需求市场广阔,Perplexity 搜索在上个月回答了大约 2.5 亿个问题,预期收入猛增 7 倍。最近,人工智能搜索引擎市场持续「升温」。一方面,市占率 90%以上的搜索界「一哥」谷歌正在将 Gemini 集成到搜索引擎中;另一方面,OpenAI 也要来 AI 搜索市场分一杯羹,推出了 SearchGPT。面对激烈的市场竞争,Perplexity 似乎并没有在巨头前后夹击下流失掉大量用户,反而迎来新一轮用户使用量的猛增。一个月 2.5 亿回答量在 ChatGPT 推出前三个月,前 OpenAI 研究科学
8/16/2024 12:55:58 PM
清源

力压 DALL-E 3 等顶级模型,谷歌开放 Imagen 3 文生图 AI 访问

科技媒体 VentureBeat 报道,谷歌已经向美国用户正式开放了最新文生图 AI 模型 Imagen 3,用户可以打开 AI Test Kitchen 体验该功能,官方称最新版本“节更清晰、光照更丰富、干扰性人工痕迹更少”。谷歌于今年 5 月召开的 I / O 开发者大会上宣布 Imagen 3 模型,6 月邀请部分 Vertex AI 用户测试使用,而现在正式向美国用户开放。谷歌人工智能研究部门 DeepMind 负责人德米斯・哈萨比斯(Demis Hassabis)说,与前代产品 Imagen 2 相比,I
8/16/2024 8:59:36 AM
故渊

「每周只上一天班」谷歌散漫制度遭前CEO怒斥:输给OpenAI,再下去要输创业公司了

然而不到 24 小时,就被骂得删视频道歉。「谷歌决定拥抱生活与工作平衡:更早下班、远程工作,胜过在竞争中取胜。」施密特说道。「而说到初创公司,他们之所以能成功,是因为人们在拼命地工作。」在本周三公布的一份斯坦福大学公开课视频中,谷歌前 CEO 埃里克・施密特(Eric Schmidt)在被问到谷歌为什么落后于 OpenAI 时,终于开炮了。「很抱歉我这么直白,但重要的是:如果你们都离开大学去创办公司,你肯定不会让自己的员工在家办公,如果你愿意的话。」这番言论很快引发了轩然大波。输出了大量前沿 AI 技术的谷歌,一直
8/15/2024 3:00:00 PM
机器之心

古尔曼:苹果在 AI 领域至少落后谷歌两到三年

昨天谷歌提前召开新品发布会,抢在苹果 iPhone 16 系列发布前展示了 Pixel 9 系列搭载的全新 AI 功能,引发业内广泛关注。彭博社记者马克・古尔曼称,苹果在 AI 技术方面至少落后谷歌两三年。谷歌在本次发布会上全面展示了 Gemini AI 的强大功能,将其深度整合到了 Android 和 Pixel 手机中。相比之下,苹果虽然在 WWDC 上公布了 Apple Intelligence,但实际应用尚不成熟,消息称部分功能甚至无法在 iPhone 16 发布时及时推出。此外,谷歌还强调 Gemini
8/15/2024 11:05:38 AM
远洋

谷歌版 Her 大翻车:试了 3 次且换手机才成功… 网友:我手动只需 10 秒

翻车,大翻车。就在今天凌晨,谷歌版 Her——Gemini Live 正式发布。毕竟明显是对标 OpenAI 家的 GPT-4o,可以说是吸足了科技圈的眼球。在官网发布的 demo 中,拍照问答功能的效果是这样的:它大致实现的功能,是用手机拍摄演唱会的海报,并让 Gemini 查看用户的日历,看看行程是否适合参加。以及还可以基于此进行一系列后续的操作,包括定时间查票价等等。然而…… 当来到发布会现场演示环节的时候,画风却 180° 大变样。请看 VCR: 第一次:失败了。第二次:失败了。第三次:换手机,成功了。嗯…
8/14/2024 12:26:03 PM
清源