谷歌
谷歌 NotebookLM 新增 Audio Overview 功能:生成 2 位 AI 主播,围绕用户文档展开播客式交流
科技媒体 maginative 昨日(9 月 11 日)报道,谷歌公司升级旗下笔记应用 NotebookLM,新增 Audio Overview 功能,可以围绕着用户上传的文档,生成两位 AI 主持人,并通过播客方式展开讨论。NotebookLM 简介NotebookLM 基于谷歌 Gemini 1.5 Pro AI 模型,是一款个性化人工智能研究助手。用户可以上传 Google Docs、Google Slides、PDF 文件以及网页 URL 地址,该应用能够研究这些文档内容,为用户提供更有洞察力的回答。Aud
9/12/2024 1:41:55 PM
故渊
任意论文一键变播客,谷歌正式发布Illuminate,它能重构研究者的学习方式吗?
像听书一样「读」论文。先来听一段英文播客,内容是不是很熟悉?是的,这俩人就是在聊那篇《Attention is All You Need》。在 4 分半的对话里,他们介绍了论文的核心内容,一问一答,听上去相当自然。播客原址:,播客中对谈的双方都是 AI,生成这段四分钟音频内容的产品是 Illuminate,来自谷歌。Illuminate 是一个将学术论文转化为人工智能生成的音频讨论的项目。已有用户晒出自己的试用结果,效果不错:谷歌实验室在邀请用户尝试「前沿技术」方面有着悠久的历史。Illuminate 最早在今年
9/9/2024 2:42:00 PM
机器之心
谷歌 AI 攻克连衣裙,数百品牌商品任你虚拟试穿
谷歌公司于 9 月 5 日周四发布新闻稿,宣布扩充和增强 AI 虚拟试穿工具,现支持用户虚拟试穿来自 Boden、Maje、Sandro、Simkhai 和 Staud 等数百个品牌的数千件连衣裙。谷歌表示连衣裙是该工具搜索次数最多的服装类别之一,但由于连衣裙相比较其它服装更细致和复杂,现有的 AI 扩散技术难以捕捉花卉或几何图案等印花细节,存在较大的挑战。此外,由于连衣裙通常覆盖身体的大部分,并有不同的长度(如中裙、大裙和迷你裙),给人穿上虚拟连衣裙往往会导致身体细节模糊不清。谷歌公司去年发布 AI 虚拟试穿工具
9/7/2024 2:16:27 PM
故渊
万人测试 OpenAI 搜索引擎:活动规划等表现出色,存在“幻觉”等不足
华盛顿邮报昨日(9 月 4 日)发布博文,表示从初期 1 万名用户反馈来看,被很多人视为“谷歌杀手”、来自 OpenAI 的 SearchGPT 搜索引擎虽然有很多亮点功能,但要撼动谷歌搜索地位仍有很长的路要走。部分功能非常优秀AI在线注:SearchGPT 并非通过搜索结果列表,而是通过提供简洁、有条理的回答,简化用户的搜索体验。SearchGPT 利用必应和其他来源的数据编制答案,OpenAI 将其视为用户搜索信息的综合资源。SearchGPT 初期用户反馈褒贬不一,在规划活动、编程、总结信息等特定查询方面,S
9/5/2024 9:13:07 AM
故渊
谷歌升级 Gemini 1.5 Flash 模型,AI 聊天响应速度最高提 50%
谷歌公司于今年推出 Gemini 1.5 Flash AI 模型,官方承诺提供更快的响应速度、能应对更复杂的用户查询。在最新版本更新中,谷歌宣布采用 Gemini 1.5 Flash 的 Gemini 大幅提升响应速度,增幅最高可以达到 50%。AI在线附上谷歌官方支持文档内容如下:Gemini 给出回答的速度大幅提升更新内容:过去几周以来,我们在改善延迟方面取得了重大进步,采用 1.5 Flash 模型的 Gemini 给出回答的速度现在大幅提升,升幅最高达 50%。更新原因:通过让 Gemini 快速给出回答,
9/4/2024 11:41:51 AM
故渊
扩散模型做游戏引擎,单TPU 20 FPS模拟毁灭战士,谷歌最新GameNGen太博眼球了
GameNGen 是第一个完全由神经模型驱动的游戏引擎。谷歌在人工智能领域又一次取得了重大进展。在最新发表的一篇论文中,研究者创建了一个神经网络,可以在不使用传统游戏引擎的情况下为经典射击游戏《毁灭战士》生成实时游戏画面。这个名为 GameNGen 的系统标志着人工智能领域向前迈出了重要一步,它在一个芯片上以每秒 20 帧的速度生成可玩的游戏画面,每帧画面都由扩散模型进行预测。可以说,这是第一个完全由神经模型驱动的游戏引擎,可以高质量地在长轨迹上与复杂环境进行实时交互。这一成就标志着人工智能首次完全模拟了一款复杂的
8/29/2024 11:39:00 AM
机器之心
谷歌将重新开放 Gemini 生成人物图像功能,此前因“种族描述不当”引争议
感谢北京时间 29(今)日,据彭博社报道,谷歌宣布将恢复 AI 模型 Gemini 生成人物图像的功能,部分消费者将可以重新使用。谷歌表示,将开始向订阅 Gemini Advanced 套餐的英语用户推出生成人物图像功能。企业也将能够使用该工具,该功能将在未来几天内上线。谷歌产品管理高级总监戴夫・西特伦(Dave Citron)表示,该公司在通过 Imagen 3 生成人物描写方面取得了“重大进展”。“我们一直在努力对产品进行技术改进,并改进了评估集、红队练习和明确的产品原则。当然,Gemini 创建的每张图像都不
8/29/2024 10:26:42 AM
清源
Jim Gao:曾助谷歌节能40%的AI专家,如今致力打造“虚拟工厂操作员”
只是使用了AI就让工厂能耗降低40%是的,你没有看错,就是降低了整整40%,几乎将能耗砍半! 这是Jim Gao在Google大型数据中心的一次尝试。 这位华人机械工程师巧妙地使用了AI系统辅助控制数据中心的复杂的工业系统,AI在实现了预期系统优化的基础上,还做到了他从没幻想过的超低冷却能耗。
8/27/2024 11:23:00 AM
刘洁
Midjourney 地位不稳?AI 绘图又一黑马出现,附 4 款产品一手实测
AI 圈,再次开卷图像生成。一连串进展扎堆:8 月 21 日,Ideogram 正式推出 2.0 版本,声称文本渲染能力更强。没错,就是那个成立于去年 8 月,由谷歌 AI 绘画 4 大牛集体离职创业的项目,曾获得过一众 AI 大佬投资。此番 Ideogram 还公开叫板 Flux,官方自信表示其人类评估明显优于 Flux Pro。要知道,Flux 由 Stable Diffusion 原班人马打造,最近正在因生成以假乱真的 TED 演讲“照片”而走红各大网络。除此之外,一周前,谷歌正式放出了 Imagen 3,在
8/25/2024 1:35:02 PM
远洋
重返谷歌的Transformer作者,开始掌管Gemini AI
Noam Shazeer 2021 年离职谷歌,3 年后又以特殊方式重回谷歌。本月初,初创公司 Character.AI 宣布了一则重磅消息,约 25 亿美元「卖身」谷歌,并授予谷歌获得 Character.AI 大型语言模型(LLM)技术的非独家许可。Character.AI 的联合创始人 Noam Shazeer 和 Daniel De Freitas 也将重返谷歌。其中,Noam Shazeer 是 Character.AI 的创始人、CEO,也是 Transformer 论文作者之一,他曾在谷歌任首席软件工
8/23/2024 2:50:00 PM
机器之心
原 Character.AI CEO 诺姆・沙泽尔“回家”后履新,消息称将任谷歌 Gemini 联合技术负责人
据 The Information 北京时间今天晨间报道,谷歌发送给员工的消息显示,本月重返谷歌的 Character.AI 联合创始人兼原 CEO 诺姆・沙泽尔(Noam Shazeer)将担任谷歌 AI 项目 Gemini 的联合技术负责人。沙泽尔将与谷歌长期从事人工智能研究的杰夫・迪恩(Jeff Dean)和奥里奥尔・维尼亚尔斯(Oriol Vinyals)一起开发 Gemini,其目标是与 OpenAI 的大语言模型 GPT 竞争。本月初,初创公司 Character.AI 宣布,该公司已与谷歌母公司 Al
8/23/2024 7:50:59 AM
清源
谷歌 Pixel 9 手机的 AI 图像生成工具“放飞自我”,或成“造假利器”
谷歌上周发布了 Pixel 9 系列智能手机,其中包含一系列以人工智能为核心的新功能。所有 Pixel 9 手机均支持 Gemini 人工智能,谷歌还加入了基于人工智能的图像生成和编辑工具。然而,评测人员测试了这些新功能后发现,人工智能图像生成很可能会成为谷歌的公关噩梦。据AI在线了解,谷歌为 Pixel 手机推出了一个名为 Pixel Studio 的人工智能图像生成应用,其能够通过文本提示创建贴纸和图像,功能与苹果计划推出的 Image Playground 非常相似。目前,评测人员能够使用 Pixel Stu
8/22/2024 6:59:00 AM
远洋
谷歌开放 HeAR AI 模型 API:1 亿条咳嗽声训练,辅助筛查、诊断和监测肺结核
谷歌公司于 8 月 19 日发布博文,宣布通过 Google Cloud API,目前已经向研究人员开放健康声学表征(Health Acoustic Representations,简称 HeAR)AI 模型。AI在线曾于今年 3 月报道,谷歌 HeAR AI 模型可以帮助人类诊断疾病,可以通过分析人的咳嗽和呼吸,诊断出疾病。谷歌表示 HeAR 在各项任务中的表现均由于其它模型,在捕捉健康相关声学数据中的有意义模式方面表现出了卓越的能力。 重要的是,使用 HeAR 训练的模型只需较少的训练数据就能获得较高的性能,在
8/21/2024 10:17:02 AM
故渊
Perplexity 热度爆表,单月搜索量达 2.5 亿是去年一半,AI 搜索让谷歌掉队?
AI 搜索需求市场广阔,Perplexity 搜索在上个月回答了大约 2.5 亿个问题,预期收入猛增 7 倍。最近,人工智能搜索引擎市场持续「升温」。一方面,市占率 90%以上的搜索界「一哥」谷歌正在将 Gemini 集成到搜索引擎中;另一方面,OpenAI 也要来 AI 搜索市场分一杯羹,推出了 SearchGPT。面对激烈的市场竞争,Perplexity 似乎并没有在巨头前后夹击下流失掉大量用户,反而迎来新一轮用户使用量的猛增。一个月 2.5 亿回答量在 ChatGPT 推出前三个月,前 OpenAI 研究科学
8/16/2024 12:55:58 PM
清源
力压 DALL-E 3 等顶级模型,谷歌开放 Imagen 3 文生图 AI 访问
科技媒体 VentureBeat 报道,谷歌已经向美国用户正式开放了最新文生图 AI 模型 Imagen 3,用户可以打开 AI Test Kitchen 体验该功能,官方称最新版本“节更清晰、光照更丰富、干扰性人工痕迹更少”。谷歌于今年 5 月召开的 I / O 开发者大会上宣布 Imagen 3 模型,6 月邀请部分 Vertex AI 用户测试使用,而现在正式向美国用户开放。谷歌人工智能研究部门 DeepMind 负责人德米斯・哈萨比斯(Demis Hassabis)说,与前代产品 Imagen 2 相比,I
8/16/2024 8:59:36 AM
故渊
「每周只上一天班」谷歌散漫制度遭前CEO怒斥:输给OpenAI,再下去要输创业公司了
然而不到 24 小时,就被骂得删视频道歉。「谷歌决定拥抱生活与工作平衡:更早下班、远程工作,胜过在竞争中取胜。」施密特说道。「而说到初创公司,他们之所以能成功,是因为人们在拼命地工作。」在本周三公布的一份斯坦福大学公开课视频中,谷歌前 CEO 埃里克・施密特(Eric Schmidt)在被问到谷歌为什么落后于 OpenAI 时,终于开炮了。「很抱歉我这么直白,但重要的是:如果你们都离开大学去创办公司,你肯定不会让自己的员工在家办公,如果你愿意的话。」这番言论很快引发了轩然大波。输出了大量前沿 AI 技术的谷歌,一直
8/15/2024 3:00:00 PM
机器之心
古尔曼:苹果在 AI 领域至少落后谷歌两到三年
昨天谷歌提前召开新品发布会,抢在苹果 iPhone 16 系列发布前展示了 Pixel 9 系列搭载的全新 AI 功能,引发业内广泛关注。彭博社记者马克・古尔曼称,苹果在 AI 技术方面至少落后谷歌两三年。谷歌在本次发布会上全面展示了 Gemini AI 的强大功能,将其深度整合到了 Android 和 Pixel 手机中。相比之下,苹果虽然在 WWDC 上公布了 Apple Intelligence,但实际应用尚不成熟,消息称部分功能甚至无法在 iPhone 16 发布时及时推出。此外,谷歌还强调 Gemini
8/15/2024 11:05:38 AM
远洋
谷歌版 Her 大翻车:试了 3 次且换手机才成功… 网友:我手动只需 10 秒
翻车,大翻车。就在今天凌晨,谷歌版 Her——Gemini Live 正式发布。毕竟明显是对标 OpenAI 家的 GPT-4o,可以说是吸足了科技圈的眼球。在官网发布的 demo 中,拍照问答功能的效果是这样的:它大致实现的功能,是用手机拍摄演唱会的海报,并让 Gemini 查看用户的日历,看看行程是否适合参加。以及还可以基于此进行一系列后续的操作,包括定时间查票价等等。然而…… 当来到发布会现场演示环节的时候,画风却 180° 大变样。请看 VCR: 第一次:失败了。第二次:失败了。第三次:换手机,成功了。嗯…
8/14/2024 12:26:03 PM
清源
资讯热榜
标签云
人工智能
AI
OpenAI
AIGC
模型
ChatGPT
DeepSeek
AI绘画
谷歌
数据
机器人
大模型
Midjourney
开源
用户
智能
Meta
微软
GPT
学习
图像
技术
Gemini
AI创作
马斯克
论文
Anthropic
代码
英伟达
算法
Stable Diffusion
智能体
训练
芯片
开发者
蛋白质
生成式
腾讯
苹果
AI新词
神经网络
3D
LLM
Claude
研究
生成
机器学习
计算
AI for Science
Sora
人形机器人
AI视频
xAI
AI设计
GPU
华为
百度
搜索
Agent
大语言模型
场景
字节跳动
预测
大型语言模型
深度学习
工具
伟达
Transformer
视觉
RAG
具身智能
神器推荐
亚马逊
Copilot
模态
AGI
LLaMA
文本
算力
驾驶