AI在线 AI在线

用户

安卓版谷歌 Gemini Live 上线,助力 AI 开启全民语音聊天时代

谷歌公司昨日(10 月 1 日)在 X 平台发布推文,宣布通过 Gemini 应用,现面向所有安卓用户开放 Gemini Live 功能。AI在线曾于 8 月报道,谷歌在 Pixel 9 系列手机发布会上,发布了 Gemini Live,该服务提供了一种移动对话体验,让用户和 Gemini 展开自由流畅的对话。Gemini Live 可以说是对标 OpenAI ChatGPT 最新上线的 Advanced Voice 模式,采用了增强型语音引擎,可以展开更连贯、更有情感表达力、更逼真的多轮对话。需要注意的是,目前仅
10/2/2024 9:14:09 AM
故渊

微软被曝拓展 Copilot AI 应用,打造专属于你的新闻主播

科技媒体 Windows Central 昨日(9 月 27 日)报道,微软公司正计划扩展 Copilot,打造个性化的虚拟新闻主播,播报用户感兴趣的相关新闻和动态信息。消息称微软在文生图和网络搜索之外,积极推动各项 AI 服务落地。AI在线曾于 9 月 21 日报道,微软启动第二波 Copilot 更新,引入了全新的 Pages,为 Excel 支持 Python 语言,以及上线  Copilot Agents 等。微软计划重塑移动端 Copilot 应用程序,将常规的 AI 助手转变为虚拟新闻主播,目前微软已经
9/28/2024 12:41:26 PM
故渊

微软网页版 OneDrive 正式融合 Copilot:一键总结、多文件对比,AI 提高你的生产力

微软公司昨日(9 月 27 日)发布新闻稿,宣布面向获得 Copilot 许可的商业用户,正式开放网页版 OneDrive 中的 Copilot,意味着用户可以探索全新的 AI 文件处理方式。OneDrive 中的 Copilot 的技能包括:为大文件生成摘要Copilot 能够为用户生成文档摘要,节省查找关键点的时间,并帮助用户专注于最重要的内容。对比多个文档中的差异用户无需打开文件,Copilot 可以比较多个文档的差异,快速展示关键差异。回答文件内容相关话题Copilot 能够分析 OneDrive 中的文件
9/28/2024 12:29:13 PM
故渊

谷歌 AI 笔记助手 NotebookLM 获更新:支持总结视频内容、创建学习指南

谷歌本周对旗下 AI 笔记助手 NotebookLM 进行更新,目前该助手已支持对视频内容进行总结(现支持 YouTube 平台)。▲ 图源谷歌(下同)谷歌 NotebookLM 自去年 7 月发布以来一直不断更新,与传统聊天机器人不同,NotebookLM 更侧重于辅助用户“学术思考”,允许用户根据需要对文章、视频、音频进行摘要。AI在线获悉,目前谷歌 NotebookLM 模型采用 Gemini 1.5 Pro 作为底层,而本次更新带来的视频内容总结能力主要用于获取视频片段关键点,方便用户快速跳转到特定视频时间
9/27/2024 3:52:19 PM
漾仔

Snapchat 聊天机器人 My AI 将整合谷歌 Gemini 模型

谷歌 Google Cloud 公司本周二宣布和 Snap 公司合作,在 Snapchat 的 AI 聊天机器人 My AI 中整合 Gemini,为用户带来更强的 AI 聊天体验。AI在线援引新闻稿内容,Snapchat 将使用谷歌 Gemini 聊天机器人的强大多模态功能,理解文本、音频、图像、视频和代码在内的多种输入类型,并理解回答用户的提问。谷歌表示本次合作,为 Snapchat 用户带来了更多创新功能。Snap 首席执行官埃文・斯皮格尔(Evan Spiegel)评论表示:与 Google Cloud 的
9/26/2024 9:42:43 AM
故渊

OpenAI 上线高级语音模式:翻开 AI 语音聊天新篇章,能用中文等 50 多种语言说“抱歉我迟到了”

感谢OpenAI 公司今天(9 月 25 日)发布博文,宣布面向所有 Plus 和 Team 订阅用户,推出高级语音模式(Advanced Voice Mode,简称 AVM),标志着人工智能对话技术向前迈出了重要一步。该功能之前仅邀请部分用户测试,OpenAI 希望通过语音,提供更自然、更像人类的交互体验。AI在线附上 AVM 主要功能如下:改善对话体验:AVM 可实现更流畅、反应更迅速的对话,让用户能够打断人工智能,并对话题的变化做出即时反应。新的声音:新增 Arbor、Maple、Sol、Spruce 和 V
9/25/2024 11:36:21 AM
故渊

OpenAI ChatGPT 新增自动模式,基于提示词复杂度灵活选择合适 AI 模型

科技媒体 testingcatalog 昨日(9 月 18 日)报道,OpenAI 面向所有用户在多种设备上,为 ChatGPT 推出了“Auto”自动模式。AI在线注:用户切换选择 Auto 之后,会自动根据用户输入的提示词复杂程度,自动选择最合适的 AI 模型。对于复杂的提示,它会选用最先进的模型,而对于较简单的提示,则采用更快的模型以节省时间。许多用户反馈表示,在大多数情况下,他们更倾向于与最先进的模型进行交互。然而,在某些特定场景下,能够选择优化速度被视为一项有价值的功能。
9/19/2024 9:28:30 AM
故渊

金山办公:目前 AI 会员、大会员累计年度付费用户数合计已超百万

金山办公今天在上证 e 互动答投资者问时透露,公司目前 AI 会员和大会员累计年度付费用户数合计已超百万。目前,WPS AI 已接入公司全线产品。金山办公在投资者平台还表示,公司与华为共同合作,已推出 WPS 鸿蒙版。目前,WPS 鸿蒙版已在全端流畅运行,还能实现多平台账号统一、跨端调用、跨屏协同等功能。本月初,WPS Office 官网上线了 WPS Office for Linux 12 个人版,新增了 AI 帮我写、帮我改等功能,以及 AI 写公式、AI 生成 PPT 等。据AI在线此前报道,今年 7 月的
9/18/2024 6:24:19 PM
清源

阿里通义将发布 AI 视频生成大模型,支持文生视频、图生视频

感谢阿里通义将在 2024 云栖大会(9 月 19 日至 9 月 21 日)期间发布视频生成大模型,目前通义 App 频道和通义万相 PC 端已上线“视频生成”入口,仅支持用户预约,但未开放使用。页面内容显示,全新发布的视频生成大模型是由通义实验室自主研发,包含“文生视频”和“图生视频”两种创作模式。AI在线测试,预约成功后,阿里通义会在用户获得使用资格时进行通知,并赠送给用户 66 灵感值(有效期 30 天)。
9/14/2024 3:03:02 PM
汪淼

OpenAI ChatGPT AI 聊天机器人新增“/picture”和“/search”指令

OpenAI 扩充 ChatGPT 系统快捷指令,新增“/picture”和“/search”,进一步改善用户的交互体验。AI在线附上操作方法如下:在与 ChatGPT 对话时,只需输入一个“/”(不含双引号),一个便捷的弹出窗口就会显示这些快捷选项。“/picture”该指令会调用 OpenAI 的文生图模型 DALL-E,即使用户没有具体的提示或想法,只需选择 / picture,也能为你生成有趣的图像。“/search”该指令会进入一个新的搜索模式,你输入的任何内容都会被视为搜索查询。即便用户没有输入任何内容
9/14/2024 9:13:18 AM
故渊

初探谷歌 Gemini 的 Google Photos 扩展:帮用户回忆过往、记录信息

科技媒体 Android Authority 今天(9 月 13 日)报道,谷歌目前正在 Gemini 应用中测试 Google Photos 扩展,在最新 15.36.40.29 测试版 Google 应用中初步体验了该扩展。根据 Google 的官方描述,该扩展主要提供两种使用方式:“回忆过往活动,如首次品尝的美食照片”以及“利用摄影来记录信息”。这强烈暗示扩展将主要运用即将登陆 Google Photos 的“Ask Photos”和自然语言搜索功能。谷歌已推出自然语言搜索功能,支持用户使用随意的对话式描述来
9/13/2024 3:11:36 PM
故渊

安卓版谷歌 Gemini Live 免费上线,开启在线 AI 语音畅聊

科技媒体 9to5Google 昨日(9 月 12 日)发布博文,报道谷歌在 1 个月前面向 Advanced 订阅用户推出后,正逐步面向所有安卓用户免费开放 Gemini Live。AI在线曾于 8 月报道,谷歌在 Pixel 9 系列手机发布会上,发布了 Gemini Live,该服务提供了一种移动对话体验,让用户和 Gemini 展开自由流畅的对话。Gemini Live 可以说是对标 OpenAI ChatGPT 最新上线的 Advanced Voice 模式(限量 Alpha 测试),采用了增强型语音引擎
9/13/2024 8:33:38 AM
故渊

文生图 AI Midjourney 雄心:7.0 版未来 1-2 月登场、开发新图像编辑器、探索 3D 系统、踏足硬件领域

科技媒体 The Decoder 昨日(9 月 12 日)发布博文,报道称在最近的“Office Hours”活动中,Midjourney 创始人兼首席执行官 David Holz 在 Discord 分享了当前项目的最新进展,并回答了社区的提问。Midjourney 7.0 版本Holz 更新了 Midjourney 7.0 版本时间表,表示将会在未来 1-2 月内发布。让更多人体验 MidjourneyHolz 表示公司并不急于推出新的 AI 模型,而是提高现有技术的易用性,让工具深入融入到专业人士的日常工作中
9/13/2024 7:36:39 AM
故渊

安卓和 iOS 版谷歌 Gemini AI 应用新增 Gems 及管理器

科技媒体 testingcatalog 昨日(9 月 12 日)发布博文,报道称 iOS 和安卓版 Gemini 应用新增支持 Gem 和 Gem 管理器。用户现可在主屏幕上查看常规聊天及与 Gems 相关的聊天,此外用户可进入 Gem 管理器,界面采用标签式布局,首屏展示所有 Gems,分为用户自定义 Gems 和谷歌预制的 Gems 两部分。用户如果要编辑或创建新 Gems,用户会被引导打开网页版,该网页版会在同一应用内的网页视图中打开。Gemini 简介AI在线附上官方介绍如下:Gemini 应用是一款实验性
9/13/2024 7:24:34 AM
故渊

谷歌 NotebookLM 新增 Audio Overview 功能:生成 2 位 AI 主播,围绕用户文档展开播客式交流

科技媒体 maginative 昨日(9 月 11 日)报道,谷歌公司升级旗下笔记应用 NotebookLM,新增 Audio Overview 功能,可以围绕着用户上传的文档,生成两位 AI 主持人,并通过播客方式展开讨论。NotebookLM 简介NotebookLM 基于谷歌 Gemini 1.5 Pro AI 模型,是一款个性化人工智能研究助手。用户可以上传 Google Docs、Google Slides、PDF 文件以及网页 URL 地址,该应用能够研究这些文档内容,为用户提供更有洞察力的回答。Aud
9/12/2024 1:41:55 PM
故渊

夸克发布全新 CueMe 智能对话助手,支持上千种体裁、2 万字长文

今日,夸克发布全新智能对话助手 CueMe,用户现可通过 cueme.cn 或夸克 App 使用。AI在线从官方获悉,CueMe 是基于夸克大模型自主研发,AI 写作能力突出,支持不同体裁、不同篇幅的内容生成,最长可生成 2 万字的内容。夸克表示,CueMe 针对不同细分体裁进行了充分的语料预训练,可支持上千种不同体裁的写作需求,包括研究报告、日常写作、课程论文、新媒体文案等等,并且还在持续扩展中。此外,CueMe 还支持文风定制,用户可选择根据平台风格、语言风格或个人文章风格生成符合其个性化需求的内容。据夸克官方
9/12/2024 10:17:24 AM
问舟

AI 被连续否定 30 次:ChatGPT 越改越错,Claude 坚持自我,甚至已读不回

一直否定 AI 的回答会怎么样?GPT-4o 和 Claude 有截然不同的表现,引起热议。GPT-4o 质疑自己、怀疑自己,有“错”就改;Claude 死犟,真错了也不改,最后直接已读不回。事情还要从网友整了个活儿开始讲起。他让模型回答 strawberry 中有几个“r”,不论对不对,都回复它们回答错了(wrong)。面对考验,GPT-4o 只要得到“wrong”回复,就会重新给一个答案…… 即使回答了正确答案 3,也会毫不犹豫又改错。一口气,连续“盲目”回答了 36 次!主打一个质疑自己、怀疑自己,就从来没怀
9/9/2024 11:02:19 PM
清源

谷歌 Google Photos 美国获推“询问照片内容”测试功能:基于 Gemini AI 模型、支持自然语言

谷歌今天为 Google Photos 美国用户推出了“询问照片内容(Ask Photos)”测试功能,现在相关地区拥有测试资格的用户可以在自己的安卓 / iOS 设备上直接询问 AI 照片中的内容。据介绍,该功能由谷歌 Gemini AI 模型驱动,谷歌提到,该应用现在可以了解用户照片库中各种点点滴滴背后的细节,如今用户若想计划一次露营之旅,并想回到自己“最喜欢的地点”,即可询问应用“我们上次去优胜美地时在哪里露营?”、如果用户想回到“自己最喜欢的餐厅”点同样的东西,可以询问应用“我们在斯坦利的酒店吃了什么?”。
9/6/2024 7:05:17 AM
漾仔