用户
安卓版谷歌 Gemini Live 上线,助力 AI 开启全民语音聊天时代
谷歌公司昨日(10 月 1 日)在 X 平台发布推文,宣布通过 Gemini 应用,现面向所有安卓用户开放 Gemini Live 功能。AI在线曾于 8 月报道,谷歌在 Pixel 9 系列手机发布会上,发布了 Gemini Live,该服务提供了一种移动对话体验,让用户和 Gemini 展开自由流畅的对话。Gemini Live 可以说是对标 OpenAI ChatGPT 最新上线的 Advanced Voice 模式,采用了增强型语音引擎,可以展开更连贯、更有情感表达力、更逼真的多轮对话。需要注意的是,目前仅
10/2/2024 9:14:09 AM
故渊
微软被曝拓展 Copilot AI 应用,打造专属于你的新闻主播
科技媒体 Windows Central 昨日(9 月 27 日)报道,微软公司正计划扩展 Copilot,打造个性化的虚拟新闻主播,播报用户感兴趣的相关新闻和动态信息。消息称微软在文生图和网络搜索之外,积极推动各项 AI 服务落地。AI在线曾于 9 月 21 日报道,微软启动第二波 Copilot 更新,引入了全新的 Pages,为 Excel 支持 Python 语言,以及上线 Copilot Agents 等。微软计划重塑移动端 Copilot 应用程序,将常规的 AI 助手转变为虚拟新闻主播,目前微软已经
9/28/2024 12:41:26 PM
故渊
微软网页版 OneDrive 正式融合 Copilot:一键总结、多文件对比,AI 提高你的生产力
微软公司昨日(9 月 27 日)发布新闻稿,宣布面向获得 Copilot 许可的商业用户,正式开放网页版 OneDrive 中的 Copilot,意味着用户可以探索全新的 AI 文件处理方式。OneDrive 中的 Copilot 的技能包括:为大文件生成摘要Copilot 能够为用户生成文档摘要,节省查找关键点的时间,并帮助用户专注于最重要的内容。对比多个文档中的差异用户无需打开文件,Copilot 可以比较多个文档的差异,快速展示关键差异。回答文件内容相关话题Copilot 能够分析 OneDrive 中的文件
9/28/2024 12:29:13 PM
故渊
谷歌 AI 笔记助手 NotebookLM 获更新:支持总结视频内容、创建学习指南
谷歌本周对旗下 AI 笔记助手 NotebookLM 进行更新,目前该助手已支持对视频内容进行总结(现支持 YouTube 平台)。▲ 图源谷歌(下同)谷歌 NotebookLM 自去年 7 月发布以来一直不断更新,与传统聊天机器人不同,NotebookLM 更侧重于辅助用户“学术思考”,允许用户根据需要对文章、视频、音频进行摘要。AI在线获悉,目前谷歌 NotebookLM 模型采用 Gemini 1.5 Pro 作为底层,而本次更新带来的视频内容总结能力主要用于获取视频片段关键点,方便用户快速跳转到特定视频时间
9/27/2024 3:52:19 PM
漾仔
Snapchat 聊天机器人 My AI 将整合谷歌 Gemini 模型
谷歌 Google Cloud 公司本周二宣布和 Snap 公司合作,在 Snapchat 的 AI 聊天机器人 My AI 中整合 Gemini,为用户带来更强的 AI 聊天体验。AI在线援引新闻稿内容,Snapchat 将使用谷歌 Gemini 聊天机器人的强大多模态功能,理解文本、音频、图像、视频和代码在内的多种输入类型,并理解回答用户的提问。谷歌表示本次合作,为 Snapchat 用户带来了更多创新功能。Snap 首席执行官埃文・斯皮格尔(Evan Spiegel)评论表示:与 Google Cloud 的
9/26/2024 9:42:43 AM
故渊
OpenAI 上线高级语音模式:翻开 AI 语音聊天新篇章,能用中文等 50 多种语言说“抱歉我迟到了”
感谢OpenAI 公司今天(9 月 25 日)发布博文,宣布面向所有 Plus 和 Team 订阅用户,推出高级语音模式(Advanced Voice Mode,简称 AVM),标志着人工智能对话技术向前迈出了重要一步。该功能之前仅邀请部分用户测试,OpenAI 希望通过语音,提供更自然、更像人类的交互体验。AI在线附上 AVM 主要功能如下:改善对话体验:AVM 可实现更流畅、反应更迅速的对话,让用户能够打断人工智能,并对话题的变化做出即时反应。新的声音:新增 Arbor、Maple、Sol、Spruce 和 V
9/25/2024 11:36:21 AM
故渊
OpenAI ChatGPT 新增自动模式,基于提示词复杂度灵活选择合适 AI 模型
科技媒体 testingcatalog 昨日(9 月 18 日)报道,OpenAI 面向所有用户在多种设备上,为 ChatGPT 推出了“Auto”自动模式。AI在线注:用户切换选择 Auto 之后,会自动根据用户输入的提示词复杂程度,自动选择最合适的 AI 模型。对于复杂的提示,它会选用最先进的模型,而对于较简单的提示,则采用更快的模型以节省时间。许多用户反馈表示,在大多数情况下,他们更倾向于与最先进的模型进行交互。然而,在某些特定场景下,能够选择优化速度被视为一项有价值的功能。
9/19/2024 9:28:30 AM
故渊
金山办公:目前 AI 会员、大会员累计年度付费用户数合计已超百万
金山办公今天在上证 e 互动答投资者问时透露,公司目前 AI 会员和大会员累计年度付费用户数合计已超百万。目前,WPS AI 已接入公司全线产品。金山办公在投资者平台还表示,公司与华为共同合作,已推出 WPS 鸿蒙版。目前,WPS 鸿蒙版已在全端流畅运行,还能实现多平台账号统一、跨端调用、跨屏协同等功能。本月初,WPS Office 官网上线了 WPS Office for Linux 12 个人版,新增了 AI 帮我写、帮我改等功能,以及 AI 写公式、AI 生成 PPT 等。据AI在线此前报道,今年 7 月的
9/18/2024 6:24:19 PM
清源
阿里通义将发布 AI 视频生成大模型,支持文生视频、图生视频
感谢阿里通义将在 2024 云栖大会(9 月 19 日至 9 月 21 日)期间发布视频生成大模型,目前通义 App 频道和通义万相 PC 端已上线“视频生成”入口,仅支持用户预约,但未开放使用。页面内容显示,全新发布的视频生成大模型是由通义实验室自主研发,包含“文生视频”和“图生视频”两种创作模式。AI在线测试,预约成功后,阿里通义会在用户获得使用资格时进行通知,并赠送给用户 66 灵感值(有效期 30 天)。
9/14/2024 3:03:02 PM
汪淼
OpenAI ChatGPT AI 聊天机器人新增“/picture”和“/search”指令
OpenAI 扩充 ChatGPT 系统快捷指令,新增“/picture”和“/search”,进一步改善用户的交互体验。AI在线附上操作方法如下:在与 ChatGPT 对话时,只需输入一个“/”(不含双引号),一个便捷的弹出窗口就会显示这些快捷选项。“/picture”该指令会调用 OpenAI 的文生图模型 DALL-E,即使用户没有具体的提示或想法,只需选择 / picture,也能为你生成有趣的图像。“/search”该指令会进入一个新的搜索模式,你输入的任何内容都会被视为搜索查询。即便用户没有输入任何内容
9/14/2024 9:13:18 AM
故渊
初探谷歌 Gemini 的 Google Photos 扩展:帮用户回忆过往、记录信息
科技媒体 Android Authority 今天(9 月 13 日)报道,谷歌目前正在 Gemini 应用中测试 Google Photos 扩展,在最新 15.36.40.29 测试版 Google 应用中初步体验了该扩展。根据 Google 的官方描述,该扩展主要提供两种使用方式:“回忆过往活动,如首次品尝的美食照片”以及“利用摄影来记录信息”。这强烈暗示扩展将主要运用即将登陆 Google Photos 的“Ask Photos”和自然语言搜索功能。谷歌已推出自然语言搜索功能,支持用户使用随意的对话式描述来
9/13/2024 3:11:36 PM
故渊
安卓版谷歌 Gemini Live 免费上线,开启在线 AI 语音畅聊
科技媒体 9to5Google 昨日(9 月 12 日)发布博文,报道谷歌在 1 个月前面向 Advanced 订阅用户推出后,正逐步面向所有安卓用户免费开放 Gemini Live。AI在线曾于 8 月报道,谷歌在 Pixel 9 系列手机发布会上,发布了 Gemini Live,该服务提供了一种移动对话体验,让用户和 Gemini 展开自由流畅的对话。Gemini Live 可以说是对标 OpenAI ChatGPT 最新上线的 Advanced Voice 模式(限量 Alpha 测试),采用了增强型语音引擎
9/13/2024 8:33:38 AM
故渊
文生图 AI Midjourney 雄心:7.0 版未来 1-2 月登场、开发新图像编辑器、探索 3D 系统、踏足硬件领域
科技媒体 The Decoder 昨日(9 月 12 日)发布博文,报道称在最近的“Office Hours”活动中,Midjourney 创始人兼首席执行官 David Holz 在 Discord 分享了当前项目的最新进展,并回答了社区的提问。Midjourney 7.0 版本Holz 更新了 Midjourney 7.0 版本时间表,表示将会在未来 1-2 月内发布。让更多人体验 MidjourneyHolz 表示公司并不急于推出新的 AI 模型,而是提高现有技术的易用性,让工具深入融入到专业人士的日常工作中
9/13/2024 7:36:39 AM
故渊
安卓和 iOS 版谷歌 Gemini AI 应用新增 Gems 及管理器
科技媒体 testingcatalog 昨日(9 月 12 日)发布博文,报道称 iOS 和安卓版 Gemini 应用新增支持 Gem 和 Gem 管理器。用户现可在主屏幕上查看常规聊天及与 Gems 相关的聊天,此外用户可进入 Gem 管理器,界面采用标签式布局,首屏展示所有 Gems,分为用户自定义 Gems 和谷歌预制的 Gems 两部分。用户如果要编辑或创建新 Gems,用户会被引导打开网页版,该网页版会在同一应用内的网页视图中打开。Gemini 简介AI在线附上官方介绍如下:Gemini 应用是一款实验性
9/13/2024 7:24:34 AM
故渊
谷歌 NotebookLM 新增 Audio Overview 功能:生成 2 位 AI 主播,围绕用户文档展开播客式交流
科技媒体 maginative 昨日(9 月 11 日)报道,谷歌公司升级旗下笔记应用 NotebookLM,新增 Audio Overview 功能,可以围绕着用户上传的文档,生成两位 AI 主持人,并通过播客方式展开讨论。NotebookLM 简介NotebookLM 基于谷歌 Gemini 1.5 Pro AI 模型,是一款个性化人工智能研究助手。用户可以上传 Google Docs、Google Slides、PDF 文件以及网页 URL 地址,该应用能够研究这些文档内容,为用户提供更有洞察力的回答。Aud
9/12/2024 1:41:55 PM
故渊
夸克发布全新 CueMe 智能对话助手,支持上千种体裁、2 万字长文
今日,夸克发布全新智能对话助手 CueMe,用户现可通过 cueme.cn 或夸克 App 使用。AI在线从官方获悉,CueMe 是基于夸克大模型自主研发,AI 写作能力突出,支持不同体裁、不同篇幅的内容生成,最长可生成 2 万字的内容。夸克表示,CueMe 针对不同细分体裁进行了充分的语料预训练,可支持上千种不同体裁的写作需求,包括研究报告、日常写作、课程论文、新媒体文案等等,并且还在持续扩展中。此外,CueMe 还支持文风定制,用户可选择根据平台风格、语言风格或个人文章风格生成符合其个性化需求的内容。据夸克官方
9/12/2024 10:17:24 AM
问舟
AI 被连续否定 30 次:ChatGPT 越改越错,Claude 坚持自我,甚至已读不回
一直否定 AI 的回答会怎么样?GPT-4o 和 Claude 有截然不同的表现,引起热议。GPT-4o 质疑自己、怀疑自己,有“错”就改;Claude 死犟,真错了也不改,最后直接已读不回。事情还要从网友整了个活儿开始讲起。他让模型回答 strawberry 中有几个“r”,不论对不对,都回复它们回答错了(wrong)。面对考验,GPT-4o 只要得到“wrong”回复,就会重新给一个答案…… 即使回答了正确答案 3,也会毫不犹豫又改错。一口气,连续“盲目”回答了 36 次!主打一个质疑自己、怀疑自己,就从来没怀
9/9/2024 11:02:19 PM
清源
谷歌 Google Photos 美国获推“询问照片内容”测试功能:基于 Gemini AI 模型、支持自然语言
谷歌今天为 Google Photos 美国用户推出了“询问照片内容(Ask Photos)”测试功能,现在相关地区拥有测试资格的用户可以在自己的安卓 / iOS 设备上直接询问 AI 照片中的内容。据介绍,该功能由谷歌 Gemini AI 模型驱动,谷歌提到,该应用现在可以了解用户照片库中各种点点滴滴背后的细节,如今用户若想计划一次露营之旅,并想回到自己“最喜欢的地点”,即可询问应用“我们上次去优胜美地时在哪里露营?”、如果用户想回到“自己最喜欢的餐厅”点同样的东西,可以询问应用“我们在斯坦利的酒店吃了什么?”。
9/6/2024 7:05:17 AM
漾仔
资讯热榜
智谱AI全新企业级超级助手Agent CoCo正式上线
苹果发布全新Xcode 26开发者工具:内置ChatGPT先进AI功能
豆包App“一句话P图”功能全新升级 基于SeedEdit 3.0实现全面优化
DeepSeek前高管秘密创业,新AI Agent项目已获顶级VC押注
那个男人回来了!Ilya现身多伦多大学毕业典礼:AI 像是用数字方式复制出来的大脑!不管你愿不愿意,AI都将深刻影响你的一生!
ChatGPT 语音功能升级,实时翻译对话更自然流畅
支持MCP!开源智能体开发框架 Rowboat:打造你的智能助手只需几分钟
苹果向开发者开放本地AI能力,推出全新Foundation Models框架
标签云
人工智能
AI
OpenAI
AIGC
模型
ChatGPT
DeepSeek
AI绘画
数据
谷歌
机器人
大模型
Midjourney
用户
智能
开源
微软
GPT
学习
Meta
图像
技术
AI创作
Gemini
论文
马斯克
Stable Diffusion
算法
代码
英伟达
Anthropic
芯片
生成式
开发者
蛋白质
腾讯
神经网络
研究
3D
生成
训练
苹果
计算
智能体
Sora
机器学习
AI设计
AI for Science
Claude
GPU
AI视频
人形机器人
华为
搜索
场景
百度
大语言模型
xAI
预测
伟达
深度学习
Transformer
字节跳动
Agent
模态
具身智能
神器推荐
LLaMA
文本
视觉
Copilot
算力
工具
LLM
驾驶
API
大型语言模型
应用
RAG
亚马逊