用户
Siri 将更聪明:苹果加速整合 ChatGPT,正推进生成文本 / 图像技能
科技媒体 MacRumors 昨日(10 月 17 日)发布博文,报道称苹果正在全力以赴为 iOS 18、iPadOS 18 和 macOS 15 添加全新的 Apple Intelligence 特性,最新发现的后端代码显示苹果公司正努力在 Siri 中整合 ChatGPT。根据最新发现的 Siri 后端代码,提到了调用 ChatGPT 生成文本和图像两个选项,意味着苹果公司即将部署这两项生成功能。ChatGPT 具备卓越的生成文本和图像能力,超越苹果现有的写作工具和文生图 Image Playground 功能,因此可以为用户提供更高级的内容创建能力。
10/18/2024 6:25:33 AM
故渊
摩托罗拉 Moto AI 开启便捷生活新篇章:点咖啡、叫网约车等一句话搞定
科技媒体 Android Authority 今天(10 月 16 日)发布博文,报道称在 2024 联想科技世界大会上,摩托罗拉推出了 Moto AI 功能,增强用户互动并提供个性化的帮助。摩托罗拉在去年的联想科技世界大会上宣布 Moto AI,宣布正开发相关的 AI 助手;今年 6 月,摩托罗拉和谷歌公司合作,在 Razr 2024 系列手机中引入了 Moto Magic Canvas(云端文生图 AI 模型)和 Style Sync(AI 壁纸创建器)两项 AI 功能。摩托罗拉在今年联想科技世界大会上,宣布进一步扩充 Moto AI 功能,AI在线附上相关改进如下:自然语言交互:Moto AI 将支持用户通过自然语言指令进行操作。
10/16/2024 2:57:25 PM
故渊
Adobe 推出多款 AI 工具:可构建 3D 场景、消除路人、清洁镜头
据 The Verge 今天凌晨报道,Adobe 近期展示了多款实验性的 AI 工具,可用于动画制作、图像生成、照片及视频的优化等领域,未来有望被整合到 Creative Cloud 中。Project Scenic:该工具可让用户在使用 Firefly 模型生成图像时拥有更大的控制权。其能够生成一个完整的 3D 场景,用户可以自由添加、移动、调整场景中的物体大小,最终结果会根据 3D 场景生成相应的 2D 图像。
10/16/2024 7:04:50 AM
清源
月之暗面发布 Kimi 探索版:搜索量相比普通版增强 10 倍,可精读 500 个页面
感谢AI在线从月之暗面获悉,具备 AI 自主搜索能力的 Kimi 探索版今日上线,其搜索量是普通版的 10 倍,一次搜索即可精读 500 个页面。据官方介绍,该功能会模拟人类的推理思考过程并执行深度搜索,帮助用户更高效完成分析调研。通过自主策略规划、自动化大规模信息检索、对搜索结果的反思补充等多个步骤,用户可以获得更准确和全面的答案。
10/11/2024 12:04:45 PM
清源
聊天机器人帮你“深入了解”约会对象,Grindr 将推出“AI 僚机”功能
据《华尔街日报》北京时间今天报道,约会平台 Grindr 宣布推出专为用户设计的 AI 助手,预计在 2027 年前后完全上线,届时可为 1400 万名用户提供服务。该 AI 助手可用于跟踪用户与心仪对象的对话,并为其提供适合的长期伴侣、为约会地点提供建议。未来,该助手还将具备更多“AI 智能体”的功能,譬如预定餐厅、与另一个“AI 智能体”进行约会。具体来看,当两名用户匹配之后,用户各自的 AI 助手可以互相交流,以便在实际约会前对彼此有更深入的了解。Grindr 的首席执行官乔治・阿利森表示,机器人之间的对话不
10/6/2024 9:04:34 AM
清源
OpenAI 推出全新写作、编码工具 ChatGPT Canvas,将免费开放
感谢OpenAI 今日宣布推出全新写作、编码工具 Canvas,这是一个与 ChatGPT 合作编写和编码项目的新界面,超越了简单的聊天。AI在线从官方介绍获悉,ChatGPT Canvas 可以更好地了解任务的上下文,用户可以突出显示特定部分,以准确表明希望 ChatGPT 关注的内容。用户也可以直接编辑文本或代码,要求 ChatGPT 调整写入长度、调试代码并快速执行其他操作,并且提供后退按钮来恢复作品的先前版本。写作功能包括:建议编辑:ChatGPT 提供建议和反馈。调整文章长度:将文档长度编辑为更短或更长。
10/4/2024 10:05:56 AM
浩渺
谷歌 Lens 开启 AI 新篇章:视频、语音多维度拓展,搜索、购物、识曲探索多元未来
谷歌公司昨日(10 月 3 日)发布博文,宣布升级旗下的 Google Lens 服务,在现有拍照、图片搜索基础上,支持视频搜索和语音输入,解锁 AI 时代新的提问方式。Google Lens 简介Google Lens 是由谷歌开发的一种图像识别技术,旨在通过识别图像中的对象,提供相关信息。这项技术可以帮助用户更好地理解周围的世界,使用起来非常简单。晒成绩谷歌在博文中首先晒出了 Google Lens 取得的成绩,表示每月全球视觉搜索次数逼近 200 亿次,帮助人们通过相机或屏幕搜索他们所看到的内容。其中年轻用户
10/4/2024 7:28:51 AM
故渊
安卓版谷歌 Gemini Live 上线,助力 AI 开启全民语音聊天时代
谷歌公司昨日(10 月 1 日)在 X 平台发布推文,宣布通过 Gemini 应用,现面向所有安卓用户开放 Gemini Live 功能。AI在线曾于 8 月报道,谷歌在 Pixel 9 系列手机发布会上,发布了 Gemini Live,该服务提供了一种移动对话体验,让用户和 Gemini 展开自由流畅的对话。Gemini Live 可以说是对标 OpenAI ChatGPT 最新上线的 Advanced Voice 模式,采用了增强型语音引擎,可以展开更连贯、更有情感表达力、更逼真的多轮对话。需要注意的是,目前仅
10/2/2024 9:14:09 AM
故渊
微软被曝拓展 Copilot AI 应用,打造专属于你的新闻主播
科技媒体 Windows Central 昨日(9 月 27 日)报道,微软公司正计划扩展 Copilot,打造个性化的虚拟新闻主播,播报用户感兴趣的相关新闻和动态信息。消息称微软在文生图和网络搜索之外,积极推动各项 AI 服务落地。AI在线曾于 9 月 21 日报道,微软启动第二波 Copilot 更新,引入了全新的 Pages,为 Excel 支持 Python 语言,以及上线 Copilot Agents 等。微软计划重塑移动端 Copilot 应用程序,将常规的 AI 助手转变为虚拟新闻主播,目前微软已经
9/28/2024 12:41:26 PM
故渊
微软网页版 OneDrive 正式融合 Copilot:一键总结、多文件对比,AI 提高你的生产力
微软公司昨日(9 月 27 日)发布新闻稿,宣布面向获得 Copilot 许可的商业用户,正式开放网页版 OneDrive 中的 Copilot,意味着用户可以探索全新的 AI 文件处理方式。OneDrive 中的 Copilot 的技能包括:为大文件生成摘要Copilot 能够为用户生成文档摘要,节省查找关键点的时间,并帮助用户专注于最重要的内容。对比多个文档中的差异用户无需打开文件,Copilot 可以比较多个文档的差异,快速展示关键差异。回答文件内容相关话题Copilot 能够分析 OneDrive 中的文件
9/28/2024 12:29:13 PM
故渊
谷歌 AI 笔记助手 NotebookLM 获更新:支持总结视频内容、创建学习指南
谷歌本周对旗下 AI 笔记助手 NotebookLM 进行更新,目前该助手已支持对视频内容进行总结(现支持 YouTube 平台)。▲ 图源谷歌(下同)谷歌 NotebookLM 自去年 7 月发布以来一直不断更新,与传统聊天机器人不同,NotebookLM 更侧重于辅助用户“学术思考”,允许用户根据需要对文章、视频、音频进行摘要。AI在线获悉,目前谷歌 NotebookLM 模型采用 Gemini 1.5 Pro 作为底层,而本次更新带来的视频内容总结能力主要用于获取视频片段关键点,方便用户快速跳转到特定视频时间
9/27/2024 3:52:19 PM
漾仔
Snapchat 聊天机器人 My AI 将整合谷歌 Gemini 模型
谷歌 Google Cloud 公司本周二宣布和 Snap 公司合作,在 Snapchat 的 AI 聊天机器人 My AI 中整合 Gemini,为用户带来更强的 AI 聊天体验。AI在线援引新闻稿内容,Snapchat 将使用谷歌 Gemini 聊天机器人的强大多模态功能,理解文本、音频、图像、视频和代码在内的多种输入类型,并理解回答用户的提问。谷歌表示本次合作,为 Snapchat 用户带来了更多创新功能。Snap 首席执行官埃文・斯皮格尔(Evan Spiegel)评论表示:与 Google Cloud 的
9/26/2024 9:42:43 AM
故渊
OpenAI 上线高级语音模式:翻开 AI 语音聊天新篇章,能用中文等 50 多种语言说“抱歉我迟到了”
感谢OpenAI 公司今天(9 月 25 日)发布博文,宣布面向所有 Plus 和 Team 订阅用户,推出高级语音模式(Advanced Voice Mode,简称 AVM),标志着人工智能对话技术向前迈出了重要一步。该功能之前仅邀请部分用户测试,OpenAI 希望通过语音,提供更自然、更像人类的交互体验。AI在线附上 AVM 主要功能如下:改善对话体验:AVM 可实现更流畅、反应更迅速的对话,让用户能够打断人工智能,并对话题的变化做出即时反应。新的声音:新增 Arbor、Maple、Sol、Spruce 和 V
9/25/2024 11:36:21 AM
故渊
OpenAI ChatGPT 新增自动模式,基于提示词复杂度灵活选择合适 AI 模型
科技媒体 testingcatalog 昨日(9 月 18 日)报道,OpenAI 面向所有用户在多种设备上,为 ChatGPT 推出了“Auto”自动模式。AI在线注:用户切换选择 Auto 之后,会自动根据用户输入的提示词复杂程度,自动选择最合适的 AI 模型。对于复杂的提示,它会选用最先进的模型,而对于较简单的提示,则采用更快的模型以节省时间。许多用户反馈表示,在大多数情况下,他们更倾向于与最先进的模型进行交互。然而,在某些特定场景下,能够选择优化速度被视为一项有价值的功能。
9/19/2024 9:28:30 AM
故渊
金山办公:目前 AI 会员、大会员累计年度付费用户数合计已超百万
金山办公今天在上证 e 互动答投资者问时透露,公司目前 AI 会员和大会员累计年度付费用户数合计已超百万。目前,WPS AI 已接入公司全线产品。金山办公在投资者平台还表示,公司与华为共同合作,已推出 WPS 鸿蒙版。目前,WPS 鸿蒙版已在全端流畅运行,还能实现多平台账号统一、跨端调用、跨屏协同等功能。本月初,WPS Office 官网上线了 WPS Office for Linux 12 个人版,新增了 AI 帮我写、帮我改等功能,以及 AI 写公式、AI 生成 PPT 等。据AI在线此前报道,今年 7 月的
9/18/2024 6:24:19 PM
清源
阿里通义将发布 AI 视频生成大模型,支持文生视频、图生视频
感谢阿里通义将在 2024 云栖大会(9 月 19 日至 9 月 21 日)期间发布视频生成大模型,目前通义 App 频道和通义万相 PC 端已上线“视频生成”入口,仅支持用户预约,但未开放使用。页面内容显示,全新发布的视频生成大模型是由通义实验室自主研发,包含“文生视频”和“图生视频”两种创作模式。AI在线测试,预约成功后,阿里通义会在用户获得使用资格时进行通知,并赠送给用户 66 灵感值(有效期 30 天)。
9/14/2024 3:03:02 PM
汪淼
OpenAI ChatGPT AI 聊天机器人新增“/picture”和“/search”指令
OpenAI 扩充 ChatGPT 系统快捷指令,新增“/picture”和“/search”,进一步改善用户的交互体验。AI在线附上操作方法如下:在与 ChatGPT 对话时,只需输入一个“/”(不含双引号),一个便捷的弹出窗口就会显示这些快捷选项。“/picture”该指令会调用 OpenAI 的文生图模型 DALL-E,即使用户没有具体的提示或想法,只需选择 / picture,也能为你生成有趣的图像。“/search”该指令会进入一个新的搜索模式,你输入的任何内容都会被视为搜索查询。即便用户没有输入任何内容
9/14/2024 9:13:18 AM
故渊
初探谷歌 Gemini 的 Google Photos 扩展:帮用户回忆过往、记录信息
科技媒体 Android Authority 今天(9 月 13 日)报道,谷歌目前正在 Gemini 应用中测试 Google Photos 扩展,在最新 15.36.40.29 测试版 Google 应用中初步体验了该扩展。根据 Google 的官方描述,该扩展主要提供两种使用方式:“回忆过往活动,如首次品尝的美食照片”以及“利用摄影来记录信息”。这强烈暗示扩展将主要运用即将登陆 Google Photos 的“Ask Photos”和自然语言搜索功能。谷歌已推出自然语言搜索功能,支持用户使用随意的对话式描述来
9/13/2024 3:11:36 PM
故渊
资讯热榜
阿里推出 AI 医学助手 App“氢离子”:收录千万级核心期刊文献,还可查疾病、找药品
MyShell ShellAgent 2.0发布:一句话创建App,零前端的AI革命来袭
AI视频记忆革命来了!Memories.ai获800万美元融资,挑战千万小时视频分析极限
因为不用AI写代码,我在终面挂了 | 一个程序员的奇葩面试经历
彻底解决出图困难!超高效的Kontext工作流搭建+提示词技巧
刷新无监督异常检测上限!首提「匹配代价滤波for异常检测」范式 | ICML'25
Lovart 实战深度测评!仅需4小时帮你完成一整套品牌全案设计!
性能比肩 Gemini-2.5 pro、o4-mini:阿里通义千问 Qwen 3 推理模型超级进化,现已开源
标签云
人工智能
AI
OpenAI
AIGC
模型
ChatGPT
DeepSeek
AI绘画
谷歌
机器人
数据
大模型
Midjourney
开源
智能
用户
Meta
微软
GPT
学习
技术
图像
Gemini
AI创作
马斯克
论文
智能体
Anthropic
英伟达
代码
算法
Stable Diffusion
训练
芯片
开发者
蛋白质
腾讯
生成式
LLM
苹果
神经网络
Claude
AI新词
3D
研究
机器学习
生成
AI for Science
Agent
xAI
计算
人形机器人
Sora
AI视频
GPU
AI设计
百度
华为
搜索
大语言模型
工具
场景
具身智能
字节跳动
RAG
大型语言模型
预测
深度学习
伟达
视觉
Transformer
AGI
视频生成
神器推荐
亚马逊
Copilot
DeepMind
架构
模态
LLaMA