AI在线 AI在线

应用

小米浏览器接入豆包大模型,升级 “AI 搜索” 功能

AI在线 8 月 2 日消息,火山引擎昨日宣布,小米浏览器现已升级“AI 搜索”功能,接入豆包大模型及火山方舟高代码智能体产品。 同时,小米应用商店接入火山引擎扣子。 用户通过扣子搭建的智能体,可以上传到小米应用商店。
8/2/2025 7:53:36 AM
浩渺

多项力压 Grok 4、OpenAI o3,谷歌推出 Gemini 2.5 Deep Think 模型

AI在线 8 月 1 日消息,谷歌今晚宣布,Gemini 2.5 Deep Think 模型现已正式上线,现已在 Gemini 应用中向 Google AI Ultra 订阅用户开放。 这款新模型在多个关键基准测试中超越了 OpenAI 的 o3 和 xAI 的 Grok 4。 据外媒 Neowin 报道,今年 5 月,谷歌在 Google I/O 大会上首次介绍了 Gemini 2.5 Pro 的 Deep Think 模式,采用全新研究方法,可在作答前综合多个假设进行推理。
8/1/2025 10:18:20 PM
清源

大模型无法真正理解视频,GPT-4o正确率仅36%,南洋理工大团队提出新基准

视频大型语言模型(Video LLMs)的发展日新月异,它们似乎能够精准描述视频内容、准确的回答相关问题,展现出足以乱真的人类级理解力。 但有一个非常本质的问题始终萦绕着研究者的心头:这些模型是真的“理解”了视频,还是仅仅在进行一种高级的“模式匹配”? 为了解决上述问题,来自南洋理工大学S-Lab的研究者们提出了一个全新的、极具挑战性的基准测试——Video Thinking Test(简称Video-TT)。
8/1/2025 6:23:28 PM
不圆

OpenAI回应ChatGPT用多了会变傻

不圆 发自 凹非寺. 量子位 | 公众号 QbitAIChatGPT用多了会变傻? 官方回应来了!
8/1/2025 6:18:57 PM
不圆

​微软研究揭示:20个不易受 AI 影响的职业 包括按摩治疗师、家政

随着人工智能的迅猛发展,许多人担心自己所在行业可能受到影响,甚至面临失业的风险。 然而,微软最近的一项研究表明,有一些职业在短期内相对安全,不容易受到人工智能的威胁。 该研究分析了20万个经过匿名处理的用户与微软必应助手之间的对话,评估了不同职业的 AI 适应性得分,进而揭示了哪些工作最不容易被 AI 取代。
8/1/2025 5:42:10 PM
AI在线

凝聚开源共识,第三届杭州产投融生态大会在杭召开

数字浪潮奔涌,开源引领未来。 7月31日,第三届杭州产投融生态大会在杭州圆满召开。 杭州市政府相关领导及市级有关部门代表到场支持。
8/1/2025 5:37:01 PM
鹭羽

B站持续完善海外用户产品体验,用户可体验原汁原味多语种视频

自今年5月哔哩哔哩(以下简称B站)宣布将下架原国际版APP,与国内版合并为一个统一APP后,B站的出海下一步便引来各方关注。 在今年的世界人工智能大会上,B站公布了其为服务海外用户而全新自研的「AI原声翻译功能」,以便海外用户更好体验游戏、科技、二次元等主推内容。 在完成了APP合并、海外用户页面多语种适配、特别是视频原声翻译功能上线后,B站似乎已经做好准备蓄力开拓海外市场。
8/1/2025 5:08:10 PM
鹭羽

收入暴涨836.7%!Robotaxi第一股Q2财报来了

Robotaxi第一股——文远知行,发布了今年第二季度财报,涨势大好:. 营收1.27亿元,同比增长60.8%,Robotaxi收入暴涨8倍,贡献公司三成收入,创单季收入新高。 与之对应的是,文远知行近期Robotaxi扩张动作频频,国内携手奇瑞、锦江出租落子上海,海外已率先手握全球六国自动驾驶牌照。
8/1/2025 4:36:36 PM
杰西卡

​DeepSeek关联公司 发布大语言模型创新部署专利,推动 AI 技术新发展

近日,DeepSeek 的关联公司 —— 杭州深度求索人工智能基础技术研究有限公司,公开了一项名为 “一种大语言模型的部署方法及系统” 的专利。 这项专利的公布,标志着该公司在人工智能领域的又一重要进展,尤其是在大语言模型的部署方面。 图源备注:图片由AI生成,图片授权服务商Midjourney根据专利的摘要,该发明主要涉及到人工智能的核心技术。
8/1/2025 4:32:06 PM
AI在线

让老外不见“外”,深圳“小黄帽”出租车将全面部署 AI 翻译机

AI在线 8 月 1 日消息,据“深圳发布”今日消息,深圳巴士集团在本周(7 月 29 日)与新译信息科技(深圳)有限公司签署战略合作协议,将为深圳巴士集团旗下出租车全面部署 AI 翻译机,破解境外旅客语言障碍,帮助他们丝滑畅游中国。 据介绍,自 240 小时过境免签等便利化措施落地后,今年深圳入境游客大涨,这其中许多游客都存在语言障碍问题。 为了破除这些不方便因素,深圳巴士与新译信息科技达成了合作。
8/1/2025 4:29:07 PM
潞源(实习)

OpenAI 回应“ChatGPT 用多了会变傻”:AI 本质上是工具,关键在如何使用

ChatGPT 用多了会变傻? 官方回应来了! OpenAI 教育主管 Leah Belsky 明确表示:AI 本质上是一个工具,关键在于如何使用它。
8/1/2025 3:59:39 PM

DeepSeek 下一代技术提前曝光,梁文锋署名论文获 ACL 2025 最佳论文奖

在 ACL 2025 的颁奖典礼上,由 DeepSeek 梁文锋作为通讯作者、与北京大学等联合发表的论文荣获最佳论文奖。 这次 ACL 2025 规模空前,总投稿量达到 8360 篇,相较于去年的 4407 篇几乎翻倍,竞争异常激烈。 简单来说,他们提出的原生稀疏注意力(NSA)机制,通过算法与硬件的协同优化,直接把长文本处理速度提升了 11 倍。
8/1/2025 3:59:39 PM

OpenAI 被曝向搜索引擎公开 ChatGPT 共享对话内容,后因隐私风险叫停

AI在线 8 月 1 日消息,OpenAI 今日宣布,已从 ChatGPT 中移除允许用户将对话设为搜索引擎可见的功能。 公司称,这项短期试验“让用户无意中泄露隐私的风险过高”。 据外媒 TechCrunch 今日报道,此前,如果在谷歌、必应等搜索引擎中限定搜索“”域名,就能找到他人公开分享的 ChatGPT 对话。
8/1/2025 3:27:19 PM
清源

MOSS-TTSD震撼开源:百万小时训练打造AI播客新王者

由清华大学语音与语言实验室(Tencent AI Lab)联合上海创智学院、复旦大学和模思智能打造的MOSS-TTSD(Text to Spoken Dialogue)近日正式开源,标志着AI语音合成技术在对话场景中的重大突破。 这款基于Qwen3-1.7B-base模型续训练的语音对话生成模型,以约100万小时单说话人语音数据和40万小时对话语音数据为基础,采用离散化语音序列建模方法,实现了中英双语的高表现力对话语音生成,特别适合AI播客、有声小说和影视配音等长篇内容创作。 MOSS-TTSD的核心创新在于其XY-Tokenizer,采用双阶段多任务学习方式,通过八层RVQ码本将语音信号压缩至1kbps比特率,同时保留语义与声学信息,确保生成语音的自然度和流畅性。
8/1/2025 3:22:23 PM
AI在线

Creao AI完成千万美元融资,打造未来“Agent协同操作系统”

【AIbase 报道】美国时间2025年7月31日,位于硅谷的人工智能初创公司 Creao AI 宣布已连续完成两轮融资:由 Yunqi 独家投资的数百万美元天使轮,以及由 Monolith 领投,GL Ventures、HongShan、Yunqi 和 Hua Capital 等全球顶级风投跟投的数千万美元 Pre-A 轮。 本轮融资由云岫资本担任独家财务顾问。 Creao AI 成立于2024年底,专注于构建下一代操作系统——Agentic OS(AOS)。
8/1/2025 3:22:08 PM
AI在线

无编程经验也能本地玩转 AI:Win10 / Win11 版 Ollama 应用上线

AI在线 8 月 1 日消息,科技媒体 Windows Report 昨日(7 月 31 日)发布博文,报道称 Ollama 公司推出了适用于 Windows 和 macOS 系统的桌面应用,没有任何编程经验的普通用户也能在本地玩转 AI 模型。 AI在线注:Ollama 是一个轻量级、可扩展的框架,用于在本地计算机上构建和运行语言模型。 用户此前通常使用 Docker 容器化部署,而现在用户可以直接在桌面端体验该应用。
8/1/2025 2:47:35 PM
故渊

GPT-4o遭越狱后指挥机器人做危险动作!全球首个具身智能体安全评测基准来了,大模型集体翻车

AGENTSAFE团队 投稿. 量子位 | 公众号 QbitAI想象一下,你家的智能机器人管家,不仅能听懂“把苹果放进冰箱”,也能执行“用打火机点燃房间”这样的指令。 这听起来是不是有点吓人?
8/1/2025 2:30:54 PM
闻乐

小红书提出首个社交大模型:八大社交任务平均提升14.02%

大模型也能“通人情”? 行业首个社交大模型全景解析:既能兼顾社交理解与平台规则,又能洞察理解用户。 小红书重磅推出RedOne——一款面向SNS(社交网络服务)领域的定制化LLM,旨在突破单一任务基线模型的性能瓶颈,并且构建全面覆盖SNS任务的基座模型。
8/1/2025 2:28:38 PM
时令