应用
小米浏览器接入豆包大模型,升级 “AI 搜索” 功能
AI在线 8 月 2 日消息,火山引擎昨日宣布,小米浏览器现已升级“AI 搜索”功能,接入豆包大模型及火山方舟高代码智能体产品。 同时,小米应用商店接入火山引擎扣子。 用户通过扣子搭建的智能体,可以上传到小米应用商店。
8/2/2025 7:53:36 AM
浩渺
多项力压 Grok 4、OpenAI o3,谷歌推出 Gemini 2.5 Deep Think 模型
AI在线 8 月 1 日消息,谷歌今晚宣布,Gemini 2.5 Deep Think 模型现已正式上线,现已在 Gemini 应用中向 Google AI Ultra 订阅用户开放。 这款新模型在多个关键基准测试中超越了 OpenAI 的 o3 和 xAI 的 Grok 4。 据外媒 Neowin 报道,今年 5 月,谷歌在 Google I/O 大会上首次介绍了 Gemini 2.5 Pro 的 Deep Think 模式,采用全新研究方法,可在作答前综合多个假设进行推理。
8/1/2025 10:18:20 PM
清源
大模型无法真正理解视频,GPT-4o正确率仅36%,南洋理工大团队提出新基准
视频大型语言模型(Video LLMs)的发展日新月异,它们似乎能够精准描述视频内容、准确的回答相关问题,展现出足以乱真的人类级理解力。 但有一个非常本质的问题始终萦绕着研究者的心头:这些模型是真的“理解”了视频,还是仅仅在进行一种高级的“模式匹配”? 为了解决上述问题,来自南洋理工大学S-Lab的研究者们提出了一个全新的、极具挑战性的基准测试——Video Thinking Test(简称Video-TT)。
8/1/2025 6:23:28 PM
不圆
微软研究揭示:20个不易受 AI 影响的职业 包括按摩治疗师、家政
随着人工智能的迅猛发展,许多人担心自己所在行业可能受到影响,甚至面临失业的风险。 然而,微软最近的一项研究表明,有一些职业在短期内相对安全,不容易受到人工智能的威胁。 该研究分析了20万个经过匿名处理的用户与微软必应助手之间的对话,评估了不同职业的 AI 适应性得分,进而揭示了哪些工作最不容易被 AI 取代。
8/1/2025 5:42:10 PM
AI在线
凝聚开源共识,第三届杭州产投融生态大会在杭召开
数字浪潮奔涌,开源引领未来。 7月31日,第三届杭州产投融生态大会在杭州圆满召开。 杭州市政府相关领导及市级有关部门代表到场支持。
8/1/2025 5:37:01 PM
鹭羽
B站持续完善海外用户产品体验,用户可体验原汁原味多语种视频
自今年5月哔哩哔哩(以下简称B站)宣布将下架原国际版APP,与国内版合并为一个统一APP后,B站的出海下一步便引来各方关注。 在今年的世界人工智能大会上,B站公布了其为服务海外用户而全新自研的「AI原声翻译功能」,以便海外用户更好体验游戏、科技、二次元等主推内容。 在完成了APP合并、海外用户页面多语种适配、特别是视频原声翻译功能上线后,B站似乎已经做好准备蓄力开拓海外市场。
8/1/2025 5:08:10 PM
鹭羽
收入暴涨836.7%!Robotaxi第一股Q2财报来了
Robotaxi第一股——文远知行,发布了今年第二季度财报,涨势大好:. 营收1.27亿元,同比增长60.8%,Robotaxi收入暴涨8倍,贡献公司三成收入,创单季收入新高。 与之对应的是,文远知行近期Robotaxi扩张动作频频,国内携手奇瑞、锦江出租落子上海,海外已率先手握全球六国自动驾驶牌照。
8/1/2025 4:36:36 PM
杰西卡
DeepSeek关联公司 发布大语言模型创新部署专利,推动 AI 技术新发展
近日,DeepSeek 的关联公司 —— 杭州深度求索人工智能基础技术研究有限公司,公开了一项名为 “一种大语言模型的部署方法及系统” 的专利。 这项专利的公布,标志着该公司在人工智能领域的又一重要进展,尤其是在大语言模型的部署方面。 图源备注:图片由AI生成,图片授权服务商Midjourney根据专利的摘要,该发明主要涉及到人工智能的核心技术。
8/1/2025 4:32:06 PM
AI在线
让老外不见“外”,深圳“小黄帽”出租车将全面部署 AI 翻译机
AI在线 8 月 1 日消息,据“深圳发布”今日消息,深圳巴士集团在本周(7 月 29 日)与新译信息科技(深圳)有限公司签署战略合作协议,将为深圳巴士集团旗下出租车全面部署 AI 翻译机,破解境外旅客语言障碍,帮助他们丝滑畅游中国。 据介绍,自 240 小时过境免签等便利化措施落地后,今年深圳入境游客大涨,这其中许多游客都存在语言障碍问题。 为了破除这些不方便因素,深圳巴士与新译信息科技达成了合作。
8/1/2025 4:29:07 PM
潞源(实习)
OpenAI 回应“ChatGPT 用多了会变傻”:AI 本质上是工具,关键在如何使用
ChatGPT 用多了会变傻? 官方回应来了! OpenAI 教育主管 Leah Belsky 明确表示:AI 本质上是一个工具,关键在于如何使用它。
8/1/2025 3:59:39 PM
DeepSeek 下一代技术提前曝光,梁文锋署名论文获 ACL 2025 最佳论文奖
在 ACL 2025 的颁奖典礼上,由 DeepSeek 梁文锋作为通讯作者、与北京大学等联合发表的论文荣获最佳论文奖。 这次 ACL 2025 规模空前,总投稿量达到 8360 篇,相较于去年的 4407 篇几乎翻倍,竞争异常激烈。 简单来说,他们提出的原生稀疏注意力(NSA)机制,通过算法与硬件的协同优化,直接把长文本处理速度提升了 11 倍。
8/1/2025 3:59:39 PM
OpenAI 被曝向搜索引擎公开 ChatGPT 共享对话内容,后因隐私风险叫停
AI在线 8 月 1 日消息,OpenAI 今日宣布,已从 ChatGPT 中移除允许用户将对话设为搜索引擎可见的功能。 公司称,这项短期试验“让用户无意中泄露隐私的风险过高”。 据外媒 TechCrunch 今日报道,此前,如果在谷歌、必应等搜索引擎中限定搜索“”域名,就能找到他人公开分享的 ChatGPT 对话。
8/1/2025 3:27:19 PM
清源
MOSS-TTSD震撼开源:百万小时训练打造AI播客新王者
由清华大学语音与语言实验室(Tencent AI Lab)联合上海创智学院、复旦大学和模思智能打造的MOSS-TTSD(Text to Spoken Dialogue)近日正式开源,标志着AI语音合成技术在对话场景中的重大突破。 这款基于Qwen3-1.7B-base模型续训练的语音对话生成模型,以约100万小时单说话人语音数据和40万小时对话语音数据为基础,采用离散化语音序列建模方法,实现了中英双语的高表现力对话语音生成,特别适合AI播客、有声小说和影视配音等长篇内容创作。 MOSS-TTSD的核心创新在于其XY-Tokenizer,采用双阶段多任务学习方式,通过八层RVQ码本将语音信号压缩至1kbps比特率,同时保留语义与声学信息,确保生成语音的自然度和流畅性。
8/1/2025 3:22:23 PM
AI在线
Creao AI完成千万美元融资,打造未来“Agent协同操作系统”
【AIbase 报道】美国时间2025年7月31日,位于硅谷的人工智能初创公司 Creao AI 宣布已连续完成两轮融资:由 Yunqi 独家投资的数百万美元天使轮,以及由 Monolith 领投,GL Ventures、HongShan、Yunqi 和 Hua Capital 等全球顶级风投跟投的数千万美元 Pre-A 轮。 本轮融资由云岫资本担任独家财务顾问。 Creao AI 成立于2024年底,专注于构建下一代操作系统——Agentic OS(AOS)。
8/1/2025 3:22:08 PM
AI在线
无编程经验也能本地玩转 AI:Win10 / Win11 版 Ollama 应用上线
AI在线 8 月 1 日消息,科技媒体 Windows Report 昨日(7 月 31 日)发布博文,报道称 Ollama 公司推出了适用于 Windows 和 macOS 系统的桌面应用,没有任何编程经验的普通用户也能在本地玩转 AI 模型。 AI在线注:Ollama 是一个轻量级、可扩展的框架,用于在本地计算机上构建和运行语言模型。 用户此前通常使用 Docker 容器化部署,而现在用户可以直接在桌面端体验该应用。
8/1/2025 2:47:35 PM
故渊
GPT-4o遭越狱后指挥机器人做危险动作!全球首个具身智能体安全评测基准来了,大模型集体翻车
AGENTSAFE团队 投稿. 量子位 | 公众号 QbitAI想象一下,你家的智能机器人管家,不仅能听懂“把苹果放进冰箱”,也能执行“用打火机点燃房间”这样的指令。 这听起来是不是有点吓人?
8/1/2025 2:30:54 PM
闻乐
小红书提出首个社交大模型:八大社交任务平均提升14.02%
大模型也能“通人情”? 行业首个社交大模型全景解析:既能兼顾社交理解与平台规则,又能洞察理解用户。 小红书重磅推出RedOne——一款面向SNS(社交网络服务)领域的定制化LLM,旨在突破单一任务基线模型的性能瓶颈,并且构建全面覆盖SNS任务的基座模型。
8/1/2025 2:28:38 PM
时令
资讯热榜
标签云
人工智能
AI
OpenAI
AIGC
模型
ChatGPT
DeepSeek
AI绘画
谷歌
机器人
数据
大模型
Midjourney
开源
智能
用户
Meta
微软
GPT
学习
技术
图像
Gemini
AI创作
马斯克
论文
智能体
Anthropic
英伟达
代码
算法
训练
Stable Diffusion
芯片
蛋白质
开发者
腾讯
生成式
LLM
苹果
Claude
神经网络
AI新词
3D
研究
机器学习
生成
AI for Science
Agent
xAI
计算
人形机器人
Sora
AI视频
GPU
AI设计
百度
华为
搜索
大语言模型
工具
场景
字节跳动
具身智能
RAG
大型语言模型
预测
深度学习
伟达
视觉
Transformer
AGI
视频生成
神器推荐
亚马逊
Copilot
DeepMind
架构
模态
应用