资讯列表
我们真的能信任人工智能的链式思考推理吗?
译者 | 涂承烨审校 | 重楼随着人工智能(AI)在医疗和自动驾驶等领域的广泛应用,我们对其信任程度的问题变得愈发关键。 一种名为链式思考(CoT)的推理方法备受关注。 它帮助人工智能将复杂问题分解为步骤,展示其如何得出最终答案。
腾讯元宝宣布打通微信读书、起点读书,搜索可直接跳转阅读
腾讯元宝在上个月发布的 2.18.0 更新说明中已经提到类似的功能,回答支持优质书籍推荐,支持跳转微信读书、起点读书。
Meta 重新调整 AI 团队结构 努力加速产品开发
根据 Axios 的最新报道,Meta 决定将其人工智能部门重新划分为两个新的团队。 这一调整旨在提升公司在快速发展的 AI 领域的竞争力,确保 Meta 能够与 OpenAI、谷歌和 Anthropic 等其他公司保持同步。 新的 AI 团队将分为两个部分:AI 产品团队和 AGI 基础单位。
Mistral 推出全新 Agents API:助力开发者构建智能 AI 代理
Mistral 公司近日发布了其全新的 Agents API,这是一个专为开发者设计的框架,旨在简化 AI 代理的创建,代理可以执行多种任务,例如运行 Python 代码、生成图像以及进行检索增强生成(RAG)。 这一 API 的推出,旨在为大型语言模型(LLMs)提供一个统一的环境,使其能够与多个工具和数据源以结构化且持久的方式进行交互。 Agents API 建立在 Mistral 的语言模型基础上,集成了多个内置连接器。
Salesforce 斥资80亿美元收购 Informatica 押注Agent
Salesforce 周二宣布,将以约80亿美元现金收购云数据管理公司 Informatica,旨在进一步强化其 AI 战略核心 Agentforce 平台的能力。 根据协议,Informatica A 类和 B-1类普通股股东将获得每股25美元的现金回报。 交易将通过 Salesforce 的现金储备与新增债务的方式融资。
Claude移动端语音对话功能测试版上线,支持日程查询与文档搜索
Anthropic近日宣布,其AI助手Claude的移动端应用推出语音对话功能测试版,为用户带来更便捷的交互体验。 该功能支持通过语音指令查询日程、搜索文档、发送邮件等操作,显著提升移动端生产力。 目前,测试版仅支持英语,Anthropic计划在未来几周内向全球用户推出多语言支持。
报道称OpenAI 计划推出 “使用 ChatGPT 登录”第三方应用功能
根据最新消息,OpenAI 正在探索用户如何能够使用他们的 ChatGPT 账号登录第三方应用程序。 该公司在本周发布的一份网页中提到,他们目前正在征集开发者对这一服务的兴趣。 图源备注:图片由AI生成,图片授权服务商Midjourney随着 ChatGPT 迅速成为全球最大的消费应用之一,目前月活跃用户已达约6亿,OpenAI 希望借助这一人气,进一步拓展其在在线购物、社交媒体和个人设备等领域的业务。
Anthropic在移动端推Claude对话语音模式,可搜索Google 文档、日历等
位于旧金山的人工智能初创公司Anthropic宣布推出 Claude 人工智能聊天机器人新的重大更新:全新的语音对话模式。 该功能已在苹果 App Store(iOS 设备)和谷歌 Play Store(Android 设备)的移动应用中上线。 除了语音模式的推出,Anthropic还为所有免费用户扩展了网络搜索功能。
Oracle 投资 400 亿美元购买 Nvidia 超级芯片 助力 OpenAI 打造强大数据中心
根据《金融时报》的报道,Oracle 公司将花费约400亿美元购买 Nvidia 最新的超级芯片,计划为 OpenAI 提供计算能力。 这些超级芯片将部署在位于德克萨斯州阿比林的首个美国 “星门” 数据中心。 不过,该数据中心能否提供足够的电力以满足如此庞大的计算需求,仍然存在疑问。
Claude网页搜索功能全面开放,免费用户可享实时信息
Anthropic宣布,其AI助手Claude的网页搜索功能现已向免费计划用户全面开放。 此前,该功能仅限美国付费用户使用,此次更新标志着Claude在全球范围内的功能普惠。 据官方消息,用户无需额外订阅即可通过Claude访问实时网络信息,显著提升其信息查询能力。
Spott 融资320万美元,力图重塑招聘行业的 AI 平台
近日,位于旧金山的创业公司 Spott 宣布获得320万美元的种子融资,旨在打造一个 AI 原生的招聘平台,帮助招聘机构简化流程、消除技术碎片化问题。 此次融资由 Base10Partners 领投,Y Combinator、Fortino、True Equity 以及多位天使投资人参与。 Spott 刚刚完成了 Y Combinator 的2025年冬季加速器项目,融资将助力其进一步发展。
马斯克发声:“AI 将取代搜索”,Google 市场份额十年首跌破90%
近日,马斯克在其社交账号上发出这一断言,并 @ 了自家 xAI 旗下的聊天机器人 Grok,引发行业热议。 他引用的,是一份显示 Google 搜索市场份额十年来首次跌破90% 的报告。 据该报告显示,Google 的全球搜索引擎份额已降至89.71%,为2015年以来的最低点。
ETT:打破原生多模态学习视觉瓶颈,重塑视觉tokenizer优化范式
本文由北京智源研究院多模态大模型研究中心(团队负责人王鑫龙,团队代表作 EMU 系列、EVA 系列、Painter & SegGPT)、中科院自动化所和大连理工大学联合完成。 在多模态学习蓬勃发展的当下,视觉 tokenizer 作为连接视觉信息与下游任务的关键桥梁,其性能优劣直接决定了多模态模型的表现。 然而,传统的视觉 tokenization 方法存在一个致命缺陷:视觉 tokenizer 的优化与下游任务的训练是相互割裂的。
One RL to See Them All?一个强化学习统一视觉-语言任务!
强化学习 (RL) 显著提升了视觉-语言模型 (VLM) 的推理能力。 然而,RL 在推理任务之外的应用,尤其是在目标检测和目标定位等感知密集型任务中的应用,仍有待深入探索。 近日,国内初创公司 MiniMax 提出了 V-Triune,一个视觉三重统一强化学习系统,它能使 VLM 在单一的训练流程中同时学习视觉推理和感知任务。
大厂程序员:AI正在将我们变成高速流水线工人,受不了了
万万没想到,大厂程序员真要成流水线工人了。 这不是谁危言耸听,而是亚马逊不少程序员最近的亲身感受——很早开始,亚马逊官方就鼓励大伙儿在工作中用AI。 结果发展到今天,“鼓励”更像是一种变相强迫:高层认为AI能提效,所以不少团队人员直接砍半,项目ddl却大大提前。
阿里开源长文本深度思考模型!渐进式强化学习破解长文本训练难题,登HuggingFace热榜
推理大模型开卷新方向,阿里开源长文本深度思考模型QwenLong-L1,登上HuggingFace今日热门论文第二。 其32B参数版本超过OpenAI-o3-mini、Qwen3-235B-A22B等,取得与Claude-3.7-Sonnet-Thingking相当的性能。 除测评分数外,论文中还详细展示了一个金融文档推理的案例。
谷歌·搜索:献给AI的第一个「祭品」?
谷歌打算用AI先革了自己的命,从搜索引擎开始。 在搜索的主页上,谷歌已经将AI Overviews和AI Mode排在了最前面。 谷歌搜索长期免费,主要依靠在搜索结果中投放广告来创收。
Meta宣布重组AI部门:拆分为“AI 产品”与“AGI 基础”两大团队
Meta 宣布重大 AI 部门重组,拆分为“AI 产品”与“AGI 基础”两大团队,以应对技术挑战并加快产品开发。 此次架构调整中,原有的 AI 部门被划分为两个核心团队:“AI 产品”组由 Connor Hayes 领导,专注于 Meta AI 助手及其在 Facebook、Instagram 和 WhatsApp 等平台上的功能应用。 “AGI 基础”组则由 Ahmad Al-Dahle 和 Amir Frenkel 共同执掌,聚焦于 Llama 模型的研发、先进推理能力及多模态模型的探索。