AI在线 AI在线

理论

陶哲轩:o3-mini纠正了我一个数学错误,十分钟解决原本一小时才能完成的题目

大模型持续震惊科学家! 以往一小时才能完成的代码,现在十分钟就能实现「生成、测试到得出结果」。 “大模型推广大神”陶哲轩又来分享他的亲测体验了。
3/18/2025 9:19:26 AM
量子位

一文读懂:模型上下文协议(MCP)

Hello folks,我是 Luga,今天我们来聊一下人工智能应用场景 - 构建高效、灵活的计算架构的模型上下文协议(MCP)。 随着人工智能迈向更复杂的应用场景,单一模型的局限性逐渐显现,而多模型协同与上下文感知的需求日益迫切。 从对话系统需要理解用户的历史语境,到跨模态任务要求无缝整合文本、图像等多源数据,AI 的发展正呼唤一种全新的协作范式。
3/18/2025 9:10:00 AM
架构驿站

技术领导者如何利用AI克服十大采购挑战

然而,软件采购决策通常需要三到六个月——甚至更长时间——才能最终确定。 在科技领域,这简直是漫长无比;等到交易签署时,市场条件可能已经改变,新的竞争对手已经出现,或者解决方案本身已经升级。 难怪北美90%的IT高管认为软件采购和供应商选择是一个痛点。
3/18/2025 9:00:00 AM
D1net编译

刚刚,o1/o3后训练掌门人出走创业,OpenAI鼎力支持押注AI材料!曾师从Bengio

OpenAI又痛失一员大将。 刚刚,后训练副总William Fedus官宣离职OpenAI,将创办一家AI发现材料创业公司。 对此OpenAI表示:「OpenAI将会对Fedus新公司进行投资并建立合作伙伴关系」。
3/18/2025 8:58:13 AM
新智元

CAIO正在脱颖而出 不再在CIO帐下听令

2016年,AI领域最著名的研究者之一安德鲁·吴(Andrew Ng)撰写了关于在公司中设立首席AI官角色的好处,以及这一角色应具备的特点和职责的文章。 当时,这一想法似乎有些牵强,认为除了少数特定行业之外,其他企业也需要设立CAIO。 但近年来,随着GenAI的兴起,智能工具的使用量增加,CAIO角色已逐渐成为众多行业关键的技术高管职位。
3/18/2025 8:30:00 AM
Ramos

豆包文生图技术报告发布!数据处理、预训练、RLHF全流程公开

今天,豆包大模型团队正式发布文生图技术报告,首次公开 Seedream 2.0 图像生成模型技术细节,覆盖数据构建、预训练框架、 后训练 RLHF 全流程。 该报告针对 Seedream 2.0 原生中英双语理解、文字渲染、高美感、分辨率与画幅变换等特性的实现,进行了具体介绍。 本文将呈现其中精华内容,报告完整版可通过下方链接获取:技术展示页:: Seedream 2.0 于 2024 年 12 月初在豆包 APP 和即梦上线,已服务上亿 C 端用户,并成为国内许多专业设计师辅助创作的首选模型。
3/18/2025 8:00:00 AM
豆包大模型团队

实战攻略:使用KubeMQ简化多LLM集成流程

译者 | 核子可乐审校 | 重楼将多个大语言模型集成至应用程序当中往往是项艰巨的挑战,各类不同API及通信协议的协同处理,以及如何确保请求路由的复杂性难题往往令人望而生畏。 好在可以使用消息代理与路由机制更优雅地解决此类问题,在解决痛点的同时实现多个关键优势。 本文将向大家介绍具体操作步骤。
3/18/2025 8:00:00 AM
核子可乐

DeepSeek 开源 3FS,一个文件系统而已,有啥值得吹的?

有人说,deepseek一个搞AI的公司,不干正事,开源一个文件系统,有啥值得吹的。 今天来简单聊聊3FS,包懂。 3FS是什么?3FS,Fire-Flyer File System,是一个用C 写的高性能分布式文件系统。
3/18/2025 7:40:00 AM
架构师之路

AAAI 2025|Portcullis —— 面向第三方大型语言模型的可信隐私保护网关

在大模型浪潮的推动下,企业和个人的数据安全面临前所未有的挑战。 抖音集团安全研究团队推出Portcullis ——针对大模型的隐私保护网关,旨在为第三方大型语言模型(LLM)推理服务提供可控可信的隐私防护。 该工作成果 《Portcullis : A Scalable and Verifiable Privacy Gateway for Third-Party LLM Inference》已被人工智能领域的顶级会议AAAI 2025以Oral报告的形式接收。
3/18/2025 7:00:00 AM
安全研究团队

突发!百川智能两位联合创始人出走,一位正在走离职手续

出品 | 51CTO技术栈(微信号:blog51cto)刚刚收到消息,大模型六小虎之一的百川智能高层出现了很大的变动——两位联合创始人被媒体曝出了离职创业的消息。 其中,联合创始人焦可已经离职,另一位联合创始人陈炜鹏也将离职,目前还在走内部流程。 另据知情人士称,焦可和陈炜鹏两人都已经分别开始AI领域的创业。
3/17/2025 3:59:19 PM

无需训练即可定制分子生成:全新多模态引导框架TFG-Flow登上ICLR 2025

编辑丨ScienceAI在药物研发和材料科学领域,设计具有特定性质的分子是一项关键但耗时的任务。 传统方法依赖大量实验试错,而生成式 AI 模型的出现为这一领域带来曙光。 然而,现有方法面临两大瓶颈:一是多数生成模型仅能处理连续型数据(如图像像素),难以应对分子设计中离散的原子类型与连续坐标共存的多模态数据;二是针对特定性质的定向生成通常需要额外训练模型,成本高昂。
3/17/2025 3:08:00 PM
ScienceAI

2025年99%代码AI生成!OpenAI高管宣告没有退路,人类将被全面超越

「2025年底,99%的编码将实现AI自动化」! 图片这是OpenAI首席产品官Kevin Weil在最新一期采访中,向全世界发出的郑重宣告。 他大胆预测,今年是人工智能在编程方面,永远超越人类的一年,我们已经没有退路了。
3/17/2025 1:51:06 PM
新智元

提前免费!百度一口气上线文心4.5和X1!实力震惊硅谷!API价格又打下来了,R1还得对半砍!实测首款“有工具箱”的推理模型!

编辑 |伊风、言征出品 | 51CTO技术栈(微信号:blog51cto)百度的步伐也是加速了! 原本计划4月1日免费的文心大模型4.5,在两周年之际就提前登场。 不仅如此,3月16日,百度搞了个“两连发”,一口气开放了两款模型文心大模型4.5和文心大模型X1。
3/17/2025 1:45:25 PM
伊风

https://mp.weixin.qq.com/s/-lOj5naC2Yb3BD32YuUyOw

机构: 北京大学人工智能研究院 北京通用人工智能研究院作者: 毛彦升 徐宇飞 李佳琪 孟繁续 杨昊桐 郑子隆 王希元 张牧涵长文本任务是当下大模型研究的重点之一。 在实际场景和应用中,普遍存在大量长序列(文本、语音、视频等),有些甚至长达百万级 tokens。 扩充模型的长文本能力不仅意味着可以在上下文窗口中装入更长的文本,更是能够更好地建模文本段落间信息的长程依赖关系,增强对长文的阅读理解和推理。
3/17/2025 12:55:18 PM
机器之心

RAG(四)Adaptive Retrieval --语言模型的信任边界,参数与非参数记忆的有效性研究

大语言模型(LMs)在许多自然语言处理任务上表现优异,但它们在记忆和回忆不太常见或不流行的事实知识方面存在明显的局限性。 并且,当涉及到长尾实体(即那些在网络上讨论较少、出现频率较低的实体)的问题时,LMs 的性能显著下降,并且增加模型规模并不能有效地解决这一问题。 此外,LMs 对于自身知识边界的认识有限,有时会产生幻觉,即生成看似合理但实际上错误的信息。
3/17/2025 12:52:44 PM
Glodma

真正的AI智能体时代即将到来,我们发现了几点「苦涩的教训」

最近一段时间,智能体(Agent)再次成为 AI 领域热议的焦点。 2025 年 1 月,OpenAI 发布了名为 DeepResearch 的 o3 模型变种,专门用于网页和文档搜索。 得益于在浏览任务上的强化学习训练,DeepResearch 具备了制定搜索策略、交叉引用信息来源、甚至利用中间反馈来处理深层次知识的能力。
3/17/2025 12:52:00 PM
机器之心

迁移DeepSeek-R1同款算法,小米让7B模型登顶音频理解推断MMAU榜单

7B小模型 3.8万条训练数据,就能让音频理解和推断评测基准MMAU榜单王座易主? 受到DeepSeek-R1中强化学习算法的启发,小米大模型团队对阿里的Qwen2-Audio-7B模型进行了微调。 结果模型在MMAU上的准确率从49.2%提升到了64.5%(涨幅31%),比以前霸榜的GPT-4o还高出近10个百分点。
3/17/2025 12:13:26 PM
量子位

有望重新定义语言生成技术的扩散模型——LLaDA​

译者 | 朱先忠审校 | 重楼简介如果我们能让语言模型更像人类一样思考,结果会怎样? 如果它们不是一次写一个字,而是先勾勒出自己的想法,然后逐渐完善,结果又会怎样? 这正是大型语言扩散模型(LLaDA)所引入的:一种与大型语言模型(LLM)中当前使用的文本生成不同的方法。
3/17/2025 11:35:36 AM
朱先忠