AI在线 AI在线

理论

百度王海峰:详解文心4.5 Turbo、X1 Turbo两大模型背后技术

4月25日,Create2025百度AI开发者大会在武汉举办。 百度创始人李彦宏发布了文心大模型4.5 Turbo及深度思考模型X1 Turbo两大模型,以及多款AI应用。 百度首席技术官王海峰现场详细解读了背后的技术。
4/25/2025 2:53:09 PM

太争气了!百度的底气,李彦宏的决心:3万卡国产自研集群;一口气九个重磅发布,全方位支持MCP,百度在大模型应用时代的出招与押注

编辑 | 云昭出品 | 51CTO技术栈(微信号:blog51cto)4月25日,一年一度的百度开发者大会会场如约到来,这是中国国内首家AI巨头在后DeepSeek时代的全新产品的公开亮相。 进入2025以后,李彦宏带领下的百度正在如何思考新的AI应用形态? 百度在AI应用爆发时代都做了哪些准备?
4/25/2025 1:51:49 PM
云昭

李飞飞/DeepSeek前员工领衔,复现R1强化学习框架,训练Agent在行动中深度思考

什么开源算法自称为DeepSeek-R1(-Zero) 框架的第一个复现? 新强化学习框架RAGEN,作者包括DeepSeek前员工Zihan Wang、斯坦福李飞飞团队等,可训练Agent在行动中深度思考。 图片论文一作Zihan Wang在DeepSeek期间参与了Deepseek-v2和Expert Specialized Fine-Tuning等工作,目前在美国西北大学读博。
4/25/2025 1:34:53 PM

百度Create AI开发者大会:李彦宏发布两大新模型、多款热门AI应用,帮助开发者全面拥抱MCP

4月25日,Create2025百度AI开发者大会在武汉隆重举办。 百度创始人李彦宏发表了题为《模型的世界 应用的天下》的演讲。 60分钟的演讲中,李彦宏发布了两大模型,多款热门AI应用,并宣布将帮助开发者全面拥抱MCP。
4/25/2025 1:11:37 PM

两万人大裁员!AI掉队、工厂暂停扩张,英特尔复兴之路注定艰难

英特尔再次开启大裁员! 据彭博社报道,英特尔本周将宣布裁员超20%! 一下子裁掉2万多人。
4/25/2025 11:58:06 AM
新智元

Meta 推 WebSSL 模型:探索 AI 无语言视觉学习,纯图训练媲美 OpenAI CLIP

科技媒体 marktechpost 发布博文,报道称 Meta 公司发布 WebSSL 系列模型,参数规模从 3 亿到 70 亿,基于纯图像数据训练,旨在探索无语言监督的视觉自监督学习(SSL)的潜力。 以 OpenAI 的 CLIP 为代表,对比语言-图像模型已成为学习视觉表征的默认选择,在视觉问答(VQA)和文档理解等多模态任务中表现突出。 不过受到数据集获取的复杂性和数据规模的限制,语言依赖面临诸多挑战。
4/25/2025 11:55:46 AM
故渊

AI优先策略:迈向更智能的数字化转型的七个步骤

当谈到将AI置于数字化转型的核心时,已经有很多说法、著作和布道,大多数企业也都表示赞同。 根据Gartner的数据,91%的企业正在开展“某种形式的数字化举措”,87%的高级领导表示数字化是首要任务。 但就像任何转型工作一样——其中只有30%的举措被认为是成功的——挑战在于执行,而非意图。
4/25/2025 11:21:14 AM
Ashar Samdani

AI入侵学术圈,超700篇顶刊论文暴雷!科学侦探揭秘真相,登Nature头版

「截至我最后的知识更新」,「重新生成响应」,「作为一个AI语言模型」......这些短句,已经成为顶刊论文中的常态。 2024年,一篇发表在Radiology Case Reports上论文,因文中出现了「我是一个AI语言模型」,直接被撤稿。 令人震惊的是,这句话不仅没有引起作者注意,更逃过了编辑、审稿人、排版人的审查。
4/25/2025 10:57:39 AM
新智元

刚刚,OpenAI推出「轻量级」Deep Research,免费用户也能薅羊毛!

刚刚,OpenAI 宣布推出「轻量级」版本的 Deep Research,免费用户也可以使用! 轻量级版本由 OpenAI 的 o4-mini 模型提供支持,而之前的 Deep Research 使用的是更强大的 o3 模型(或其变体)。 OpenAI 表示,虽然响应通常会更简短,但仍能够维持您所期待的深度和质量。
4/25/2025 10:26:19 AM
机器之心

揭秘 RAG:为什么说它是让大语言模型(LLM)更聪明的秘密武器?

现在人工智能(AI)很火,尤其是像 ChatGPT 这样的大语言模型(LLM),它们能聊天、写文章、写代码,感觉无所不能。 但有时候,它们也会犯一些小错误,比如信息过时了,或者一本正经地胡说八道(这叫“幻觉”),或者你问它一些你们公司内部的事情,它就完全不知道了。 为了解决这些问题,科学家们想出了一个聪明的办法,叫做RAG。
4/25/2025 10:03:12 AM
用户007

再也不用愁画架构图了,AI帮你画

作为技术人,你一定有过这样的经历:项目文档需要一张专业的架构图,你打开draw.io或Visio,从一个空白画布开始,拖拽组件、调整布局、设置样式...一张像样的架构图往往需要耗费数小时。 画架构图一直是我最头疼的事情,不仅公司项目,我做的一些开源项目也需要画架构图,画的崩溃时我就想到,现在代码都可以通过AI从零生成,为什么还要手动绘制架构图? 通过我的实践发现,Claude在生成draw.io格式的XML架构图方面表现尤为出色——只需描述你的系统,它就能生成格式规范、结构合理的draw.io架构图,导入后即可直接使用或微调,将数小时的工作压缩至几分钟内完成。
4/25/2025 10:00:00 AM
贝塔街的万事屋

我的小网站被"薅秃"了,用 Trae 五 分钟给网站增加日志功能,揪出爬虫!

最近我发现自己用 Express 搭建的网站突然响应变慢,服务器负载莫名其妙地升高。 一开始我还以为是代码优化问题,但看了几天后隐约感觉不对劲——流量突然暴增,但 uv 并没有明显增长。 这种情况显然是遭遇了异常访问,要么是人为高频刷新,要么是爬虫抓取。
4/25/2025 9:54:26 AM
story

RL真让大模型更会推理?清华新研究:其能力边界或仍被基座「锁死」

近年来,RLVR(可验证奖励的强化学习)训练大模型在数学、代码等各项任务中表现惊艳,大模型的推理能力快速提升,强化学习因而被视为重要的推手。 然而,其中直指核心的重要问题却悬而未决:强化学习真的能让大模型获得超越基础模型的新推理能力吗? 清华大学LeapLab团队联合上海交通大学开展的最新实证研究,通过实验现象揭示了一个值得关注的问题:当前的 RLVR 方法似乎尚未突破基座模型的能力上限。
4/25/2025 9:22:44 AM
机器之心

无需数据标注!测试时强化学习,模型数学能力暴增 | 清华&上海AI Lab

无需数据标注,在测试时做强化学习,模型数学能力暴增159%! 清华和上海AI Lab周伯文团队用这样的方法,对模型进行了强化——结果模型在多个数据集上的成绩均大幅提升,尤其是Qwen-2.5-Math-7B,它做AIME 2024竞赛题的成绩直接提高了159%。 实验过程中,强化学习的数据均由被训练的模型自身生成。
4/25/2025 9:20:00 AM

机器人也会挤牙膏?ManipTrans:高效迁移人类双手操作技能至灵巧手

研究团队由来自北京通用人工智能研究院(BIGAI)、清华大学和北京大学的跨专业研究者组成,致力于具身智能领域的前沿研究。 团队成员在开发高效、智能的通用机器人技术,特别是机械灵巧手操作方面,拥有丰富的研究经验。 一作为北京通用人工智能研究院研究员李恺林,其它作者为清华大学博士生李浦豪、北京通用人工智能研究院研究员刘腾宇、北京大学博士生李宇飏;通讯作者为北京通用人工智能研究院研究员黄思远。
4/25/2025 9:17:00 AM
机器之心

北大团队引领3D生成与对齐革新:OctGPT打破扩散模型垄断

近年来,智能三维形状生成(3D AIGC)技术迅速崛起,正成为推动数字内容创作革新的关键力量,特别是在游戏、影视、虚拟现实和工业设计等领域表现出巨大的应用潜力。 随着技术的不断进步,三维内容的生成质量与效率持续提升,成为业界与学界广泛关注的焦点。 最近,北京大学陈宝权教授带领团队在三维形状生成和三维数据对齐方面取得新的突破。
4/25/2025 9:15:00 AM
量子位

TTS和TTT已过时?TTRL横空出世,推理模型摆脱「标注数据」依赖,性能暴涨

在大语言模型(LLMs)竞争日趋白热化的今天,「推理能力」已成为评判模型优劣的关键指标。 OpenAI 的 o 系列、Anthropic 的 Claude 和 DeepSeek-R1 等模型的惊艳表现背后,测试时缩放(TTS)技术功不可没。 测试时缩放(TTS,Test-Time Scaling)是一种提升大语言模型推理能力的新兴策略,通过在测试阶段优化推理过程(如多数投票、蒙特卡洛树搜索等)提升大型语言模型(LLMs)的性能,而无需修改模型参数。
4/25/2025 9:12:00 AM
机器之心

UniToken:多模态AI的“全能选手”,一次编码搞定图文理解与图像生成!

首次在统一框架内实现理解与生成的“双优表现”,打破了多模态统一建模的僵局! 复旦大学和美团的研究者们提出了UniToken——一种创新的统一视觉编码方案,在一个框架内兼顾了图文理解与图像生成任务,并在多个权威评测中取得了领先的性能表现。 UniToken通过融合连续和离散视觉表征,有效缓解了以往方法中“任务干扰”和“表示割裂”的问题,为多模态统一建模提供了新的范式。
4/25/2025 9:10:00 AM