资讯列表
开创性扩散思维链:让人工智能更具创造力和灵活性
在近年来的人工智能研究中,思维链的概念越来越受到重视,尤其是在大型语言模型的训练和推理中。 最近,西湖大学 MAPLE 实验室的齐国君教授团队首次提出了一种新颖的 “扩散式发散思维链”,这是一种为扩散语言模型量身定制的全新推理方式。 传统的大型语言模型通常采用线性思维链,即通过逐步推理生成答案。
5/27/2025 10:01:20 AM
AI在线
搜狗输入法推出AI汪仔“快捷搜索”功能:接入混元快思考模型Turbo S
近日,搜狗输入法Windows版迎来重大升级,全新推出AI汪仔“快捷搜索”功能,为用户带来了更高效便捷的办公学习体验。 AI汪仔“快捷搜索”功能具有一键触发、快速响应的特点。 用户无需再遵循“打开浏览器👉🏻搜索引擎👉🏻输入内容”的传统搜索三步曲,只需在桌面任意地方直接打字,或者使用快捷键“Ctrl Shift 空格”,就能在0.5秒内召唤出全能“快捷搜索”功能,信息获取速度相比传统方式提升了300%。
5/27/2025 10:01:20 AM
AI在线
前Meta高管克莱格放话:要求AI训练征求艺术家同意将"根本性扼杀"英国AI产业
英国人工智能监管政策制定正值关键时刻,前副首相、前Meta高管尼克·克莱格的最新表态引发广泛争议。 他声称,强制要求AI公司在使用艺术家作品训练模型前征求同意,将"从根本上扼杀"英国AI产业。 克莱格的"不可行"论调在新书推广活动中,克莱格承认创意社区应有权选择不将其作品用于AI模型训练,但坚持认为事先征求同意在实际操作中不可行。
5/27/2025 10:01:20 AM
AI在线
谷歌Chrome浏览器新增Gemini AI助手,实时屏幕感知能力引关注
谷歌最近在其 Chrome 浏览器中推出了全新的 Gemini 人工智能助手,这一功能为用户带来了革命性的体验。 新助手能够实时感知屏幕内容,令用户的浏览体验更加智能化。 目前,这一功能仅向 AI Pro 和 AI Ultra 订阅用户开放,且目前处于 Chrome 测试版阶段。
5/27/2025 10:01:20 AM
AI在线
秘塔AI搜索推出全新“极速”模型:最高400 tokens/秒响应速度
近日,秘塔AI搜索正式推出全新“极速”模型,为用户带来更高效、精准的搜索体验。 秘塔AI搜索团队通过在GPU上进行kernel fusion技术,以及在CPU上实施动态编译优化策略,成功在单张H800GPU上实现了最高400tokens/秒的响应速度,大部分问题能在2秒内给出答案。 为了让用户更真切地感受新模型的速度,秘塔AI搜索还特别搭建了一个测速站点(kuai.metaso.cn),用户可随时输入问题,亲自体验新模型带来的快速响应。
5/27/2025 10:01:20 AM
AI在线
阿里突破性发布QwenLong-L1-32B:首个强化学习训练的长文本推理模型,性能媲美Claude-3.7
阿里巴巴今日正式发布QwenLong-L1-32B,这是一款专为长上下文推理设计的大型语言模型,标志着AI长文本处理能力的重大突破。 该模型在性能表现上超越了o3-mini和Qwen3-235B-A22B,与Claude-3.7-Sonnet-Thinking达到相当水平。 技术创新亮点QwenLong-L1-32B最大的技术突破在于其是全球首个通过强化学习训练的长文本情境推理模型。
5/27/2025 10:01:20 AM
AI在线
中国信通院发布软件开发智能体标准
最近,中国信息通信研究院(信通院)牵头联合腾讯、阿里、华为等二十余家知名企业,共同发布了《面向软件工程智能体的技术和应用要求 第1部分:开发智能体》。 这一标准的发布,标志着 AI 智能体的研发与应用进入了一个全新的阶段。 图源备注:图片由AI生成,图片授权服务商Midjourney新标准围绕技术能力和服务能力两个方面,对开发智能体的能力建设和应用要求进行了详细阐述。
5/27/2025 9:00:50 AM
AI在线
苹果设计大师艾维因 OpenAI 收购获巨额财富,或成亿万富翁
据《福布斯》报道,苹果传奇设计师乔纳森・艾维(Jonathan Ive)因其创办的人工智能硬件公司 io 被 OpenAI 收购,获得了价值7.15亿美元的股票。 这一交易预计将使艾维的净资产在未来几年突破10亿美元,可能让他跻身亿万富翁行列。 图源备注:图片由AI生成,图片授权服务商MidjourneyOpenAI 在上周宣布,将通过全股票交易的方式收购艾维的公司 io,交易的估值达65亿美元。
5/27/2025 9:00:50 AM
AI在线
苹果设计师乔纳森・艾维因 OpenAI 收购一夜暴富,净资产或破十亿
在科技界,乔纳森・艾维(Jonathan Ive)这个名字可谓家喻户晓,作为 iPhone 的设计师,他在苹果公司的贡献不言而喻。 近日,《福布斯》报道揭示,艾维因其 AI 硬件公司 io 被 OpenAI 收购,净资产有望突破十亿美元,成功跻身亿万富豪的行列。 上周,OpenAI 宣布以全股票交易的方式收购艾维创办的公司 io,交易的估值高达65亿美元。
5/27/2025 9:00:50 AM
AI在线
与Gemini Diffusion共振!首个扩散式「发散思维链」来了
近年来,思维链在大模型训练和推理中愈发重要。 近日,西湖大学 MAPLE 实验室齐国君教授团队首次提出扩散式「发散思维链」—— 一种面向扩散语言模型的新型大模型推理范式。 该方法将反向扩散过程中的每一步中间结果都看作大模型的一个「思考」步骤,然后利用基于结果的强化学习去优化整个生成轨迹,最大化模型最终答案的正确率。
5/27/2025 9:00:00 AM
红杉中国xbench全球首发,AI智能体真实战力揭榜!
随着基础模型的快速发展和AI Agent进入规模化应用阶段,被广泛使用的基准测试(Benchmark)却面临一个日益尖锐的问题:想要真实地反映AI的客观能力正变得越来越困难。 因此,构建更加科学、长效和如实反映AI客观能力的评测体系,正在成为指引AI技术突破与产品迭代的重要需求。 有鉴于此,红杉中国今天正式推出一款全新的AI基准测试工具xbench,并发布论文《xbench: Tracking Agents Productivity ,Scaling with Profession-Aligned Real-world Evaluations》。
5/27/2025 8:50:00 AM
刚刚,北大校友Lilian Weng自曝公司首个产品?一篇论文未发,估值却已90亿
OpenAI前研究员大佬、如今的Thinking Machines Lab联创Lilian Weng,刚刚转发了一个神秘产品——一个看似仪表盘的东西。 或许,这就将是公司即将打造的第一个爆品? 这个产品所揭示的理念,可谓十分惊人——在训练过程中,研究人员可以直接用它来手动调整所有的超参数了!
5/27/2025 8:40:00 AM
四页绝密文件曝OpenAI野心!ChatGPT占领人类心智,25年致命杀招公开
OpenAI真正的野心终于曝光! 最近,泄露的一份法律文件揭示了OpenAI的雄心:终极目标是「占领用户的AI心智」——ChatGPT就等价于AI,等价于智能体。 原始文件:,几个月前GPT-4o掀起「吉卜力风格」的热潮,或许也是OpenAI精心布局的一环。
5/27/2025 8:40:00 AM
RAG 架构实战:Fixed-Size Chunking(固定切块) 解析
Hello folks,我是 Luga,今天我们来聊一下人工智能应用场景 - 构建高效、灵活的计算架构的 RAG 架构的切块策略—Fixed-Size Chunking(固定切块)。 众所周知,在构建 RAG(Retrieval-Augmented Generation,检索增强生成)系统的过程中,文档切块策略往往决定了模型检索质量的上限。 切得好,信息命中更精准,生成回答更有上下文逻辑;切得差,模型则容易“答非所问”。
5/27/2025 8:35:00 AM
Luga Lee
可能是目前最好的3B多模态模型,有望做“AI作业帮”
作者 | 徐浚哲、尹宇阳我们团队近期开源多模态模型VLR1-3B的预览版(preview),欢迎大家尝试:“小”模型,使用了强化学习训练方式,增强了推理性能。 达到了同级别模型中推理能力第一(SOTA)。 主要是数学相关的测试,在MathVista和MathVision这两个权威AI数学榜单的官网上,VLR1-3B 这“小”模型不仅都在榜,而且比很多商业闭源大模型(如Gemini1.5和GPT-4V)表现都要强,甚至在MathVista的评测中领先GPT-4o~同时对比了多个banchMark结果,Average第一~ModelAverageMathVistaMathVisionMathVerseDynaMathWeMathLogicVistaQwen2-VL-2B20.548.016.117.53.810.826.6InternVL2.5-2B21.251.114.022.34.48.027.3InternVL3-2B29.157.620.224.514.822.940.3Qwen2.5-VL-3B31.861.221.931.213.222.940.3VLM-R1-3B-Math-030533.462.721.932.213.030.040.5Taichu-VLR-3B33.664.923.132.112.630.438.7VLAA-Thinker-Qwen2.5VL-3B35.461.024.436.418.233.838.5TBAC-VLR1-3B-preview35.764.825.033.217.732.440.8正巧最近正愁帮邻居刚上初中的孩子批数学作业,被多项式计算和几何证明搞得焦头烂额的。
5/27/2025 8:30:00 AM
腾讯技术工程
LiteLLM:用于统一大模型访问的开源网关
译者 | 核子可乐审校 | 重楼摘要:LiteLLM 允许开发者像调用 OpenAI API 那样集成各种大语言模型(LLM),并支持故障转移、预算控制、速率限制以及对API调用的实时监控。 不同提供商发布的大语言模型(LLM)层出不穷——包括 Anthropic、谷歌、Meta、微软、英伟达、OpenAI 等等——这为开发者提供了丰富的选择,但也令复杂性一路攀升。 每家提供商都有其独特的API特性和响应格式,使得在同一个应用中切换模型或支持多个后端变得愈发困难。
5/27/2025 8:19:06 AM
核子可乐
如何访问和使用 OpenAI Codex?
译者 | 布加迪审校 | 重楼“软件工程正在发生变革;到 2025 年底,它将焕然一新。 ”Greg Brockman在OpenAI 发布会上的开场白为接下来的活动定下了基调。 OpenAI随后发布了Codex,这是一款旨在与开发者协同工作的云原生软件智能体。
5/27/2025 8:14:29 AM
布加迪
8秒出大片!10个案例实测谷歌Veo 3视频生成功能
前几天的 2025 年 Google I/O 开发者大会上,谷歌发布了一系列先进的图像和视频生成工具,好玩的太多了,我还没来得及一一体验,今天先尝试一下最近超级火的 Veo 3 视频生成。 后续再尝试下 Imagen 4 和 Flow 平台和大家分享。 先简单介绍一下。
5/27/2025 7:31:45 AM
阿真Irene