AI在线 AI在线

AI

全球首个:OpenAI 免除 20 美元月费,阿联酋全民免费用 ChatGPT Plus 订阅

科技媒体 Axios 于 5 月 25 日报道称,阿拉伯联合酋长国(UAE)将成为全球首个为全体公民(citizens)和居民(residents)免费提供 ChatGPT Plus 服务的国家。
5/27/2025 2:37:15 PM
故渊

微软携手清华、北大推出奖励推理模型:根据 AI 任务复杂性动态分配计算资源

微软研究院联合清华大学、北京大学组建团队,推出奖励推理模型(Reward Reasoning Models,RRMs),通过显式推理过程动态分配计算资源,提升复杂任务评估效果。
5/27/2025 2:17:41 PM
故渊

我国首个软件开发 AI 智能体标准发布,20 余家巨头联手参编

中国信息通信研究院联合中国工商银行、百度、腾讯、阿里、华为等二十余家头部企业,正式发布《面向软件工程智能体的技术和应用要求第 1 部分:开发智能体》(标准编号 AIIA / T 0219-2025)。
5/27/2025 1:44:54 PM
故渊

OpenAI顶级工程师Philip Su:几个接地气的程序员职场发展经验

今天的文章发的有点晚,因为我又翻译了一期很长的优质内容。 现在每天信息真是太多了,我最近把一些群全部折叠,减少干扰。 要不然,每天开着微信,朋友圈、微信群、公众号、视频号,这些小红点把人的时间切的稀巴烂。
5/27/2025 11:52:07 AM
阿颖

Meta Llama 创始团队被曝分崩离析:14 名 AI 核心人才中 11 人投奔竞争对手

科技媒体 Business Insider 昨日(5 月 26 日)发布博文,报道称 Meta 正面临严重的 AI 人才流失危机,其开源 AI 项目 Llama 的 14 名初始创作者中,已有 11 人离职,其中多人加入了竞争对手 Mistral AI。
5/27/2025 11:42:28 AM
故渊

与Gemini Diffusion共振!首个扩散式「发散思维链」来了

近年来,思维链在大模型训练和推理中愈发重要。 近日,西湖大学 MAPLE 实验室齐国君教授团队首次提出扩散式「发散思维链」—— 一种面向扩散语言模型的新型大模型推理范式。 该方法将反向扩散过程中的每一步中间结果都看作大模型的一个「思考」步骤,然后利用基于结果的强化学习去优化整个生成轨迹,最大化模型最终答案的正确率。
5/27/2025 9:00:00 AM

红杉中国xbench全球首发,AI智能体真实战力揭榜!

随着基础模型的快速发展和AI Agent进入规模化应用阶段,被广泛使用的基准测试(Benchmark)却面临一个日益尖锐的问题:想要真实地反映AI的客观能力正变得越来越困难。 因此,构建更加科学、长效和如实反映AI客观能力的评测体系,正在成为指引AI技术突破与产品迭代的重要需求。 有鉴于此,红杉中国今天正式推出一款全新的AI基准测试工具xbench,并发布论文《xbench: Tracking Agents Productivity ,Scaling with Profession-Aligned Real-world Evaluations》。
5/27/2025 8:50:00 AM

刚刚,北大校友Lilian Weng自曝公司首个产品?一篇论文未发,估值却已90亿

OpenAI前研究员大佬、如今的Thinking Machines Lab联创Lilian Weng,刚刚转发了一个神秘产品——一个看似仪表盘的东西。 或许,这就将是公司即将打造的第一个爆品? 这个产品所揭示的理念,可谓十分惊人——在训练过程中,研究人员可以直接用它来手动调整所有的超参数了!
5/27/2025 8:40:00 AM

可能是目前最好的3B多模态模型,有望做“AI作业帮”

作者 | 徐浚哲、尹宇阳我们团队近期开源多模态模型VLR1-3B的预览版(preview),欢迎大家尝试:“小”模型,使用了强化学习训练方式,增强了推理性能。 达到了同级别模型中推理能力第一(SOTA)。 主要是数学相关的测试,在MathVista和MathVision这两个权威AI数学榜单的官网上,VLR1-3B 这“小”模型不仅都在榜,而且比很多商业闭源大模型(如Gemini1.5和GPT-4V)表现都要强,甚至在MathVista的评测中领先GPT-4o~同时对比了多个banchMark结果,Average第一~ModelAverageMathVistaMathVisionMathVerseDynaMathWeMathLogicVistaQwen2-VL-2B20.548.016.117.53.810.826.6InternVL2.5-2B21.251.114.022.34.48.027.3InternVL3-2B29.157.620.224.514.822.940.3Qwen2.5-VL-3B31.861.221.931.213.222.940.3VLM-R1-3B-Math-030533.462.721.932.213.030.040.5Taichu-VLR-3B33.664.923.132.112.630.438.7VLAA-Thinker-Qwen2.5VL-3B35.461.024.436.418.233.838.5TBAC-VLR1-3B-preview35.764.825.033.217.732.440.8正巧最近正愁帮邻居刚上初中的孩子批数学作业,被多项式计算和几何证明搞得焦头烂额的。
5/27/2025 8:30:00 AM
腾讯技术工程

AI和分析如何改变供应链弹性

在一个充满波动性和前所未有的挑战的时代,供应链正面临着来自各方的巨大压力。 预见并缓解干扰的能力已成为企业成功的决定性因素。 “供应链比以往任何时候都更加关键,但也更加脆弱,”Qlik公司EMEA地区现场CTO马丁·汤姆斯强调,“从原材料短缺到地缘政治不稳定,从消费者需求的不断变化到自然灾害,任何干扰都可能破坏运营并损害信任。
5/27/2025 7:05:00 AM
Tom Chapman

智能体「Agent」技术全景:挑战、机遇与未来

大家好,我是肆〇柒。 这篇论文的研究来自 MetaGPT、Montréal & Mila人工智能研究所、南洋理工大学、美国阿贡国家实验室、悉尼大学、宾夕法尼亚州立大学、微软亚洲研究院、伊利诺伊大学厄巴纳-香槟分校、香港科技大学、南加州大学、耶鲁大学、斯坦福大学、佐治亚大学、俄亥俄州立大学、阿卜杜拉国王科技大学、杜克大学、香港理工大学、谷歌 DeepMind 以及加拿大高等研究院(CIFAR)等众多研究者的集体智慧与前瞻思考,历时半年创作而成。 这篇论文的质量很高,为我们综述了 AI Agent 领域的全景现状,能看的出来是花了大心思的。
5/27/2025 2:00:00 AM
肆零柒

Spring AI Observations:让AI应用监控变得简单高效

在AI应用爆发式增长的今天,Spring AI 1.0版本带来了革命性的可观测性功能。 本文将深入探讨如何利用Spring AI Micrometer 构建企业级AI应用监控体系,实现成本控制、性能优化和全链路追踪。 为什么Spring AI应用急需可观测性?
5/27/2025 1:35:00 AM
PIG AI

硅基模型vs.碳基大脑:AI能否成为超越人类的超级预测者?

如果能精准预测未来,就能在生活中占尽先机,无论是预判房价涨跌,还是捕捉下一个产业风口,预测的魅力都无人可挡。 随着 AI 技术的蓬勃发展,一个核心问题开始引发思考:人工智能能否成为超越人类的超级预测者? 在这一思潮的推动下,预测领域正加速构建 AI 预测机器人。
5/27/2025 1:00:00 AM
小刀

RAG系列:问题优化 - 意图识别&同义改写&多视角分解&补充上下文

在实际业务场景中,知识库不会只有单一领域的知识,可能会存在多个领域的知识,如果对用户问题不提前做领域区分,在对基于距离的向量数据库进行检索时,可能会检索出很多与用户问题不属于同一个领域的文档片段,这样的上下文会存在较多的噪音或者不准确的信息,从而影响最终的回答效果。 另一方面知识库中涵盖的知识表达形式也是有限的,但用户的提问方式却是千人千面的,用户遣词造句的方式以及描述问题的角度可能会与向量数据库中存储的文档片段存在差异,这就可能导致用户问题和知识库之间不能很好匹配,从而降低检索效果。 为了解决此问题,我们可以对用户问题进行查询增强,比如对用户问题进行意图识别、同义改写、多视角分解以及补充上下文,通过这几个查询增强方式来更好地匹配知识库中的文档片段,提升检索效果和回答效果。
5/27/2025 12:40:00 AM
燃哥讲AI

基于图的 RAG 方法总结(GraphRAG、 GraphReader、LightRAG、HippoRAG和KAG)

在自然语言处理领域,检索增强生成(RAG)技术通过结合外部知识库与语言模型,显著提升了模型在知识密集型任务中的表现。 近年来,基于图结构的 RAG 方法成为研究热点,通过引入知识图谱的实体关系建模能力,有效解决了传统 RAG 在多跳推理、长文本理解和全局语义捕捉中的局限性。 本文详细分析五种代表性方法:GraphRAG、GraphReader、LightRAG、HippoRAG和KAG ,从实现细节、优缺点及适用场景展开对比。
5/27/2025 12:15:00 AM
Goldma

国际劳工组织报告:全球25%就业岗位或受生成式人工智能影响

近日,国际劳工组织(ILO)与波兰国家研究院发布联合研究报告《生成式人工智能与就业:全球职业受影响程度精编指数》,对生成式人工智能如何重塑劳动世界进行了迄今最详尽的评估。 报告指出,全球 25% 的就业岗位可能受到生成式人工智能影响,高收入国家这一比例更高,达 34%。 该指数通过整合近3 .
5/27/2025 12:10:00 AM

英国前副首相尼克・克莱格:使用艺术家作品训练 AI 模型前需获授权将“扼杀”AI 行业

前Meta高管尼克・克莱格警告,若强制AI训练前获得艺术家同意,将扼杀英国AI行业。数百名音乐家等支持相关修正案,但上周被否决。#AI伦理##版权保护#
5/26/2025 10:02:06 PM
远洋

要有野心!创始人揭秘Claude4诞生:有点玄学,很快接入测谎仪!26年出现单人独角兽!做AI像登上太空飞船,MCP快行业标准了

编辑 | 云昭出品 | 51CTO技术栈(微信号:blog51cto)上周五 Claude 4 的发布会上,Anthropic 的 CEO Dario Amodei 与Instagram联合创始人、Anthropic 首席产品官 Mike Krieger 在 KeyNote 最后进行了一场围炉对话。 两个人都是创业公司的创始人,又都参与了同一款 AI 产品的打磨与迭代。 对于AI 编程,Anthropic 的产品路线图将是什么样子?
5/26/2025 6:40:00 PM
云昭