AI在线 AI在线

理论

思维链也会「跳帧」?浙大团队提出CoT-Bridge,显著提升数学推理性能

本文的共同第一作者是徐皓雷和颜聿辰。 徐皓雷是浙江大学的一年级硕士生,主要研究兴趣集中在大模型推理和可解释性研究;颜聿辰是浙江大学博士三年级研究生,主要研究兴趣集中在大模型推理和智能体。 本文通讯作者是浙江大学鲁伟明教授和沈永亮研究员。
6/4/2025 8:35:00 AM

ACL2025 | 传统符号语言传递知识太低效?探索LLM高效参数迁移可行性

论文第一作者谭宇乔来自中国科学院自动化研究所的自然语言处理和知识工程研究组,导师为何世柱老师。 目前研究方向主要在利用大语言模型参数知识增强大模型能力。 1 跨规模参数知识迁移 PKT 的全面分析人类的思维是非透明的,没有继承的记忆,因此需要通过语言交流的环境来学习。
6/4/2025 8:35:00 AM

IT技术人必知的八大专业AI模型

译者 | 涂承烨审校 | 重楼不到十年前,能与计算机进行有意义的对话的想法还只是科幻小说。 但今天,数以百万计的人与AI助手聊天,根据文本描述创作令人惊叹的艺术作品,并每天使用这些AI工具/系统来理解图像和执行高级任务。 这一进步由许多专业AI模型驱动,每个模型都有其独特的功能和应用。
6/4/2025 8:31:48 AM
涂承烨

实用指南:构建基于RAG的聊天机器人

译者 | 布加迪审校 | 重楼“你能为我们开发一个聊天机器人吗? ” 如果你的IT团队还没有收到这个请求,相信我,很快就会收到。 随着大语言模型(LLM)的兴起,聊天机器人已成为新的必备功能——无论你是交付SaaS服务、管理内部工具,还是仅仅试图解读庞大的文档。
6/4/2025 8:21:28 AM
布加迪

我体验了谷歌 Stitch AI,发现了(UI 设计师的终结?)

我从没想到 AI 在 UX/UI 设计上能做到这么惊人。 如果你还怀疑,不妨试试谷歌新出的 Google Stitch。 上一次用 Gemini AI 设计简单网站,结果是一场 UI 灾难——像素化图片加上糟糕排版,惨不忍睹。
6/4/2025 8:10:59 AM
前端小智

斯坦福医学院是如何利用AI改善患者护理的

美国临床肿瘤学会最近的一项研究发现,医生们为每位患者仔细审查影像、病理切片、临床记录和基因组数据,需要花费1.5至2.5小时。 在此背景下,自主式AI在减轻行政负担和改变医疗服务提供方式方面具有非凡潜力。 在本月初的微软Build 2025大会上,斯坦福医疗保健中心的首席数据官Nigam .
6/4/2025 8:00:00 AM
Irene

2025年四大AI模型对比:Claude 4、ChatGPT o3、Grok 3与Gemini 2.5 Pro

随着大模型领域竞争的日益激烈,包括Claude 4、ChatGPT o3、Grok 3和Gemini 2.5 Pro,每款工具都有其独特的优势和适用场景,但如何选择最适合自己的AI工具? 本文将从功能、性能、价格等多个维度进行全面对比,帮助您找到最佳解决方案。 4ChatGPT o3/4.1Grok 3Gemini 2.5 Pro最佳用途编码与分析通用任务实时资讯长文本研究与分析免费版本有限制有 (GPT-3.5)无 (需X Premium)有 (有限功能)API支持是是Beta测试中是上下文窗口200K tokens128K tokens100K tokens2M tokens图像生成否是 (DALL-E)是是月费$20$20$16 (X Premium)20四大AI模型详解Claude 4:开发者的首选工具Claude 4以其在代码生成和分析方面的卓越表现成为开发者的热门选择。
6/4/2025 4:25:00 AM
云原生SRE

Karpathy教你值回ChatGPT 200刀「票价」,初创工程师揭秘ChatGPT最核心能力

ChatGPT你肯定已经用过,也用的很「爽」,但你的使用方法大概率是不对的! 别急,这是OpenAI初创大神Andrej Karpathy说的,「热衷于」科普AI的他再度出手。 这次Andrej Karpathy用一张图教会你如何选择ChatGPT模型!
6/4/2025 4:21:00 AM
新智元

Meta科学家LeCun:当前 AI 模型缺乏四项关键人类智能特质

在巴黎举行的AI行动峰会上,Meta首席AI科学家Yann LeCun提出一个问题:“什么才是智能的基本构成? ”在与IBM AI负责人Anthony Annunziata的对话中,他提出四项标准:理解物理世界、拥有持续的记忆、具备推理能力,以及可以进行分层规划。 这四项能力在LeCun看来,是任何一种具备智能的生命体所共有的基础能力。
6/4/2025 3:22:00 AM

一文让你搞懂什么是 RAG

鸡哥是一个优秀且苦逼的程序员,每天都被领导无情地摧残着,就在他感觉身体即将被掏空时,领导又让他充当交际花,利用美色从某个女老板手里拿到投资。 正所谓工欲善其事,必先利其器,领导给鸡哥一份文档,是从女老板秘书手里买来的,里面记录了女老板近一年的生活轨迹等,让鸡哥在脑海中构建女老板的画像。 没过多久,女老板要求在饭桌上洽谈合作的事情,那么鸡哥自然要打扮一番,可是该穿什么样的衣服呢?
6/4/2025 3:21:00 AM
古明地觉

定义任务 + 合成数据:智能训练的高效引擎 —— Synthetic Data RL

大家好,我是肆〇柒。 在人工智能领域,基础模型的广泛应用为我们带来了前所未有的机遇,然而其在专业领域的表现往往不尽如人意。 高昂的数据标注成本和低效的标注流程,成为了阻碍模型性能提升的两大难题。
6/4/2025 3:00:00 AM
肆零柒

MCP原理与实战:下一代AI Agent的底层基建设计

MCP (Model Context Protocol) 模型上下文协议,通俗地讲就是 AI 领域的“通用接口”。 若将大模型视作计算机或智能手机,MCP 则相当于标准化的 USB 接口,不同的大模型都能通过它无缝接入实时数据、外部数据源等。 通过 MCP,开发者无须针对不同的大模型重复编写集成代码,只需遵循统一的标准即可实现兼容。
6/4/2025 2:25:00 AM
三笠

AI 时代下设计模式的逆袭:为何经典架构思想从未过时?

一、设计模式的“前世今生”:从被忽视到重新审视在软件开发的漫长历程中,设计模式曾经历过备受追捧、过度使用,乃至被部分开发者束之高阁的阶段。 20世纪90年代,《设计模式:可复用面向对象软件的基础》一书的问世,如同在软件开发领域投下一颗重磅炸弹。 抽象工厂、装饰器等模式成为开发者们热议的话题,它们为解决常见问题提供了标准化的方案,建立了一套通用的技术语言,让开发者无需每次都从零开始构思解决方案。
6/4/2025 2:00:05 AM
大模型之路

超实用!Dify快速接入本地MCP服务

Dify 可以通过插件实现 MCP 服务调用,而被调用的 MCP 服务基本可以分为以下两类:通用 MCP 服务(非本地 MCP 服务)。 本地 MCP 服务。 本地 MCP 服务指的是本地通过 Java 或其他语言实现的 MCP 服务器端。
6/4/2025 12:00:00 AM
磊哥

从“代码补全”到“Agent编码”——Amazon Q Developer重新定义下一代开发范式

在全球AI大模型竞赛激烈的当下,Amazon Q Developer正以突破性的技术进化,将软件开发从“代码补全”升级为“Agent编码”,重新定义了下一代开发范式。 自去年re:Invent全球大会首次亮相以来,Amazon Q Developer功能持续迭代,全面发力于MCP(模型上下文协议)和交互式Agent编码体验,正成为开发者理想的AI助手。 它不仅能在命令行(CLI)和IDE(如Visual Studio Code)中灵活使用,还能在GitHub、GitLab等主流开发平台中无缝集成。
6/3/2025 6:06:50 PM

斯坦福临床医疗AI横评,DeepSeek把谷歌OpenAI都秒了

斯坦福最新大模型医疗任务全面评测,DeepSeek R1以66%胜率拿下第一! 歪国网友纷纷被惊艳住了,原因在于该评测重点聚焦临床医生的日常工作场景,而非仅局限于传统医疗执照考试题。 图片要评测就要全 方 位。
6/3/2025 5:40:30 PM

推理“刹不住车”?新框架让DeepSeek-R1们告别过度思考,已开源

DeepSeek-R1、OpenAI o1等推理模型大放异彩。 但随着能力增强,一个副作用越来越明显——它们开始想太多了。 从奥数题到程序逻辑,能解的题越来越多、推理链条越来越长。
6/3/2025 5:38:24 PM

训练MoE足足提速70%!华为只用了三招

Scaling Law之下,MoE(混合专家)如今已经成为各大模型厂商扩展模型能力的制胜法宝。 不过,在高效实现模型参数规模化的同时,MoE的训练难题也日益凸显:训练效率不足,甚至一半以上训练时间都浪费在“等待”上。 现在,为了突破MoE的训练瓶颈,华为出手了:构建了一套名为Adaptive Pipe & EDPB的优化方案,开启“上帝视角”,让MoE面临“交通拥堵”的训练集群,实现无等待流畅运行。
6/3/2025 5:37:49 PM