AI在线 AI在线

AI

Karpathy教你值回ChatGPT 200刀「票价」,初创工程师揭秘ChatGPT最核心能力

ChatGPT你肯定已经用过,也用的很「爽」,但你的使用方法大概率是不对的! 别急,这是OpenAI初创大神Andrej Karpathy说的,「热衷于」科普AI的他再度出手。 这次Andrej Karpathy用一张图教会你如何选择ChatGPT模型!
6/4/2025 4:21:00 AM
新智元

Meta科学家LeCun:当前 AI 模型缺乏四项关键人类智能特质

在巴黎举行的AI行动峰会上,Meta首席AI科学家Yann LeCun提出一个问题:“什么才是智能的基本构成? ”在与IBM AI负责人Anthony Annunziata的对话中,他提出四项标准:理解物理世界、拥有持续的记忆、具备推理能力,以及可以进行分层规划。 这四项能力在LeCun看来,是任何一种具备智能的生命体所共有的基础能力。
6/4/2025 3:22:00 AM

定义任务 + 合成数据:智能训练的高效引擎 —— Synthetic Data RL

大家好,我是肆〇柒。 在人工智能领域,基础模型的广泛应用为我们带来了前所未有的机遇,然而其在专业领域的表现往往不尽如人意。 高昂的数据标注成本和低效的标注流程,成为了阻碍模型性能提升的两大难题。
6/4/2025 3:00:00 AM
肆零柒

MCP原理与实战:下一代AI Agent的底层基建设计

MCP (Model Context Protocol) 模型上下文协议,通俗地讲就是 AI 领域的“通用接口”。 若将大模型视作计算机或智能手机,MCP 则相当于标准化的 USB 接口,不同的大模型都能通过它无缝接入实时数据、外部数据源等。 通过 MCP,开发者无须针对不同的大模型重复编写集成代码,只需遵循统一的标准即可实现兼容。
6/4/2025 2:25:00 AM
三笠

AI 时代下设计模式的逆袭:为何经典架构思想从未过时?

一、设计模式的“前世今生”:从被忽视到重新审视在软件开发的漫长历程中,设计模式曾经历过备受追捧、过度使用,乃至被部分开发者束之高阁的阶段。 20世纪90年代,《设计模式:可复用面向对象软件的基础》一书的问世,如同在软件开发领域投下一颗重磅炸弹。 抽象工厂、装饰器等模式成为开发者们热议的话题,它们为解决常见问题提供了标准化的方案,建立了一套通用的技术语言,让开发者无需每次都从零开始构思解决方案。
6/4/2025 2:00:05 AM
大模型之路

斯坦福临床医疗AI横评,DeepSeek把谷歌OpenAI都秒了

斯坦福最新大模型医疗任务全面评测,DeepSeek R1以66%胜率拿下第一! 歪国网友纷纷被惊艳住了,原因在于该评测重点聚焦临床医生的日常工作场景,而非仅局限于传统医疗执照考试题。 图片要评测就要全 方 位。
6/3/2025 5:40:30 PM

推理“刹不住车”?新框架让DeepSeek-R1们告别过度思考,已开源

DeepSeek-R1、OpenAI o1等推理模型大放异彩。 但随着能力增强,一个副作用越来越明显——它们开始想太多了。 从奥数题到程序逻辑,能解的题越来越多、推理链条越来越长。
6/3/2025 5:38:24 PM

训练MoE足足提速70%!华为只用了三招

Scaling Law之下,MoE(混合专家)如今已经成为各大模型厂商扩展模型能力的制胜法宝。 不过,在高效实现模型参数规模化的同时,MoE的训练难题也日益凸显:训练效率不足,甚至一半以上训练时间都浪费在“等待”上。 现在,为了突破MoE的训练瓶颈,华为出手了:构建了一套名为Adaptive Pipe & EDPB的优化方案,开启“上帝视角”,让MoE面临“交通拥堵”的训练集群,实现无等待流畅运行。
6/3/2025 5:37:49 PM

Windsurf创始人:我们对Java工程师做了很多优化和适配

自从 OpenAI 以 30 亿美元收购 Windsurf,这家公司一夜之间成了行业焦点。 我非常喜欢看 Windsurf 创始人 Varun Mohan 的访谈。 他年纪不大,但对于公司经营和产品方向,总能给出一些新鲜、实际的思考,而且讲得很坦诚,没有废话。
6/3/2025 4:36:03 PM
阿颖

提前交付超预期!美国FDA的AI助手Elsa正式上线,药品审查将提速

美国食品药品监督管理局(FDA)今日正式推出名为Elsa的生成式人工智能工具,标志着美国政府部门在AI应用领域迈出重要一步。 该工具的成功部署不仅提前于原定时间表,还实现了预算节约,为政府机构AI转型树立了新标杆。 提前交付的成功案例FDA局长Marty Makary医学博士表示,Elsa的推出比原计划提前且低于预算,这得益于与机构科学审查员此前开展的成功试点计划。
6/3/2025 3:00:54 PM
AI在线

DeepReaserch智能体突破:阿里WebDancer原生Agentic Model让AI自己「上网找答案」

一、背景在现实生活中,我们常常需要解决各种复杂的多步推理问题,这些问题往往需要从多个网页中获取信息,并进行综合分析和推理才能得出答案。 例如,当我们想要了解某个历史事件的详细经过时,可能需要查阅多个不同来源的网页,对比和分析其中的信息,才能还原事件的全貌。 这种复杂的信息检索任务,对于传统的搜索引擎来说是非常困难的,因为它们通常只能提供单步的搜索结果,而无法像人类一样进行多步的推理和决策。
6/3/2025 2:17:18 PM

李飞飞空间智能独角兽开源底层技术!AI生成3D世界在所有设备流畅运行空间智能的“着色器”来了

李飞飞空间智能创业公司World Labs,开源一项核心技术! Forge渲染器,可在桌面端、低功耗移动设备、XR等所有设备上实时、流畅地渲染AI生成的3D世界。 具体来说,Forge是一款Web端3D高斯泼溅渲染器,无缝集成three.js,实现完全动态和可编程的高斯泼溅。
6/3/2025 2:14:59 PM

大神卡帕西这么用ChatGPT:日常4o快又稳,烧脑切o4做后盾,o3只当备胎用

OpenAI模型命名混乱没规律,以至于打开ChatGPT后,好多人都不知道到底该用哪个模型来完成任务。 不过别慌,现在咱们有救了! 刚刚,大神卡帕西在𝕏上发布了一篇使用ChatGPT时的模型选择指南。
6/3/2025 2:13:56 PM

Andrej Karpathy 盛赞!斯坦福团队新作,让Llama-1B 实现毫秒级推理

斯坦福 Hazy Research 团队刚刚公布了一项重量级优化成果:他们将开源模型 Llama-3.2-1B 的前向推理整合成了一个“Megakernel”,并将低延迟推理能力推向了极限。 在某些实时性极高的应用中,例如对话式 AI 和人类参与的交互式工作流中,大语言模型的响应速度不仅重要,甚至可以决定用户体验的成败。 团队认为限制 LLM 推理速度的瓶颈其实是在内存加载的问题上,他们经过研究发现,现有的开源推理引擎(如 vLLM、SGLang),在极低延迟的单序列生成任务下,即使在顶级 GPU(如 H100)上,也只能利用不到 50% 的内存带宽。
6/3/2025 12:49:00 PM
郑佳美

Agent 元年,小厂碎步快跑反超

过去三年,大模型从生成走向理解,从多模态走向执行,让 AI 第一次具备了承接复杂任务链的能力。 到了 2024 年,Agent 概念迅速崛起,成为 AI 应用落地的新焦点。 所以进入 2025 年,越来越多业内人认定——这就是 Agent 元年。
6/3/2025 12:41:00 PM
郑佳美

英伟达合作推出 Fast-dLLM 框架,AI 扩散模型推理速度最高飙升 27.6 倍

英伟达联合麻省理工学院(MIT)、香港大学,合作推出 Fast-dLLM 框架,大幅提升扩散模型(Diffusion-based LLMs)的推理速度。
6/3/2025 11:29:46 AM
故渊

AI 攻击 AI:全球超 1.7 万 Open WebUI 实例被入侵,威胁 Linux 和 Win10 / Win11 用户

网络安全公司 Sysdig 示警,有攻击者利用配置不当的 Open WebUI 实例,通过 AI 生成的恶意软件入侵系统,威胁 Linux 和 Windows 用户。
6/3/2025 9:38:37 AM
故渊

5700问答对全面评估拷问AI空间感!最新空间智能评测基准来了丨浙大&成电&港中文

这个对人类来说非常简单的问题,连GPT-4o这样级别的视觉语言大模型(VLMs)也可能答错。 究其根本,还是当前的视觉语言大模型在大规模图文数据中学习到的空间信息往往是片段化的,仅限于静态视角的理解,缺乏多维度、多视角的空间推理能力。 因此,当面对需要多视角空间推理的任务时,这些模型们就频频卡壳。
6/3/2025 9:16:00 AM