理论
Meta科学家LeCun:当前 AI 模型缺乏四项关键人类智能特质
在巴黎举行的AI行动峰会上,Meta首席AI科学家Yann LeCun提出一个问题:“什么才是智能的基本构成? ”在与IBM AI负责人Anthony Annunziata的对话中,他提出四项标准:理解物理世界、拥有持续的记忆、具备推理能力,以及可以进行分层规划。 这四项能力在LeCun看来,是任何一种具备智能的生命体所共有的基础能力。
6/4/2025 3:22:00 AM
一文让你搞懂什么是 RAG
鸡哥是一个优秀且苦逼的程序员,每天都被领导无情地摧残着,就在他感觉身体即将被掏空时,领导又让他充当交际花,利用美色从某个女老板手里拿到投资。 正所谓工欲善其事,必先利其器,领导给鸡哥一份文档,是从女老板秘书手里买来的,里面记录了女老板近一年的生活轨迹等,让鸡哥在脑海中构建女老板的画像。 没过多久,女老板要求在饭桌上洽谈合作的事情,那么鸡哥自然要打扮一番,可是该穿什么样的衣服呢?
6/4/2025 3:21:00 AM
古明地觉
定义任务 + 合成数据:智能训练的高效引擎 —— Synthetic Data RL
大家好,我是肆〇柒。 在人工智能领域,基础模型的广泛应用为我们带来了前所未有的机遇,然而其在专业领域的表现往往不尽如人意。 高昂的数据标注成本和低效的标注流程,成为了阻碍模型性能提升的两大难题。
6/4/2025 3:00:00 AM
肆零柒
MCP原理与实战:下一代AI Agent的底层基建设计
MCP (Model Context Protocol) 模型上下文协议,通俗地讲就是 AI 领域的“通用接口”。 若将大模型视作计算机或智能手机,MCP 则相当于标准化的 USB 接口,不同的大模型都能通过它无缝接入实时数据、外部数据源等。 通过 MCP,开发者无须针对不同的大模型重复编写集成代码,只需遵循统一的标准即可实现兼容。
6/4/2025 2:25:00 AM
三笠
AI 时代下设计模式的逆袭:为何经典架构思想从未过时?
一、设计模式的“前世今生”:从被忽视到重新审视在软件开发的漫长历程中,设计模式曾经历过备受追捧、过度使用,乃至被部分开发者束之高阁的阶段。 20世纪90年代,《设计模式:可复用面向对象软件的基础》一书的问世,如同在软件开发领域投下一颗重磅炸弹。 抽象工厂、装饰器等模式成为开发者们热议的话题,它们为解决常见问题提供了标准化的方案,建立了一套通用的技术语言,让开发者无需每次都从零开始构思解决方案。
6/4/2025 2:00:05 AM
大模型之路
超实用!Dify快速接入本地MCP服务
Dify 可以通过插件实现 MCP 服务调用,而被调用的 MCP 服务基本可以分为以下两类:通用 MCP 服务(非本地 MCP 服务)。 本地 MCP 服务。 本地 MCP 服务指的是本地通过 Java 或其他语言实现的 MCP 服务器端。
6/4/2025 12:00:00 AM
磊哥
从“代码补全”到“Agent编码”——Amazon Q Developer重新定义下一代开发范式
在全球AI大模型竞赛激烈的当下,Amazon Q Developer正以突破性的技术进化,将软件开发从“代码补全”升级为“Agent编码”,重新定义了下一代开发范式。 自去年re:Invent全球大会首次亮相以来,Amazon Q Developer功能持续迭代,全面发力于MCP(模型上下文协议)和交互式Agent编码体验,正成为开发者理想的AI助手。 它不仅能在命令行(CLI)和IDE(如Visual Studio Code)中灵活使用,还能在GitHub、GitLab等主流开发平台中无缝集成。
6/3/2025 6:06:50 PM
斯坦福临床医疗AI横评,DeepSeek把谷歌OpenAI都秒了
斯坦福最新大模型医疗任务全面评测,DeepSeek R1以66%胜率拿下第一! 歪国网友纷纷被惊艳住了,原因在于该评测重点聚焦临床医生的日常工作场景,而非仅局限于传统医疗执照考试题。 图片要评测就要全 方 位。
6/3/2025 5:40:30 PM
推理“刹不住车”?新框架让DeepSeek-R1们告别过度思考,已开源
DeepSeek-R1、OpenAI o1等推理模型大放异彩。 但随着能力增强,一个副作用越来越明显——它们开始想太多了。 从奥数题到程序逻辑,能解的题越来越多、推理链条越来越长。
6/3/2025 5:38:24 PM
训练MoE足足提速70%!华为只用了三招
Scaling Law之下,MoE(混合专家)如今已经成为各大模型厂商扩展模型能力的制胜法宝。 不过,在高效实现模型参数规模化的同时,MoE的训练难题也日益凸显:训练效率不足,甚至一半以上训练时间都浪费在“等待”上。 现在,为了突破MoE的训练瓶颈,华为出手了:构建了一套名为Adaptive Pipe & EDPB的优化方案,开启“上帝视角”,让MoE面临“交通拥堵”的训练集群,实现无等待流畅运行。
6/3/2025 5:37:49 PM
经典ReLU回归!重大缺陷「死亡ReLU问题」已被解决
在深度学习领域中,对激活函数的探讨已成为一个独立的研究方向。 例如 GELU、SELU 和 SiLU 等函数凭借其平滑梯度与卓越的收敛特性,已成为热门选择。 尽管这一趋势盛行,经典 ReLU 函数仍因其简洁性、固有稀疏性及其他优势拓扑特性而广受青睐。
6/3/2025 5:37:10 PM
Windsurf创始人:我们对Java工程师做了很多优化和适配
自从 OpenAI 以 30 亿美元收购 Windsurf,这家公司一夜之间成了行业焦点。 我非常喜欢看 Windsurf 创始人 Varun Mohan 的访谈。 他年纪不大,但对于公司经营和产品方向,总能给出一些新鲜、实际的思考,而且讲得很坦诚,没有废话。
6/3/2025 4:36:03 PM
阿颖
从 Copilot 到 Agentic,微软的 AI“开放”革命
人工智能领域的焦点,正在经历一场深刻的转移。 当产业界的焦点集中在大模型的生成准确度、响应速度和成本控制时,前沿玩家们的探索已悄然升级。 构建具备感知、决策和行动能力的智能体,正在成为驱动 AI 发展的关键命题。
6/3/2025 4:23:05 PM
鸢玮
人工智能和知识图谱三:知识图谱系统的基准与评估
一、通用基准知识图谱一些大型知识库已成为事实上的研究基准,通常用作链接预测、问答和实体分类等任务的数据来源。 关键的基准包括:Freebase:一个巨大的通用领域图谱,前身是谷歌收购的开放数据库,包含数百万个实体的事实。 虽然 Freebase 本身已停止服务,已迁移至 Wikidata,但它仍在基准测试中继续存在。
6/3/2025 3:00:04 PM
晓晓
DeepReaserch智能体突破:阿里WebDancer原生Agentic Model让AI自己「上网找答案」
一、背景在现实生活中,我们常常需要解决各种复杂的多步推理问题,这些问题往往需要从多个网页中获取信息,并进行综合分析和推理才能得出答案。 例如,当我们想要了解某个历史事件的详细经过时,可能需要查阅多个不同来源的网页,对比和分析其中的信息,才能还原事件的全貌。 这种复杂的信息检索任务,对于传统的搜索引擎来说是非常困难的,因为它们通常只能提供单步的搜索结果,而无法像人类一样进行多步的推理和决策。
6/3/2025 2:17:18 PM
万帧?单卡!智源研究院开源轻量级超长视频理解模型Video-XL-2
长视频理解是多模态大模型关键能力之一。 尽管 OpenAI GPT-4o、Google Gemini 等私有模型已在该领域取得显著进展,当前的开源模型在效果、计算开销和运行效率等方面仍存在明显短板。 近日,智源研究院联合上海交通大学等机构,正式发布新一代超长视频理解模型:Video-XL-2。
6/3/2025 2:15:33 PM
李飞飞空间智能独角兽开源底层技术!AI生成3D世界在所有设备流畅运行空间智能的“着色器”来了
李飞飞空间智能创业公司World Labs,开源一项核心技术! Forge渲染器,可在桌面端、低功耗移动设备、XR等所有设备上实时、流畅地渲染AI生成的3D世界。 具体来说,Forge是一款Web端3D高斯泼溅渲染器,无缝集成three.js,实现完全动态和可编程的高斯泼溅。
6/3/2025 2:14:59 PM
大神卡帕西这么用ChatGPT:日常4o快又稳,烧脑切o4做后盾,o3只当备胎用
OpenAI模型命名混乱没规律,以至于打开ChatGPT后,好多人都不知道到底该用哪个模型来完成任务。 不过别慌,现在咱们有救了! 刚刚,大神卡帕西在𝕏上发布了一篇使用ChatGPT时的模型选择指南。
6/3/2025 2:13:56 PM
资讯热榜
标签云
AI
人工智能
OpenAI
AIGC
模型
ChatGPT
谷歌
DeepSeek
AI绘画
大模型
机器人
数据
AI新词
Midjourney
开源
Meta
微软
智能
用户
GPT
学习
智能体
技术
Gemini
马斯克
英伟达
Anthropic
图像
AI创作
训练
LLM
论文
代码
算法
AI for Science
苹果
腾讯
Agent
Claude
芯片
Stable Diffusion
蛋白质
具身智能
xAI
开发者
生成式
人形机器人
神经网络
机器学习
3D
AI视频
RAG
大语言模型
Sora
研究
百度
生成
GPU
工具
字节跳动
华为
AGI
计算
大型语言模型
AI设计
搜索
生成式AI
视频生成
DeepMind
亚马逊
AI模型
特斯拉
场景
深度学习
Transformer
架构
MCP
Copilot
编程
视觉