AI在线 AI在线

理论

英伟达让机器人「做梦学习」,靠梦境实现真·从0泛化

「仿生人会梦见电子羊吗? 」这是科幻界一个闻名遐迩的问题。 现在英伟达给出答案:Yes!
5/22/2025 9:06:00 AM

OpenAI放大招!核心API支持MCP,一夜改变智能体开发

今天凌晨,OpenAI全资收购io的消息占据了大部分头条。 同时OpenAI也“悄悄地”放出了另外一个重磅消息,用于开发智能体的核心API——Responses API支持MCP服务。 传统方法,我们在开发智能体需要通过函数调用与外部服务交互,每次操作都涉及从大模型到后端再到外部服务的网络传输,导致多次跳转、延迟会很高,并增加扩展和管理的复杂性。
5/22/2025 8:55:03 AM

如何基于自定义MCP服务器构建支持工具调用的Llama智能体(含code)

一、背景与目标:从知识隔离到本地化智能体在人工智能应用日益普及的今天,隐私保护与数据主权成为重要挑战。 传统的AI模型依赖外部服务,导致私有知识面临泄露风险。 本文将详细介绍如何构建一个完全本地化的AI智能体,通过自定义的Model Context Protocol(MCP)服务器实现知识隔离,并结合Llama 3.2轻量级模型实现工具调用能力。
5/22/2025 8:51:48 AM
大模型之路

Dia-1.6B TTS:优秀的文本到对话生成模型

译者 | 李睿审校 | 重楼Dia-1.6B TTS是由Nari Labs开发的一款拥有16亿个参数的文本转语音模型(TTS)。 本文将详细介绍该模型,以及其访问途径、使用方法,并展示实际应用结果以真正了解该模型的功能。 你是否正在寻求一种合适的文本转语音模型?
5/22/2025 8:05:00 AM
李睿

当心:AI 真的在抢你的工作!​

译者 | 陈峻审校 | 重楼你也许是被本文的标题吸引进来,而且感觉不寒而栗。 这实际上是全球性的自由职业在线平台 Fiverr 的 CEO 在给其全体员工的一封电子邮件中,所描述的一个严酷事实。 而且这并非个案。
5/22/2025 8:00:00 AM
陈峻

100行代码速通Agent开发

大家好,我卡颂自从23年初GPT爆火后,每年都会涌现一些爆火的AI概念。 今年最火的概念无疑是Agent。 伴随而来的,是各家都在争夺「Agent的解释权」:openAI发布a-practical-guide-to-building-agents[1]Antropic发布building-effective-agents[2]langchain作者发文how-to-think-about-agent-frameworks[3]反驳openAI的观点(目的是推销自家的langGraph)这些繁杂的信息无疑加深了开发者对Agent的理解成本。
5/22/2025 7:40:32 AM
卡颂

如何防止智能体成为数据安全威胁

每家公司都存在信息缺口和瓶颈,归根结底,这正是AI为企业带来的真正价值:扩大信息获取渠道,帮助人们连接更多信息点。 但是,当你部署一个像智能体这样的系统,该系统连接着企业的每一个数据源,旨在回答问题、主动从数百个应用程序或部门中挖掘洞察,并采取行动(无论是否有人类提出要求),会发生什么呢?你会得到一个可能极大提升生产力的智能体,但同时也可能成为一个重大的安全风险。 好了,别急着渲染末日氛围——这个问题并非完全新鲜,毕竟,近六成的安全漏洞都是由人为造成的。
5/22/2025 7:10:00 AM
Rahul

RAG系列:基于 DeepSeek + Chroma + LangChain 开发一个简单 RAG 系统

创建 Next 项目首先,使用 npx create-next-app@latest 根据提示完成 Next 项目的创建:复制创建好项目之后,在 src/app 目录下新建 rag 目录,本次 demo 的代码都将放在这里。 知识库构建接下来,我们将构建知识库,主要目标是将准备好的 pdf 通过向量化存到向量数据库中,以便后续的检索。 由于本次 RAG 系统的开发都要依赖 LangChain 框架,所以我们先在项目中安装 LangChain 框架和核心依赖:复制文档加载LangChain 的 DocumentLoaders[1] 提供了种类丰富的文档加载器,可加载文件系统的文件也可以加载线上文件,包括 csv、docx、pdf、pptx、html、github、youtube等等。
5/22/2025 6:48:50 AM
赖祥燃

Qwen3:开源 LLM 的革新者与多语言先锋(万字)

“ Qwen3 模型以其卓越的性能、效率和多语言能力,为开源大语言模型领域树立了新的标杆,引领着技术发展的新潮流。 ”大家好,我是肆〇柒。 在 4 月底的时候 Qwen3 开源放出了权重,在热火朝天开炉炼丹后的不久,上周三千问团队又放出了 Qwen3 的技术报告,最近有点小忙,所以虽然第一时间阅读了技术报告,但是一直没有发文出来。
5/22/2025 5:00:00 AM
肆零柒

并行扩展(Parallel Scaling):一种新型语言模型扩展范式(万字)

“ PARSCALE 作为一种新型的语言模型扩展范式,通过增加并行计算次数 P,在保持参数规模几乎不变的情况下,能够显著提升模型的推理能力。 ”大家好,我是肆〇柒。 今天,我们来聊一项可以改变语言模型性能的技术——PARSCALE(Parallel Scaling)。
5/22/2025 4:00:00 AM
肆零柒

前端 x AI:基于Ollama、DeepSeek、Chroma、LangChain搭建AI应用开发框架

“纸上得来终觉浅,绝知此事要躬行”,因此学习的过程讲究“口到、手到、心到”,为避免浮于表面,需要通过实践进一步将理论内化为个人能力。 为了后续更好的在本地实践 AI 应用开发,今天我先带你在本地搭建基于 Ollama[1]、DeepSeek[2]、Chroma[3]、LangChain.js[4] 和 Next.js[5] 的全栈 AI 应用开发框架。 本开发框架秉承开源、轻量、易操作的理念,让你用最少的资源在本地进行 AI 应用开发实践,带你轻松踏入 AI 应用开发的大门。
5/22/2025 2:00:00 AM
赖祥燃

前端 x AI:从了解提示工程、RAG和微调开始

在AI工程应用中有三种应用范式,他们分别是提示工程(Prompt Engineering)、RAG(Retrieve Augmented Generation)、微调(Fine Tuning),那么在工程应用中我们该如何选择呢? 在具体介绍这三种范式之前,首先我们需要了解什么是大模型。 大模型通常指的是拥有大量参数和复杂结构的深度学习模型,它经过海量的多样化的数据预训练之后,具备了非常多的能力,包括编码、数学、金融、教育和法律等行业的能力。
5/22/2025 1:00:00 AM
赖祥燃

告别“单打独斗”!AI 协作新范式 MoA,如何集结大模型“梦之队”?

大模型浪潮下,你的 AI 应用遇到瓶颈了吗? 当 GPT、Claude、文心一言等各类强大模型如繁星般涌现,我们惊喜于它们令人惊叹的能力。 然而,在实际落地中,我们常常发现,即使是最顶尖的单一模型,也难以完美应对所有复杂场景的需求。
5/21/2025 4:27:00 PM
贝塔街的万事屋

美图联姻阿里:2.5亿美元注资背后的AI电商突围战

5 月 21 日,美图公司一纸公告掀起行业波澜 —— 阿里巴巴以 2.5 亿美元可转债形式战略投资美图,这场资本联姻不仅是财务层面的合作,更预示着 "AI 电商" 领域将爆发剧烈的化学反应。 根据合作协议,阿里巴巴的注资将以 3 年期可转债形式落地,年利率 1% 的设计兼具灵活性与稳定性。 更值得关注的是双方在业务层面的深度绑定:阿里巴巴将在淘宝、天猫等核心电商平台优先推广美图 AI 电商工具,共同开发数据驱动的商品视觉内容生成工具。
5/21/2025 4:25:58 PM
小菲

零代码配置多Agent,腾讯云正式发布“智能体开发平台”

2025年以来,随着 DeepSeek 等大模型技术的持续突破,AI 智能体热度持续攀升。 全球科技巨头与初创企业纷纷入局,智能体正加速向落地演进,成为企业实现降本增效、重塑业务流程的关键驱动力。 5月21日,在“2025腾讯云AI产业应用峰会”上,腾讯云副总裁、腾讯云智能负责人、腾讯优图实验室负责人吴运声宣布大模型知识引擎全面升级为“腾讯云智能体开发平台(TCADP)”。
5/21/2025 2:20:50 PM

AI语音劫持:你能多相信你的耳朵?

你有多确定自己能识别出AI克隆的声音?如果你认为自己完全有把握,那你可能错了。 为何其威胁日益加剧只需三秒钟的音频,犯罪分子现在就能克隆某人的声音,而这些音频很容易从网上或社交媒体上分享的视频中获取。 一位美国母亲差点成为虚拟绑架骗局的受害者,骗子用克隆的声音逼真地模仿了她女儿的求救声,这一案例显示了犯罪分子为达目的不择手段的残忍程度。
5/21/2025 2:03:46 PM
Sinisa

DeepSeek-V3新论文:软硬协同,砸碎“算力神话”!

当AI大模型越来越“吃”硬件,把内存、算力、带宽逼到极限,追赶者们,或者说整个行业,除了干等硬件升级,还能怎么办? ChatGPT横空出世,大模型竞赛白热化。 英伟达的GPU成了硬通货,算力就是一切。
5/21/2025 2:01:22 PM

ChatGPT转型计划曝光!不再只是回答问题,而是通过穿插使用工具变身行动助手

AI Agent今天是初级工程师,6个月后是高级工程师,一年后是架构师。 这是OpenAI CPO Kevin Weil在接受最新访谈时提出的构想。 他表示,ChatGPT将从回答问题转变为为用户做事。
5/21/2025 1:57:58 PM