理论
如何基于自定义MCP服务器构建支持工具调用的Llama智能体(含code)
一、背景与目标:从知识隔离到本地化智能体在人工智能应用日益普及的今天,隐私保护与数据主权成为重要挑战。 传统的AI模型依赖外部服务,导致私有知识面临泄露风险。 本文将详细介绍如何构建一个完全本地化的AI智能体,通过自定义的Model Context Protocol(MCP)服务器实现知识隔离,并结合Llama 3.2轻量级模型实现工具调用能力。
5/22/2025 8:51:48 AM
大模型之路
Dia-1.6B TTS:优秀的文本到对话生成模型
译者 | 李睿审校 | 重楼Dia-1.6B TTS是由Nari Labs开发的一款拥有16亿个参数的文本转语音模型(TTS)。 本文将详细介绍该模型,以及其访问途径、使用方法,并展示实际应用结果以真正了解该模型的功能。 你是否正在寻求一种合适的文本转语音模型?
5/22/2025 8:05:00 AM
李睿
当心:AI 真的在抢你的工作!
译者 | 陈峻审校 | 重楼你也许是被本文的标题吸引进来,而且感觉不寒而栗。 这实际上是全球性的自由职业在线平台 Fiverr 的 CEO 在给其全体员工的一封电子邮件中,所描述的一个严酷事实。 而且这并非个案。
5/22/2025 8:00:00 AM
陈峻
100行代码速通Agent开发
大家好,我卡颂自从23年初GPT爆火后,每年都会涌现一些爆火的AI概念。 今年最火的概念无疑是Agent。 伴随而来的,是各家都在争夺「Agent的解释权」:openAI发布a-practical-guide-to-building-agents[1]Antropic发布building-effective-agents[2]langchain作者发文how-to-think-about-agent-frameworks[3]反驳openAI的观点(目的是推销自家的langGraph)这些繁杂的信息无疑加深了开发者对Agent的理解成本。
5/22/2025 7:40:32 AM
卡颂
如何防止智能体成为数据安全威胁
每家公司都存在信息缺口和瓶颈,归根结底,这正是AI为企业带来的真正价值:扩大信息获取渠道,帮助人们连接更多信息点。 但是,当你部署一个像智能体这样的系统,该系统连接着企业的每一个数据源,旨在回答问题、主动从数百个应用程序或部门中挖掘洞察,并采取行动(无论是否有人类提出要求),会发生什么呢?你会得到一个可能极大提升生产力的智能体,但同时也可能成为一个重大的安全风险。 好了,别急着渲染末日氛围——这个问题并非完全新鲜,毕竟,近六成的安全漏洞都是由人为造成的。
5/22/2025 7:10:00 AM
Rahul
RAG系列:基于 DeepSeek + Chroma + LangChain 开发一个简单 RAG 系统
创建 Next 项目首先,使用 npx create-next-app@latest 根据提示完成 Next 项目的创建:复制创建好项目之后,在 src/app 目录下新建 rag 目录,本次 demo 的代码都将放在这里。 知识库构建接下来,我们将构建知识库,主要目标是将准备好的 pdf 通过向量化存到向量数据库中,以便后续的检索。 由于本次 RAG 系统的开发都要依赖 LangChain 框架,所以我们先在项目中安装 LangChain 框架和核心依赖:复制文档加载LangChain 的 DocumentLoaders[1] 提供了种类丰富的文档加载器,可加载文件系统的文件也可以加载线上文件,包括 csv、docx、pdf、pptx、html、github、youtube等等。
5/22/2025 6:48:50 AM
赖祥燃
Qwen3:开源 LLM 的革新者与多语言先锋(万字)
“ Qwen3 模型以其卓越的性能、效率和多语言能力,为开源大语言模型领域树立了新的标杆,引领着技术发展的新潮流。 ”大家好,我是肆〇柒。 在 4 月底的时候 Qwen3 开源放出了权重,在热火朝天开炉炼丹后的不久,上周三千问团队又放出了 Qwen3 的技术报告,最近有点小忙,所以虽然第一时间阅读了技术报告,但是一直没有发文出来。
5/22/2025 5:00:00 AM
肆零柒
并行扩展(Parallel Scaling):一种新型语言模型扩展范式(万字)
“ PARSCALE 作为一种新型的语言模型扩展范式,通过增加并行计算次数 P,在保持参数规模几乎不变的情况下,能够显著提升模型的推理能力。 ”大家好,我是肆〇柒。 今天,我们来聊一项可以改变语言模型性能的技术——PARSCALE(Parallel Scaling)。
5/22/2025 4:00:00 AM
肆零柒
前端 x AI:基于Ollama、DeepSeek、Chroma、LangChain搭建AI应用开发框架
“纸上得来终觉浅,绝知此事要躬行”,因此学习的过程讲究“口到、手到、心到”,为避免浮于表面,需要通过实践进一步将理论内化为个人能力。 为了后续更好的在本地实践 AI 应用开发,今天我先带你在本地搭建基于 Ollama[1]、DeepSeek[2]、Chroma[3]、LangChain.js[4] 和 Next.js[5] 的全栈 AI 应用开发框架。 本开发框架秉承开源、轻量、易操作的理念,让你用最少的资源在本地进行 AI 应用开发实践,带你轻松踏入 AI 应用开发的大门。
5/22/2025 2:00:00 AM
赖祥燃
前端 x AI:从了解提示工程、RAG和微调开始
在AI工程应用中有三种应用范式,他们分别是提示工程(Prompt Engineering)、RAG(Retrieve Augmented Generation)、微调(Fine Tuning),那么在工程应用中我们该如何选择呢? 在具体介绍这三种范式之前,首先我们需要了解什么是大模型。 大模型通常指的是拥有大量参数和复杂结构的深度学习模型,它经过海量的多样化的数据预训练之后,具备了非常多的能力,包括编码、数学、金融、教育和法律等行业的能力。
5/22/2025 1:00:00 AM
赖祥燃
告别“单打独斗”!AI 协作新范式 MoA,如何集结大模型“梦之队”?
大模型浪潮下,你的 AI 应用遇到瓶颈了吗? 当 GPT、Claude、文心一言等各类强大模型如繁星般涌现,我们惊喜于它们令人惊叹的能力。 然而,在实际落地中,我们常常发现,即使是最顶尖的单一模型,也难以完美应对所有复杂场景的需求。
5/21/2025 4:27:00 PM
贝塔街的万事屋
美图联姻阿里:2.5亿美元注资背后的AI电商突围战
5 月 21 日,美图公司一纸公告掀起行业波澜 —— 阿里巴巴以 2.5 亿美元可转债形式战略投资美图,这场资本联姻不仅是财务层面的合作,更预示着 "AI 电商" 领域将爆发剧烈的化学反应。 根据合作协议,阿里巴巴的注资将以 3 年期可转债形式落地,年利率 1% 的设计兼具灵活性与稳定性。 更值得关注的是双方在业务层面的深度绑定:阿里巴巴将在淘宝、天猫等核心电商平台优先推广美图 AI 电商工具,共同开发数据驱动的商品视觉内容生成工具。
5/21/2025 4:25:58 PM
小菲
零代码配置多Agent,腾讯云正式发布“智能体开发平台”
2025年以来,随着 DeepSeek 等大模型技术的持续突破,AI 智能体热度持续攀升。 全球科技巨头与初创企业纷纷入局,智能体正加速向落地演进,成为企业实现降本增效、重塑业务流程的关键驱动力。 5月21日,在“2025腾讯云AI产业应用峰会”上,腾讯云副总裁、腾讯云智能负责人、腾讯优图实验室负责人吴运声宣布大模型知识引擎全面升级为“腾讯云智能体开发平台(TCADP)”。
5/21/2025 2:20:50 PM
AI语音劫持:你能多相信你的耳朵?
你有多确定自己能识别出AI克隆的声音?如果你认为自己完全有把握,那你可能错了。 为何其威胁日益加剧只需三秒钟的音频,犯罪分子现在就能克隆某人的声音,而这些音频很容易从网上或社交媒体上分享的视频中获取。 一位美国母亲差点成为虚拟绑架骗局的受害者,骗子用克隆的声音逼真地模仿了她女儿的求救声,这一案例显示了犯罪分子为达目的不择手段的残忍程度。
5/21/2025 2:03:46 PM
Sinisa
DeepSeek-V3新论文:软硬协同,砸碎“算力神话”!
当AI大模型越来越“吃”硬件,把内存、算力、带宽逼到极限,追赶者们,或者说整个行业,除了干等硬件升级,还能怎么办? ChatGPT横空出世,大模型竞赛白热化。 英伟达的GPU成了硬通货,算力就是一切。
5/21/2025 2:01:22 PM
ChatGPT转型计划曝光!不再只是回答问题,而是通过穿插使用工具变身行动助手
AI Agent今天是初级工程师,6个月后是高级工程师,一年后是架构师。 这是OpenAI CPO Kevin Weil在接受最新访谈时提出的构想。 他表示,ChatGPT将从回答问题转变为为用户做事。
5/21/2025 1:57:58 PM
纯靠“脑补”图像,大模型推理准确率狂飙80%丨剑桥谷歌新研究
不再依赖语言,仅凭图像就能完成模型推理? 大模型又双叒叕迎来新SOTA! 当你和大模型一起玩超级玛丽时,复杂环境下你会根据画面在脑海里自动规划步骤,但LLMs还需要先转成文字攻略一格格按照指令移动,效率又低、信息也可能会丢失,那难道就没有一个可以跳过“语言中介”的方法吗?
5/21/2025 1:56:37 PM
瘦身不降智!大模型训推效率提升30%,京东大模型开发计算研究登Nature旗下期刊
京东探索研究院关于大模型的最新研究,登上了Nature旗下期刊! 该项研究提出了一种在开放环境场景中训练、更新大模型,并与小模型协同部署的系统与方法。 它通过模型蒸馏、数据治理、训练优化与云边协同四大创新,这个项目将大模型推理效率平均提升30%,训练成本降低70%。
5/21/2025 1:54:20 PM
资讯热榜
标签云
AI
人工智能
OpenAI
AIGC
模型
ChatGPT
谷歌
DeepSeek
AI绘画
大模型
机器人
数据
AI新词
Midjourney
开源
Meta
微软
智能
用户
GPT
学习
智能体
技术
Gemini
马斯克
英伟达
Anthropic
图像
AI创作
训练
LLM
论文
代码
算法
苹果
AI for Science
腾讯
Agent
Claude
芯片
Stable Diffusion
具身智能
蛋白质
xAI
开发者
生成式
人形机器人
神经网络
机器学习
3D
AI视频
RAG
大语言模型
Sora
研究
百度
生成
GPU
字节跳动
工具
华为
AGI
计算
大型语言模型
AI设计
搜索
生成式AI
视频生成
亚马逊
DeepMind
AI模型
特斯拉
场景
深度学习
Transformer
架构
MCP
Copilot
编程
视觉