AI在线 AI在线

理论

MCP协议让AI不再“与世隔绝”

什么是MCP? MCP(Model Context Protocol,模型上下文协议)是由 Anthropic 公司于 2024 年 11 月 26 日 推出的一项技术协议。 其主要目的是解决 AI 助手与外部数据源隔离的问题,使 AI 能够连接并访问外部资源。
3/26/2025 3:01:00 AM
飘渺Jam

图解「模型上下文协议(MCP)」:从与传统 API 的比较入手

最近,关于模型上下文协议(MCP)的讨论非常热烈。 你一定听说过它。 今天,让我们一起来了解一下模型上下文协议(MCP)。
3/26/2025 3:00:00 AM
追求卓越的

AI玩具迎来爆发式增长,IoT行业如何抓住机遇?

最近这两年,AI技术的迅猛发展,对整个社会产生了深远影响。 各行各业都在经历AI所带来的变革。 很多的产品,正在加速融入AI元素。
3/26/2025 12:25:00 AM
小枣君

关于人工智能技术学习与应用心得

最近一年多来开始转行做人工智能,从刚开始一点都不懂的小白到现在对人工智能有了初步的认识;中间过程可以说是相当不容易。 因此,经过这段时间的应用和学习,也慢慢有了一点心得体会,因此在此记录一下。 人工智能心得体会关于什么是人工智能,什么是机器学习,什么是神经网络,什么是大模型,以及各种模型架构在这里就不说了;在前面的文章中已经不止一次的讲述过以上内容。
3/26/2025 12:00:00 AM
DFires

传神语联发布深度思考大模型-T1:根原创铸基,任度双脑开启AI深度思考新高度

2025年3月24日,传神语联A纪元系列线上发布活动的第一天,传神语联重磅发布任度双脑深度思考大模型-T1(以下简称任度大模型-T1),为大模型领域贡献了又一创新性成果。 那么,你或许会好奇,在大模型层出不穷的今天,传神语联为什么还执着于推出大模型? 底气来自哪里?
3/25/2025 5:59:13 PM

阿里震撼发布,32B的Qwen2.5,开发者福音!实测:AI可以帮抓小偷了!阿里撞车DS再次坐实“AI汪峰”;网友:美国模型完了

编辑 | 伊风阿里今天发了Qwen2.5-VL的32B版本,达到同等规模的SOTA模型,堪称开发者福音! 千问接连两三次的模型发布时间都不太凑巧。 今日与DeepSeek V3的更新撞车,而上次发的QwQ-32B以轻量推理模型击败了DeepSeek R1,但风头完全被Manus抢走了!
3/25/2025 1:31:45 PM
伊风

AMD跑DeepSeek性能超H200!128并发Token间延迟不超50ms,吞吐量达H200五倍

DeepSeek-R1掀起新一轮购卡潮的同时,AMD的含金量也上升了。 在AMD的MI300X上跑FP8满血R1,性能全面超越了英伟达H200——相同延迟下吞吐量最高可达H200的5倍,相同并发下则比H200高出75%。 这个结果,一方面归功于SGLang框架,另一方面则是得益于AMD新优化的AI内核库AITER。
3/25/2025 12:59:01 PM
量子位

阿里深夜开源Qwen2.5-VL新版本,视觉推理通杀,32B比72B更聪明

就在 DeepSeek V3「小版本更新」后的几个小时,阿里通义千问团队也开源了新模型。 择日不如撞日,Qwen2.5-VL-32B-Instruct 就这么来了。 相比此前的 Qwen2.5-VL 系列模型,32B 模型有如下改进:回复更符合人类主观偏好:调整了输出风格,使回答更加详细、格式更规范,并更符合人类偏好。
3/25/2025 12:11:08 PM
机器之心

为矛盾的理论提供统一解释,牛津大学等揭秘非晶硅结构

编辑丨coisini非晶硅(α-Si)是研究最广泛的无序网络固体之一,其结构已经被研究了几十年。 两种主要理论分别基于连续随机网络模型和「类晶体」模型,后者被定义为在保持整体非晶网络的同时,表现出类似于晶体状态的局部结构有序性。 然而,这种局部有序性的程度一直不明确。
3/25/2025 12:02:00 PM
ScienceAI

分子对接速度提升10,000倍,深度图学习加速RNA虚拟筛选,助力药物靶标发现

编辑 | 萝卜皮RNA 是尚未开发的药物靶标的巨大宝库。 基于结构的虚拟筛选 (VS) 利用结合位点信息识别候选分子,传统上采用分子对接模拟。 然而,对接很难在大型化合物库和 RNA 靶标中扩展。
3/25/2025 12:01:00 PM
ScienceAI

DeepSeek-V3在Mac Studio上以每秒20个token的速度运行,这对OpenAI来说是一场噩梦

DeepSeek悄然发布了一款新的大型语言模型,已在AI行业掀起波澜——不仅因为其能力出众,更因其部署方式独特。 这款名为DeepSeek-V3-0324的641GB模型出现在AI仓库Hugging Face上,几乎没有进行任何宣传,延续了该公司一贯低调却影响深远的产品发布风格。 此次发布尤为引人注目的是该模型的MIT许可证——允许其免费用于商业用途——以及早期报告显示,它可以直接在消费级硬件上运行,特别是配置了M3 Ultra芯片的Apple Mac Studio。
3/25/2025 11:42:41 AM
Michael Nuñez

谷歌320亿豪赌云安全热门赛道:AI+CNAPP

当云安全进入“AI驱动、秒级响应”时代,企业需要的不仅是技术堆砌,而是能将安全转化为业务加速引擎的智能平台;这意味着企业需要AI驱动的CNAPP解决方案来简化CI/CD安全性并减轻DevOps团队的云安全负担。 云安全的未来属于集成人工智能、自动检测风险并在多云环境中提供全栈可视性的平台。 谷歌能否占据CNAPP领先地位将取决于Wiz与谷歌人工智能驱动的威胁情报和安全运营套件的集成程度。
3/25/2025 10:59:17 AM
佚名

专治AI爬虫,Cloudflare推出“下一代蜜罐”

网络基础设施服务商Cloudflare近日推出一项全新功能“AI Labyrinth”(AI迷宫),专门针对那些未经授权、肆意抓取网站数据的AI爬虫。 这项工具不走寻常路,不直接拦截,而是用AI生成的“假内容”迷惑爬虫,让试图为ChatGPT这类大语言模型收集训练数据的AI公司空忙一场。 “下一代蜜罐”登场成立于2009年的Cloudflare提供网站基础设施和安全服务,尤其擅长抵御分布式拒绝服务(DDoS)攻击和恶意流量。
3/25/2025 10:54:08 AM
佚名

RAG(七)Chain-of-Note:笔记链让检索增强型语言模型更强大!

现有的检索增强型语言模型(Retrieval-Augmented Language Models, RALMs)在处理外部知识时存在一定的局限性。 这些模型有时会因为检索到不相关或不可靠的信息而产生误导性的回答,或者在面对检索信息和模型内在知识的干扰时,无法正确选择使用哪一种知识。 此外,在检索信息不足或完全不存在的情况下,标准的RALMs可能会尝试生成一个答案,即使它们并不具备足够的信息来准确作答。
3/25/2025 10:41:06 AM
Goldma

SFT 指令微调数据如何构建?

SFT的重点是学习样式,而非知识注入,所以SFT的样本在于其质量而非数量,少量但精良的样本往往胜过大批中低品质的样本,实现同样甚至更优的微调效果。 通常情况下,2-10k数据就会有一个不错的效果。 这一理念在Meta发布的《LIMA: Less Is More for Alignment》论文中得到了有力阐述,该文献强调了在指令微调过程中,高品质微调数据的决定性作用。
3/25/2025 10:27:14 AM
Goldma

统一细粒度感知!北大&阿里提出UFO:无需SAM,16个token让MLLM实现精准分割

本文作者来自北京大学和阿里通义万相实验室。 其中论文第一作者是汤昊,北京大学 2022 级博士生,目前主要关注统一的多模态任务建模算法。 指导教授是王立威老师,北京大学智能学院教授,曾获 NeurIPS 2024 最佳论文奖、ICLR 2023 杰出论文奖及 ICLR 2024 杰出论文提名奖。
3/25/2025 10:13:26 AM
机器之心

棋盘变战场,大模型却呆了?普林斯顿、UT Austin新基准SPIN-Bench曝AI智商瓶颈

当棋盘变成战场,当盟友暗藏心机,当谈判需要三十六计,AI 的智商令人叹息! 近日,来自普林斯顿和德州大学奥斯丁分校最新评测基准 SPIN-Bench,用一套 "组合拳" 暴击了大模型的软肋。 研究显示,即便是 o1、o3-mini、DeepSeek R1、GPT-4o、Claude 3.5 等顶尖大模型,在涉及战略规划和社会推理的复杂任务中集体 "自闭"。
3/25/2025 9:50:23 AM
机器之心

DeepSeek V3深夜低调升级,代码进化令人震惊,网友实测可媲美Claude 3.5/3.7 Sonnet

昨夜,DeepSeek V3 毫无征兆地来了一波更新,升级到了「DeepSeek-V3-0324」版本。 目前,新版本在 Hugging Face 上可以下载并部署。 Hugging Face 地址:,DeepSeek-V3-0324 没有公布详细的模型卡。
3/25/2025 9:48:22 AM
机器之心