AI在线 AI在线

理论

机器人杭州上演格斗赛!拳拳到肉,宇树CEO王兴兴:创造了人类历史新时刻

激烈,着实激烈! 全球首个人形机器人格斗赛刚刚在杭州落下帷幕,战况那叫一个精彩纷呈。 贴身肉搏、侧身闪避、倒地后快速爬起…格斗技巧的十八般武艺通通拿出来了:当然也不乏搞笑画风,有选手直接对着空气一通乱挥:本次公开表演赛一共有四支参赛队伍,均使用了宇树科技G1人形机器人。
5/27/2025 2:00:00 AM

智能体「Agent」技术全景:挑战、机遇与未来

大家好,我是肆〇柒。 这篇论文的研究来自 MetaGPT、Montréal & Mila人工智能研究所、南洋理工大学、美国阿贡国家实验室、悉尼大学、宾夕法尼亚州立大学、微软亚洲研究院、伊利诺伊大学厄巴纳-香槟分校、香港科技大学、南加州大学、耶鲁大学、斯坦福大学、佐治亚大学、俄亥俄州立大学、阿卜杜拉国王科技大学、杜克大学、香港理工大学、谷歌 DeepMind 以及加拿大高等研究院(CIFAR)等众多研究者的集体智慧与前瞻思考,历时半年创作而成。 这篇论文的质量很高,为我们综述了 AI Agent 领域的全景现状,能看的出来是花了大心思的。
5/27/2025 2:00:00 AM
肆零柒

利用DeepSeek与Python自动生成测试用例!

在当今快节奏的软件开发领域,自动化测试已然成为保障软件质量的中流砥柱。 传统手动编写测试用例的方式,非但耗时费力,还极易遗漏关键场景。 所幸,AI 技术的飞速发展为我们带来了全新的解决方案。
5/27/2025 1:45:00 AM
狂师

Spring AI Observations:让AI应用监控变得简单高效

在AI应用爆发式增长的今天,Spring AI 1.0版本带来了革命性的可观测性功能。 本文将深入探讨如何利用Spring AI Micrometer 构建企业级AI应用监控体系,实现成本控制、性能优化和全链路追踪。 为什么Spring AI应用急需可观测性?
5/27/2025 1:35:00 AM
PIG AI

LLM能理解数学吗?最新研究揭露大模型数学推理的致命缺陷

你有没有想过,那些在聊天中侃侃而谈的AI大模型,遇到数学题时会是什么样子? 就像一个平时很会聊天的朋友,突然被问到复杂的数学问题时支支吾吾的样子。 最近有研究团队专门研究了这个问题,结果发现了一些让人意外的真相。
5/27/2025 1:27:00 AM
无影寺

拆解OpenAI最大对手的杀手锏:为什么会是MCP?

坦白说,很多人曾与a16z的观察者持相同观点:GPT Wrapper凭借其优雅的抽象层设计,理应成为智能体通信协议的事实标准。 但MCP的逆袭轨迹颠覆了所有预测——这个最初仅为Claude Desktop打造隐私优先本地化集成的协议,竟在短短三个月内完成了从边缘工具到生态基石的跃迁。 这验证了网络效应铁律:协议价值永远锚定在已有生态密度。
5/27/2025 1:25:00 AM
曹洪伟

深度剖析向量数据库HNSW索引,参数优化与性能权衡

随着深度学习在特征表示领域的突破,向量嵌入已成为处理和检索非结构化数据(如文本、图像、音频)的核心技术。 向量数据库,作为专门存储、管理和查询大规模向量数据的系统,其性能高度依赖于高效的近似最近邻(Approximate Nearest Neighbor, ANN)搜索算法。 HNSW (Hierarchical Navigable Small World) 作为当前业界领先的图 ANN 索引算法之一,因其出色的搜索速度和召回率平衡而备受青睐。
5/27/2025 1:20:00 AM
贝塔街的万事屋

如何给自研 MCP 服务,加上安全认证?

一、举例,对接高德地图 MCP高德地图 MCP Server;复制官网:  - 官网提供了创建对接 Key1. 代码使用示例复制对接时,需要设定 sseEndpoint 如果不设定个,Spring AI 默认是对 builder 的 baseUrl 值添加 /sse 的。 所以,如果你要对接外部带有验证权限的 MCP 服务,需要手动设置下 sseEndpoint 值。
5/27/2025 1:10:00 AM
小傅哥

硅基模型vs.碳基大脑:AI能否成为超越人类的超级预测者?

如果能精准预测未来,就能在生活中占尽先机,无论是预判房价涨跌,还是捕捉下一个产业风口,预测的魅力都无人可挡。 随着 AI 技术的蓬勃发展,一个核心问题开始引发思考:人工智能能否成为超越人类的超级预测者? 在这一思潮的推动下,预测领域正加速构建 AI 预测机器人。
5/27/2025 1:00:00 AM
小刀

RAG系列:问题优化 - 意图识别&同义改写&多视角分解&补充上下文

在实际业务场景中,知识库不会只有单一领域的知识,可能会存在多个领域的知识,如果对用户问题不提前做领域区分,在对基于距离的向量数据库进行检索时,可能会检索出很多与用户问题不属于同一个领域的文档片段,这样的上下文会存在较多的噪音或者不准确的信息,从而影响最终的回答效果。 另一方面知识库中涵盖的知识表达形式也是有限的,但用户的提问方式却是千人千面的,用户遣词造句的方式以及描述问题的角度可能会与向量数据库中存储的文档片段存在差异,这就可能导致用户问题和知识库之间不能很好匹配,从而降低检索效果。 为了解决此问题,我们可以对用户问题进行查询增强,比如对用户问题进行意图识别、同义改写、多视角分解以及补充上下文,通过这几个查询增强方式来更好地匹配知识库中的文档片段,提升检索效果和回答效果。
5/27/2025 12:40:00 AM
燃哥讲AI

社区造数服务接入MCP

一、背景今年 MCP 的概念非常火,市面上也涌现出了一大批 MCP 相关工具。 作为技术一线者,都会按捺不住地去实操一下,很早的时候就有个设想,如果把我们的测试工具都改造为符合 MCP 服务协议标准,然后全部接入 AI Agent,打造一个集万千工具于一体的智能管家来帮助我们提效,是不是一个很完美的设想。 很多宏伟或者天马行空的想法想要真正的落地,必然需要不断向下,拆解成可落地的任务模块,这里我们先从造数开始。
5/27/2025 12:15:07 AM
阿凯

基于图的 RAG 方法总结(GraphRAG、 GraphReader、LightRAG、HippoRAG和KAG)

在自然语言处理领域,检索增强生成(RAG)技术通过结合外部知识库与语言模型,显著提升了模型在知识密集型任务中的表现。 近年来,基于图结构的 RAG 方法成为研究热点,通过引入知识图谱的实体关系建模能力,有效解决了传统 RAG 在多跳推理、长文本理解和全局语义捕捉中的局限性。 本文详细分析五种代表性方法:GraphRAG、GraphReader、LightRAG、HippoRAG和KAG ,从实现细节、优缺点及适用场景展开对比。
5/27/2025 12:15:00 AM
Goldma

国际劳工组织报告:全球25%就业岗位或受生成式人工智能影响

近日,国际劳工组织(ILO)与波兰国家研究院发布联合研究报告《生成式人工智能与就业:全球职业受影响程度精编指数》,对生成式人工智能如何重塑劳动世界进行了迄今最详尽的评估。 报告指出,全球 25% 的就业岗位可能受到生成式人工智能影响,高收入国家这一比例更高,达 34%。 该指数通过整合近3 .
5/27/2025 12:10:00 AM

高手做决策的认知公式:贝叶斯定理及其三重境界

“顶级的成功不是因为他们是谁,而是因为他们以什么方式思考,以什么逻辑行动。 ”爱因斯坦有个著名的问题:“你所经历过的最大的挑战是什么? ”埃隆·马斯克对此足足思考了30秒,给出了一个非常精彩的回答:“确保你有一个可纠错的反馈闭环(making sure you have a corrective feedback loop)”。
5/27/2025 12:00:25 AM

智能体常用策略FunctionCalling和ReAct有什么区别?

Dify 内置了两种 Agent 策略:Function Calling 和 ReAct,但二者有什么区别呢? 在使用时又该如何选择呢? 接下来我们一起来看。
5/27/2025 12:00:00 AM
磊哥

要有野心!创始人揭秘Claude4诞生:有点玄学,很快接入测谎仪!26年出现单人独角兽!做AI像登上太空飞船,MCP快行业标准了

编辑 | 云昭出品 | 51CTO技术栈(微信号:blog51cto)上周五 Claude 4 的发布会上,Anthropic 的 CEO Dario Amodei 与Instagram联合创始人、Anthropic 首席产品官 Mike Krieger 在 KeyNote 最后进行了一场围炉对话。 两个人都是创业公司的创始人,又都参与了同一款 AI 产品的打磨与迭代。 对于AI 编程,Anthropic 的产品路线图将是什么样子?
5/26/2025 6:40:00 PM
云昭

字节跳动 AdaCoT:基于强化学习的自适应推理触发方法(万字)

大家好,我是肆〇柒。 在当下,大型语言模型(LLM)凭借其强大的语言理解和生成能力,在众多领域展现出了巨大的潜力。 然而,尽管 LLM 在处理常规任务时表现出色,但在面对复杂推理任务时,却常常暴露出明显的短板。
5/26/2025 5:16:51 PM
肆零柒

字节开源Dolphin,高精度文档图像解析大模型,创新先分析后解析新范式

在数字时代,从扫描文档、图片等非结构化数据中高效、准确地提取结构化信息,是人工智能领域长期面临的挑战。 无论是复杂的表格、交织的文本段落,还是难以识别的数学公式,都对文档解析技术提出了严苛要求。 传统的解决方案往往依赖于多个专业模型的串联,不仅集成成本高昂,还容易在处理过程中累积误差 。
5/26/2025 4:46:38 PM
贝塔街的万事屋