资讯列表
日本AI王者,CTO是Transformer之父,刚拿下世界编程竞赛冠军
今年的国际编程竞赛ICFP(International Conference on Functional Programming)的冠军队伍名为「Team Unagi」,团队来自日本初创AI研究公司Sakana AI,其中的AI系统不仅帮助他们加速解决方案,更为人类队友带来了全新的解题思路。 ICFP 2025编程大赛高度开放,「任何手段皆可」,鼓励各路奇思妙想和工具(包括AI)自由登场。 Sakana AI团队选择了一条独特的「人机共创」道路。
10/27/2025 8:57:00 AM
AI 编程热潮下的万字思考 — 规避风险,善用其利
在 AI 技术席卷软件工程的今天,我们是否真的可以仅凭“氛围”和直觉,就构建出可靠、安全且可维护的生产级系统? 我们今天为大家带来的这篇文章,作者的核心观点是:“氛围编程(vibe coding)”与“AI 辅助的工程实践”存在本质区别,前者虽在创意激发和快速原型中具有价值,但绝不能替代结构化的工程方法。 文章通过多个维度深入探讨了这一观点:从 FAANG 团队的实际工作流程切入,指出真正的 AI 辅助的工程实践是在严格的设计、审查和测试框架内使用 AI 作为“效能倍增器”。
10/27/2025 4:00:00 AM
Baihai IDP
90%的团队都在用的 Agentic AI 设计模式解析
在当今大语言模型(LLM)应用爆发式增长的背景下,大多数应用仍停留在“智能自动补全”的阶段——你问一句,它答一句。 但真正的 Agentic AI(智能体AI) 则更进一步:它能制定计划、调用工具、自我检查,甚至在处理高风险任务前主动寻求人类确认。 本文将带你了解实践中真正有效、被超过 90% 的生产级系统所采用的核心 Agentic AI 设计模式,包括它们的含义、适用场景以及清晰的架构图解(文中有图片链接可查看完整架构图)。
10/27/2025 3:11:00 AM
大模型之路
系统提示词稳住AI
为什么你问同一个问题,AI 每次回答的风格都不一样? 很大概率是因为没有写“系统提示词”。 • 它是对 AI 的行为规则与角色定位的隐藏指令。
10/27/2025 2:25:00 AM
红绿灯灯灯灯
大白话谈 AI:什么是 RAG 中的 Rerank?
一、回顾下 RAGRAG 的基本工作流程RAG 的全称是 "Retrieval-Augmented Generation" ,翻译成人话就是"检索增强生成"。 听起来还是很专业对吧? 让我用一个生活中的例子来解释。
10/27/2025 1:55:00 AM
玄武后端技术栈
LLM 应用评估综合指南(多轮对话系统、RAG、AI Agent)
随着大语言模型应用从简单的文本生成,发展到复杂的多轮对话机器人、检索增强生成(RAG)系统乃至智能体(Agent),我们应如何科学、有效地评估它们的性能,确保其稳定可靠? 我们今天为大家带来的文章,作者的观点是,对现代 LLM 应用的评估,必须超越传统的 NLP 评估指标,转向一个分场景、系统化的评估体系,综合运用新兴的评价指标与自动化框架,从而全面地衡量系统的综合表现。 作者系统梳理了从传统 NLP 评估指标(如 BLEU、ROUGE)到现代 LLM 基准测试(如 MMLU)的演进,并重点阐释了“LLM-as-a-judge”这一新兴评估范式。
10/27/2025 1:50:00 AM
Baihai IDP
三分钟看懂ChatGPT技术原理
引言与目标本文旨在为普通观众提供大型语言模型(如ChatGPT)的全面介绍。 目标是建立理解LLM的"心智模型",解释其工作原理、优势与局限。 LLM既有神奇之处,也有明显缺陷和"尖锐边缘"(潜在风险)需警惕。
10/27/2025 1:35:00 AM
知识药丸
【n8n入门篇】n8n新手看过来!n8n +windows+docker化部署,喂饭级教程
安装 docker打开 docker 官网。 要查看电脑的架构是 ARM 还是 AMD,可以通过以下步骤使用 WIN R 快捷键来实现:使用系统信息工具:按下 Win R 快捷键,打开“运行”对话框。 输入 msinfo32,然后按 Enter 键。
10/27/2025 1:22:00 AM
子龙
MCP 与 API 网关:二者不可互换
MCP 与 API 网关在架构和协议层面存在本质差异,企业应采用专为 MCP 设计的网关方案以保障安全性与可扩展性,而非简单复用传统 API 网关。 我服务的许多组织正在快速采用 模型上下文协议(MCP),以便通过 AI 智能体将服务和数据连接到 AI 模型。 但他们也遇到了熟悉的挑战:既要保护 MCP 服务器和工具的访问安全,又要实现路由、限流、可观测性和开发者门户等能力。
10/27/2025 1:22:00 AM
Jimmy Song
StereoAdapter:北大首提自监督,适配水下双目深度估计
水下环境中的深度感知对水下机器人自主导航、目标检测和三维重建等任务至关重要。 相比单目方法,双目视觉可以通过双目相机直接获得具有度量尺度的3D深度,避免了单目深度固有的尺度不确定性。 然而,将现有视觉算法直接应用于水下场景会遇到显著挑战。
10/27/2025 1:13:00 AM
新智元
LangGraph 记忆系统实战:反馈循环 + 动态 Prompt 让 AI 持续学习
代理系统或者 RAG 方案,基本都需要一个双层记忆架构,这样 LLM 既能保持对当前上下文的专注,又能记住过往交互的内容。 短期记忆负责单个会话内的即时信息管理,长期记忆则跨会话存储知识,让系统能够持续学习和进化。 两者配合,代理才能表现出连贯性、上下文感知能力,看起来更加智能。
10/27/2025 1:11:00 AM
云朵君
多模态开发踩坑实录
你是不是也遇到这种情况:代码写完了、跑起来也没报错,但模型就是“不看图”? 别急,这事儿很常见——多模态开发不难,难在模型是否真支持多模态。 本文用最简单的方式,带你把“文字 图片”的多模态对话跑起来,并告诉你常见坑怎么避。
10/27/2025 1:11:00 AM
红绿灯灯灯灯
第二波!2025年10月精选实用设计干货合集
大家好,这是 2025 年 10 月第 2 波干货合集! 这一期干货合集当中,有基于 AI 的 UI 和视觉设计平台,基于 AI 的全自动切片的开源工具,有精选的 AI 创作工具推荐网站,便当风 UI 在线编辑工具,来自资深设计总监的免费设计资料库、高品质创意灵感分享网站,以及专门生成 90 年代风格配色的在线网站。 当然,在继续阅读下去之前,记得看看往期干货中有没有你感兴趣的素材:下面我们具体看看这一期的干货:.
10/27/2025 1:00:06 AM
陈子木
全网刷屏的「电影感」三宫格图片,教你用AI快速生成!
更多AI教程:最近这两天,被一个三宫格 AI 图片给刷屏了。 还有那三句经典的台词:. “山的那边是什么。
10/27/2025 12:35:03 AM
数字生命卡兹克
三百年几何猜想被推翻,数学家首次发现「穿不过去」的多面体
想象一下,你手里拿着两个大小相同的骰子。 有没有可能在其中一个骰子上钻一条通道(tunnel),让另一个骰子能从中滑过去? 你的直觉也许会告诉你「不可能吧」,如果是这样,你不是唯一这样认为的。
10/26/2025 7:17:00 PM
机器之心
手把手带你入门机器人学习,HuggingFace联合牛津大学新教程开源SOTA资源库
入坑机器人的春天来了。 众所周知,机器人学本质上是一个多学科交叉的领域,自 20 世纪 60 年代诞生以来,已经取得了前所未有的进步。 尤其是在大模型诞生,多模态大模型等人工智能技术蓬勃发展的当下,机器人领域与过去经典机器人学产生了重大的变化,机器人学习成为了现代机器人学的中流砥柱。
10/26/2025 7:12:00 PM
机器之心
NeurIPS25高分论文|以判别式监督学习强化推理LLM,解决难度偏差和熵崩塌难题
作者介绍:德州农工大学博士生李港,专注于设计和应用高效算法到大规模机器学习和人工智能任务,包括增强大型基础模型的后训练算法、对抗性鲁棒学习算法和分布鲁棒性学习算法。 曾发表数篇论文在 NeurIPS、ICML、KDD 等顶会, 并作为主要贡献者之一发布了针对不平衡分类任务的知名软件包 LibAUC。 DeepSeek-R1 的成功吸引了人们对群体相对策略优化(GRPO)作为大型推理模型(LRM)强化学习方法的广泛关注。
10/26/2025 7:04:00 PM
机器之心
连马桶都会看图说话了,巨头敢卖,你敢坐么?
屎屁尿也是宝贵数据,卫浴巨头把AI放进厕所,看好「被动式、零交互」的健康场景。 据说,日本人来香港买楼,有一条隐形标配:TOTO 智能马桶,必不可少。 加热座圈、温柔清洗、播放自然声掩盖尴尬声音,TOTO 早就把如厕体验做成了一门细腻的生活艺术。
10/26/2025 6:57:00 PM
机器之心