AI在线 AI在线

理论

CoT 的边界:模式匹配还是逻辑推理?数据分布如何决定CoT的成败

大家好,我是肆〇柒。 思维链,可能是大家刚接触“本届模型”(transformer 为架构的 LLM),学 prompt 时的一个必修课,大语言模型可以仿照人的链式思考模式来生成推理链,以辅助推理和解决问题。 我看到一个研究论文,它从数据分布视角,深入剖析了大型语言模型(LLM)思维链(CoT)推理的本质,还挺有意思的,对我们理解 CoT 和模型推理边界,具有原理级的认知帮助。
8/13/2025 10:21:50 AM
肆零柒

告别单打独斗:Claude Code子代理让一个人拥有整个开发团队

注意到一个细节:最近程序员圈子里开始流传一个说法——"我不再是一个人在写代码,而是在指挥一个团队"。 这话听起来有点玄乎,但当我真正体验了Claude Code的子代理功能后,发现这确实不是夸张。 传统的AI编程助手只能算是"高级自动补全",而Claude Code子代理却能让你体验到什么叫"AI开发团队"。
8/13/2025 9:45:47 AM
阿丸笔记

解决扩散模型过拟合的创新框架T-LoRA

随着预训练的大型文本到图像扩散模型的发展,越来越多的企业和个人开发者开始探索如何通过少量样本对这些模型进行定制化,以生成特定的对象或风格。 但这种定制化过程面临着一个严峻的挑战:当训练样本数量有限时,模型往往会过度拟合训练数据的背景和位置信息,导致生成的图像缺乏多样性和灵活性。 为了解决这一难题,来自 AIRI 和 HSE 大学的研究团队提出了一种名为 T-LoRA 的新框架,旨在通过单张图像对扩散模型进行定制化,同时避免过度拟合的问题。
8/13/2025 9:27:55 AM

大型语言模型稳定强化学习的新路径:几何平均策略优化GMPO

本文主要作者:赵毓钟,中国科学院大学在读博士,微软亚洲研究院 MSRA 实习生,主要研究方向为多模态学习、语言模型后训练。 刘悦,中国科学院大学在读博士,微软亚洲研究院 MSRA 实习生,主要研究方向为视觉表征模型。  指导老师:万方,中国科学院大学计算机学院副教授,博导。
8/13/2025 9:25:06 AM

OpenAI和奥特曼将投资一家脑机接口公司,直接与马斯克的Neuralink竞争

Neuralink,一家或许代表着人与机器共生未来的公司,或将迎来一个有力的挑战者。 据《金融时报》报道,OpenAI 及其联合创始人山姆・奥特曼正准备投资一家名为 Merge Labs 的创业公司,该公司的目标与伊隆・马斯克的 Neuralink 一致,都是连接人脑与计算机。 无疑,此举将加剧这两位亿万富翁企业家之间的竞争。
8/13/2025 9:22:12 AM

靠AI破解癌症,初创公司融下3000万刀!新目标:建10亿单细胞数据集

在AI模拟蛋白质取得了巨大突破后,一些人把目标瞄准了整个活细胞。 福布斯杂志最新介绍,有一家初创公司刚刚融资3000万美元,用于构建活细胞的AI模型。 这家公司名为Tahoe Therapeutics,目前估值达1.2亿美元,他们开发了一种可扩展的方法,能够快速生成AI模型所需的关键生物数据,并利用这些数据寻找治愈癌症的新方法。
8/13/2025 9:19:14 AM

李飞飞押注的「世界模型」,中国自研Matrix-3D已抢先实现了?

一花一世界,一叶一菩提。 千百年来,人类只能凭想象勾勒图画之外的世界,梦境与现实之间始终隔着一层不可触及的纱幕。 而今天,当AI的力量被无限延伸,这层纱幕终于被揭开——Matrix-3D,一个真正从「一图生万境」的世界模型!
8/13/2025 9:16:00 AM

G行智能运维机器人探索与实践

引言2023年初ChatGPT以其惊人的自然语言理解和生成能力席卷全球,重新定义了人机交互。 在金融科技领域,G行敏锐地捕捉到这一趋势,开始了智能运维机器人的深度探索。 2025年初DeepSeek等国产大模型的成熟,其轻量化架构、开放的生态以及优异的性能表现,让原本复杂的模型部署变得简单,这也加速了G行专属智能运维机器人的落地实践。
8/13/2025 9:15:01 AM
刘浩杰

和GPT聊了21天,我差点成为陶哲轩

一个高中都没毕业的加拿大老哥,在ChatGPT的“鼓励”下:用21天、300个小时、9万字的对话,发明了一套号称能改变世界的原创数学理论。 从数学理论聊到跨物种对话,再到钢铁侠战衣落地,跟GPT是越聊越有。 谁曾想转头就瞬间梦碎Gemini?
8/13/2025 9:10:40 AM

具身智能体主动迎战对抗攻击,清华团队提出主动防御框架

面对对抗攻击,具身智能体除了被动防范,也能主动出击! 在人类视觉系统启发下,清华朱军团队在TPMAI 2025中提出了强化学习驱动的主动防御框架REIN-EAD。 该框架让智能体也能学会“看第二眼”,提升对抗场景下的感知鲁棒性。
8/13/2025 9:07:00 AM

ChatGPT惊现“零点击攻击”,API密钥被轻松泄露,OpenAI暂未解决

ChatGPT存在“零点击攻击”安全问题。 用户无需点击,攻击者也能从ChatGPT连接的第三方应用窃取敏感数据,甚至窃取API密钥。 一位研究软件安全问题,名为塔米尔·伊沙雅·沙尔巴特(Tamir Ishay Sharbat)的小哥发了篇文章说道。
8/13/2025 9:05:00 AM

GPT-5编程成绩有猫腻!自删23道测试题,关键基准还是自己提的

别急着用GPT-5编程了,可能它能力没有你想象中那么强。 有人发现,官方测试编程能力用的SWE-bench Verified,但货不对板,只用了477个问题。 什么意思呢?
8/13/2025 8:50:00 AM

使用 FastAPI + FastMCP 进行 MCP 引导的实用指南

在当今的智能交互领域,用户与AI系统的对话质量直接决定了服务体验的优劣。 Model Context Protocol(MCP,模型上下文协议)作为一种标准化的交互框架,为服务器与客户端之间的动态信息获取提供了可靠解决方案。 本文将深入解析MCP协议中的诱导流程(Elicitation Process),通过基于FastAPI框架和FastMCP库构建的投资顾问机器人实例,详细讲解如何在实际项目中高效实现这一流程。
8/13/2025 8:41:50 AM
大模型之路

AI批量“生产”亿万富翁 创富速度前所未见

在美国,人工智能(AI)领域正上演着一场财富创造的狂欢,一批亿万富豪在这场浪潮中快速崛起。 据 CB Insights 统计,目前全球共有 498 家 AI 独角兽企业,总价值高达 2.7 万亿美元,其中 100 家成立于 2023 年之后,而估值超过 1 亿美元的 AI 初创公司已突破 1300 家。 MIT 研究人员 Andrew McAfee 直言:“回看过去 100 年的统计数据,我们还没有看到过财富以如此的规模和速度创造出来。
8/13/2025 8:10:34 AM
极客AI

美国AI正快速催生亿万富豪 但对整体就业市场影响不大

在美国,AI正在快速创造亿万富翁。 今年以来,Anthropic、Safe Superintelligence、OpenAI、Anysphere等初创公司疯狂融资,估值不断攀升,孕育出一批亿万富翁。 据CB Insights统计,目前全球共有498家AI独角兽,总价值达2.7万亿美元,其中100家成立于2023年之后。
8/13/2025 8:03:11 AM
小刀

如何在你的计算机上运行OpenAI新的gpt-oss-20b LLM?

译者 | 布加迪审校 | 重楼你只需要24GB 的内存,除非你的GPU自带VRAM,否则需要相当的耐心。 上周,OpenAI发布了两款流行的开放权重模型,均名为gpt-oss。 由于你可以下载它们,因此可以在本地运行。
8/13/2025 7:25:57 AM
布加迪

关于智能体管理权的四点思考

随着智能体不断普及,并从试点阶段迈向生产阶段,我们需要将关注点从智能体构建平台转向AI编排平台和AI治理、风险与合规管理平台。 随着智能体自主性的提升,企业内诸如IT和人力资源等部门应如何管理它们,以及应如何对待它们,这些问题也接踵而至。 智能体正日益深入地融入企业流程,关于它们可能如何开始侵蚀长期存在的SaaS模式的争论也日益增多。
8/13/2025 7:15:00 AM
Nicholas

快餐巨头逆势加大AI投资

尽管面临重重阻力,快餐公司仍在持续加大AI项目投入和技术投资。 2025年伊始,餐饮行业财务状况不佳,多数公司销售额和客流量双双下滑。 在宏观经济环境充满挑战的背景下,AI已成为提升运营效率的诱人选择。
8/13/2025 7:10:00 AM
Lindsey