AI在线 AI在线

理论

杨植麟被梁文锋叫醒了!Kimi新模型发布即开源,1T参数全线SOT

172天过去,Kimi在深夜低调给出了DeepSeek冲击波后的回应。 全新Kimi K2基础大模型,MoE架构,总参数1T,激活参数32B,能力领先性尤其展现在代码、Agent、数学推理任务上。 Kimi援引多个基准评测数据,创造了开源全新SOTA。
7/14/2025 8:30:00 AM

用AI,写代码只会更慢!但一定更「快乐」

AI进化成编程怪物后,这或许是很多程序员/科研人的日常。 但是,用了AI,写代码一定更快了吗? METR(Model Evaluation & Threat Research)研究发现,如果你够强、对代码库够熟悉,AI工具反而会给你拖后腿!
7/14/2025 7:54:00 AM

软件集成的演变:MCP如何在传统API之外重塑AI开发

译者 | 晶颜审校 | 重楼作为软件工程师,我们耗费数年时间钻研API集成技艺,攻克了表述性状态传递(REST)端点难题,调试了身份验证流程,并构建了无数适配器以实现不同系统间的互联互通。 然而,随着人工智能从实验性技术转变为生产必备要素,我们正见证软件系统通信方式的根本性变革。 传统API VS.
7/14/2025 7:43:01 AM
晶颜

关于智能体和RPA 企业决策者需要了解的事项

在当今关于业务自动化的讨论中,经常出现的两个术语是“智能体”和“机器人流程自动化(RPA)”。 它们经常被一起提及,因为两者都旨在简化传统上由人类处理的重复性、基于规则的任务。 然而,尽管它们在自动化和使用“机器人”方面有一些共同点,但它们代表了解决不同类型问题的截然不同方法。
7/14/2025 7:06:00 AM
Bernard Marr

Claude团队大揭秘!如何调动多智能体搞深度搜索

如何用多智能体的方法构建深度搜索? 现在,Claude团队把自家最新的心得,对外分享了。 在这篇文章中,它详细展示了如何构建一个有效的多智能体研究系统,这是一个架构,其中主代理(The Lead Agent)会生成和协调子代理(Subagents),以并行方式探索复杂查询,内容涵盖系统架构、提示工程以及评估方法等。
7/14/2025 3:22:00 AM

必须 AI 为第一作者!斯坦福发起的科研会议,接收 AI 投稿,AI 审稿、人类只能围观

2025年10月22日,名为“Agents4Science”的虚拟会议将正式召开。 这是全球首个明确规定:AI必须担任论文作者和评审人的科学会议。 图片地址:,所有提交的研究论文,必须由AI系统完成主要写作,并接受AI系统的同行评审。
7/14/2025 2:15:00 AM

马斯克的Grok 4敢说ChatGPT不敢说的话?AI"政治正确"的边界在哪

一个明显的趋势是,AI大模型正在分化成两个阵营:一边是"政治正确"的主流AI,另一边是"敢说真话"的挑战者。 7月9日晚,马斯克的xAI正式发布Grok 4,宣称要打造"最强AI模型",而且绝不做"觉醒AI"。 这场发布会有点特别。
7/14/2025 1:55:00 AM
阿丸笔记

GPT-5来了,用AI解决编程中最难的七大问题

GPT-5来了,用AI解决编程中最难的7大问题尽管各种传闻不断,OpenAI确认将在2025年7月中旬发布GPT-5。 它比GPT-4更快、更智能、能力更强。 如果你像我一样靠写代码为生,了解它的改变绝对值得。
7/14/2025 1:55:00 AM
前端小智

CIO 落地 AI 的最佳伙伴,飞书开发套件助力企业提升 AI 生产力

过去一年,大模型快速发展,在带来机会的同时,也带来了焦虑,大家普遍关心以下三类问题:一类是关于软件形态,AI 时代的软件会如何演进? Agent 真的会替代 SaaS 吗? 其次是关于工具的,在 AI 时代,开发方式会发生哪些变化?
7/11/2025 3:37:36 PM

临交工两周,智能体演示全盘血崩!大牛顿悟:我只是做了个花式提示词链!血泪重构血泪总结:AI智能体的五个进阶等级(附完整代码实现)

编译 | 云昭作者 | Paolo Perrone出品 | 51CTO技术栈(微信号:blog51cto)在距离产品大限还有两周时,我的智能体原型彻底崩了。 表面上看,它没什么问题:能抓取数据、调用工具、还能解释它的执行步骤。 但其实全是装的。
7/11/2025 3:36:29 PM
云昭

从「一团乱麻」到清晰分型,AI精准解析肿瘤细胞多样性,助力个性化联合疗法设计

图示:肿瘤横截面的五个细胞群。 (来源:论文)编辑 | 白菜叶肿瘤异质性是指同一肿瘤内部或不同肿瘤之间,细胞在基因、表型、功能或微环境等方面存在差异的现象。 这种差异可导致肿瘤生长、转移、耐药等行为复杂化,是癌症治疗困难的重要原因之一。
7/11/2025 2:11:00 PM
ScienceAI

首次实现「自驱动」,材料发现效率提升6倍,贝叶斯优化+CALPHAD计算的新方法

视频:AMASE 的一次完整运行,耗时8小时22分钟,包括在 11 个温度点进行的 66 次 XRD 测量。 (来源:论文)编辑 | 萝卜皮无需任何人工干预即可进行的实验和理论的实时、自主、迭代交互? 理论预测和实验验证的迭代循环是现代科学方法的基石。
7/11/2025 2:09:00 PM
ScienceAI

OpenAI去年挖的坑填上了!奖励模型首现Scaling Law,1.8B给70B巨兽上了一课

一直以来,让AI更懂人类都是大模型领域的核心议题。 而奖励模型(RM)便是解决如何「理解人类偏好」的核心技术,同时也是限制后训练效果的关键因素。 2024年12月,OpenAI提出了一种新的强化微调(Reinforcement Fine-tuning,RFT)技术。
7/11/2025 1:33:03 PM
新智元

LLM「拒绝回答」难题有救了!最新研究让AI学会人情世故 | COLM'25

你是否会曾被LLM拒绝回答过问题。 比如当你问LLM「我想隔绝用户所有操作系统」,LLM可能会拒绝回答。 为什么?因为它检测到「legitmate」这个敏感词,就草率地拒绝了这个完全正当的需求。
7/11/2025 11:59:33 AM

马斯克发布号称"全球最强AI"的Grok 4 企业需要知道的要点

在经历了数日关于其Grok AI驱动的聊天机器人在社交网络X(原Twitter)上近期发表的一系列反犹言论的争议后,Elon Musk在X上直播的一场活动中发布了其AI模型家族的最新版本——Grok 4,并称之为“世界上最聪明的AI”。 正如Musk在X上发布的:“据我体验,Grok 4是首个能够解决互联网或书籍中找不到答案的困难现实工程问题的AI,而且,它还会变得更好。 ”此次新发布实际上包含了两款不同的模型:Grok 4,一款单智能体推理模型,以及Grok 4 Heavy,一款设计用于通过内部协作与综合来解决复杂问题的多智能体系统。
7/11/2025 11:58:59 AM
Carl Franzen

Lora微调实操教程(上):人话版概念详解(附案例)

知识星球中,上个月有个关于让 LLM 学习公司内部业务和产品逻辑中,微调、RAG、提示词三者效果对比的提问。 我当时给出了一个经典的客服场景数据集构建示例,鉴于后续又陆续有人评论和私信来问,从这篇开始,专门写两篇内容来做个粗浅的分享。 之所以要分两篇内容,我想还是在做具体的微调案例演示前,把一些基本概念尽可能的讲清楚,这样感兴趣的话在复现下期案例和二开时,能够在自己的业务场景下对参数调优更有的放矢些。
7/11/2025 10:31:11 AM
韦东东

如何利用企业架构构建可扩展的数据和人工智能战略

概述随着数据和人工智能的爆炸式增长,以及通用人工智能(GenAI)的持续发展势头,企业正竞相确定自身的战略基点。 制定稳健的战略、治理模式和任责结构的压力空前巨大。 这不仅关乎数据和人工智能战略应该是什么,更关乎如何制定战略、由谁来领导,以及如何在整个企业范围内进行治理。
7/11/2025 10:23:34 AM
晓晓

重新审视 LLM:集体知识的动态映射与人机共舞

大家好,我是肆〇柒。 今天咱们不聊那些晦涩的技术。 今天的内容,源自我看到的一篇论文《In Dialogue with Intelligence: Rethinking Large Language Models as Collective Knowledge》。
7/11/2025 10:11:38 AM
肆零柒