理论
杨植麟被梁文锋叫醒了!Kimi新模型发布即开源,1T参数全线SOT
172天过去,Kimi在深夜低调给出了DeepSeek冲击波后的回应。 全新Kimi K2基础大模型,MoE架构,总参数1T,激活参数32B,能力领先性尤其展现在代码、Agent、数学推理任务上。 Kimi援引多个基准评测数据,创造了开源全新SOTA。
7/14/2025 8:30:00 AM
用AI,写代码只会更慢!但一定更「快乐」
AI进化成编程怪物后,这或许是很多程序员/科研人的日常。 但是,用了AI,写代码一定更快了吗? METR(Model Evaluation & Threat Research)研究发现,如果你够强、对代码库够熟悉,AI工具反而会给你拖后腿!
7/14/2025 7:54:00 AM
软件集成的演变:MCP如何在传统API之外重塑AI开发
译者 | 晶颜审校 | 重楼作为软件工程师,我们耗费数年时间钻研API集成技艺,攻克了表述性状态传递(REST)端点难题,调试了身份验证流程,并构建了无数适配器以实现不同系统间的互联互通。 然而,随着人工智能从实验性技术转变为生产必备要素,我们正见证软件系统通信方式的根本性变革。 传统API VS.
7/14/2025 7:43:01 AM
晶颜
关于智能体和RPA 企业决策者需要了解的事项
在当今关于业务自动化的讨论中,经常出现的两个术语是“智能体”和“机器人流程自动化(RPA)”。 它们经常被一起提及,因为两者都旨在简化传统上由人类处理的重复性、基于规则的任务。 然而,尽管它们在自动化和使用“机器人”方面有一些共同点,但它们代表了解决不同类型问题的截然不同方法。
7/14/2025 7:06:00 AM
Bernard Marr
Claude团队大揭秘!如何调动多智能体搞深度搜索
如何用多智能体的方法构建深度搜索? 现在,Claude团队把自家最新的心得,对外分享了。 在这篇文章中,它详细展示了如何构建一个有效的多智能体研究系统,这是一个架构,其中主代理(The Lead Agent)会生成和协调子代理(Subagents),以并行方式探索复杂查询,内容涵盖系统架构、提示工程以及评估方法等。
7/14/2025 3:22:00 AM
必须 AI 为第一作者!斯坦福发起的科研会议,接收 AI 投稿,AI 审稿、人类只能围观
2025年10月22日,名为“Agents4Science”的虚拟会议将正式召开。 这是全球首个明确规定:AI必须担任论文作者和评审人的科学会议。 图片地址:,所有提交的研究论文,必须由AI系统完成主要写作,并接受AI系统的同行评审。
7/14/2025 2:15:00 AM
马斯克的Grok 4敢说ChatGPT不敢说的话?AI"政治正确"的边界在哪
一个明显的趋势是,AI大模型正在分化成两个阵营:一边是"政治正确"的主流AI,另一边是"敢说真话"的挑战者。 7月9日晚,马斯克的xAI正式发布Grok 4,宣称要打造"最强AI模型",而且绝不做"觉醒AI"。 这场发布会有点特别。
7/14/2025 1:55:00 AM
阿丸笔记
GPT-5来了,用AI解决编程中最难的七大问题
GPT-5来了,用AI解决编程中最难的7大问题尽管各种传闻不断,OpenAI确认将在2025年7月中旬发布GPT-5。 它比GPT-4更快、更智能、能力更强。 如果你像我一样靠写代码为生,了解它的改变绝对值得。
7/14/2025 1:55:00 AM
前端小智
CIO 落地 AI 的最佳伙伴,飞书开发套件助力企业提升 AI 生产力
过去一年,大模型快速发展,在带来机会的同时,也带来了焦虑,大家普遍关心以下三类问题:一类是关于软件形态,AI 时代的软件会如何演进? Agent 真的会替代 SaaS 吗? 其次是关于工具的,在 AI 时代,开发方式会发生哪些变化?
7/11/2025 3:37:36 PM
临交工两周,智能体演示全盘血崩!大牛顿悟:我只是做了个花式提示词链!血泪重构血泪总结:AI智能体的五个进阶等级(附完整代码实现)
编译 | 云昭作者 | Paolo Perrone出品 | 51CTO技术栈(微信号:blog51cto)在距离产品大限还有两周时,我的智能体原型彻底崩了。 表面上看,它没什么问题:能抓取数据、调用工具、还能解释它的执行步骤。 但其实全是装的。
7/11/2025 3:36:29 PM
云昭
从「一团乱麻」到清晰分型,AI精准解析肿瘤细胞多样性,助力个性化联合疗法设计
图示:肿瘤横截面的五个细胞群。 (来源:论文)编辑 | 白菜叶肿瘤异质性是指同一肿瘤内部或不同肿瘤之间,细胞在基因、表型、功能或微环境等方面存在差异的现象。 这种差异可导致肿瘤生长、转移、耐药等行为复杂化,是癌症治疗困难的重要原因之一。
7/11/2025 2:11:00 PM
ScienceAI
首次实现「自驱动」,材料发现效率提升6倍,贝叶斯优化+CALPHAD计算的新方法
视频:AMASE 的一次完整运行,耗时8小时22分钟,包括在 11 个温度点进行的 66 次 XRD 测量。 (来源:论文)编辑 | 萝卜皮无需任何人工干预即可进行的实验和理论的实时、自主、迭代交互? 理论预测和实验验证的迭代循环是现代科学方法的基石。
7/11/2025 2:09:00 PM
ScienceAI
OpenAI去年挖的坑填上了!奖励模型首现Scaling Law,1.8B给70B巨兽上了一课
一直以来,让AI更懂人类都是大模型领域的核心议题。 而奖励模型(RM)便是解决如何「理解人类偏好」的核心技术,同时也是限制后训练效果的关键因素。 2024年12月,OpenAI提出了一种新的强化微调(Reinforcement Fine-tuning,RFT)技术。
7/11/2025 1:33:03 PM
新智元
LLM「拒绝回答」难题有救了!最新研究让AI学会人情世故 | COLM'25
你是否会曾被LLM拒绝回答过问题。 比如当你问LLM「我想隔绝用户所有操作系统」,LLM可能会拒绝回答。 为什么?因为它检测到「legitmate」这个敏感词,就草率地拒绝了这个完全正当的需求。
7/11/2025 11:59:33 AM
马斯克发布号称"全球最强AI"的Grok 4 企业需要知道的要点
在经历了数日关于其Grok AI驱动的聊天机器人在社交网络X(原Twitter)上近期发表的一系列反犹言论的争议后,Elon Musk在X上直播的一场活动中发布了其AI模型家族的最新版本——Grok 4,并称之为“世界上最聪明的AI”。 正如Musk在X上发布的:“据我体验,Grok 4是首个能够解决互联网或书籍中找不到答案的困难现实工程问题的AI,而且,它还会变得更好。 ”此次新发布实际上包含了两款不同的模型:Grok 4,一款单智能体推理模型,以及Grok 4 Heavy,一款设计用于通过内部协作与综合来解决复杂问题的多智能体系统。
7/11/2025 11:58:59 AM
Carl Franzen
Lora微调实操教程(上):人话版概念详解(附案例)
知识星球中,上个月有个关于让 LLM 学习公司内部业务和产品逻辑中,微调、RAG、提示词三者效果对比的提问。 我当时给出了一个经典的客服场景数据集构建示例,鉴于后续又陆续有人评论和私信来问,从这篇开始,专门写两篇内容来做个粗浅的分享。 之所以要分两篇内容,我想还是在做具体的微调案例演示前,把一些基本概念尽可能的讲清楚,这样感兴趣的话在复现下期案例和二开时,能够在自己的业务场景下对参数调优更有的放矢些。
7/11/2025 10:31:11 AM
韦东东
如何利用企业架构构建可扩展的数据和人工智能战略
概述随着数据和人工智能的爆炸式增长,以及通用人工智能(GenAI)的持续发展势头,企业正竞相确定自身的战略基点。 制定稳健的战略、治理模式和任责结构的压力空前巨大。 这不仅关乎数据和人工智能战略应该是什么,更关乎如何制定战略、由谁来领导,以及如何在整个企业范围内进行治理。
7/11/2025 10:23:34 AM
晓晓
重新审视 LLM:集体知识的动态映射与人机共舞
大家好,我是肆〇柒。 今天咱们不聊那些晦涩的技术。 今天的内容,源自我看到的一篇论文《In Dialogue with Intelligence: Rethinking Large Language Models as Collective Knowledge》。
7/11/2025 10:11:38 AM
肆零柒
资讯热榜
标签云
AI
人工智能
OpenAI
AIGC
模型
ChatGPT
谷歌
DeepSeek
AI绘画
大模型
机器人
数据
AI新词
Midjourney
开源
Meta
微软
智能
用户
GPT
学习
技术
智能体
Gemini
马斯克
Anthropic
英伟达
图像
AI创作
训练
LLM
论文
代码
算法
苹果
AI for Science
Agent
Claude
腾讯
芯片
Stable Diffusion
蛋白质
具身智能
开发者
xAI
生成式
神经网络
机器学习
人形机器人
3D
AI视频
RAG
大语言模型
研究
百度
Sora
生成
GPU
工具
华为
字节跳动
计算
AGI
大型语言模型
AI设计
搜索
生成式AI
视频生成
DeepMind
特斯拉
场景
AI模型
深度学习
亚马逊
架构
Transformer
MCP
编程
视觉
预测