AI在线 AI在线

资讯列表

从需求分析到代码生成,LLM都能干点啥?一文读懂291个软工Benchmark!

近年来,ChatGPT、Llama等大语言模型在软件工程领域的能力突飞猛进,从需求分析、代码生成到测试与维护几乎无所不能。 但一个核心问题是:我们如何客观评估这些模型在不同软件工程任务中的表现? 在SE领域,Benchmark既是分数卡,让不同模型在同一标准下比拼;也是方向盘,引导技术改进与未来研究方向。
8/28/2025 9:10:00 AM

老黄太难了!英伟达Q2营收467亿美元创纪录,股价盘后还跌了5%

英伟达最新财报,营收和每股收益双双超预期! 刚刚公布的第二季度营收467亿美元,高出市场预期1.3%。 调整后每股收益1.05美元,也高于市场预期的1.01美元。
8/28/2025 8:59:03 AM
梦晨

当数字世界的“万能钥匙”被滥用,谁来守护核心资产?来自火山的 MCP 安全授权新范式

摘要本文旨在深入剖析火山引擎 Model Context Protocol (MCP) 开放生态下的 OAuth 授权安全挑战,并系统阐述火山引擎为此构建的多层次、纵深防御安全方案。 面对由 OAuth 2.0动态客户端注册带来的灵活性与潜在风险,我们设计了从“事前预防”到“事中限制”,再到“事后兜底”的完整安全闭环。 该体系通过授权前二次确认、令牌身份与权限隔离、以及 API 级别精细化管控等关键举措,在确保 MCP 生态灵活开放的同时,最大限度地保障用户资产与数据安全,构建值得信赖的开发者生态。
8/28/2025 8:41:23 AM

人人都能看懂!一篇文章帮你彻底搞懂AI绘画的底层原理

现在 ComfyUI 慢慢被很多人接受,但是更多的是工程师,作为一名设计师,我发现很难理解 AI 绘画的底层逻辑,如果没有了解本质,只是了解大概,不理解里面各个参数后面的原理,那么之后面临的最直接的一个问题是不知道怎么微调模型,只能照着人家的教程 1:1 模仿。 知其然,不知其所以然是不可取的,这就是“知识”和“懂”的区别。 所以,我一直好奇,AI 绘画是怎么输入描述词,输出一张高质量的又好看的图片的?
8/28/2025 8:10:49 AM
体验设计

揭秘Mem0的卓越架构:打造真正拥有记忆的AI系统

在人工智能应用迅猛发展的当下,聊天机器人已成为企业服务用户、个人提升效率的重要工具。 然而,许多开发者都遭遇过这样的尴尬场景:花费数周精心打造的聊天机器人在演示时表现出色,能流利回答问题、提供帮助,看似智能十足。 但当用户次日再次访问时,机器人却仿佛患上了“失忆症”,只会机械地问“今天我能为您提供什么帮助?
8/28/2025 7:52:17 AM
大模型之路

预测型AI vs. 生成型AI:哪种更适合你的企业?

根据Resume Builder最近的一项调查,66%的美国管理者在裁员决策时曾咨询过ChatGPT或其他大型语言模型。 大多数管理者也会使用AI来决定加薪(78%)和晋升(77%),这些数据反映出GenAI正在渗透到业务流程中,这些流程本不应依赖它。 基础模型并非为处理高风险、领域特定的情况而设计,正是这些场景最为敏感。
8/28/2025 7:44:00 AM
Gershon

正确采用AI,防止影子AI迅速蔓延的实战经验

企业采用AI已不再是理论,而是正在发生的现实——无论企业是否做好准备。 员工正在使用公开可用的AI工具完成实际工作:总结文档、撰写邮件、生成报告、翻译资料、编写代码、解答问题。 他们并非因为被强制去做,而是因为这些工具能快速、有效地解决实际问题。
8/28/2025 7:26:00 AM
Tyler

企业成功部署智能体的关键要素

毫无疑问,智能体——那些能够在企业工作流中自主、异步运作的系统——目前正是企业界的热门话题。 然而,越来越多的人担心,这些讨论大多停留在口头上,充满炒作,却缺乏实质性支撑。 例如,Gartner指出,企业正处于“期望膨胀的顶峰”,这是在失望感出现之前的一段时期,因为供应商尚未用真实的、可落地的案例支撑其承诺。
8/28/2025 7:09:00 AM
Taryn

从3000万到1777.9 Token:LogicRAG用动态逻辑图实现“零预建图的高效推理

大家好,我是肆〇柒。 今天要和大家分享的是一项来自香港理工大学的研究——LogicRAG。 这项工作挑战了当前主流的GraphRAG范式,提出了一种无需预建图、按需生成动态逻辑结构的新型RAG框架。
8/28/2025 1:00:00 AM
肆零柒

从1920TPS到2400TPS,华为云Tokens服务全面接入384超节点

8 月 27 日,在第四届 828 B2B 企业节开幕式上,华为云宣布其 Tokens 服务全面接入 CloudMatrix384 超节点,通过 xDeepServe 架构创新,单芯片最高可实现 2400TPS、50msTPOT 的超高吞吐、低时延的性能,超过业界水平。 发挥 “大杂烩” 优势,以系统能力打造先进算力过去 18 个月,中国 AI 算力需求呈现指数级增长。 数据显示,2024 年初中国日均 Token 的消耗量为 1000 亿,截至今年 6 月底,日均 Token 消耗量已突破 30 万亿,1 年半的时间增长了 300 多倍,反映了我国人工智能应用规模快速增长,也对算力基础设施的需求提出了更大的挑战。
8/27/2025 9:47:00 PM
新闻助手

DeepSeek刚提到FP8,英伟达就把FP4精度推向预训练,更快、更便宜

前些天,DeepSeek 在发布 DeepSeek V3.1 的文章评论区中,提及了 UE8M0 FP8 的量化设计,声称是针对即将发布的下一代国产芯片设计。 这件事一下引发了巨大反响,不仅是关于新一代国产芯片设计、大模型在国产芯片训练的话题,也顺势引发了大家对大模型量化策略的关注。 FP8,其全称为 8-bit floating point(8 位浮点数),是一种超低精度的数据表示格式,相较于 FP32(单精度)或 FP16(半精度)等传统浮点格式,FP8 可以在尽量保持数值稳定性和模型精度的前提下,进一步降低存储和计算开销(参见机器之心文章:用FP8训练大模型有多香?
8/27/2025 8:52:00 PM
机器之心

入职不到30天,OpenAI员工闪辞Meta回归,赵晟佳也反悔过

距离 Meta 宣布成立超级智能实验室仅过去两个月,陆续已经有多位研究员离职了。 昨天被爆出离职的有两位,一位是专注于强化学习的 Rishabh Agarwal(去向未定);另一位是已经在 Meta 工作了 12 年、参与了 PyTorch 构建的 Bert Maher(确定加入 Anthropic)。 可参考《一天之内,Meta 痛失两员大将,小扎钞能力失效?
8/27/2025 8:48:00 PM
机器之心

We-Math 2.0:全新多模态数学推理数据集 × 首个综合数学知识体系

本文作者来自北京邮电大学、腾讯微信、清华大学。 共同第一作者为北京邮电大学博士生乔润祺与硕士生谭秋纳,其共同完成的代表性工作 We-Math 于 ACL 2025 发表,并曾在 CVPR、ACL、ICLR、AAAI、ACM MM 等多个顶会中有论文发表。 本文的通讯作者为博士生导师张洪刚与微信视觉技术中心李琛,We-Math 系列工作为乔润祺在微信实习期间完成。
8/27/2025 8:46:00 PM
机器之心

IBM与AMD联手冲刺量子计算,打造未来AI新生态

近日,IBM 与 AMD 宣布达成战略合作,旨在将 IBM 的量子系统与 AMD 的 AI 专用芯片整合,打造下一代计算架构。 这一举措不仅是两家公司在近年来的 AI 浪潮中寻找弯道超车的机会,也是它们向量子计算领域迈出的重要一步。 IBM CEO 阿尔文・克里希纳(Arvind Krishna)表示,量子计算将重新定义我们如何模拟自然界,并以全新的方式表示信息。
8/27/2025 7:31:36 PM
AI在线

元戎率先供应VLA方案!打掉车企数亿自研预算,下探至10万级车型

“VLA的下限,就是端到端的上限”。 这是元戎启行CEO周光在VLA(视觉语言动作)模型发布会上,对VLA能力的概括。 在周光看来,此前的智能辅助驾驶系统都可以归为端到端1.0阶段,上限已至,就像尼安德特人 (智力不行的人种,已灭绝)。
8/27/2025 5:34:09 PM
一凡

半数英国成年人担忧 AI 对就业的影响,工会呼吁更大参与

根据最新民调显示,半数英国成年人对人工智能(AI)将如何影响他们的工作感到担忧。 这项由工会组织工人联合会(TUC)进行的调查结果显示,2600名受访者中有51% 的人表示,他们对 AI 可能导致的工作丢失或工作条件改变感到忧虑。 特别是在25至34岁之间的年轻工人中,近三分之二(62%)的人对 AI 的影响表示关注。
8/27/2025 5:11:21 PM
AI在线

L3级AI服务智能体落地!联想百应智能体2.0重磅升级,打造中小企业创新生产力

8月27日,在36氪主办的“AI Partner百业大会”上,联想正式发布联想百应智能体2.0,标志着国内首个面向企业的L3级AI服务智能体的问世。 联想百应智能体2.0具备自主规划、按需生成和闭环解决能力,实现了AI从“响应式助手”到“协作级伙伴”的能力跃迁,重新定义了中小企业AI服务边界。 会上,联想中国区中小企业方案服务事业部总经理魏东强调:“联想百应智能体2.0依靠L3级智能体能力,技术赋能业务,将AI真正转化为中小企业都能用上的‘创新生产力’。
8/27/2025 4:58:42 PM
量子位的朋友们

北大南开数学家解决著名“十杯马天尼”问题:更统一、更优雅的证明

困扰数学和量子力学交叉领域长达半个世纪的难题,因为北大、南开数学家的参与,终于是有了较为完美的答案。 这个难题有个非常有趣的名字,叫做“十杯马天尼”(The Ten Martini Problem)。 之所以叫这个名字,是因为数学家马克·卡茨(Mark Kac)在1981年表示,谁能解决这个问题,就请对方喝十杯马天尼。
8/27/2025 4:47:59 PM
十三