资讯列表
GPT-5编程成绩有猫腻!自删23道测试题,关键基准还是自己提的
别急着用GPT-5编程了,可能它能力没有你想象中那么强。 有人发现,官方测试编程能力用的SWE-bench Verified,但货不对板,只用了477个问题。 什么意思呢?
8/13/2025 8:50:00 AM
使用 FastAPI + FastMCP 进行 MCP 引导的实用指南
在当今的智能交互领域,用户与AI系统的对话质量直接决定了服务体验的优劣。 Model Context Protocol(MCP,模型上下文协议)作为一种标准化的交互框架,为服务器与客户端之间的动态信息获取提供了可靠解决方案。 本文将深入解析MCP协议中的诱导流程(Elicitation Process),通过基于FastAPI框架和FastMCP库构建的投资顾问机器人实例,详细讲解如何在实际项目中高效实现这一流程。
8/13/2025 8:41:50 AM
大模型之路
AI批量“生产”亿万富翁 创富速度前所未见
在美国,人工智能(AI)领域正上演着一场财富创造的狂欢,一批亿万富豪在这场浪潮中快速崛起。 据 CB Insights 统计,目前全球共有 498 家 AI 独角兽企业,总价值高达 2.7 万亿美元,其中 100 家成立于 2023 年之后,而估值超过 1 亿美元的 AI 初创公司已突破 1300 家。 MIT 研究人员 Andrew McAfee 直言:“回看过去 100 年的统计数据,我们还没有看到过财富以如此的规模和速度创造出来。
8/13/2025 8:10:34 AM
极客AI
美国AI正快速催生亿万富豪 但对整体就业市场影响不大
在美国,AI正在快速创造亿万富翁。 今年以来,Anthropic、Safe Superintelligence、OpenAI、Anysphere等初创公司疯狂融资,估值不断攀升,孕育出一批亿万富翁。 据CB Insights统计,目前全球共有498家AI独角兽,总价值达2.7万亿美元,其中100家成立于2023年之后。
8/13/2025 8:03:11 AM
小刀
如何在你的计算机上运行OpenAI新的gpt-oss-20b LLM?
译者 | 布加迪审校 | 重楼你只需要24GB 的内存,除非你的GPU自带VRAM,否则需要相当的耐心。 上周,OpenAI发布了两款流行的开放权重模型,均名为gpt-oss。 由于你可以下载它们,因此可以在本地运行。
8/13/2025 7:25:57 AM
布加迪
关于智能体管理权的四点思考
随着智能体不断普及,并从试点阶段迈向生产阶段,我们需要将关注点从智能体构建平台转向AI编排平台和AI治理、风险与合规管理平台。 随着智能体自主性的提升,企业内诸如IT和人力资源等部门应如何管理它们,以及应如何对待它们,这些问题也接踵而至。 智能体正日益深入地融入企业流程,关于它们可能如何开始侵蚀长期存在的SaaS模式的争论也日益增多。
8/13/2025 7:15:00 AM
Nicholas
快餐巨头逆势加大AI投资
尽管面临重重阻力,快餐公司仍在持续加大AI项目投入和技术投资。 2025年伊始,餐饮行业财务状况不佳,多数公司销售额和客流量双双下滑。 在宏观经济环境充满挑战的背景下,AI已成为提升运营效率的诱人选择。
8/13/2025 7:10:00 AM
Lindsey
2025年下半年CIO的六大AI战略目标
AI与数据是数字化转型议程的核心。 但对许多企业而言,这些关键领域的进展却举步维艰。 尽管企业在GenAI试点项目、数据平台和自动化方面投入了大量资金,但实现规模化价值却依然遥不可及。
8/13/2025 7:00:00 AM
Loren
AI Agent原生企业落地的技术路径之二
一、AI Agent应用系统的构建和运营AI Agent系统框架是一种指导Agent业务或应用落地的系统性、工程化方法,但其实际执行效果受限于技术成熟度、业务逻辑复杂性及运行环境等多重因素。 在启动Agent系统建设之前,企业应系统梳理业务诉求,全面评估系统建设及长期运营对战略目标、资源投入及组织能力的影响,确保建设路径与企业发展方向相契合。 与企业战略目标对齐厘清系统建设与运营如何对齐企业的战略目标,是推动AI Agent系统成功落地的前提。
8/13/2025 2:55:00 AM
安全牛
老龄化设计不得不佩服大厂高手,这个实操案例太惊艳了!
你是否曾面临这样的挑战:倾心打造的设计缺乏对用户的同理心,最终让他们“看不懂、不会用”? 本篇文章结合 58 到家—阿姨简历工具的实操案例,与你分享:用户行为洞察拆解. AI 时代下的体验升级更多58实战案例:一、写在前面.
8/13/2025 12:40:55 AM
58UXD 团队
百度智能云重磅发布“AI创投加速计划” 为入选企业提供亿级算力补贴!
8月12日,百度AI DAY在北京举办。 活动以「AI新势力的商业进化」为主题,聚焦电商、游戏、可穿戴设备、具身智能等创新和重点赛道,全面展现百度智能云的全栈AI赋能方案及实践成果。 心影随形、李未可科技、灵生科技、述信科技、VAST等AI创企代表受邀出席,集中分享企业商业落地的实战经验。
8/12/2025 8:02:18 PM
MiniMax推出全球首个AI智能体再创作市场,15万美元奖金池开启创作新模式
MiniMax近日宣布推出全球首个Agent Remix Marketplace平台,开创了AI智能体创作的全新商业模式。 该平台最大的亮点是支持用户对已发布的成熟AI智能体作品进行一键再创作,同时建立了创新的收益分享机制,原作者可从每次Remix操作中获得100Credits的收益。 这一平台的推出标志着AI智能体创作生态从单纯的原创模式向协作共创模式的重要转变。
8/12/2025 7:05:54 PM
AI在线
让强化学习快如闪电:FlashRL一条命令实现极速Rollout,已全部开源
在今年三月份,清华 AIR 和字节联合 SIA Lab 发布了 DAPO,即 Decoupled Clip and Dynamic sAmpling Policy Optimization(解耦剪辑和动态采样策略优化)。 这是一个可实现大规模 LLM 强化学习的开源 SOTA 系统,使用该算法,该团队成功让 Qwen2.5-32B 模型在 AIME 2024 基准上获得了 50 分,我们也做了相关报道。 论文地址::,伊利诺伊大学香槟分校博士,微软研究院的首席研究员刘力源、清华大学校友,加州大学圣地亚哥分校计算机科学与工程学院博士生姚峰团队在强化学习的研究中更进一步。
8/12/2025 6:36:00 PM
机器之心
过去15年SaaS都在造牢房!Notion创始人劲爆采访:跟微软、谷歌非互斥,他们都没碰这地方;从关停到估值上千亿,做软件界乐高
编辑 | 云昭近期, Coding 赛道十足火热。 然而,提高生产力,可不止于 Vibe Coding,上半年我们有一项非正式调查,大家持续在用半年以上的 AI 产品中,有一项工具类产品赫然在列:Notion。 那么这款产品的魔力究竟来源于哪里?
8/12/2025 6:32:48 PM
云昭
从物竞天择到智能进化,首篇自进化智能体综述的ASI之路
近年来,大语言模型(LLM)已展现出卓越的通用能力,但其核心仍是静态的。 面对日新月异的任务、知识领域和交互环境,模型无法实时调整其内部参数,这一根本性瓶颈日益凸显。 当我们将视野从提升静态模型的规模,转向构建能够实时学习和适应的动态智能体时,一个全新的范式——自进化智能体(Self-evolving Agents)——正引领着人工智能领域的变革。
8/12/2025 6:32:00 PM
机器之心
破解效率与成本难题:华为UCM技术推动AI推理体验升级
2025 金融 AI 推理应用落地与发展论坛在上海举行。 中国银联执行副总裁涂晓军、华为数字金融军团 CEO 曹冲出席本次论坛并发表致辞。 论坛上,华为公司副总裁、数据存储产品线总裁周跃峰博士发布 AI 推理创新技术 ——UCM 推理记忆数据管理器,旨在推动 AI 推理体验升级,提升推理性价比,加速 AI 商业正循环。
8/12/2025 5:24:00 PM
新闻助手
马斯克宣布xAI 公司对苹果提起法律诉讼,指控其违反反垄断法
近日,特斯拉和 SpaceX 的首席执行官埃隆・马斯克宣布,xAI 公司将对苹果公司采取 “立即法律行动”。 马斯克在社交平台 X 上发文称,苹果的行为使得除了 OpenAI 之外,其他人工智能公司几乎不可能在 App Store 上取得成功,他称这是一种 “明确的反垄断违法行为”。 图源备注:图片由AI生成,图片授权服务商Midjourney尽管马斯克的指控引发了广泛关注,但他并未提供具体证据来支持自己的说法。
8/12/2025 5:20:48 PM
AI在线
高德全面接入通义大模型 推出首个地图AI原生Agent
阿里巴巴集团旗下的高德地图与通义实验室达成深度合作,宣布共同打造全球首个 AI 原生地图。 这一合作成果已在近日发布的高德地图2025版本中落地。 高德地图2025版本的亮点之一是推出了一款智能体 “小高老师”。
8/12/2025 5:20:47 PM
AI在线