资讯列表
比甄嬛还狠!奥特曼「千面人设」被揭穿,MIT华人记者7年曝黑幕
OpenAI的「宫斗」往事,还有大瓜! 因为曝料实在太过惊人,奥特曼在相关书籍正式出版之前,否认三连,撇清关系。 但曝料人Karen Hao毕业于MIT,曝料过多家美国科技巨头的「黑幕」,因新闻报道获得多个奖项。
全球首款 Office 智能体:昆仑万维天工超级智能体 App 上线
昆仑万维集团今日宣布:昆仑万维天工超级智能体(Skywork Super Agents)App 正式上线。这是全球首款基于 AI Agent 架构的 Office 智能体手机 App,标志着“AI Office 智能体”时代从桌面端全面迈向移动端。
全球首次发现 OpenAI 模型能无视关机指令,AI 自我保护引发关注
近日,Palisade Research 发布了一项引人注目的研究,揭示了一些人工智能模型在面对直接关闭命令时竟然会选择 “违抗”。 这项研究的核心发现是,包括 OpenAI 最新推出的 o3模型在内的几个 AI 模型,表现出了对关机指令的无视能力。 这一现象引发了人们对 AI 自主性的深入思考。
英伟达推出低价AI芯片应对出口限制,专供中国市场
据路透社援引三位知情人士消息,英伟达将于6月推出一款专为中国市场设计的全新AI芯片,定价预计在6,500至8,000美元之间,明显低于当前售价约为10,000至12,000美元的H20型号。 新芯片基于最新Blackwell架构,并采用RTX Pro6000D的设计框架。 为规避美国对华高端芯片出口限制,该GPU刻意避开了台积电的先进封装工艺,改用标准GDDR7内存,以降低制造复杂度并提升可量产性。
全球首款Office智能体APP!昆仑万维天工超级智能体APP上线
昆仑万维集团宣布其天工超级智能体(Skywork Super Agents)APP正式上线。 这款APP是全球首款基于AI Agent架构的Office智能体手机应用,标志着AI办公新时代的到来,将专业办公功能装进了用户的口袋。 天工超级智能体APP以“8分钟完成8小时工作”为核心理念,通过文档、PPT、表格和通用四大智能体的协同工作,重新定义了移动办公的效率。
312条轨迹助力241%性能提升,上交大与SII开源电脑智能体引领新潮流
在电脑智能体(Computer Use Agent)领域,最近有一个激动人心的进展。 上海交通大学与 SII 的研究团队,借助仅312条人类标注的操作轨迹,成功训练出了名为 PC Agent-E 的新一代开源电脑智能体,其性能提升高达241%,超越了著名的 Claude3.7Sonnet,成为 Windows 系统上的新一代最优模型。 自从 Anthropic 推出 Claude Computer Use 以来,电脑智能体的发展一直备受关注。
AI救不了塔吉特:销量下滑、顾客流失,人工智能成“背锅侠”?
在2023年圣诞节前夕,美国大型连锁零售商塔吉特(Target)宣布将通过人工智能技术“提升节日购物体验”。 从推出AI聊天机器人“Store Companion”,到引入预测库存系统,再到部署营销平台“Roundel”,塔吉特自诩正在打造“零售业的未来”。 但现实远比宣传冷酷。
DeepSeek用的GRPO有那么特别吗?万字长文分析四篇精品论文
随着 DeepSeek R1 的持续爆火,推理和强化学习已经成为 AI 领域的热门词汇。 短短几个月的时间,我们已经见证了太多的推理大模型,AI 更新迭代速度似乎已经快进到了以天为单位。 但在众多研究成果中找到值得关注的内容并不容易。
ChatGPT引爆教育革命,学习效果暴涨86.7%!
现在的学生,已经离不开各种AIGC工具了, 不论是写作业,还是生成笔记,或者通过阅读AI生成的摘要来读文献。 面对这些离不开AI的学生,老师和家长都开始担忧了,这样下去,孩子会不会越变越笨啊。 然而,最近一项发表在Nature子刊的研究,基于对59项研究对汇总(元分析)指出,ChatGPT的使用对提高K12(中小学生)的学习表现有显著的正向影响,对于培养学生解决复杂问题的能力也有所帮助。
矩阵乘法新突破!XX^T原来可以更快!RL助力搜索,世界纪录又被提升了5%
深圳市大数据研究院、香港中文大学(深圳)研究团队最新研究发现, 这类特殊的矩阵乘法可以进一步加速,并在强化学习与组合优化技术的结合下发掘出了一种新的算法,节省 5% 的乘法数量。 论文标题:XXt Can Be Faster论文链接: X 引发热烈讨论,并引起 MIT、斯坦福、哈佛及 Google DeepMind 科学家的广泛关注。 背景矩阵乘法优化堪称计算机科学领域的「珠穆朗玛峰」。
打破思维链推理瓶颈!“软推理”让大模型学会人类抽象能力,token使用量还更少了
不再像CoT(“思维链”)一样“一个字一个字往外蹦”,加上“软思维”就能让大模型像人类一样进行抽象思考。 来自SimularAI和微软DeepSpeed的研究员联合提出了Soft Thinking,让模型在连续的概念空间中进行 “软推理”,而非局限于离散的语言符号,打破了基于离散token的推理瓶颈。 相比标准CoT,Soft Thinking最高提升Pass@1平均准确率2.48%、减少token使用量22.4%。
如何使用Google Gemini模型完成计算机视觉任务?
译者 | 李睿审校 | 重楼自从人工智能聊天机器人兴起以来,Google Gemini脱颖而出,已经成为推动智能系统进化的主要参与者之一。 除了强大的会话能力之外,Gemini还释放了计算机视觉实际应用的潜力,让它们能够看到、解释和描述周围的世界。 本文将逐步讲解如何利用Google Gemini完成计算机视觉任务,其中包括如何设置环境,发送带有指令的图像以及解释模型的输出以进行对象检测、字幕生成和OCR,还将探讨数据注释工具(例如YOLO中使用的工具),为自定义训练场景提供上下文。
星际之门内部惊人曝光:40万块GPU爆铺!奥特曼千亿豪赌险把电网干崩
星际之门数据中心内部,首次曝光了! 就在刚刚,记者Emily Chang探访了德州阿比林的星际之门基地。 这项特朗普就职典礼第二天就官宣的、意义非凡的5000亿美元AI未来投资计划,第一次如此详尽地展示在我们眼前。
AI越聪明越不听话!新研究:最强推理模型指令遵循率仅50%
如果面前有两个AI助手:一个很聪明但经常不守规矩,另一个很听话但不太聪明,你会怎么选? 最近,上海人工智能实验室与香港中文大学的研究团队发布了论文《Scaling Reasoning, Losing Control: Evaluating Instruction Following in Large Reasoning Models》,通过一个全新的评测基准MathIF揭示:大模型越擅长复杂推理,越容易忽略用户的指令要求,“聪明”和“听话”之间存在明显的矛盾。 这项工作的灵感,源自实际使用推理模型(如o3)过程中的一个意外发现:相比许多经过强化推理训练的大模型,GPT-4o在执行具体指令时反而更加“听话” 。
AI 的阴暗面:揭露"举报模式"与勒索企图
人工智能行业正热议最新发布的克劳德4(Claude 4)系列模型。 这些模型具备先进的持续推理能力,能够在执行复杂任务时自主暂停,通过搜索引擎或外部工具检索数据,然后无缝恢复操作。 持续推理与举报功能这种设计使模型能够长时间不间断处理复杂任务。
首次,AI下棋不再是「黑盒」!
围棋因其独特的复杂性和对人类智能的深刻体现,可作为衡量AI专业能力最具代表性的任务之一。 目前,AI虽然在棋力、效率、通用性等方面均取得显著成绩,但其具体推理过程仍处于「黑盒」之中,更无法用人类语言解释其思考过程和结果。 大模型具备良好的自然语言交互性,如何通过提升大模型的推理能力,实现围棋专业能力突破,是摆在科研人员面前的一道难题。
微软AI公开折磨微软员工,修Bug唯一贡献是改了PR标题,GitHub评论区成吃瓜现场
微软著名开源项目.NET Runtime成了吃瓜现场,全球程序员在GitHub评论区围观嘲笑:微软用垃圾AI折磨微软员工,真是可悲又可笑。 发生什么事? 原来是新出的Copilot代码智能体在尝试帮忙自动修Bug,但那叫一个越帮越乱。
不达目的不罢休,全球首次发现 OpenAI 模型工作时会破坏关机命令
Palisade Research 最近一项关于“危险 AI 能力”的研究显示,某些 AI 模型 —— 包括 OpenAI 的 o3 —— 能够无视直接的关闭指令。OpenAI 在今年 4 月推出这些模型时表示,O3 和 o4-mini 是它们的“最智能模型”。