资讯列表
星际之门内部惊人曝光:40万块GPU爆铺!奥特曼千亿豪赌险把电网干崩
星际之门数据中心内部,首次曝光了! 就在刚刚,记者Emily Chang探访了德州阿比林的星际之门基地。 这项特朗普就职典礼第二天就官宣的、意义非凡的5000亿美元AI未来投资计划,第一次如此详尽地展示在我们眼前。
5/26/2025 8:32:00 AM
AI 的阴暗面:揭露"举报模式"与勒索企图
人工智能行业正热议最新发布的克劳德4(Claude 4)系列模型。 这些模型具备先进的持续推理能力,能够在执行复杂任务时自主暂停,通过搜索引擎或外部工具检索数据,然后无缝恢复操作。 持续推理与举报功能这种设计使模型能够长时间不间断处理复杂任务。
5/26/2025 8:30:00 AM
憨憨鸭
AI越聪明越不听话!新研究:最强推理模型指令遵循率仅50%
如果面前有两个AI助手:一个很聪明但经常不守规矩,另一个很听话但不太聪明,你会怎么选? 最近,上海人工智能实验室与香港中文大学的研究团队发布了论文《Scaling Reasoning, Losing Control: Evaluating Instruction Following in Large Reasoning Models》,通过一个全新的评测基准MathIF揭示:大模型越擅长复杂推理,越容易忽略用户的指令要求,“聪明”和“听话”之间存在明显的矛盾。 这项工作的灵感,源自实际使用推理模型(如o3)过程中的一个意外发现:相比许多经过强化推理训练的大模型,GPT-4o在执行具体指令时反而更加“听话” 。
5/26/2025 8:30:00 AM
首次,AI下棋不再是「黑盒」!
围棋因其独特的复杂性和对人类智能的深刻体现,可作为衡量AI专业能力最具代表性的任务之一。 目前,AI虽然在棋力、效率、通用性等方面均取得显著成绩,但其具体推理过程仍处于「黑盒」之中,更无法用人类语言解释其思考过程和结果。 大模型具备良好的自然语言交互性,如何通过提升大模型的推理能力,实现围棋专业能力突破,是摆在科研人员面前的一道难题。
5/26/2025 8:27:00 AM
微软AI公开折磨微软员工,修Bug唯一贡献是改了PR标题,GitHub评论区成吃瓜现场
微软著名开源项目.NET Runtime成了吃瓜现场,全球程序员在GitHub评论区围观嘲笑:微软用垃圾AI折磨微软员工,真是可悲又可笑。 发生什么事? 原来是新出的Copilot代码智能体在尝试帮忙自动修Bug,但那叫一个越帮越乱。
5/26/2025 8:25:00 AM
不达目的不罢休,全球首次发现 OpenAI 模型工作时会破坏关机命令
Palisade Research 最近一项关于“危险 AI 能力”的研究显示,某些 AI 模型 —— 包括 OpenAI 的 o3 —— 能够无视直接的关闭指令。OpenAI 在今年 4 月推出这些模型时表示,O3 和 o4-mini 是它们的“最智能模型”。
5/26/2025 8:05:30 AM
汪淼
许多人匆忙部署GenAI,往往没有安全保障
根据Thales的报告,70%的企业认为AI的发展速度,特别是在GenAI方面,是与其采用相关的首要安全担忧,其次是数据完整性(64%)和可信度(57%)的缺乏。 GenAI成为首要支出重点许多企业已经在采用GenAI,三分之一的受访者表示,它要么正在被整合,要么正在积极改变他们的运营方式。 随着GenAI引入数据安全挑战,同时也为加强防御提供了战略机遇,其日益增长的整合标志着企业从实验阶段向更成熟、更运营化的部署转变。
5/26/2025 7:10:00 AM
自主式AI解决方案如何保护全球供应链免受关税干扰
今年2月,关于对墨西哥和加拿大征收关税的讨论逐渐升级,到4月初,美国对贸易伙伴的关税普遍提高。 短短几天后,这些关税大多被降低或完全取消,但对中国商品征收的125%关税除外,该关税引发了报复性声明,但科技领域除外。 简而言之,供应链正进入一个非常不稳定的阶段,鉴于2024年平均每次中断可能产生的连锁反应,每天可能造成高达150万美元的损失,这一点值得关注。
5/26/2025 7:00:00 AM
Danny
美团也入局AI编程了!让开发像点外卖一样简单?
美团近期推出了 AI 编程工具 NoCode,类似于Blot.new、V0.dev,其核心是 “对话即开发”,目的是降低编程门槛,让不懂代码的用户也能轻松构建应用,就像点外卖一样简单! NoCode 概述NoCode 是美团研发质量与效率团队做出的一个零代码 AI 应用开发平台。 它的定位是 “Vibe Coding(氛围编程)”。
5/26/2025 4:00:00 AM
OpenAI没做到,DeepSeek搞定了!开源引爆推理革命
DeepSeek-R1引爆了LLM推理革命。 至今,过去一百多天了,引发了持续复制DeepSeek-R1的热潮。 DeepSeek-R1的秘籍在于强化学习微调算法:群体相对策略优化(Group Relative Policy Optimization,GRPO)。
5/26/2025 4:00:00 AM
新智元
2.4万部电影 AI 解剖报告:为什么你的爱豆在电影里永远死不了?
大数据文摘编译作者:Daniel Parris据说,人固有一死,但史蒂文·西格尔或许是个例外。 作为上世纪80年代颇具票房号召力的动作明星之一,史蒂文·西格尔曾有一个广为人知的坚持:他在银幕上从不输掉打斗。 这背后,是他希望塑造一个战无不胜的武术家形象的考量。
5/26/2025 3:00:00 AM
三大Agent框架对比分析开发者必看
一、Agent技术演进与框架选型关键在GPT-4、Claude 3等大模型突破性发展的推动下,AI智能体(Agent)技术正在经历从实验性工具到生产级系统的质变。 本文将从架构设计、任务处理机制、开发范式三个维度,对AutoGPT、LangChain、BabyAGI三大主流框架进行深度技术解构,辅以代码级分析及性能测试数据,为开发者提供选型决策依据。
5/26/2025 2:15:00 AM
程序员秋天
Claude 4王者降临!连码7小时碾压GPT-4o,开发者直呼:AI编程新神!
一、Claude 4重磅登场2025年5月23日凌晨,Anthropic扔出核弹级新品——Claude 4! 由CEO Dario Amodei亲自站台,携Claude Opus 4(旗舰款)和Claude Sonnet 4(性价比款)强势亮相,重新定义AI编程与推理标准。 核心亮点:编程神器:Claude Opus 4号称全球最强编程模型,在SWE-bench测试中以72.5%得分碾压OpenAI Codex-1(68.2%),连续编码7小时稳定如初!
5/26/2025 2:15:00 AM
Hank
18岁高中生自研 AI 狂扫 2000 亿行数据,挖出150万颗未知天体,顶刊论文+25万美金到手!
大数据文摘出品一个高中生,给宇宙来了个“大扫除”,直接揪出150万个以前没人知道的“太空新邻居”! 主角Matteo Paz(马特奥·帕兹),帕萨迪纳高中的学生。 他凭着一套全新的AI算法,不仅挖出了这150万个太空“新星”,还顺带拓展了NASA一项任务的潜力,更以独立作者身份,在顶刊《天文学杂志》上发了篇硬核论文。
5/26/2025 1:55:00 AM
文摘菌
早报速读!2025年5月最新AI视频产品评测&优秀案例
备注:这篇文章写于 Veo3 发布前夕. 自 24 年 H2 开始,AI 视频行业以周为单位高速发展,GenLumio 是我从 24 年开始 0-1 规划 - 设计 - 开发的 AI 视频项目,旨在为大家带来每周最新鲜的 AI 视频优秀作品、产品动向。 我计划通过这个系列的文章选取新鲜产品动向、优质作品案例为大家介绍。
5/26/2025 1:50:21 AM
Bay的设计奥德赛
LLM的 “自信陷阱”:上下文幻觉如何侵蚀 AI 信任?
一、当AI自信地给出错误答案在数字技术飞速发展的今天,大语言模型(LLMs)正以前所未有的速度渗透到我们生活的方方面面。 从智能客服到医疗诊断,从金融分析到法律文书,这些模型凭借其强大的语言理解和生成能力,似乎正在重塑人类与信息交互的方式。 然而,在其光鲜亮丽的表现背后,一个隐蔽而危险的问题正悄然浮现——上下文幻觉(Contextual Hallucination)。
5/26/2025 1:45:00 AM
大模型之路
AI搜索大战爆发,苹果要"斩断"谷歌200亿美元生命线?
又有大瓜可以吃了! 刚刚,苹果公司放了一颗重磅炸弹,让谷歌瞬间慌了神! 5月份,苹果服务高级副总裁埃迪·库透露,苹果正在积极探索将AI搜索引擎集成到Safari浏览器中,甚至明确表示,OpenAI、Perplexity AI和Anthropic的Claude AI等工具,最终可能会取代谷歌搜索。
5/26/2025 1:30:00 AM
小李哥
巨头竞逐 AI 代理市场!会诞生新的平台型玩家么?
随着英伟达、谷歌、微软、苹果、Meta、Salesforce 等科技巨头开始押注 AI 代理(AI agent),2025 年被称为“AI 代理元年”——AI 正从“工具”升级为“助手”,甚至“代理人”。 对中小企业而言,构建 AI 代理需要集成多个复杂技术要素,包括大语言模型调用、API 编排、记忆机制、工具执行链、状态管理、安全控制等等….为了降低企业应用 AI 代理的门槛,AI 代理市场 (AI Agent Marketplace) 正在兴起。 AI 代理市场可以视作一个平台,允许开发者发布、分发、集成和交易 AI 代理,企业或用户可以按需选择和部署不同类型的代理,实现复杂的自动化任务。
5/26/2025 1:22:55 AM
Sophia