AI在线 AI在线

AI

刚刚,苹果WWDC掀AI重构风暴!端侧模型全开放、AI版Siri却成最大「鸽」王

刚刚,苹果WWDC掀AI重构风暴!端侧模型全开放、AI版Siri却成最大「鸽」王

今年的苹果,到底有没有新活? 北京时间今天凌晨 1 点,一年一度的「科技圈春晚」—— 苹果全球开发者大会 WWDC 在 CEO 蒂姆・库克的演讲中拉开了序幕! 此次大会,苹果宣布了一系列操作系统、服务和软件的更新,其中包括全新的系统命名规则以及名为液态玻璃( Liquid Glass)的新设计语言。
6/10/2025 9:10:47 AM
AI集体“听不懂”!MMAR基准测试揭示音频大模型巨大短板

AI集体“听不懂”!MMAR基准测试揭示音频大模型巨大短板

用AI来整理会议内容,已经是人类的常规操作。 不过,你猜怎么着? 面对1000道多步骤音频推理题时,30款AI模型竟然几乎全军覆没,很多开源模型表现甚至接近瞎猜。
6/10/2025 9:10:00 AM
AI七个月突破数学家“围剿”反超人类!14位数学家深挖原始推理token:不靠死记硬背靠直觉

AI七个月突破数学家“围剿”反超人类!14位数学家深挖原始推理token:不靠死记硬背靠直觉

从只能答对2%的题目,到在超难数学题集中刷下22%得分,甚至超过人类团队平均水平,大模型需要多长时间? 现在,令数学家们都惊讶的结果已经尘埃落定:7个月。 发生在大名鼎鼎的“专为为难大模型而生的”FrontierMath基准测试上的这一幕,在激起热议同时,也引发了新的思考:大模型们是怎么做到的?
6/10/2025 9:09:00 AM
首创像素空间推理,7B模型领先GPT-4o,让VLM能像人类一样「眼脑并用」

首创像素空间推理,7B模型领先GPT-4o,让VLM能像人类一样「眼脑并用」

视觉语言模型(VLM)正经历从「感知」到「认知」的关键跃迁。 当OpenAI的o3系列通过「图像思维」(Thinking with Images)让模型学会缩放、标记视觉区域时,我们看到了多模态交互的全新可能。 然而,当前主流VLM仍被困在「文本茧房」中——依赖文本token间接翻译视觉信息,在高清图像中的微小物体、视频里的动态细节等场景中,常常因缺乏直接视觉操作能力而「视而不见」。
6/10/2025 9:07:00 AM
双重突破:全球首个零售VLA大模型来了!开源OpenWBT让机器人遥操门槛暴降!

双重突破:全球首个零售VLA大模型来了!开源OpenWBT让机器人遥操门槛暴降!

学会“适当暂停与总结”,大模型终于实现无限推理。 想象一下,让你一口气不歇地推演一个超复杂数学证明,大脑也会“内存溢出”吧? 如今的大模型在长上下文推理中也面临同样的困境,随着推理长度增加而指数级增长的计算成本,以及由于长度受限而被迫中断推理过程。
6/10/2025 9:07:00 AM
无需SFT也不用RL,样本级推理优化神器SLOT来了,准确率轻松+10%

无需SFT也不用RL,样本级推理优化神器SLOT来了,准确率轻松+10%

试想一下,如果你参加考试时,可以在答题前花几秒钟「适应」一下这道具体的题目,你的表现会不会更好? 这正是西湖大学研究团队在最新论文中提出的核心思想。 他们开发的 SLOT(Sample-specific Language Model Optimization at Test-time)方法,把每个输入 prompt 本身当作一份「迷你训练数据」,让模型在生成答案前先「学习」理解这个具体问题。
6/10/2025 9:05:00 AM
李飞飞自曝详细创业经历:五年前因眼睛受伤,坚定要做世界模型

李飞飞自曝详细创业经历:五年前因眼睛受伤,坚定要做世界模型

因为眼睛受伤暂时失去立体视觉,李飞飞更加坚定了做世界模型的决心。 在a16z的最新播客节目中,“AI教母”李飞飞讲述了五年前因为一次角膜损伤暂时失去立体视觉的经历:尽管凭借多年经验能想象出三维世界,但一只眼睛看东西时,我开始害怕开车。 但作为一名科学家,她也把这次经历当成一次宝贵的“实验”机会。
6/10/2025 8:43:00 AM
我如何仅用 0.80 美元使用 Cursor 构建 17,000 行代码库

我如何仅用 0.80 美元使用 Cursor 构建 17,000 行代码库

市面上出现过不少工具来来去去,但 Cursor 搭配 Claude Sonnet 4 这组合,绝对称得上革命性。 三小时内,仅在 /lib 目录,就生成了超过 17,000 行代码,花费却不到一美元。 要么 Cursor 在赔钱运营,就像我叔叔烤火鸡烤焦那样惨烈,要么我找到了一个让 AI 编码极度低价的秘密。
6/10/2025 8:10:59 AM 前端小智
如何在不陷入复杂性陷阱的情况下构建生产就绪的 AI 代理

如何在不陷入复杂性陷阱的情况下构建生产就绪的 AI 代理

一、从“大而全”到“小而精”的范式转变在医疗管理领域,当凌晨2点的紧急审批因某个隐蔽漏洞被驳回时,那些标榜“全能”的超级智能体架构正在暴露其致命缺陷。 这些试图将资格审核、医疗必要性评估、申诉处理和医患沟通等功能一网打尽的“巨无霸”系统,如同希腊神话中试图吞噬一切的海妖卡律布狄斯,在演示阶段展现出雄心壮志,却在真实医疗场景中成为不可预测的风险黑洞。 这种困境折射出人工智能领域的一个深层矛盾:我们是否应该追求“全能型”智能体,还是回归“专精化”的本质?
6/10/2025 4:18:00 AM 大模型之路
我们一起聊聊聊聊智能体的基础架构

我们一起聊聊聊聊智能体的基础架构

2023年下半年,智能体这个概念开始随着AI的突进式发展而被很多人关注起来。 到了2024年,大模型的能力进一步增强,为智能体快速发展提供了底层能力支撑。 随着2025年DeepSeek的爆火,智能体在各行各业的落地应用案例开始明显增加。
6/10/2025 3:00:00 AM 写文章的老张
智能体式推理与工具集成:ARTIST 基于强化学习的新思路

智能体式推理与工具集成:ARTIST 基于强化学习的新思路

大家好,我是肆〇柒。 这两天,我看到一篇论文《Agentic Reasoning and Tool Integration for LLMs via Reinforcement Learning》讲述的是ARTIST 框架,为 LLM 赋予智能体式推理与工具集成的全新维度。 今天,就一起了解一下这个 ARTIST 框架,看看 LLM 如何借助强化学习突破局限,开启智能体式推理与工具集成。
6/10/2025 2:30:00 AM 肆零柒
AI疯狂进化6个月,一张天梯图全浓缩!30+模型混战,大神演讲爆火

AI疯狂进化6个月,一张天梯图全浓缩!30+模型混战,大神演讲爆火

半年之期已到,AI龙王归位! (AI卷成啥样了? )就在刚刚,AI圈大神Simon Willison在旧金山AI工程师世博会(AI Engineer World’s Fair)上带来爆笑又干货满满的主题演讲:「过去六个月中的LLM——由骑自行车的鹈鹕来解释」。
6/10/2025 2:10:00 AM
AI成为企业勒索软件防御的关键角色

AI成为企业勒索软件防御的关键角色

支付赎金并不总是能带来预期的结果,约四分之一支付赎金的受访者表示,他们没有拿回所有数据,在英国这一比例上升到了三分之一,即使他们拿回了数据,对手仍可能会尝试将其变现。 “勒索软件已经演变成一种形态多变、AI驱动的威胁,任何企业都不能掉以轻心,”Delinea的CEO Art . Gilliland表示,“为了应对当今攻击的复杂性,企业必须利用AI对抗AI,并采取主动的身份安全策略,如零信任架构、特权访问管理和持续的凭证监控,以保持领先。
6/10/2025 12:20:00 AM D1net编译
83% 员工用 AI 却工资不变,NBER研究揭露:AI 带来的时间红利被谁吞了?

83% 员工用 AI 却工资不变,NBER研究揭露:AI 带来的时间红利被谁吞了?

2025 年,ChatGPT 已进入千行百业。 但一项来自丹麦的研究提醒我们,流行并不等于变革。 图注:论文标题“Large Language Models, Small Labor Market Effects”这项覆盖 2.5 万名员工、7000 家公司的调研数据显示:即便像 ChatGPT 这样的生成式 AI 已被广泛使用,它对员工工资、工作时长、雇佣状况等核心劳动指标的影响几乎为零。
6/10/2025 12:00:00 AM
奇作!现在的AI脚本僵化臃肿、万金油、一遇混乱就崩溃!骑单车荷兰一日游,竟然改变了我对AI的看法:MCP、A2A应该是这样!

奇作!现在的AI脚本僵化臃肿、万金油、一遇混乱就崩溃!骑单车荷兰一日游,竟然改变了我对AI的看法:MCP、A2A应该是这样!

作者 | Natasha Wijesekare编译 |  云昭智慧总是藏在自然之中。 而作为人工制造的AI,更不例外。 然而对于感悟 AI 而言,有时候却需要我们换个环境去散散心。
6/9/2025 5:35:59 PM 云昭
AI 成本直降 90%!女股神 Cathie Wood 圈定 3 条迁徙线:Robotaxi、端侧大模型、AI 医药

AI 成本直降 90%!女股神 Cathie Wood 圈定 3 条迁徙线:Robotaxi、端侧大模型、AI 医药

(视频来源:对话ARK Invest创始人Cathie Wood)北京时间 6 月 5 日,在《The Diary of a CEO》最新一期节目中,ARK Invest 创始人、掌管 300 亿美元资产的‘女股神’  Cathie Wood(凯茜·伍德),用三组数据划出 AI 落地的爆发路径:训练侧:过去两年,GPT-3 级别模型的训练成本从 460 万美元跌到 45 万美元,年降幅约 70%,堪称“断崖式”跳水;应用侧:ARK 测算 Robotaxi 单英里成本可低至 0.25 美元,比现有网约车便宜近 90%;消费侧:AI 代理激发的新消费行为,2030 年线上支出或达 9 万亿美元,改写全球最大产业链的资金流。 在同一天,特朗普在 Truth Social 威胁“取消特斯拉全部政府合同”,引发政商关系骤然紧张。 但 Cathie Wood 的判断更冷静、更本质:“Robotaxi 的成败,关键不是谁在互呛,而是成本模型能不能跑通。
6/9/2025 5:32:09 PM
影视级3D生成新王:Direct3D-S2全面开源!8块GPU超越闭源登顶HF

影视级3D生成新王:Direct3D-S2全面开源!8块GPU超越闭源登顶HF

HuggingFace是全球最大的开源大模型社区,汇集了来自世界各地的上百个开源大模型。 其趋势榜(HuggingFace Trending)展示了各类开源大模型在全球开发者中的受欢迎程度,DeepSeek、Qwen等大模型就因曾登顶HuggingFace榜单而获得了全球开发者的关注与热议。 可以说,这是当前最具权威性的榜单之一。
6/9/2025 3:25:43 PM
3B超越DeepSeek,大模型终于理解时间了!Time-R1一统过去/未来/生成

3B超越DeepSeek,大模型终于理解时间了!Time-R1一统过去/未来/生成

时间,是我们日常生活中最基础的概念。 但对于大语言模型(LLM)来说,它们或许能写诗作画、通晓古今,但在真正理解和运用时间概念时,却常常显得力不从心。 这个技术短板来自于大模型的底层设计,无法避免:训练语料库是静态的,存在知识截断时间;在按非时间顺序的语料训练过程中,跨越不同时期的时间信息是同时处理的,不像人类逐步接收知识,阻碍了在事件与其对应时间之间建立可靠的逻辑映射。
6/9/2025 3:25:03 PM