AI在线 AI在线

资讯列表

300亿美元AI巨头掌门人自曝:正在开发可能引发20%失业率的"超人类"AI

Anthropic联合创始人Dario Amodei本周在接受Axios采访时发出惊人预警:人工智能可能会消灭一半的入门级白领工作,并描绘了一个"20%的人没有工作"的未来场景。 四阶段劳动力危机预测这位身价数十亿美元的科技企业家详细描述了他预期的劳动力危机演进过程:第一阶段:OpenAI、谷歌和Anthropic等公司持续开发大型语言模型,使其"在越来越多的任务中达到甚至超越人类的表现"。 第二阶段:政府因担心中国竞争和劳工动荡而既不"监管人工智能",也不警告公众潜在风险。
5/30/2025 10:01:14 AM
AI在线

Anthropic重磅开源!“电路追踪”工具解锁AI大脑,揭秘大模型决策全过程

近年来,大语言模型(LLM)的快速发展为人工智能领域带来了前所未有的突破,但其内部决策过程却常常被视为“黑盒子”,难以捉摸。 5月29日,AI研究领域的明星公司Anthropic发布了一项重大开源成果——“电路追踪”(Circuit Tracing)工具,为破解大模型的内部工作机制提供了全新视角。 这一工具不仅能帮助研究人员深入探索AI的“思考”过程,还为推动更透明、可控的AI发展迈出了重要一步。
5/30/2025 10:01:14 AM
AI在线

AI芯片初创公司EnCharge AI发布革命性芯片:能效比传统方案高20倍

人工智能芯片初创公司EnCharge AI宣布推出基于模拟内存计算技术的AI加速器EN100,该产品旨在打破AI计算对数据中心的依赖,将先进AI功能直接带到笔记本电脑和边缘设备上。 技术突破:20倍能效提升EN100采用EnCharge AI独有的模拟内存计算架构,在各种AI工作负载下展现出比竞品解决方案高达20倍的每瓦性能提升。 该芯片运行最先进AI模型所需的能耗仅相当于一个灯泡的功耗,彻底颠覆了传统AI计算的能耗模式。
5/30/2025 10:01:14 AM
AI在线

波士顿动力机器人进厂打工现逆天操作!3D感知+实时追踪,人类捣乱完全不带怕的

波士顿动力带机器人看世界,Altas重磅升级了! 现在,它具备3D空间感知和实时物体追踪能力,可以自主执行更复杂的工业任务。 请看Altas在汽车工厂打工VCR:小哥故意将汽车零部件丢在地上,只见它360°转动头部环顾四周,随后成功识别并将其放入正确位置:(就是偷感好重,笑死)故意移动装置位置,它也能精准感知到变化:然后依旧稳稳地将零部件放入槽内:头部和腰部都可360°旋转,干起活来那叫一个麻利:据介绍,Altas的一系列功能升级源于波士顿动力团队对Altas感知系统进行的全新设计,融合了2D与3D感知技术、物体位姿追踪,以及基于物理特性的精确校准方案。
5/30/2025 9:19:00 AM

视频推理界的“福尔摩斯测试”:所有大模型,统统不及格 | 论文代码开源

一个新的Benchmark,竟让大模型在复杂视频推理这事儿上统统不及格! 这就是腾讯ARC Lab和香港城市大学最新推出的Video-Holmes——如其名,它可以说是视频推理界的“福尔摩斯测试”,通过让多模态大模型参与“推理杀人凶手”, “解析作案意图”等高难度的推理任务,以展现他们复杂视频推理能力的边界。 而且Video-Holmes可以说是规避了现在业内已有的Benchmark痛点,即视频源和问题都偏简单,没法反映推理模型和非推理模型之间的差距。
5/30/2025 9:17:00 AM

博士级AI智能体写的论文,首次登上顶会ACL!人类作者只是监工

有个叫Zochi的AI系统写了一篇研究论文,并且被顶级学术会议ACL 2025的主会场接受了! ACL是自然语言处理(NLP)领域里最顶尖的会议之一。 Zochi是Intology AI开发的首个博士级智能体,就像一个从头到尾完成科学研究「AI科学家」。
5/30/2025 9:15:00 AM

视频实时生成可交互! 两位自动驾驶大牛创业世界模型:40毫秒/帧,无需任何游戏引擎,人人免费可玩

李飞飞押注的世界模型领域,迎来两位自动驾驶大牛创业新成果! 无需任何游戏引擎,AI能以40毫秒/帧想象并实时生成视频。 40毫秒/帧啥概念?
5/30/2025 9:14:00 AM

妈妈再也不用担心延迟了!斯坦福手搓Llama超级内核,推理仅需0.00068秒

想象一下:你和AI聊天时,每句话都要等它3秒——血压是不是瞬间飙升? 低延迟LLM推理,就是专门针对这个问题的解决办法。 博客地址:「整了个大活」:他们手搓了个叫做「Megakernel」超级玩具(推理引擎),把Llama-1B的前向传播整个塞进单个GPU内核!
5/30/2025 9:12:00 AM

中国团队让AI拥有「视觉想象力」,像人类一样脑补画面来思考

在人类的认知过程中,视觉思维(Visual Thinking)扮演着不可替代的核心角色,这一现象贯穿于各个专业领域和日常生活的方方面面。 图 1:需要借助「脑补」图像进行思考的真实世界任务。 这些任务通常需要视觉预见性和想象力,仅凭基于文本的思考无法完全实现生物化学家在探索新的治疗途径时,会在脑海中构建蛋白质的三维立体结构,通过视觉化的分子间相互作用来理解复杂的生化过程;法医分析师在破解疑难案件时,需要在心中重建犯罪现场的空间布局,通过视觉推理来验证证据之间的逻辑连接;建筑师在设计创新建筑时,会在脑海中不断勾勒和修正建筑草图,通过视觉想象来优化空间配置和光照效果;篮球运动员在制定战术策略时,需要在脑海中构想队友的跑位路线、防守阵型的变化以及关键时刻的战术配合,通过视觉化的场景想象来设计最佳的进攻方案;在日常决策中,一般人也会通过「脑补」各种可能的场景图像来辅助判断和选择,用脑海中自发生成的图像作为认知媒介。
5/30/2025 9:10:00 AM

基准测试揭秘大模型“字数危机”:26个模型长文本生成普遍拉胯,最大输出长度过度宣传

你是否曾对大语言模型(LLMs)下达过明确的“长度指令”? 比如,“写一篇10,000字的长文,详细分析某个议题。 ”看似简单的要求,实际却往往让这些模型“力不从心”:不是生成内容不足,就是重复啰嗦,甚至直接罢工拒绝生成。
5/30/2025 9:10:00 AM

135 个项目、七大趋势、三大赛道:撕开大模型开源生态真相,你会怎么卷?

在微软 Build、谷歌 I/O、 Code with Claude 三大开发者大会接连登场的一周里,微软为 Windows 加装模型上下文协议(MCP),Google Gemini 野心初显「AI 操作系统」,Claude 4.0 高调抢滩编程主战场。 就在这样的节奏下,5 月 27 日,蚂蚁集团的开源团队「接棒」发布了一张《 2025 大模型开源开发生态全景图》。 访问地址::——135 个社区核心项目、19 个技术领域,全面覆盖从智能体应用到模型基建,系统性梳理了开源力量在大模型浪潮下的集结与演化路径。
5/30/2025 9:07:00 AM

Linear-MoE:线性注意力遇上混合专家的开源实践

近年来随着大语言模型的爆火,旨在取代 Transformer 的高效模型架构及其预训练成为大模型领域的研究热点,主要包括线性序列建模(如 Linear Attention、SSM、Linear RNN 等)和混合专家(Mixture-of-Experts, MoE)两部分。 这两部分分别都有了长足的进步,但两者的结合却鲜少有人研究,两者结合后的 Linear-MoE 架构开源实现更是完全缺失。 值得一提的是,近期广受好评的 MiniMax-01 模型(使用 Lightning Attention-MoE)和腾讯混元 TurboS 模型(使用 Mamba2-MoE)均属于 Linear-MoE 架构。
5/30/2025 9:06:00 AM

百度智能云千帆大模型平台全新升级,文小言App引入DeepSeek最新技术

百度智能云千帆大模型平台于5月29日迎来了重大更新,正式上架了最新的 DeepSeek-R1-0528大模型。 这一更新标志着百度在 AI 技术领域的进一步创新,旨在为企业提供更加全面和强大的模型支持。 此次升级,千帆模型开发平台不仅仅是简单的模型更新,还增加了多项实用功能。
5/30/2025 9:05:04 AM
AI在线

Artificial Analysis:DeepSeek成为世界前二AGI实验室

模型与 API 独立分析公司 Artificial Analysis 发布了对 DeepSeek R1-0528的最新评估报告,结果显示,DeepSeek R1在技术性能上取得了显著突破,一举超越了 xAI、Meta 和 Anthropic,与谷歌平起平坐,成为全球第二大人工智能实验室。 同时,DeepSeek 在开源权重领域也确立了其无可争议的领导地位。 根据 Artificial Analysis 的智能指数,DeepSeek R10528版本在对所有顶尖模型进行的七项主流评估中得分从60分跃升至68分。
5/30/2025 9:05:04 AM
AI在线

阿里巴巴开源自主搜索 AI 智能体 WebAgent 让研究更高效

阿里巴巴在 GitHub 上发布了其创新的自主搜索 AI 智能体 ——WebAgent。 这款 AI 智能体具备端到端的信息检索和多步推理能力,能够像人类一样在网络环境中主动搜索、分析和决策。 它的推出将极大提升研究人员获取和整理信息的效率。
5/30/2025 9:05:04 AM
AI在线

百度智能云千帆大模型平台、文小言接入DeepSeek-R1-0528模型

百度智能云千帆大模型平台正式上架了 DeepSeek 最新的 R1-0528大模型。 这一重要更新于5月29日上线,旨在为企业和用户提供更强大的 AI 能力和支持。 千帆模型开发平台不仅上架了这一全新大模型,还同步推出了一系列实用功能,包括批量推理、模型评估、推理日志挖掘分析以及模型蒸馏。
5/30/2025 9:05:04 AM
AI在线

AI仅凭“自信”学会推理,浙大校友复刻DeepSeek长思维链涌现,强化学习无需外部奖励信号

复刻DeepSeek-R1的长思维链推理,大模型强化学习新范式RLIF成热门话题。 UC Berkeley团队共同一作Xuandong Zhao把这项成果称为:大模型无需接触真实答案,仅通过优化自己的信心,就能学会复杂推理。 具体来说,新方法完全不需要外部奖励信号或标注数据,只需使用模型自身的置信程度作为内在奖励信号。
5/30/2025 9:05:00 AM

SOTA大模型遇上加密数据评测:Qwen3未破10%,o1也栽了丨上海AI Lab等联合研究

大语言模型遇上加密数据,即使是最新Qwen3也直冒冷汗! 尽管当前的推理模型在各类基准测试中展现出卓越的性能,但在密码学这一对逻辑严密性和细节精确度要求近乎苛刻的专业领域,模型的推理能力仍有待深入探索。 密码学不仅需要模型具备高阶数学运算能力和严密的逻辑推理链条,更要求其能够精准识别复杂加密模式中的潜在规律;成功解密需要模型具有极强的综合推理能力。
5/30/2025 9:03:00 AM