AI在线 AI在线

资讯列表

​纽约时报与亚马逊达成人工智能内容授权协议

在经历了近两年的法律纠纷后,《纽约时报》终于与亚马逊达成了一项新的协议,允许后者使用其编辑内容来训练其人工智能平台。 这项协议标志着《纽约时报》首次将其内容授权给一家科技巨头,以支持生成式人工智能的发展。 图源备注:图片由AI生成,图片授权服务商Midjourney根据《纽约时报》的声明,该协议不仅包括新闻文章,还涵盖了《纽约时报烹饪》(NYT Cooking)网站上的食谱和美食相关内容,以及体育网站 The Athletic 的材料。
5/30/2025 10:01:19 AM
AI在线

Hugging Face进军人形机器人市场:推出售价3000美元的开源机器人HopeJR

人工智能开发平台Hugging Face周四正式进军机器人硬件领域,发布了两款开源人形机器人产品,旨在打破大型科技公司对机器人技术的垄断。 两款新品各有特色该公司推出的两款机器人分别针对不同应用场景:HopeJR是一款全尺寸人形机器人,配备66个驱动自由度,具备完整的行走和手臂操作能力;Reachy Mini则是一款桌面级机器人,专注于头部运动、语音交互和AI应用测试。 在定价方面,HopeJR预计售价约3000美元,而Reachy Mini的价格区间为250-300美元,具体价格将根据关税情况调整。
5/30/2025 10:01:14 AM
AI在线

​黑森林实验室推出 FLUX.1Kontext:可通过文本和参考图像对图像进行多次修改

黑森林实验室(Black Forest Labs,简称 BFL),由著名的 Stable Diffusion 模型创作者成立,近日推出了新一代图像生成模型 FLUX.1Kontext。 该模型不仅可以生成和编辑照片,还支持用户通过文本和参考图像对图像进行多次修改,为企业的 AI 应用带来了全新可能。 多版本选择与平台支持BFL 推出了 FLUX.1Kontext 的三个版本:FLUX.1Kontext [pro]、FLUX.1Kontext [max] 以及即将进入私有测试阶段的 FLUX.1Kontext [dev]。
5/30/2025 10:01:14 AM
AI在线

小米多模态大模型Xiaomi MiMo-VL开源

近日,小米公司研发的MiMo-VL多模态模型接过MiMo-7B的接力棒,在多个领域展现出了强大的实力。 该模型在图片、视频、语言的通用问答和理解推理等多个任务上大幅领先同尺寸标杆多模态模型Qwen2.5-VL-7B,在GUI Grounding任务上的表现更是可与专用模型相媲美,为Agent时代的到来做好了准备。 MiMo-VL-7B在多模态推理任务上成绩斐然,尽管参数规模仅为7B,却在奥林匹克竞赛(OlympiadBench)和多个数学竞赛(MathVision、MathVerse)中大幅领先参数规模10倍大的阿里Qwen-2.5-VL-72B和QVQ-72B-Preview,同时也超越了闭源模型GPT-4o。
5/30/2025 10:01:14 AM
AI在线

全球首款生成式人形机器人运动大模型发布,上海构建智能数据生态圈

2025张江具身智能开发者大会上,全球首款生成式人形机器人运动大模型 “龙跃”(MindLoongGPT)正式发布。 此次发布标志着人形机器人技术的一次重要飞跃,尤其在运动控制和数据生成方面。 该大会还见证了国家地方共建人形机器人创新中心与多个省市的创新中心联合启动了人形机器人产业标准互认计划,旨在为行业发展建立统一的标准。
5/30/2025 10:01:14 AM
AI在线

Perplexity Labs上线:从AI搜索工具进化为全能项目开发平台

AI搜索公司Perplexity近日推出全新"实验室"(Labs)功能,这项面向专业版用户的重大更新标志着该公司正在从单纯的搜索工具向综合性AI平台转型,以应对来自ChatGPT、Gemini和Claude等竞争对手的激烈挑战。 突破时间限制的复杂项目处理与Perplexity此前主打的快速"研究"模式不同,新推出的实验室模式具备显著的技术优势:超长运行时间:可以独立运行超过十分钟,为复杂项目提供充足的处理时间。 多功能集成:能够执行Web搜索、运行代码和创建文件等多种任务,实现真正的一站式解决方案。
5/30/2025 10:01:14 AM
AI在线

300亿美元AI巨头掌门人自曝:正在开发可能引发20%失业率的"超人类"AI

Anthropic联合创始人Dario Amodei本周在接受Axios采访时发出惊人预警:人工智能可能会消灭一半的入门级白领工作,并描绘了一个"20%的人没有工作"的未来场景。 四阶段劳动力危机预测这位身价数十亿美元的科技企业家详细描述了他预期的劳动力危机演进过程:第一阶段:OpenAI、谷歌和Anthropic等公司持续开发大型语言模型,使其"在越来越多的任务中达到甚至超越人类的表现"。 第二阶段:政府因担心中国竞争和劳工动荡而既不"监管人工智能",也不警告公众潜在风险。
5/30/2025 10:01:14 AM
AI在线

Anthropic重磅开源!“电路追踪”工具解锁AI大脑,揭秘大模型决策全过程

近年来,大语言模型(LLM)的快速发展为人工智能领域带来了前所未有的突破,但其内部决策过程却常常被视为“黑盒子”,难以捉摸。 5月29日,AI研究领域的明星公司Anthropic发布了一项重大开源成果——“电路追踪”(Circuit Tracing)工具,为破解大模型的内部工作机制提供了全新视角。 这一工具不仅能帮助研究人员深入探索AI的“思考”过程,还为推动更透明、可控的AI发展迈出了重要一步。
5/30/2025 10:01:14 AM
AI在线

AI芯片初创公司EnCharge AI发布革命性芯片:能效比传统方案高20倍

人工智能芯片初创公司EnCharge AI宣布推出基于模拟内存计算技术的AI加速器EN100,该产品旨在打破AI计算对数据中心的依赖,将先进AI功能直接带到笔记本电脑和边缘设备上。 技术突破:20倍能效提升EN100采用EnCharge AI独有的模拟内存计算架构,在各种AI工作负载下展现出比竞品解决方案高达20倍的每瓦性能提升。 该芯片运行最先进AI模型所需的能耗仅相当于一个灯泡的功耗,彻底颠覆了传统AI计算的能耗模式。
5/30/2025 10:01:14 AM
AI在线

波士顿动力机器人进厂打工现逆天操作!3D感知+实时追踪,人类捣乱完全不带怕的

波士顿动力带机器人看世界,Altas重磅升级了! 现在,它具备3D空间感知和实时物体追踪能力,可以自主执行更复杂的工业任务。 请看Altas在汽车工厂打工VCR:小哥故意将汽车零部件丢在地上,只见它360°转动头部环顾四周,随后成功识别并将其放入正确位置:(就是偷感好重,笑死)故意移动装置位置,它也能精准感知到变化:然后依旧稳稳地将零部件放入槽内:头部和腰部都可360°旋转,干起活来那叫一个麻利:据介绍,Altas的一系列功能升级源于波士顿动力团队对Altas感知系统进行的全新设计,融合了2D与3D感知技术、物体位姿追踪,以及基于物理特性的精确校准方案。
5/30/2025 9:19:00 AM

视频推理界的“福尔摩斯测试”:所有大模型,统统不及格 | 论文代码开源

一个新的Benchmark,竟让大模型在复杂视频推理这事儿上统统不及格! 这就是腾讯ARC Lab和香港城市大学最新推出的Video-Holmes——如其名,它可以说是视频推理界的“福尔摩斯测试”,通过让多模态大模型参与“推理杀人凶手”, “解析作案意图”等高难度的推理任务,以展现他们复杂视频推理能力的边界。 而且Video-Holmes可以说是规避了现在业内已有的Benchmark痛点,即视频源和问题都偏简单,没法反映推理模型和非推理模型之间的差距。
5/30/2025 9:17:00 AM

博士级AI智能体写的论文,首次登上顶会ACL!人类作者只是监工

有个叫Zochi的AI系统写了一篇研究论文,并且被顶级学术会议ACL 2025的主会场接受了! ACL是自然语言处理(NLP)领域里最顶尖的会议之一。 Zochi是Intology AI开发的首个博士级智能体,就像一个从头到尾完成科学研究「AI科学家」。
5/30/2025 9:15:00 AM

视频实时生成可交互! 两位自动驾驶大牛创业世界模型:40毫秒/帧,无需任何游戏引擎,人人免费可玩

李飞飞押注的世界模型领域,迎来两位自动驾驶大牛创业新成果! 无需任何游戏引擎,AI能以40毫秒/帧想象并实时生成视频。 40毫秒/帧啥概念?
5/30/2025 9:14:00 AM

妈妈再也不用担心延迟了!斯坦福手搓Llama超级内核,推理仅需0.00068秒

想象一下:你和AI聊天时,每句话都要等它3秒——血压是不是瞬间飙升? 低延迟LLM推理,就是专门针对这个问题的解决办法。 博客地址:「整了个大活」:他们手搓了个叫做「Megakernel」超级玩具(推理引擎),把Llama-1B的前向传播整个塞进单个GPU内核!
5/30/2025 9:12:00 AM

中国团队让AI拥有「视觉想象力」,像人类一样脑补画面来思考

在人类的认知过程中,视觉思维(Visual Thinking)扮演着不可替代的核心角色,这一现象贯穿于各个专业领域和日常生活的方方面面。 图 1:需要借助「脑补」图像进行思考的真实世界任务。 这些任务通常需要视觉预见性和想象力,仅凭基于文本的思考无法完全实现生物化学家在探索新的治疗途径时,会在脑海中构建蛋白质的三维立体结构,通过视觉化的分子间相互作用来理解复杂的生化过程;法医分析师在破解疑难案件时,需要在心中重建犯罪现场的空间布局,通过视觉推理来验证证据之间的逻辑连接;建筑师在设计创新建筑时,会在脑海中不断勾勒和修正建筑草图,通过视觉想象来优化空间配置和光照效果;篮球运动员在制定战术策略时,需要在脑海中构想队友的跑位路线、防守阵型的变化以及关键时刻的战术配合,通过视觉化的场景想象来设计最佳的进攻方案;在日常决策中,一般人也会通过「脑补」各种可能的场景图像来辅助判断和选择,用脑海中自发生成的图像作为认知媒介。
5/30/2025 9:10:00 AM

基准测试揭秘大模型“字数危机”:26个模型长文本生成普遍拉胯,最大输出长度过度宣传

你是否曾对大语言模型(LLMs)下达过明确的“长度指令”? 比如,“写一篇10,000字的长文,详细分析某个议题。 ”看似简单的要求,实际却往往让这些模型“力不从心”:不是生成内容不足,就是重复啰嗦,甚至直接罢工拒绝生成。
5/30/2025 9:10:00 AM

135 个项目、七大趋势、三大赛道:撕开大模型开源生态真相,你会怎么卷?

在微软 Build、谷歌 I/O、 Code with Claude 三大开发者大会接连登场的一周里,微软为 Windows 加装模型上下文协议(MCP),Google Gemini 野心初显「AI 操作系统」,Claude 4.0 高调抢滩编程主战场。 就在这样的节奏下,5 月 27 日,蚂蚁集团的开源团队「接棒」发布了一张《 2025 大模型开源开发生态全景图》。 访问地址::——135 个社区核心项目、19 个技术领域,全面覆盖从智能体应用到模型基建,系统性梳理了开源力量在大模型浪潮下的集结与演化路径。
5/30/2025 9:07:00 AM

Linear-MoE:线性注意力遇上混合专家的开源实践

近年来随着大语言模型的爆火,旨在取代 Transformer 的高效模型架构及其预训练成为大模型领域的研究热点,主要包括线性序列建模(如 Linear Attention、SSM、Linear RNN 等)和混合专家(Mixture-of-Experts, MoE)两部分。 这两部分分别都有了长足的进步,但两者的结合却鲜少有人研究,两者结合后的 Linear-MoE 架构开源实现更是完全缺失。 值得一提的是,近期广受好评的 MiniMax-01 模型(使用 Lightning Attention-MoE)和腾讯混元 TurboS 模型(使用 Mamba2-MoE)均属于 Linear-MoE 架构。
5/30/2025 9:06:00 AM