资讯列表
模仿学习新范式,Chain-of-Action:轨迹自回归实现动作推理
论文标题:Chain-of-Action: Trajectory Autoregressive Modeling for Robotic Manipulation主页链接:::(Embodied AI)作为人工智能领域的前沿方向,旨在赋予机器人或智能体在物理世界中感知、决策和行动的能力。 近年来,尽管视觉 - 语言 - 动作模型(Vision Language Action, VLA)已经取得了诸多进展,但具身智能领域尚未迎来 「GPT 时刻」。 越来越多的研究人员开始相信,仅仅增加模型规模和数据量似乎不足以创造出通用操作模型,如果我们想要充分释放现有数据的潜力,就需要找到更有效的机器人操作建模方法。
7/16/2025 10:42:32 AM
突发|思维链开山作者Jason Wei被曝加入Meta,机器之心独家证实:Slack没了
这或许是目前为止,扎克伯格挖走的最强技术人才。 就在刚刚,外媒 Wired 的一位资深 AI 领域记者爆料称,「多个消息源证实,OpenAI 知名研究员 Jason Wei 和另一位研究科学家 Hyung Won Chung 将双双离职,投奔 Meta。 」并且,他们二人的 Slack 账号已经被停用。
7/16/2025 10:39:05 AM
微软打造 AI 新工具:每月辅助审查 60 万条 PR,占比超 90%
AI在线 7 月 16 日消息,微软公司于 7 月 14 日发布博文,介绍了内部使用的 AI 智能代码审查助手(暂未命名),已扩展帮助公司每月审查超过 60 万条 Pull Requests(PR)请求,占比超过 90%。 AI在线注:Pull Request (PR),也称为拉取请求,是软件开发中一种合作机制,主要用于将代码更改从一个分支合并到另一个分支,通常用于在代码仓库中进行协作和代码审查。 微软始终在寻找提升开发者生产力和代码质量的方法,其中一项重大创新是 AI 智能代码审查助手,该助手源于内部实验,能帮助工程师更快发现问题,更早完成 PR,并在标准开发流程中强制执行一致的最佳实践。
7/16/2025 10:21:54 AM
故渊
苹果MLX支持英伟达CUDA,AI开发者迎来成本与效率双重利好
苹果正在为其专为 Apple Silicon 芯片打造的机器学习框架 MLX 增添对英伟达 CUDA 的支持,这一突破性进展将为 AI 开发者提供前所未有的灵活性与成本优势。 据 Appleinsider 报道,开发者现在可以在配备 Apple Silicon 的 Mac 上使用 MLX 框架开发 AI 应用,并将代码导出至支持 CUDA 的英伟达显卡或服务器环境中运行。 这一能力的实现,意味着开发者可以在 macOS 上构建模型原型,并在部署阶段无缝迁移至英伟达平台,充分利用其强大算力。
7/16/2025 10:21:32 AM
AI在线
智元机器人获正大集团投资,开启国产机器人全球化新篇章
智元机器人近日宣布获得正大集团旗下正大机器人的战略投资。 这一合作标志着智元机器人正式迈入国产机器人“出海”发展的新阶段,也为其在全球化布局和垂直领域业务拓展上注入强劲动能。 据智元机器人方面表示,本轮战略合作不仅有助于企业提升技术创新与产业协同能力,更将依托正大集团在全球范围内的产业资源,推动智元机器人走向国际市场。
7/16/2025 10:21:32 AM
AI在线
Willow Voice获420万美元融资,AI语音输入重塑高效工作体验
2025年7月15日 – 人工智能语音输入平台Willow Voice宣布成功完成420万美元天使轮融资,致力于推动语音优先交互技术的革新。 本轮融资将用于优化其先进的语音输入技术,并加速实现打造通用语音操作系统层的愿景。 Willow Voice由一群在计算机科学和机器学习领域拥有丰富经验的创业者于2025年创立,此前团队曾在医疗等领域进行过多次创业尝试。
7/16/2025 10:21:17 AM
AI在线
OpenAI 前 CTO的AI公司Thinking Machines Lab 获得 20 亿美元融资,估值达 120 亿美元
AI 创业公司 Thinking Machines Lab(思维机器实验室)正式宣布完成由安德森・霍洛维茨基金领投的20亿美元种子轮融资。 这一消息在硅谷引发了广泛关注,标志着该公司的估值已经达到120亿美元。 这家由 OpenAI 前首席技术官米拉・穆拉蒂(Mira Murati)创办的公司,自成立不到一年便吸引了包括英伟达、AMD 等在内的多家知名投资者。
7/16/2025 10:21:17 AM
AI在线
基于闪电注意力机制,创新高效开源大模型
从数学竞赛、编程到自然语言处理,通过大规模的强化学习的模型正不断提升其推理能力。 但传统的Transformer架构由于其注意力机制的二次计算复杂度,在处理长文本和复杂推理任务时面临着效率瓶颈。 尽管有研究提出了多种改进方法,如稀疏注意力、线性注意力等,但这些方法在大规模推理模型中的应用效果尚未得到充分验证,大多数领先的模型仍然依赖于传统的注意力设计。
7/16/2025 10:15:51 AM
完全透明开源的共情语音大模型,三阶段训练,四大模块实现端到端对话
GPT-4o、Gemini这些顶级语音模型虽然展现了惊人的共情对话能力,但它们的技术体系完全闭源。 现在,紫东太初团队联合长城汽车AI Lab直接把整个技术栈都开源了,推出完全透明开源的端到端共情语音语言大模型OpenS2S。 OpenS2S的核心在于提供一个高效、低成本构建共情语音系统的新范式。
7/16/2025 10:12:35 AM
首篇潜空间推理综述!模型思考不必依赖Token,带宽暴增2700+倍
大模型在潜空间中推理,带宽能达到普通(显式)思维链(CoT)的2700多倍? 史上首篇潜空间推理综述,对这种新兴的推理范式进行了全面总结。 这篇综述当中,作者分析了循环、递归、连续思维等潜空间推理的形式,并将这些方法总结成了一个框架。
7/16/2025 10:08:57 AM
七个月翻一番!AI Agent能力飙升,METR报告揭示指数级进化规律
Agent能力每7个月翻一番! 根据非营利研究机构METR最新发布的报告,这一规律已在9项基准测试中得到了验证。 这些任务涉及编程、数学、计算机使用、自动驾驶等领域,表明大模型正在不断向着高度自动化迈进。
7/16/2025 10:06:00 AM
老黄投了个120亿美元最贵种子轮!但小钱:H20中国开卖,市值一夜暴涨1600亿美元
种子轮,估值120亿美元! 硅谷乃至全球创纪录的创业种子轮诞生了。 OpenAI前CTO Mira创业公司,Thinking Machines Lab——思考机器实验室,刚刚公告了首款融资情况:顺利筹集约20亿美元(约合人民币143亿元),公司估值一夜飙升至120亿美元(约合人民币861亿元),成为硅谷史上最大种子轮之一。
7/16/2025 10:03:14 AM
加拿大丛林迷路五小时,ChatGPT救命神技,比地图还靠谱!
最近,X平台上一个帖子火了,一群人在加拿大偏远的小镇Mabou骑全地形车(ATV)玩,结果迷路了整整五小时,最后靠ChatGPT导航才安全回来。 Mabou是个小地方,周围全是没开发过的森林和小路。 他们本来打算从Upper Southwest Mabou Rd出发,骑18公里到Whycocomagh玩一圈。
7/16/2025 9:58:47 AM
倒反天罡:ChatGPT教人说话?36万视频+77万播客已证实!
AI驯服人类第一步:教人重新说英语? 最近,越来越多的媒体发现:说话的方式,越来越像ChatGPT了! 这不是模仿,而是「入侵」。
7/16/2025 9:52:07 AM
错题本 × LLM:人机协作如何炼成“最严代码考官”
大家好,我是肆〇柒。 在 vibe coding 活跃的当下,有时,我们不得不思考一个问题:在软件开发流程中,我们能否完全依赖、使用 LLM 生成的代码? 大型语言模型(LLM)在代码生成基准测试中的卓越表现备受瞩目,从 HumanEval 到 LiveCodeBench,众多基准测试平台见证了 LLM 在代码生成任务上的飞速进步。
7/16/2025 9:51:43 AM
肆零柒
秘塔AI整大活,国内首个免费「深度研究」来了!搞研究证据链惊人
就在刚刚,国内第一家免费公开可用的「深度研究」产品来了! 这个产品,可以直接对标海外的Deep Research能力,性能十分强大。 在BrowseComp等评测集上,它们超越了上周刚开源且达到最好结果的WebSailor模型,准确率有明显提升。
7/16/2025 9:48:23 AM
五个月估值120亿!OpenAI前CTO自曝首个多模态AI,竟要免费开源
OpenAI前CTO初创,又拿到新融资了! 一早,Mira Murati官宣由a16z领投20亿美元融资,至此,Thinking Machines Lab估值120亿美元。 同时,英伟达、AMD、Accel、ServiceNow等多家明星风投也参与了本次融资。
7/16/2025 9:44:29 AM
月之暗面卷土重来?Kimi K2杀回来了
为什么一个中国公司的开源模型,能让硅谷的闭源巨头们感到紧张? 昨天看到月之暗面发布Kimi K2的消息,我特意去测试了一下。 说实话,刚开始我还是有点怀疑,毕竟之前见过太多"对标GPT-4"的宣传最后都不了了之。
7/16/2025 9:29:39 AM
阿丸笔记