资讯列表
谷歌DeepMind重磅发布:无需联网的机器人AI,可独立完成系鞋带等精细操作
谷歌DeepMind近日发布博客文章,正式推出全新的Gemini Robotics On-Device本地化机器人AI模型。 该模型采用视觉-语言-动作(VLA)架构,能够在无需云端支持的情况下实现实体机器人的精准控制。 新模型的最大亮点在于完全独立运行于机器人设备本地,实现了低延迟响应能力。
6/25/2025 10:00:44 AM
AI在线
OpenAI新硬件被指抄袭,初创公司IYO怒诉商标侵权
近日,OpenAI 的首款硬件产品 “IO” 陷入了舆论风暴,面临初创公司 IYO 的强烈指控。 IYO 声称,他们早在2018年就开始研发一款无屏幕语音交互设备 “IYO ONE”,而 OpenAI 却在与 IYO 多次接触后,推出了设计、理念和命名高度相似的 “IO” 产品。 根据 IYO 的诉讼文件,双方曾进行了深入的技术交流,这让 OpenAI 被指控借机获取了 IYO 的技术细节。
6/25/2025 10:00:44 AM
AI在线
年增长15倍!语音AI客服平台Synthflow完成2000万美元融资,挑战Sierra和Bland AI
总部位于柏林的语音AI初创公司Synthflow AI宣布完成2000万美元A轮融资,由知名风投机构Accel领投,现有投资者Atlantic Labs和Singular跟投。 该公司专注于为企业提供无代码语音AI客服解决方案,正值对话式AI市场迎来爆发式增长。 市场前景广阔,增长迅猛根据MarketsAndMarkets数据,自2022年11月ChatGPT发布以来,对话式人工智能市场呈现爆炸式增长态势,预计到2031年将发展成为价值近500亿美元的全球产业。
6/25/2025 10:00:44 AM
AI在线
未来已来!奥比中光发布天工 Pro 机器人,搭载尖端深度相机
在近期的券商策略会上,奥比中光宣布了与北京人形机器人创新中心的合作,并透露其新一代天工 Pro 机器人正在全面升级。 该机器人在头部、胸部、腰部和后背各自配置了先进的 Gemini330系列深度相机,使其具备了更强大的感知能力,能够更好地适应复杂的工作环境。 据奥比中光介绍,天工 Pro 机器人的升级不仅仅体现在硬件上,还包括其核心技术的革新。
6/25/2025 10:00:44 AM
AI在线
你的答案能听了!秘塔AI搜索宣布上线“听讲解” 功能
近日,秘塔AI搜索宣布上线一项创新功能——“听讲解”,该功能旨在为用户提供更加便捷、高效的信息获取体验。 用户在进行搜索后,只需简单点击“听讲解”按钮,即可让AI将搜索结果生动地讲述出来,无需手动阅读,极大提升了信息获取的便利性。 据了解,秘塔AI搜索的“听讲解”功能不仅支持语音输出,还允许用户以互动网页、海报、PPT等多种形式查看搜索结果,满足了不同用户在不同场景下的信息获取需求。
6/25/2025 10:00:44 AM
AI在线
万字干货:小红书 hi lab 团队关于奖励模型的一些探索
奖励模型(Reward Models,RM)在确保大语言模型(LLMs)遵循人类偏好方面发挥着关键作用。 这类模型通过学习人类的偏好判断,为语言模型的训练提供重要的引导信号。 奖励模型很多科学问题都充满挑战,小红书 hi lab团队过去一段时间对下列几个问题和关键挑战进行了一些探索:奖励模型应该如何评估?
6/25/2025 9:53:59 AM
强化学习新发现:无需数学样本,仅游戏训练AI推理大增
第一作者谢云飞是莱斯大学博士生,导师为通讯作者魏晨教授,研究方向包括多模态生成与理解。 Project Leader 肖俊飞是约翰斯・霍普金斯大学博士生,导师为 Bloomberg Distinguished Professor Alan Yuille。 第二作者马崟淞是约翰斯・霍普金斯大学博士生。
6/25/2025 9:28:38 AM
外国小哥徒手改装消费级5090,一举击败巨无霸RTX Pro 6000
一块经过 shunt mod 改装的华硕 ROG Astral LC RTX 5090 的性能,超越了售价 10,000 美元的 RTX Pro 6000。 「Shunt Mod」 是一种硬件级别的、具有高风险性的电路改装方法,主要用于绕过电子设备(特别是高性能显卡和主板)内置的功耗(功率)和电流限制。 这项惊人的成果来自硬件改装大师 Der8auer(本名 Roman Hartung)。
6/25/2025 9:25:07 AM
ToMAP:赋予大模型「读心术」,打造更聪明的AI说服者
本文第一作者为韩沛煊,本科毕业于清华大学计算机系,现为伊利诺伊大学香槟分校(UIUC)计算与数据科学学院一年级博士生,接受 Jiaxuan You 教授指导。 其主要研究方向为:大语言模型的安全性及其在复杂场景中的推理。 说服,是影响他人信念、态度甚至行为的过程,广泛存在于人类社会之中。
6/25/2025 9:19:44 AM
Cache Me If You Can:陈丹琦团队如何「抓住」关键缓存,解放LLM内存?
普林斯顿大学计算机科学系助理教授陈丹琦团队又有了新论文了。 近期,诸如「长思维链」等技术的兴起,带来了需要模型生成数万个 token 的全新工作负载。 大多数语言模型都基于 Transformer 架构,其在进行自回归解码(即逐字生成文本)时,需要将所有先前 token 的注意力状态存储在一个名为 KV 缓存的内存区域中。
6/25/2025 9:15:38 AM
华科开源MonkeyOCR:3B小模型,居然把GPT-4o给比下去了
看到这个标题,你可能会想"又一个号称吊打GPT的模型"。 但这次不一样,华中科技大学真的搞出了点名堂。 前几天,华科和金山办公联合开源了一个叫MonkeyOCR的文档解析模型。
6/25/2025 9:14:00 AM
阿丸笔记
如何做到在手机上实时跑3D真人数字人?MNN-TaoAvatar开源了!
TaoAvatar 是由阿里巴巴淘宝 Meta 技术团队研发的 3D 真人数字人技术,这一技术能在手机或 XR 设备上实现 3D 数字人的实时渲染以及 AI 对话的强大功能,为用户带来逼真的虚拟交互体验。 它是如何实现的呢? 本文将为您揭秘 TaoAvatar 背后的黑科技!
6/25/2025 9:11:16 AM
谷歌发布本地具身智能模型!全程无联网执行精细操作,从人形机器人到工业机器人全覆盖
机器人终于有了自己的“离线大脑”。 Google DeepMind团队首个可以完全在机器人本地运行的视觉-语言-动作(VLA)模型Gemini Robotics On-Device发布。 这个模型不仅能离线运行,还保持了相当强悍的操作能力,能遵循指令完成各种需要精细操作的任务。
6/25/2025 9:04:59 AM
机器人视觉语言导航进入R1时代!港大联合上海AI Lab提出全新具身智能框架
你对着家里的机器人说:“去厨房,看看冰箱里还有没有牛奶。 ”它不仅准确走到了厨房,还在移动过程中避开了椅子,转身打开冰箱,并回答你:“还有半瓶。 ”这不是遥远的科幻,而是视觉语言导航技术的下一站。
6/25/2025 9:02:05 AM
加州法院裁定使用版权内容训练 AI 合规,引发创作者担忧
美国加州北区地方法院作出了一项重要裁决,允许使用受版权保护的作品来训练人工智能模型。 这个决定引发了广泛的关注和争议,尤其是在创意产业中,许多艺术家和内容创作者对此表示担忧。 裁决支持了被告 Anthropic 公司在没有授权的情况下使用盗版材料来训练其 AI 模型 Claude,进一步引发了关于创作者权益的讨论。
6/25/2025 9:00:44 AM
AI在线
联邦法官首次裁定AI训练使用版权书籍属合理使用,Anthropic获胜但仍面临盗版指控
在一项具有里程碑意义的裁决中,联邦法官威廉·阿尔苏普(William Alsup)裁定,Anthropic公司在未经作者许可的情况下使用已出版书籍训练其人工智能模型属于合法行为。 这是法院首次认可AI公司关于合理使用原则的辩护论点,为科技行业在版权争议中奠定了重要先例。 行业影响深远这一判决对正在进行的AI版权大战产生重大影响。
6/25/2025 9:00:44 AM
AI在线
讯飞星火医疗大模型 V2. 国际版发布,超越人类医生的实用性!
科大讯飞正式推出了星火医疗大 V2.5国际版,标志着医疗人工智能领域的一次重要突破。 这款模型是业界唯一基于全国产算力训练的医疗大模型,显示出中国在这一领域的领先地位。 根据权威评测平台 MedBench 的最新排名,星火医疗大模型以98.4分的优异成绩位列综合能力榜首,显示出其卓越的性能。
6/25/2025 9:00:44 AM
AI在线
苹果iOS 26升级:图乐园功能焕然一新,AI 生成图像更真实!
近日,科技媒体 MacRumors 披露了苹果即将推出的 iOS26系统中的新特性,特别是增强版图乐园(Image Playground)。 此次更新不仅让图像生成效果更自然,更加入了 ChatGPT 的强大功能,使得用户体验得到显著提升。 iOS26的图乐园功能最早在 iOS18中引入,用户可以通过输入简短的描述,生成各种风格的图像。
6/25/2025 9:00:44 AM
AI在线