AI在线 AI在线

应用

提升 1.5~20 倍吞吐量,字节豆包大模型团队与香港大学发布并开源全新 RLHF 框架

字节跳动豆包大模型团队与香港大学公开联合研究成果 —— HybridFlow。 官方宣称,HybridFlow(开源项目名:veRL)是一个灵活且高效的大模型 RL 训练框架,兼容多种训练和推理框架,支持灵活的模型部署和多种 RL 算法实现。 该框架采用混合编程模型,融合单控制器(Single-Controller)的灵活性和多控制器(Multi-Controller)的高效性,可更好实现和执行多种 RL 算法,显著提升训练吞吐量,降低开发和维护复杂度。
11/3/2024 3:24:59 PM
沛霖(实习)

刚刚,阿里全球数学竞赛决赛结果公布,姜萍违反预选赛规则未获奖

刚刚,2024 阿里巴巴全球数学竞赛决赛结果正式公布! 共有86名选手获奖,其中金奖5名,银奖10名,铜奖20名,优秀奖51名。 与初赛不分方向不同,决赛设有代数与数论、几何与拓扑、分析与方程、组合与概率、计算与应用数学五个赛道,每个赛道评出金奖 1 名、银奖 2 名、铜奖 4 名以及优秀奖 10 名,先前备受关注的江苏17岁中专生姜萍无缘奖项。
11/3/2024 1:14:00 PM
机器之心

普渡发布 11 自由度五指灵巧手 PUDU DH11:单手最大提拉负载 40kg

继今年 9 月发布旗下首款类人形机器人 PUDU D7 后,普渡机器人于 10 月 31 日发布 11 自由度五指灵巧手 PUDU DH11。 AI在线获悉,基于仿人五指设计,PUDU DH11 拥有 11 自由度,搭载 12 个触觉传感器区域;内置 1018 个感应矩阵点数;单手最大提拉重量 40kg。 PUDU DH11 采用仿人手结构的绳驱方案及欠驱动机构,降低自身重量及空间占用,相比传统方案具备更高的灵活性和柔顺度。
11/3/2024 9:56:15 AM
沛霖(实习)

支持中英双语及 40 种方言任意混说,中国电信 TeleAI 星辰语音大模型升级

中国电信人工智能研究院(TeleAI)在今年 5 月发布业内首个支持 30 种方言自由混说的语音识别大模型 —— 星辰超多方言语音识别大模型。 时隔不到半年,TeleAI 星辰语音大模型的多方言能力再次升级,攻克了湛江话、宜宾话、洛阳话、烟台话等方言,将方言种类从 30 种提升至 40 种,并引入对英文的识别。 与传统的有标注训练方法相比,TeleAI 通过预训练语音识别模型,利用海量无标注数据进行预训练,再通过少量有标注数据进行微调。
11/3/2024 9:37:53 AM
沛霖(实习)

马斯克老部下创业成果:2mm 芯片植入视网膜,盲人重获阅读能力还能打牌

把一块 2mm 大小的芯片植入视网膜,搭配一副带摄像头的眼镜,就能成功让盲人恢复视力! 不仅重拾阅读能力,甚至还能打牌。 这是来自美国加州的脑机接口公司 Science 的最新进展。
11/2/2024 3:22:36 PM
清源

每帧都是AI实时生成的,全球首款AI游戏问世了!

欢迎来到 Transformer 的世界。 两个月前,我们对 AI 游戏的认知刚刚被谷歌 GameNGen 颠覆。 他们实现了历史性的突破,从此不再需要游戏引擎,AI 能基于扩散模型,为玩家生成实时可玩的游戏。
11/2/2024 3:04:00 PM
机器之心

MetaGPT开源SELA,用AI设计AI,效果超越OpenAI使用的AIDE

AIxiv专栏是AI在线发布学术、技术内容的栏目。 过去数年,AI在线AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。 如果您有优秀的工作想要分享,欢迎投稿或者联系报道。
11/2/2024 2:48:00 PM
机器之心

谷歌 Agent 首次发现真实世界代码漏洞:抢救全球数亿设备,有望挽回数十亿美元损失

AI 首次发现真实世界中的重大安全漏洞? SQLite 中的一个漏洞,幸运地被谷歌研究者的 AI Agent 发现了,修复后并未造成任何损失。 莫非 AI 再进化一番,微软的全球蓝屏事故就可以永久避免了?
11/2/2024 1:32:26 PM
清源

迪士尼成立新 AI 部门,探索人工智能、混合现实等新型技术的潜力

据路透社报道,华特迪士尼正在组建一个新的小组,以协调公司对人工智能和混合现实等新兴技术的使用,这家媒体巨头正积极探索 AI 等技术在电影、电视和主题公园等业务中的潜力。 根据路透社当地时间周五获取的电子邮件,新成立的“技术赋能办公室”(Office of Technology Enablement)将由杰米・沃里斯(Jamie Voris)领导,他是迪士尼电影制片厂的首席技术官,此前主导了迪士尼为苹果 Vision Pro 混合现实设备开发应用的工作。 迪士尼娱乐联合主席艾伦・伯格曼(Alan Bergman)在邮件中写道:“人工智能和 XR(扩展现实)技术发展迅速,将对未来的消费者体验、创意项目以及我们的业务产生深远影响。
11/2/2024 12:20:36 PM
清源

超方便!3个设计师都在用的免费AI配色工具

6大章节帮你从零开始系统学配色推荐阅读一、前言 在我们平时的设计工作中,色彩是工作中必不可少的元素。 阅读文章 . 在现代设计领域,色彩搭配不仅是审美体现,更是影响用户体验的关键因素。
11/2/2024 8:10:27 AM
58UXD 团队

苹果 AI 研究:“猕猴桃”简单算术考倒 o1 和 Llama 等 20 多个最先进模型

《洛杉矶时报》昨日(11 月 1 日)发布博文,报道称苹果研究团队测试了 20 个最先进的 AI 模型,发现在有干扰项存在的情况下,它们处理简单的算术问题时表现不佳,甚至不如小学生。 苹果公司用以下这道简单的算术题测试 20 多个最先进的 AI 模型,AI在线附上题目如下:Oliver 在星期五采摘了 44 个猕猴桃、然后他在星期六采摘了 58 个猕猴桃,星期日采摘的数量是星期五的两倍,不过其中有 5 个猕猴桃的块头要比平均值要小,请问 Oliver 这三天共摘了多少个猕猴桃? 正确答案是 190 个,计算公式为 44(星期五) 58(星期六) 88(44*2,星期日)。
11/2/2024 7:41:20 AM
故渊

克服奖励欺骗:Meta 发布全新后训练方式 CGPO 编程水平直升 5%,打破 RLHF 瓶颈

CGPO 框架通过混合评审机制和约束优化器,有效解决了 RLHF 在多任务学习中的奖励欺骗和多目标优化问题,显著提升了语言模型在多任务环境中的表现。 CGPO 的设计为未来多任务学习提供了新的优化路径,有望进一步提升大型语言模型的效能和稳定性。 近年来,随着大规模语言模型(LLMs)的发展,特别是通用大模型的应用场景愈发广泛,RLHF 逐渐成为调整和优化语言模型输出的主流方法。
11/1/2024 10:31:28 PM
问舟

奥特曼回答一切:Ilya确实看到了了不起的东西,OpenAI也缺算力

北京时间 11 月 1 日凌晨,OpenAI 宣布为 ChatGPT 推出了最新的人工智能搜索体验。 在宣布发布 ChatGPT 搜索后不久,OpenAI 还在 Reddit 上进行了 AMA 问答。 在问到 Ilya 到底看到了什么时?
11/1/2024 4:56:00 PM
机器之心

豆包大模型团队开源RLHF框架,训练吞吐量最高提升20倍

强化学习(RL)对大模型复杂推理能力提升有关键作用,但其复杂的计算流程对训练和部署也带来了巨大挑战。 近日,字节跳动豆包大模型团队与香港大学联合提出 HybridFlow。 这是一个灵活高效的 RL/RLHF 框架,可显著提升训练吞吐量,降低开发和维护复杂度。
11/1/2024 2:44:00 PM
新闻助手

夸克发布“灵知”学习大模型,号称考研数学题正确率、得分率比肩 OpenAI o1

夸克今日宣布全面升级“AI 搜题”产品,用户可通过手机、平板、电脑等设备搜到各类新题和难题,AI 还会分步骤进行题目讲解,并支持用户随时提问。 据介绍,夸克 AI 还可围绕题目中的知识点与考点进行深度讲解,精准定位关键步骤,能够以“启发式”学习的体验让用户不仅学会这一道难题,还能举一反三学会一类题。 同时,夸克发布“灵知”学习大模型。
11/1/2024 12:54:46 PM
清源

“成都造”机器狗在宽窄巷子当夜间“巡逻员”,机器人进入景区将迎常态化

据《成都商报》昨日报道,10 月 30 日晚,机器狗“灵瞳”作为“巡逻员”在宽窄巷子投入使用,其任务是根据景区木制建筑及道路特点,进行夜间安全巡逻示范,巡逻内容包括火灾防范、治安维护等。 此次机器人产品的亮相,是机器人进场景长效机制的首次实践,标志着“成都造”机器人进入景区工作的常态化序幕正式拉开。 未来,将有更多不同类型和功能的机器人,进入春熙路、大熊猫繁育研究基地等景区承担不同工种并进行常态化工作。
11/1/2024 10:27:57 AM
清源

机器人迈向ChatGPT时刻!清华团队首次发现具身智能Scaling Laws

AIxiv专栏是AI在线发布学术、技术内容的栏目。 过去数年,AI在线AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。 如果您有优秀的工作想要分享,欢迎投稿或者联系报道。
11/1/2024 10:21:00 AM
机器之心

谷歌推出新付费功能,借助搜索结果对抗 AI 幻觉问题

谷歌公司昨日(10 月 31 日)发布新闻稿,宣布在其 Google AI Studio 和 Gemini API 中,推出 Grounding with Google Search 功能,支持用户通过谷歌搜索验证 AI 回答内容。 主流大模型的挑战包括 OpenAI、Anthropic 和 Google 在内,大部分大语言模型(LLM)由于训练数据集的原因,都有 1 个知识截止日期,因此在回答近期相关事件时,都表现得非常糟糕。 新功能简介Grounding with Google Search 功能旨在解决大型语言模型(LLM)在处理最新事件时的响应不足问题,开发者通过结合实时搜索,可以获得更准确和时效性的信息,提升 AI 应用的可靠性和实用性。
11/1/2024 9:47:27 AM
故渊