应用
提升 1.5~20 倍吞吐量,字节豆包大模型团队与香港大学发布并开源全新 RLHF 框架
字节跳动豆包大模型团队与香港大学公开联合研究成果 —— HybridFlow。 官方宣称,HybridFlow(开源项目名:veRL)是一个灵活且高效的大模型 RL 训练框架,兼容多种训练和推理框架,支持灵活的模型部署和多种 RL 算法实现。 该框架采用混合编程模型,融合单控制器(Single-Controller)的灵活性和多控制器(Multi-Controller)的高效性,可更好实现和执行多种 RL 算法,显著提升训练吞吐量,降低开发和维护复杂度。
11/3/2024 3:24:59 PM
沛霖(实习)
刚刚,阿里全球数学竞赛决赛结果公布,姜萍违反预选赛规则未获奖
刚刚,2024 阿里巴巴全球数学竞赛决赛结果正式公布! 共有86名选手获奖,其中金奖5名,银奖10名,铜奖20名,优秀奖51名。 与初赛不分方向不同,决赛设有代数与数论、几何与拓扑、分析与方程、组合与概率、计算与应用数学五个赛道,每个赛道评出金奖 1 名、银奖 2 名、铜奖 4 名以及优秀奖 10 名,先前备受关注的江苏17岁中专生姜萍无缘奖项。
11/3/2024 1:14:00 PM
机器之心
普渡发布 11 自由度五指灵巧手 PUDU DH11:单手最大提拉负载 40kg
继今年 9 月发布旗下首款类人形机器人 PUDU D7 后,普渡机器人于 10 月 31 日发布 11 自由度五指灵巧手 PUDU DH11。 AI在线获悉,基于仿人五指设计,PUDU DH11 拥有 11 自由度,搭载 12 个触觉传感器区域;内置 1018 个感应矩阵点数;单手最大提拉重量 40kg。 PUDU DH11 采用仿人手结构的绳驱方案及欠驱动机构,降低自身重量及空间占用,相比传统方案具备更高的灵活性和柔顺度。
11/3/2024 9:56:15 AM
沛霖(实习)
支持中英双语及 40 种方言任意混说,中国电信 TeleAI 星辰语音大模型升级
中国电信人工智能研究院(TeleAI)在今年 5 月发布业内首个支持 30 种方言自由混说的语音识别大模型 —— 星辰超多方言语音识别大模型。 时隔不到半年,TeleAI 星辰语音大模型的多方言能力再次升级,攻克了湛江话、宜宾话、洛阳话、烟台话等方言,将方言种类从 30 种提升至 40 种,并引入对英文的识别。 与传统的有标注训练方法相比,TeleAI 通过预训练语音识别模型,利用海量无标注数据进行预训练,再通过少量有标注数据进行微调。
11/3/2024 9:37:53 AM
沛霖(实习)
马斯克老部下创业成果:2mm 芯片植入视网膜,盲人重获阅读能力还能打牌
把一块 2mm 大小的芯片植入视网膜,搭配一副带摄像头的眼镜,就能成功让盲人恢复视力! 不仅重拾阅读能力,甚至还能打牌。 这是来自美国加州的脑机接口公司 Science 的最新进展。
11/2/2024 3:22:36 PM
清源
每帧都是AI实时生成的,全球首款AI游戏问世了!
欢迎来到 Transformer 的世界。 两个月前,我们对 AI 游戏的认知刚刚被谷歌 GameNGen 颠覆。 他们实现了历史性的突破,从此不再需要游戏引擎,AI 能基于扩散模型,为玩家生成实时可玩的游戏。
11/2/2024 3:04:00 PM
机器之心
MetaGPT开源SELA,用AI设计AI,效果超越OpenAI使用的AIDE
AIxiv专栏是AI在线发布学术、技术内容的栏目。 过去数年,AI在线AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。 如果您有优秀的工作想要分享,欢迎投稿或者联系报道。
11/2/2024 2:48:00 PM
机器之心
谷歌 Agent 首次发现真实世界代码漏洞:抢救全球数亿设备,有望挽回数十亿美元损失
AI 首次发现真实世界中的重大安全漏洞? SQLite 中的一个漏洞,幸运地被谷歌研究者的 AI Agent 发现了,修复后并未造成任何损失。 莫非 AI 再进化一番,微软的全球蓝屏事故就可以永久避免了?
11/2/2024 1:32:26 PM
清源
迪士尼成立新 AI 部门,探索人工智能、混合现实等新型技术的潜力
据路透社报道,华特迪士尼正在组建一个新的小组,以协调公司对人工智能和混合现实等新兴技术的使用,这家媒体巨头正积极探索 AI 等技术在电影、电视和主题公园等业务中的潜力。 根据路透社当地时间周五获取的电子邮件,新成立的“技术赋能办公室”(Office of Technology Enablement)将由杰米・沃里斯(Jamie Voris)领导,他是迪士尼电影制片厂的首席技术官,此前主导了迪士尼为苹果 Vision Pro 混合现实设备开发应用的工作。 迪士尼娱乐联合主席艾伦・伯格曼(Alan Bergman)在邮件中写道:“人工智能和 XR(扩展现实)技术发展迅速,将对未来的消费者体验、创意项目以及我们的业务产生深远影响。
11/2/2024 12:20:36 PM
清源
超方便!3个设计师都在用的免费AI配色工具
6大章节帮你从零开始系统学配色推荐阅读一、前言
在我们平时的设计工作中,色彩是工作中必不可少的元素。 阅读文章 . 在现代设计领域,色彩搭配不仅是审美体现,更是影响用户体验的关键因素。
11/2/2024 8:10:27 AM
58UXD 团队
苹果 AI 研究:“猕猴桃”简单算术考倒 o1 和 Llama 等 20 多个最先进模型
《洛杉矶时报》昨日(11 月 1 日)发布博文,报道称苹果研究团队测试了 20 个最先进的 AI 模型,发现在有干扰项存在的情况下,它们处理简单的算术问题时表现不佳,甚至不如小学生。 苹果公司用以下这道简单的算术题测试 20 多个最先进的 AI 模型,AI在线附上题目如下:Oliver 在星期五采摘了 44 个猕猴桃、然后他在星期六采摘了 58 个猕猴桃,星期日采摘的数量是星期五的两倍,不过其中有 5 个猕猴桃的块头要比平均值要小,请问 Oliver 这三天共摘了多少个猕猴桃? 正确答案是 190 个,计算公式为 44(星期五) 58(星期六) 88(44*2,星期日)。
11/2/2024 7:41:20 AM
故渊
克服奖励欺骗:Meta 发布全新后训练方式 CGPO 编程水平直升 5%,打破 RLHF 瓶颈
CGPO 框架通过混合评审机制和约束优化器,有效解决了 RLHF 在多任务学习中的奖励欺骗和多目标优化问题,显著提升了语言模型在多任务环境中的表现。 CGPO 的设计为未来多任务学习提供了新的优化路径,有望进一步提升大型语言模型的效能和稳定性。 近年来,随着大规模语言模型(LLMs)的发展,特别是通用大模型的应用场景愈发广泛,RLHF 逐渐成为调整和优化语言模型输出的主流方法。
11/1/2024 10:31:28 PM
问舟
奥特曼回答一切:Ilya确实看到了了不起的东西,OpenAI也缺算力
北京时间 11 月 1 日凌晨,OpenAI 宣布为 ChatGPT 推出了最新的人工智能搜索体验。 在宣布发布 ChatGPT 搜索后不久,OpenAI 还在 Reddit 上进行了 AMA 问答。 在问到 Ilya 到底看到了什么时?
11/1/2024 4:56:00 PM
机器之心
豆包大模型团队开源RLHF框架,训练吞吐量最高提升20倍
强化学习(RL)对大模型复杂推理能力提升有关键作用,但其复杂的计算流程对训练和部署也带来了巨大挑战。 近日,字节跳动豆包大模型团队与香港大学联合提出 HybridFlow。 这是一个灵活高效的 RL/RLHF 框架,可显著提升训练吞吐量,降低开发和维护复杂度。
11/1/2024 2:44:00 PM
新闻助手
夸克发布“灵知”学习大模型,号称考研数学题正确率、得分率比肩 OpenAI o1
夸克今日宣布全面升级“AI 搜题”产品,用户可通过手机、平板、电脑等设备搜到各类新题和难题,AI 还会分步骤进行题目讲解,并支持用户随时提问。 据介绍,夸克 AI 还可围绕题目中的知识点与考点进行深度讲解,精准定位关键步骤,能够以“启发式”学习的体验让用户不仅学会这一道难题,还能举一反三学会一类题。 同时,夸克发布“灵知”学习大模型。
11/1/2024 12:54:46 PM
清源
“成都造”机器狗在宽窄巷子当夜间“巡逻员”,机器人进入景区将迎常态化
据《成都商报》昨日报道,10 月 30 日晚,机器狗“灵瞳”作为“巡逻员”在宽窄巷子投入使用,其任务是根据景区木制建筑及道路特点,进行夜间安全巡逻示范,巡逻内容包括火灾防范、治安维护等。 此次机器人产品的亮相,是机器人进场景长效机制的首次实践,标志着“成都造”机器人进入景区工作的常态化序幕正式拉开。 未来,将有更多不同类型和功能的机器人,进入春熙路、大熊猫繁育研究基地等景区承担不同工种并进行常态化工作。
11/1/2024 10:27:57 AM
清源
机器人迈向ChatGPT时刻!清华团队首次发现具身智能Scaling Laws
AIxiv专栏是AI在线发布学术、技术内容的栏目。 过去数年,AI在线AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。 如果您有优秀的工作想要分享,欢迎投稿或者联系报道。
11/1/2024 10:21:00 AM
机器之心
谷歌推出新付费功能,借助搜索结果对抗 AI 幻觉问题
谷歌公司昨日(10 月 31 日)发布新闻稿,宣布在其 Google AI Studio 和 Gemini API 中,推出 Grounding with Google Search 功能,支持用户通过谷歌搜索验证 AI 回答内容。 主流大模型的挑战包括 OpenAI、Anthropic 和 Google 在内,大部分大语言模型(LLM)由于训练数据集的原因,都有 1 个知识截止日期,因此在回答近期相关事件时,都表现得非常糟糕。 新功能简介Grounding with Google Search 功能旨在解决大型语言模型(LLM)在处理最新事件时的响应不足问题,开发者通过结合实时搜索,可以获得更准确和时效性的信息,提升 AI 应用的可靠性和实用性。
11/1/2024 9:47:27 AM
故渊
资讯热榜
OpenAI 开源模型被 Meta 研究员“逆改”!只动0.3%参数,gpt-oss-20B 解锁无约束基座
奥特曼:我承认GPT-5发布搞砸了
首个面向肽分子设计的大模型平台:直接「读序列」出结合子,无需结构输入即可生成
阿里千问踢馆子了!Qwen3新作秒杀ChatGPT,侧脸杀切换第一人称视角,表情包绝绝子,小编:再也不用美图秀秀去水印了
小红书发布DynamicFace人脸生成技术,实现高质量图像视频人脸融合
网易有道发布子曰教育大模型多款AI新品,定义教育AI应用能力L1-L5分级
深度揭秘OpenAI如何让GPT-5「技术性」超越Claude:悄悄跳过最难的23道题
摩根士丹利:AI 革命将为标准普尔 500 指数企业每年节省近 1 万亿美元
标签云
AI
人工智能
OpenAI
AIGC
模型
ChatGPT
DeepSeek
AI绘画
谷歌
机器人
数据
大模型
Midjourney
开源
智能
用户
Meta
微软
GPT
学习
技术
图像
Gemini
马斯克
AI创作
智能体
论文
Anthropic
英伟达
代码
训练
算法
Stable Diffusion
芯片
AI新词
LLM
蛋白质
腾讯
开发者
生成式
Claude
苹果
Agent
AI for Science
神经网络
3D
机器学习
研究
生成
xAI
人形机器人
AI视频
计算
Sora
百度
GPU
AI设计
华为
工具
大语言模型
搜索
具身智能
RAG
字节跳动
大型语言模型
场景
深度学习
预测
伟达
视觉
Transformer
视频生成
AGI
架构
神器推荐
亚马逊
Copilot
DeepMind
特斯拉
应用