快手
5天连更5次,可灵AI年末“狂飙式”升级
允中 发自 凹非寺. 量子位 | 公众号 QbitAI12月伊始,可灵AI接连放出大招。 全球首个统一的多模态视频及图片创作工具“可灵O1”、具备“音画同出”能力的可灵2.6模型、可灵数字人2.0功能…….
12/10/2025 2:28:37 PM
思邈
视频理解霸榜!快手Keye-VL旗舰模型重磅开源,多模态视频感知领头羊
Keye-VL-671B-A37B正式发布! 作为快手新一代旗舰多模态大语言模型,在保持基础模型强大通用能力的前提下,对视觉感知、跨模态对齐与复杂推理链路进行了系统升级,实现了多模态理解和复杂推理的全方位性能跃升:更会“看”、更会“想”、也更会“答”。 无论是日常场景还是高难任务,都能给出更准确、更稳健的回应。
11/28/2025 5:28:55 PM
量子位的朋友们
让LLM不再话痨,快手HiPO框架来了
当用户向大语言模型提出一个简单问题,比如「单词 HiPPO 里有几个字母 P? 」,它却正襟危坐,开始生成一段冗长的推理链:「首先,让我们分析 HiPPO 这个词,河马的英文单词为 hippo,河马是一种半水生哺乳动物,这里用户用了大写字母,可能有特殊的含义,对于单词 HiPPO,我们可以将其拆分为 H-i-P-P-O,字母 P 出现在第 3 与第 4 个位置,因此有 2 个字母 P... 让我们简化问题,HiPO 可以拆分为...」面对这样的「严谨」,用户难免哭笑不得,既浪费了计算资源,也增加了等待时间,甚至更坏的情况是模型被自己冗长的推理链「绕晕了过去」,最终给出了错误的答案,用户只得捶胸顿足地大喊:「这合理吗?
11/3/2025 3:28:00 PM
机器之心
扔掉人工公式:快手EMER框架,用“会比较、自进化”的模型重构短视频推荐排序
当你打开短视频 App,手指上下滑动的每一秒,背后都藏着一套决定 “你接下来看什么” 的排序逻辑。 过去十年,行业里的推荐排序大多依赖 “人工设计公式”—— 工程师们把 “用户会不会点赞”、“能看多久” 等指标,按经验分配权重、套进公式,算出每个视频的 “优先级分数”。 但这套模式正在遭遇瓶颈:有人喜欢 “短平快” 的搞笑视频,有人偏爱 “慢节奏” 的生活记录,一套公式怎么满足千万用户的个性化需求?
10/30/2025 12:08:00 PM
机器之心
VAE再被补刀!清华快手SVG扩散模型亮相,训练提效6200%,生成提速3500%
前脚谢赛宁刚宣告VAE在图像生成领域退役,后脚清华与快手可灵团队也带着无VAE潜在扩散模型SVG来了。 该方法实现了在训练效率上62倍、生成速度上35倍的提升。 VAE为何被接连抛弃?
10/28/2025 3:35:11 PM
闻乐
快手Klear团队提出CE-GPPO:通过梯度保留协调熵,解决强化学习中的熵不稳定问题
本研究由快手科技 Klear 语言大模型团队完成,核心作者苏振鹏,潘雷宇,吕民轩,胡文凭,张富峥,周国睿等。 快手 Klear 语言大模型团队聚焦在基础语言大模型研发、Agent RL 等前沿技术创新等方向,积累务实的探索 AGI 的能力边界,并不断推进 AI 领域新技术和新产品的发展。 此前,该团队已开源了 Klear-46B-A2.5B 和 Klear-Reasoner-8B 等模型,其中 Klear-Reasoner-8B 在数学和代码的基准测试上达到了同参数级别模型的 SOTA 效果。
10/25/2025 10:29:00 PM
机器之心
快手进军AI编程!“模型+工具+平台”一口气放三个大招
时令 发自 凹非寺. 量子位 | 公众号 QbitAIAI编程领域竞争正酣。 就在DeepSeek、阿里、Google、OpenAI等巨头纷纷展示最新代码生成能力之际,快手也交出了一份重量级答卷——.
10/24/2025 3:12:49 PM
时令
清华、快手提出AttnRL:让大模型用「注意力」探索
从 AlphaGo 战胜人类棋手,到 GPT 系列展现出惊人的推理与语言能力,强化学习(Reinforcement Learning, RL)一直是让机器「学会思考」的关键驱动力。 然而,在让大模型真正掌握「推理能力」的道路上,探索效率仍是一道难以逾越的鸿沟。 当下最前沿的强化学习范式之一——过程监督强化学习(Process-Supervised RL, PSRL),让模型不再只看「结果对不对」,而是学会在「推理过程」中不断修正自己。
10/21/2025 5:39:00 PM
机器之心
Agentic Coding表现创新高,全新KAT系列模型上榜SWE-Bench
近期,快手 Kwaipilot 团队推出了 KAT 系列两款突破性 Agentic Coding 大模型:开源 32B 参数模型 KAT-Dev-32B 与闭源旗舰模型 KAT-Coder。 这两款模型在 Code Intelligence 领域分别体现出轻量级的超强表现和极致性能。 其中,在 SWE-Bench Verified 上,KAT-Dev-32B 展现出强劲性能并取得了 62.4% 的解决率,在所有不同规模的开源模型中排名第 5。
9/26/2025 7:28:00 PM
机器之心
快手解密「AI印钞机」,首提生成式强化学习出价技术,为平台实现超过3%的广告收入提升
前段时间,谷歌母公司 Alphabet 市值突破 3 万亿美元,成为第四家市值达到这一门槛的公司。 如果时间倒回到两年半以前,谷歌自己可能都没有想到这一结果。 当时,ChatGPT 带来的冲击让外界开始质疑谷歌能否守住营收,尤其是广告营收。
9/23/2025 1:30:00 PM
机器之心
OneSearch,揭开快手电商搜索「一步到位」的秘技
还有一个多月,一年一度的“双十一”购物节就要来了! 作为消费者,你通常会如何寻找心仪的商品呢? 或许你兴致勃勃地在搜索框里敲下关键词,却发现呈现出来的商品列表总是差强人意。
9/18/2025 1:28:00 PM
机器之心
从「对口型」到「会表演」,刚进化的可灵AI数字人,技术公开了
让数字人的口型随着声音一开一合早已不是新鲜事。 更令人期待的,是当明快的旋律响起,它会自然扬起嘴角,眼神含笑;当进入说唱段落,它会随着鼓点起伏,肩膀与手臂有节奏地带动气氛。 观众看到的不再只是嘴在动,而是整个人在表演。
9/15/2025 8:49:00 PM
机器之心
快手可灵团队提出MIDAS:压缩比64倍、延迟低于500ms,多模态互动数字人框架实现交互生成新突破
数字人视频生成技术正迅速成为增强人机交互体验的核心手段之一。 然而,现有方法在实现低延迟、多模态控制与长时序一致性方面仍存在显著挑战。 大多数系统要么计算开销巨大,无法实时响应,要么只能处理单一模态输入,缺乏真正的交互能力。
9/13/2025 6:17:00 PM
机器之心
可灵 AI 季度收入突破2.5亿,助力快手业绩创新高
快手在2025年第二季度业绩报告中再次取得骄人表现,其中可灵 AI 的贡献尤为突出,季度收入突破2.5亿元(约合3500万美元),成为公司收入增长的重要驱动力。 这一成绩标志着可灵 AI 在市场上的快速崛起,显示出其在商业化方面的巨大潜力。 根据快手发布的财报,2025年第二季度,公司总收入达到350.4亿元,同比增长13%。
8/22/2025 1:34:07 PM
AI在线
快手 Q2 财报出炉:营收超预期,可灵AI收入2.5亿元
根据快手最新发布的2025年第二季度财报,公司实现营收350.5亿元,超出市场预期的344.5亿元,同比增长13.1%。 这一增长得益于短剧与电商业务的双轮驱动。 报告显示,快手的调整后净利润达到56.2亿元,远超预期的50.6亿元,同比也有20.1% 的增长。
8/22/2025 9:27:40 AM
AI在线
1.5B刷新数学代码SOTA!快手&清华精细化Token管理,LLM推理能力飙升
当大模型在数学题和代码任务里“卷”参数规模时,一支来自快手和清华的团队给出了不同答案——. 他们用1.5B参数的小模型,在多个推理基准上干过了同量级SOTA。 秘密在于给模型的“学习过程”做了精细化管理:让该记牢的知识稳住,让该灵活的推理放开。
7/31/2025 12:13:29 PM
不圆
累计生成超2亿视频!快手可灵AI上线以来迭代已超30次
7月27日,在2025世界人工智能大会期间,快手可灵AI举办了以“生成式AI应用元年”为主题的生态论坛。 会上披露的信息显示,可灵AI目前已在全球拥有超过4500万创作者,产品自发布以来迭代升级30余次,累计生成超2亿个视频和4亿张图片,服务超过2万家企业客户。 在这场围绕着生成式AI产业应用展开的论坛上,与会嘉宾深入探讨AI如何赋能影视、创作领域、电商及游戏等各行业,行业合作伙伴、知名导演及创作者们共同探索生成式AI的多元应用场景。
7/28/2025 3:25:04 PM
量子位的朋友们
WAIC直击|快手可灵AI引领「生成式AI应用元年」,累计生成超2亿视频
7 月 27 日,在 2025 世界人工智能大会期间,快手可灵 AI 举办了以 “生成式 AI 应用元年” 为主题的生态论坛。 会上披露的信息显示,可灵 AI 目前已在全球拥有超过 4500 万创作者,产品自发布以来迭代升级 30 余次,累计生成超 2 亿个视频和 4 亿张图片,服务超过 2 万家企业客户。 在这场围绕着生成式 AI 产业应用展开的论坛上,与会嘉宾深入探讨 AI 如何赋能影视、创作领域、电商及游戏等各行业,行业合作伙伴、知名导演及创作者们共同探索生成式 AI 的多元应用场景。
7/28/2025 2:24:00 PM
机器之心
资讯热榜
标签云
AI
人工智能
OpenAI
AIGC
模型
ChatGPT
谷歌
DeepSeek
AI绘画
大模型
机器人
数据
AI新词
Midjourney
开源
Meta
微软
智能
用户
GPT
学习
技术
智能体
Gemini
马斯克
Anthropic
英伟达
图像
AI创作
训练
LLM
论文
代码
算法
苹果
AI for Science
Agent
Claude
腾讯
芯片
Stable Diffusion
蛋白质
具身智能
开发者
xAI
生成式
神经网络
机器学习
人形机器人
3D
AI视频
RAG
大语言模型
Sora
研究
百度
生成
GPU
工具
华为
字节跳动
计算
AGI
大型语言模型
AI设计
搜索
生成式AI
视频生成
DeepMind
特斯拉
场景
AI模型
深度学习
亚马逊
架构
Transformer
MCP
编程
Copilot
视觉