字节跳动
字节跳动推出 VAPO 框架:突破 AI 推理极限,Qwen2.5-32B 提分 12 倍超 Deepseek-R1
字节跳动Seed团队推出VAPO强化学习框架,针对大型语言模型在复杂任务中的推理能力进行优化。VAPO通过三项创新技术,显著提升模型性能,在AIME24基准测试中得分从5分跃升至60.4分。#AI技术# #字节跳动#
4/12/2025 1:46:13 PM
故渊
200B参数击败满血DeepSeek-R1,字节豆包推理模型Seed-Thinking-v1.5要来了
字节跳动豆包团队今天发布了自家新推理模型 Seed-Thinking-v1.5 的技术报告。 从报告中可以看到,这是一个拥有 200B 总参数的 MoE 模型,每次工作时会激活其中 20B 参数。 其表现非常惊艳,在各个领域的基准上都超过了拥有 671B 总参数的 DeepSeek-R1。
4/11/2025 11:21:00 AM
机器之心
MySQL遇到AI:字节跳动开源 MySQL 虚拟索引 VIDEX
虚拟索引技术(virtual index,也称为 hypothetical index)在数据库系统的查询优化、索引推荐等场景中扮演着关键角色。 简单来说,虚拟索引可以理解为数据库的'沙盘推演'系统——无需真实构建索引,仅基于统计信息即可精准模拟不同索引方案对查询计划的优化效果。 由于虚拟索引的创建/删除代价极低,使用者可以大量创建和删除索引、反复推演,确定最有效的索引方案。
4/9/2025 9:20:00 AM
字节跳动开源
全网都在猜,这些视频是不是字节AI生成的:该跟动捕说再见了?
在 GPT-4o 的风到处吹时,X 平台(原推特)上有好多带视频的帖子爆了。 到底是什么引来了一百万的浏览量? 没错,是玛丽莲・梦露「活了过来」。
4/5/2025 5:28:00 PM
机器之心
字节跳动豆包新版深度思考开启测试,支持边想边搜
据介绍,和之前的深度思考不同,新版功能将推理过程的思维链与搜索深度结合,支持边想边搜。思考过程中,豆包可基于推理多次调用工具、搜索信息,提供更加全面、准确的结果。
3/28/2025 9:30:23 AM
浩渺
前字节跳动AI技术专家加盟千寻智能,出任具身智能部负责人
近日,前字节跳动 AI 技术专家解浚源在朋友圈官宣加入具身智能创业公司千寻智能,并发布了千寻智能最新披露的 Spirit v1 VLA 演示视频。 据悉,解浚源目前任职千寻智能具身智能部负责人,全面负责具身大模型的研发工作。 解浚源,本科毕业于中国科学技术大学,博士毕业于美国华盛顿大学。
3/21/2025 1:01:00 PM
机器之心
字节跳动豆包大模型团队召开全员会,探索 AI 新高度
在人工智能领域蓬勃发展的背景下,字节跳动的豆包大模型团队(Seed)近日召开了一次全员会议,标志着该团队在未来发展方向上的重要决策。 会议由朱文佳与新任 AI 基础研究负责人吴永辉共同主持,这也是两位领导首次同台出席,吸引了业内的广泛关注。 会议上,朱文佳和吴永辉明确表示,Seed 团队的首要目标是 “探索智能上限”,这将成为团队未来工作的核心导向。
3/19/2025 9:39:00 AM
AI在线
告别“无声视频”尴尬!字节AI音效生成模型SeedFoley上线即梦 一键生成大片感音效
还在为短视频配音效抓耳挠腮?还在苦苦寻找合适的BGM却总是差强人意?现在,字节跳动直接放出王炸级AI黑科技,一举打破视频创作的最后一道静音魔咒!他们最新推出的SeedFoley音效生成模型,如同为视频注入了声命之魂,只需轻轻一点,就能为你的视频智能匹配专业级音效,瞬间让你的作品从默片变身有声大片,效果堪称惊艳!更令人振奋的是,这项AI音效神技已火速上线字节跳动旗下视频创作平台即梦,人人都能秒速体验一键音效加持的神奇魔力!SeedFoley究竟是如何做到如此声入人心的?其核心奥秘在于它采用了革命性的端到端架构,如同一个精密的声音魔术师,巧妙地融合了视频的时空特征与强大的扩散生成模型,实现了音效与视频内容的高度同步和完美契合。 简单来说,SeedFoley首先会对视频进行抽帧分析,就像给视频做CT扫描一样,提取出每一帧画面的关键信息,再通过一个视频编码器深度解读视频内容,理解视频中发生了什么,然后将这些视频理解投射到条件空间,为后续的音效生成指明方向。 在音效生成的高速公路上,SeedFoley采用了改进的扩散模型框架,如同拥有无限创意的声音设计师,根据视频内容,智能生成与之完美匹配的音效方案。
3/13/2025 10:27:00 AM
AI在线
字节跳动豆包文生图技术报告发布:数据处理、预训练、RLHF 全流程公开
据介绍,豆包大模型团队文生图模型 Seedream 2.0 于 2024 年 12 月初在豆包 App 和即梦上线,已服务上亿 C 端用户。
3/12/2025 1:26:51 PM
问舟
字节音效生成模型来了,一键生成大片感音效!已上线即梦
在 AIGC 持续突破视频生成边界的当下,音效制作仍是制约行业发展的瓶颈。 字节跳动豆包大模型语音团队最新提出的 SeedFoley 模型,通过端到端架构实现了视频音效的智能生成,将 AI 视频创作带入「有声时代」。 相关功能「AI 音效」已在即梦上线,用户使用即梦生成视频后,选择「AI 音效」功能,即可生成 3 个专业级音效方案。
3/11/2025 5:17:00 PM
机器之心
“专为我开了一个新课题”,顶尖博士为什么偏爱去字节实习?
在字节跳动,有这样一群实习生,他们的另一重身份,都是来自顶尖高校的技术博士。 实习第 100 天,团队为了清华博士云飞专门开了一个全新课题。 北大博士瑞晨曾经不得已搁置的想法,也在这里实现了大规模验证。
3/10/2025 6:46:00 PM
机器之心
字节跳动豆包大模型团队开源MoE架构优化技术,训练成本节省40%
字节跳动豆包大模型团队官宣开源一项针对 MoE(混合专家模型)架构的关键优化技术,可将大模型训练效率提升 1.7 倍,成本节省 40%。据悉,该技术叫做 COMET,已实际应用于字节的万卡集群训练,累计帮助节省了数百万 GPU 小时训练算力。
3/10/2025 5:42:41 PM
远洋
字节跳动Trae一手实测来了,懂编程也懂中文用户的AI IDE
前些天,字节跳动的 AI IDE 产品 Trae 上线了国内版本,其具备「中文语境深度适配 全功能免费开放」的双重杀手锏,一上线就收获了不少支持者。 全网一片夸赞,很少能看见批评的声音。 现在,虽然 Trae 的热度已经有所退减,但仍旧是非常值得我们关注的 AI IDE。
3/8/2025 3:28:00 PM
机器之心
字节跳动豆包上线「深度思考」推理模式,覆盖问答、搜索、写作和阅读场景
2025 年 3 月 5 日,豆包宣布上线「深度思考」推理模式,全面覆盖问答、搜索、写作和阅读场景。要想进入「深度思考」推理模式,用户只需在输入框打开「深度思考Beta」开关即可。
3/6/2025 10:24:47 AM
问舟
即梦 AI 上线 “动作模仿” 功能:照片 + 参考视频即可让人物动起来
用户从“数字人”入口进入,只需上传一张人物图片和一条参考视频,就能生成一条动态视频,让图片里的人物模拟参考视频中的人物动作,亦能实现情绪的一比一还原。
3/5/2025 3:53:26 PM
清源
DeepSeek 反思潮:AGI 既被重新审视,又被持续低估
2 月很有意思。 一、DeepSeek 反思潮在 DeepSeek 的集体反思潮中,无论是大厂内部的“AGI 创业团队”、还是 AGI 的明星创业公司,都进行了战略调整。 很显然,DeepSeek 的暴击让整个行业都进行了一次深刻的反思,值得注意的几个变化是:首先,大模型创业公司重新将技术突破提升到一个新的高度、超越产品更新成为公司战略发展的优先级。
2/28/2025 11:45:00 PM
陈彩娴
字节旗下又一应用“悟空浏览器”接入 DeepSeek,下一步或是抖音
尽管此前,字节跳动旗下飞书和火山引擎相继宣布接入 DeepSeek,但与这些产品有所不同,悟空浏览器更偏向 C 端用户,并且是融合了抖音 + 番茄小说的内容端 App。
2/27/2025 8:11:48 AM
罗宁
报道称字节跳动旗下AI产品 “即梦” 考虑接入 DeepSeek
据“晚点 LatePost”报道,字节跳动旗下的 AI 产品 “即梦” 正在考虑接入热门 AI 工具 DeepSeek。 报道提到,用户可以先利用 DeepSeek 生成更加精细的视频脚本,然后再将其输入即梦进行视频制作。 这种结合将为用户带来更高效、更专业的创作体验。
2/26/2025 10:06:00 AM
AI在线
资讯热榜
标签云
人工智能
OpenAI
AIGC
AI
ChatGPT
AI绘画
DeepSeek
数据
模型
机器人
谷歌
大模型
Midjourney
智能
用户
开源
学习
GPT
微软
Meta
图像
AI创作
技术
论文
Stable Diffusion
马斯克
Gemini
算法
蛋白质
芯片
代码
生成式
英伟达
腾讯
神经网络
研究
计算
Anthropic
3D
Sora
AI for Science
AI设计
机器学习
开发者
GPU
AI视频
华为
场景
人形机器人
预测
百度
苹果
伟达
Transformer
深度学习
xAI
模态
字节跳动
Claude
大语言模型
搜索
驾驶
具身智能
神器推荐
文本
Copilot
LLaMA
算力
安全
视觉
视频生成
训练
干货合集
应用
大型语言模型
科技
亚马逊
智能体
DeepMind
特斯拉