字节跳动
豆包语音对话功能更新,能讲4种地道方言,具备思考能力
近日,豆包语音对话功能迎来更新,可以说4种地道方言,包括粤语、四川话、东北话及陕西话。 用户打开豆包App对话框,发送简单的文字或语音指令,要求豆包使用上述方言对话,通过默认的“温柔桃子”升级版音色,即可开启对话体验。 据悉,该功能借助豆包语音模型方言迁移技术,实现单音色说多方言,且具备思考能力,可根据用户意图,灵活切换方言。
11/28/2025 12:42:59 PM
十三
字节跳动 PICO 战略升级:2026年推自研芯片新一代 VR 头显
字节跳动在 VR 硬件领域正加速其自研和高端化战略。 在2025年字节跳动奖学金颁奖典礼上,字节跳动技术副总裁杨震原透露,旗下 VR 品牌 PICO 计划于 2026年推出新一代产品。 据杨震原介绍,PICO 新一代头显将搭载全链路自研的头显专用芯片。
11/26/2025 3:21:30 PM
AI在线
3D视觉被过度设计?字节Depth Anything 3来了,谢赛宁点赞
现在,只需要一个简单的、用深度光线表示训练的 Transformer 就行了。 这项研究证明了,如今大多数 3D 视觉研究都存在过度设计的问题。 本周五,AI 社区最热门的话题是一篇新论文,有关 3D 建模的。
11/15/2025 9:20:00 PM
机器之心
字节跳动大模型研究员因泄密被开除!曾频繁在知乎曝光机器人研发细节,公司重拳整治信息安全
近日,公司大模型团队(Seed)研究员任某某已确认离职,据多位内部人士透露,其系因多次泄露公司保密信息被正式辞退。 值得注意的是,任某某在知乎平台拥有超8万粉丝,曾频繁发布涉及字节跳动机器人研发进展、技术路线与内部项目细节的内容,引发高度关注,也最终招致公司纪律审查。 从工程师到“泄密者”:高调分享酿成职业危机公开资料显示,任某某在加入字节前曾任职于珞石科技与小米集团,长期深耕机器人系统集成领域。
11/13/2025 4:57:41 PM
AI在线
字节火山引擎启动高薪招聘,实质性进军“人形具身机器人”赛道
科技巨头字节跳动正以高薪姿态实质性发力最前沿的 人形具身机器人 赛道。 近日,字节跳动旗下 火山引擎团队 启动了一项高规格招聘,公开寻求 “操作算法资深专家(具身智能)”,并开出了每月高达 9.5万元至12万元人民币(95K-120K) 的顶尖待遇。 这一招聘动向显示,字节跳动对具身智能的布局并非泛泛而谈,而是精准锁定了“人形具身机器人”的研发。
11/5/2025 2:31:21 PM
AI在线
字节Seed团队发布循环语言模型Ouro,在预训练阶段直接「思考」,Bengio署名
现代 LLM 通常依赖显式的文本生成过程(例如「思维链」)来进行「思考」训练。 这种策略将推理任务推迟到训练后的阶段,未能充分挖掘预训练数据中的潜力。 为解决这一问题,字节 Seed 团队联合多家机构推出了 Ouro,一类被称为循环语言模型(Looped Language Models)的新型预训练模型,其名称源于象征循环与自我吞噬的「衔尾蛇」(Ouroboros)。
11/4/2025 12:03:00 PM
机器之心
中国科大与字节发布 MoGA 长视频生成模型:分钟级多镜头短片一键生成
中国科学技术大学与字节跳动即将联合发布一款具有里程碑意义的 端到端长视频生成模型。 该模型能够直接生成**分钟级长度、480p 分辨率、24帧/秒(fps)**的高质量视频,并支持多镜头场景切换,标志着国产视频生成技术在全球生成式 AI 竞赛中实现关键突破。 这项成果的核心创新在于其底层算法——MoGA(Modular Global Attention),这是一种全新的注意力机制,专为解决长视频生成中的上下文扩展与算力开销问题而设计。
10/24/2025 2:31:35 PM
AI在线
豆包是如何炼成的?字节放出自研万卡训练系统ByteRobust论文
大型语言模型(LLM)训练的核心基础设施是 GPU。 现如今,其训练规模已达到数万块 GPU,并且仍在持续扩大。 同时,训练大模型的时间也越来越长。
10/21/2025 5:45:00 PM
机器之心
Self-Forcing++:让自回归视频生成模型突破 4 分钟时长极限
本工作由加州大学洛杉矶分校与字节 Seed 等团队联合完成。 在扩散模型持续引领视觉生成浪潮的今天,图像生成早已臻于极致,但视频生成仍被一个关键瓶颈困住——时长限制。 目前多数模型还停留在数秒短视频的生成,Self-Forcing 让视频生成首次跨入 4 分钟高质量长视频时代,且无需任何长视频数据再训练。
10/18/2025 9:57:00 PM
机器之心
火山引擎多媒体实验室重要突破!LiveGS 技术登榜 SIGGRAPH,重新定义移动端自由视角视频直播
近日,火山引擎多媒体实验室的最新研究成果 LiveGS: Live Free-Viewpoint Video via High-Performance Gaussian Splatting for Mobile Devices 成功入选计算机图形学顶会 SIGGRAPH Emerging Technologies,并于2025年8月10日至8月14日在加拿大温哥华对外展出。 这一技术突破首次实现了移动端实时自由视角视频(FVV)直播的完整链路落地,在视觉保真度、计算效率和传输成本之间达成了前所未有的平衡,为互动直播、沉浸式娱乐等场景开辟了技术新范式。 图1 论文主页打破技术瓶颈:从实验室走向移动端的实时自由视角革命自由视角视频(FVV)允许用户从任意角度探索场景,是元宇宙、沉浸式直播等前沿领域的核心技术。
9/12/2025 4:51:20 PM
多媒体实验室
VLDB2025 | Magnus: 字节跳动面向大规模机器学习的数据管理方案
导读机器学习广泛应用于字节跳动,数据作为机器学习训练的核心要素,如何高效灵活的管理支撑大规模训练数据的存储、生产以及训练,成为数据基础设施的一大挑战;近两年大模型迅猛发展,对数据集管理也提出了更多新的场景需求。 字节跳动在开源 Apache Iceberg 的基础上,打造了一套面向大规模机器学习的数据管理解决方案 Magnus,在存储格式、索引、元数据管理、更新机制、训练框架集成等多个维度实现优化。 Magnus 已在字节内部部署超过五年,在搜索、广告、推荐、大模型等核心业务中大规模落地,数据规模超5EB,相关成果已被 VLDB 2025收录。
9/10/2025 9:59:52 AM
基础技术训练设施
AI人才争夺战白热化 MiniMax与字节跳动推出大规模期权激励计划
MiniMax和字节跳动近日相继启动大规模期权激励计划,反映出AI行业激烈的人才竞争态势。 据《科创板日报》报道,MiniMax已开始实施期权增发,激励金额从数十万美元到数百万美元不等,覆盖算法工程师、市场人员及职能岗位的核心员工。 公司希望通过这一机制将核心员工利益与长期发展绑定,构建"合伙人"式合作关系。
9/9/2025 9:01:21 AM
AI在线
字节Seedream 4.0将全量开放!抢先评测来了,我们摸索出AI生图20种「邪修」玩法
打开多模态自由创作的大门。 谷歌 Nano Banana 掀起的全球创作狂欢尚未消退之际,字节又玩了把大的。 近日,字节跳动开始内测最新的豆包・图像创作模型 Seedream 4.0。
9/8/2025 5:26:00 PM
机器之心
字节跳动Seed推出「机器人大脑」Robix:让机器人学会思考、规划与灵活互动
近日,字节跳动 Seed 团队发布了最新的机器人研究成果——Robix,一个旨在提升机器人思考、规划与灵活交互能力的「机器人大脑」。 标题:Robix: A Unified Model for Robot Interaction, Reasoning and PlanningArXiv::,通用机器人在处理复杂、长程任务时,往往因依赖 “模块化” 拼接的设计而显得僵化。 Robix 的核心亮点在于其一体化架构:将推理、任务规划与人机交互无缝整合到单个端到端多模态模型中。
9/7/2025 4:19:00 PM
机器之心
不止会动嘴,还会「思考」!字节跳动发布OmniHuman-1.5,让虚拟人拥有逻辑灵魂
想象一个虚拟人,他不仅能精准地对上你的口型,还能在你讲到关键点时做出恍然大悟的表情,在你讲述悲伤故事时流露出同情的神态,甚至能根据你的话语逻辑做出有意义的手势。 这不再是科幻电影的场景。 8 月底,字节跳动数字人团队推出了 OmniHuman-1.5,提出了一种全新的虚拟人生成框架,让虚拟人真正拥有了「思考」和 「表达」的能力。
9/5/2025 3:22:00 PM
机器之心
长视频AI数字人来了!字节×浙大推出商用级音频驱动数字人模型InfinityHuman
随着内容创作智能化需求的爆发,长时长、高质量数字人视频生成始终是行业痛点。 近日,字节跳动商业化 GenAI 团队联合浙江大学推出商用级长时序音频驱动人物视频生成模型 ——InfinityHuman,打破传统音频驱动技术在长视频场景中的局限性,开启 AI 数字人实用化新征程。 从静态图像到动态视频:音频驱动的 "数字复活术"只需提供一张人物图像与对应音频素材,InfinityHuman 就能自动生成连贯自然的高分辨率长视频:无论是 30 秒的产品快推、还是 3 分钟的演讲致辞,均能实现专业级呈现。
9/4/2025 1:00:00 PM
机器之心
字节跳动为Seed部门专注于大模型技术的员工增发股权期权
字节跳动近期宣布了一项针对其 Seed 部门的重大举措,将为该部门专注于大模型技术的员工增发股权期权。 这一计划的,旨在进一步激励和留住这些在人工智能领域具备核心竞争力的人才。 据悉,股权增发的具体细节将依据员工的综合绩效和职级来制定。
9/3/2025 5:01:58 PM
AI在线
字节跳动重奖大模型人才,Seed部门推百万期权激励计划
AIbase报道 据科创板日报消息,字节跳动正为其关键的Seed部门启动一项新的期权增发计划,旨在激励并留住从事大模型方向的核心技术人才。 此举凸显了该公司在人工智能领域的雄心,并加剧了顶尖技术人才的争夺战。 据了解,该激励计划将根据员工的综合绩效和职级进行差异化授予。
9/3/2025 3:31:41 PM
AI在线
资讯热榜
标签云
AI
人工智能
OpenAI
AIGC
模型
ChatGPT
DeepSeek
谷歌
AI绘画
大模型
机器人
数据
AI新词
Midjourney
开源
Meta
微软
智能
用户
GPT
学习
技术
智能体
马斯克
Gemini
Anthropic
英伟达
图像
AI创作
训练
LLM
论文
代码
算法
AI for Science
苹果
Agent
Claude
芯片
腾讯
Stable Diffusion
蛋白质
开发者
xAI
具身智能
生成式
神经网络
机器学习
3D
人形机器人
AI视频
RAG
大语言模型
研究
百度
Sora
生成
GPU
工具
华为
计算
字节跳动
AI设计
AGI
大型语言模型
搜索
生成式AI
视频生成
场景
DeepMind
特斯拉
深度学习
AI模型
架构
MCP
亚马逊
Transformer
编程
视觉
预测