字节跳动
联想携手字节跳动推进 AI 手机合作,内部揭示更多业务动态
最近,联想与字节跳动的合作引发了广泛关注。 根据媒体报道,字节跳动正在加快与包括 vivo、联想、传音等在内的硬件厂商进行 AI 手机的合作,目的是在这些设备上预装 AIGC 插件,从而提升用户的使用体验和获取入口。 这一举措旨在改变 AI 在实际应用中的被动局面,进而拓展市场。
豆包上线 Seedance 1.5 Pro,可直接生成有声视频
字节跳动新一代音视频创作模型 “Seedance1.5Pro” 正式登陆豆包,为普通用户打开了 “零门槛做有声视频” 的新体验。 这次上线的 Seedance1.5Pro,核心是把 “文字 - 画面 - 声音” 的创作链路做了一体化升级:语义 音画同步:不再是先出画面再配声音,模型能深度理解文本意图,同步生成匹配内容的画面与音效、台词,避免 “音画脱节”;更自然的 “开口说话”:生成的人物台词不再是机械合成音,语气、节奏更贴近真人表达;电影感叙事 动态镜头:画面会自带景别切换、运镜效果,复杂动作(比如人物的肢体互动)也能被精准捕捉,不用再手动调特效。 普通用户的操作也很简单:打开豆包 App 对话框,点击 “照片动起来” 功能,选择 “1.5Pro” 模型,上传一张参考图(比如自己的生活照、手绘草稿),再输入提示词(比如 “让这只猫用温柔的语气讲睡前故事,背景是星空卧室”),就能直接生成一条完整的有声视频。
字节跳动 AI 手机合作方案曝光,免收 Token 分成开启“让利换入口”
据界面报道,字节跳动正积极推进与 vivo、联想、传音等头部硬件厂商的 AI 手机深度合作,计划通过在设备操作系统层面预装 AIGC 插件(如“豆包手机助手”),以此攫取至关重要的 AI 流量入口,并扭转目前大模型在执行层面的被动局面。 多位 vivo 内部员工已证实双方确认合作,正在商讨落地细节。 此次合作的核心在于字节跳动开出了极具诱惑力的“分成方案”。
火山引擎相关人士回应“豆包比价”是否会提高字节产品权重:不会
AI在线 12 月 18 日消息,据搜狐科技,在今天的火山引擎 FORCE 原动力大会后,火山引擎相关人士对“豆包大模型在调用 App 的时候是否会提高字节产品权重”作出回应:“不会提高字节产品权重,AI 完全基于用户指令执行任务。 ”这名相关人士以豆包手机的演示 demo 为例解释说:“豆包手机助手的发布视频中,比价结果选择的是拼多多。 都是 AI 比出来的,没有人为干预。
告别抽卡!一手实测字节刚放出的视频模型Seedance 1.5 pro
编辑|杜伟、杨文结果在2025年底,视频生成再次热闹起来,多个新模型接连登场。 我们发现,在国内的头部厂商中,火山发动机的豆包系列视频生成模型已经很长时间没有大的版本更新了。 前代 Seedance 1.0 pro 的问世已经过去半年时间了,这也让我们对其下一代 Seedance 1.5 的关注度越来越高。
字节跳动推出 TRAE CN 企业版,助力高效编程
字节跳动正式发布了其 AI 编程工具 TRAE CN 的企业版。 这款工具在字节内部已经获得了超过92% 的工程师的使用,显示出其强大的实用性。 同时,个人版的注册用户也已经突破了600万。
字节跳动发布 Seedance 1.5 Pro:AI 音视频创作进入 100% 视听同步时代!
12月16日,字节跳动在北京正式发布了其新一代音视频创作模型 ——Seedance1.5pro。 这一全新的创作工具不仅在音视频生成领域实现了重大突破,还为用户带来了更为丰富的视听体验。 Seedance1.5pro 支持音视频的联合生成,用户可以通过文本输入生成音视频内容,或者利用图像引导生成音视频。
“豆包手机”被监管机构约谈?知情人士称消息不实
AI在线 12 月 13 日消息,近日,有报道称,由于担忧网络安全、数据安全以及潜在的竞争问题,监管机构已经约谈字节跳动相关负责人。 12 月 13 日,对于上述报道,知情人士向澎湃新闻记者回应称,该消息不实。 字节跳动旗下 AI 助手豆包和中兴通讯 12 月 1 日宣布,搭载豆包手机助手技术预览版的工程样机努比亚 M153 少量发售。
薪资直接翻倍!腾讯反向挖角字节AI研究员,人才战风向逆转
据The Information报道,过去几个月里,腾讯向字节跳动的AI研究员开出薪资直接翻倍的挖角条件,且不是个案。 字节大模型团队中的部分核心研究员已接受腾讯邀约,标志着中国互联网大厂AI人才争夺战出现戏剧性风向逆转。 过去一年里主动四处挖人的是字节跳动,如今风向却悄然对调。
保姆级教程!教你用AI生成一首超燃的专业级歌曲(附详细步骤)
一、背景. 最近在思考怎么作一首团队歌曲,要燃一点的,因为Suno需要魔法上网,我就暂且搁置了。 转而用了国内的几个AI音乐生成平台,最终选了字节跳动“海绵”,对我这种小白来说,上手度和完成度都非常高。
豆包语音对话功能更新,能讲4种地道方言,具备思考能力
近日,豆包语音对话功能迎来更新,可以说4种地道方言,包括粤语、四川话、东北话及陕西话。 用户打开豆包App对话框,发送简单的文字或语音指令,要求豆包使用上述方言对话,通过默认的“温柔桃子”升级版音色,即可开启对话体验。 据悉,该功能借助豆包语音模型方言迁移技术,实现单音色说多方言,且具备思考能力,可根据用户意图,灵活切换方言。
字节跳动 PICO 战略升级:2026年推自研芯片新一代 VR 头显
字节跳动在 VR 硬件领域正加速其自研和高端化战略。 在2025年字节跳动奖学金颁奖典礼上,字节跳动技术副总裁杨震原透露,旗下 VR 品牌 PICO 计划于 2026年推出新一代产品。 据杨震原介绍,PICO 新一代头显将搭载全链路自研的头显专用芯片。
3D视觉被过度设计?字节Depth Anything 3来了,谢赛宁点赞
现在,只需要一个简单的、用深度光线表示训练的 Transformer 就行了。 这项研究证明了,如今大多数 3D 视觉研究都存在过度设计的问题。 本周五,AI 社区最热门的话题是一篇新论文,有关 3D 建模的。
字节跳动大模型研究员因泄密被开除!曾频繁在知乎曝光机器人研发细节,公司重拳整治信息安全
近日,公司大模型团队(Seed)研究员任某某已确认离职,据多位内部人士透露,其系因多次泄露公司保密信息被正式辞退。 值得注意的是,任某某在知乎平台拥有超8万粉丝,曾频繁发布涉及字节跳动机器人研发进展、技术路线与内部项目细节的内容,引发高度关注,也最终招致公司纪律审查。 从工程师到“泄密者”:高调分享酿成职业危机公开资料显示,任某某在加入字节前曾任职于珞石科技与小米集团,长期深耕机器人系统集成领域。
字节火山引擎启动高薪招聘,实质性进军“人形具身机器人”赛道
科技巨头字节跳动正以高薪姿态实质性发力最前沿的 人形具身机器人 赛道。 近日,字节跳动旗下 火山引擎团队 启动了一项高规格招聘,公开寻求 “操作算法资深专家(具身智能)”,并开出了每月高达 9.5万元至12万元人民币(95K-120K) 的顶尖待遇。 这一招聘动向显示,字节跳动对具身智能的布局并非泛泛而谈,而是精准锁定了“人形具身机器人”的研发。
字节Seed团队发布循环语言模型Ouro,在预训练阶段直接「思考」,Bengio署名
现代 LLM 通常依赖显式的文本生成过程(例如「思维链」)来进行「思考」训练。 这种策略将推理任务推迟到训练后的阶段,未能充分挖掘预训练数据中的潜力。 为解决这一问题,字节 Seed 团队联合多家机构推出了 Ouro,一类被称为循环语言模型(Looped Language Models)的新型预训练模型,其名称源于象征循环与自我吞噬的「衔尾蛇」(Ouroboros)。
中国科大与字节发布 MoGA 长视频生成模型:分钟级多镜头短片一键生成
中国科学技术大学与字节跳动即将联合发布一款具有里程碑意义的 端到端长视频生成模型。 该模型能够直接生成**分钟级长度、480p 分辨率、24帧/秒(fps)**的高质量视频,并支持多镜头场景切换,标志着国产视频生成技术在全球生成式 AI 竞赛中实现关键突破。 这项成果的核心创新在于其底层算法——MoGA(Modular Global Attention),这是一种全新的注意力机制,专为解决长视频生成中的上下文扩展与算力开销问题而设计。
豆包是如何炼成的?字节放出自研万卡训练系统ByteRobust论文
大型语言模型(LLM)训练的核心基础设施是 GPU。 现如今,其训练规模已达到数万块 GPU,并且仍在持续扩大。 同时,训练大模型的时间也越来越长。
资讯热榜
标签云
AI
人工智能
OpenAI
AIGC
模型
ChatGPT
谷歌
DeepSeek
AI新词
AI绘画
大模型
机器人
数据
Midjourney
开源
Meta
微软
智能
用户
GPT
学习
智能体
Gemini
技术
英伟达
马斯克
Anthropic
图像
AI创作
训练
LLM
论文
代码
AI for Science
腾讯
苹果
算法
Agent
Claude
芯片
具身智能
Stable Diffusion
xAI
蛋白质
开发者
人形机器人
生成式
神经网络
机器学习
AI视频
3D
字节跳动
大语言模型
RAG
Sora
百度
研究
GPU
生成
华为
工具
AGI
计算
生成式AI
AI设计
大型语言模型
搜索
AI模型
亚马逊
视频生成
特斯拉
DeepMind
场景
Copilot
深度学习
Transformer
架构
MCP
编程
视觉