豆包大模型
字节音效生成模型来了,一键生成大片感音效!已上线即梦
在 AIGC 持续突破视频生成边界的当下,音效制作仍是制约行业发展的瓶颈。 字节跳动豆包大模型语音团队最新提出的 SeedFoley 模型,通过端到端架构实现了视频音效的智能生成,将 AI 视频创作带入「有声时代」。 相关功能「AI 音效」已在即梦上线,用户使用即梦生成视频后,选择「AI 音效」功能,即可生成 3 个专业级音效方案。
3/11/2025 5:17:00 PM
机器之心
大模型效率狂飙:字节COMET技术开源,提速1.7倍
字节跳动旗下豆包大模型团队近日宣布,成功攻克混合专家模型(MoE)架构的关键瓶颈,并开源一项名为COMET的重大优化技术。 该技术显著提升了大模型的训练效率,实现了高达1.7倍的效率提升,并有效降低了40%的训练成本。 图源备注:图片由AI生成,图片授权服务商Midjourney据介绍,COMET技术已在字节跳动的万卡集群训练中得到实际应用,累计节省了数百万GPU小时的训练算力。
3/10/2025 5:59:00 PM
AI在线
字节跳动豆包上线「深度思考」推理模式,覆盖问答、搜索、写作和阅读场景
2025 年 3 月 5 日,豆包宣布上线「深度思考」推理模式,全面覆盖问答、搜索、写作和阅读场景。要想进入「深度思考」推理模式,用户只需在输入框打开「深度思考Beta」开关即可。
3/6/2025 10:24:47 AM
问舟
字节跳动豆包小范围测试深度思考模型,并非接入 DeepSeek
字节跳动旗下AI助手豆包正小范围测试自研深度思考模型,非DeepSeek接入。部分用户已体验思维链功能,官方确认正在测试不同实验版本。
2/25/2025 3:56:09 PM
问舟
超越DeepSeek-ProverV1.5!豆包首个形式化数学推理模型BFS-Prover来了,直接开源
AIxiv专栏是AI在线发布学术、技术内容的栏目。 过去数年,AI在线AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。 如果您有优秀的工作想要分享,欢迎投稿或者联系报道。
2/25/2025 2:11:00 PM
机器之心
豆包:视频生成模型 “VideoWorld” 已开源 实现纯视觉学习
据豆包大模型团队官方公众号消息,在北京交通大学和中国科学技术大学的联合研究下,由豆包大模型团队提出的 “VideoWorld” 视频生成实验模型近日正式开源。 这个模型的最大亮点在于,它不再依赖传统的语言模型,而是仅凭视觉信息就能认知和理解世界。 这一突破性的研究灵感来源于李飞飞教授在 TED 演讲中提到的 “幼儿可以不依靠语言理解真实世界” 的理念。
2/10/2025 2:22:00 PM
AI在线
Video Depth Anything来了!字节开源首款10分钟级长视频深度估计模型,性能SOTA
AIxiv专栏是AI在线发布学术、技术内容的栏目。 过去数年,AI在线AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。 如果您有优秀的工作想要分享,欢迎投稿或者联系报道。
1/27/2025 8:33:00 PM
机器之心
百万tokens仅需8毛,不蒸馏造出世界一流大模型,豆包全新1.5Pro不走捷径
马上就要进入蛇年了,国内的 AI 厂商们却完全没有闲下来的意思,正在春节前扎堆发布各自的新一代大模型。 本周一,豆包刚刚上线了全新的实时语音功能,可说是在中文语音对话方面做到了断崖式领先,为终端用户带来了智商与情商双高的实时语音助手和聊天伙伴。 第二天,月之暗面与 DeepSeek 都各自推出了可比肩满血版 o1 的推理模型,吸引了中外无数眼球。
1/23/2025 12:01:00 PM
机器之心
百万 tokens 降至 0.8 元后,消息称字节跳动豆包大模型毛利率达 50%
据界面新闻今日援引多个知情人士消息称,字节跳动旗下的豆包大模型在去年大幅降价后,毛利率仍然为正。
1/22/2025 6:13:02 PM
清源
豆包大模型披露2024技术进展,亮相7个月综合能力全面对齐GPT-4o
12月30日,字节豆包大模型对外披露2024全领域技术进展。 距5月15日首次亮相仅7个月,豆包大模型在通用语言、视频生成、语音对话、视觉理解等方面模型能力均已跨入国际第一梯队。 豆包大模型团队表示,“从孩童般学语,到懵懂看世界,到为创作者绘出想象中的奇幻梦境,一切依然处于最早期。
12/30/2024 3:15:07 PM
豆包视觉理解模型惊艳亮相:首次评测就排名全球第二
12 月 18 日-19 日,火山引擎 FORCE 原动力大会・冬正式在上海举行。本次大会最引人关注的看点,无疑就是豆包大模型家族的全线升级,以及全新豆包视觉理解模型的发布
12/23/2024 2:50:02 PM
汐元
豆包说要「普惠」,于是大模型处理图片按「厘」计价了
这段时间,OpenAI 宣告连续 12 轮轰炸,让 2024 年底的大模型领域热闹起来了。 但坚持每个凌晨看直播的话会发现,越到后面的发布越平淡,内心的波动也越少了。 今年的大模型就卷到这里了吗?
12/23/2024 1:06:00 PM
机器之心
抖音副总裁李亮:希望用更低成本推动 AI 技术普惠和应用发展
在昨日举行的火山引擎 Force 大会上,字节跳动正式发布豆包视觉理解模型,为企业提供多模态大模型能力。千 tokens 输入价格仅为 3 厘,一元钱就可处理 284 张 720P 的图片,官方宣称比行业价格便宜 85%。
12/19/2024 3:35:58 PM
浩渺
代码大模型考卷升级!字节开源FullStack Bench,首次覆盖全栈编程超11类真实场景
代码大模型越来越卷,评估AI编程水平的“考卷”也被迫升级。 12月5日,字节豆包大模型团队开源最新代码大模型评估基准FullStack Bench,在业界首次囊括编程全栈技术中超11类真实场景,覆盖16种编程语言,包含3374个问题,相比此前基准,可以更有效地评估大模型在现实世界中的代码开发能力。 代码评估基准是衡量大模型编程能力的标准工具,也是推动模型优化的关键驱动力。
12/5/2024 3:22:19 PM
真·打字P图!字节发布新模型SeedEdit,一句话爆改世界名画,可免费体验
一句话实时P图,网友又能整活了。 字节豆包大模型又又又上新了! 11 月 11 日,字节跳动豆包大模型团队推出了最新图像编辑模型 SeedEdit,主打一句话轻松 P 图。
11/11/2024 1:26:00 PM
机器之心
字节豆包通用图像编辑模型SeedEdit开启测试 用户可一句话轻松改图
11月11日,字节在豆包大模型团队官网上公布最新通用图像编辑模型SeedEdit。 SeedEdit支持一句话轻松改图,包括修图、换装、美化、转化风格、在指定区域添加删除元素等各类编辑操作,通过简单的自然语言即可驱动模型编辑任意图像。 目前,该模型已经在豆包PC端及即梦网页端开启测试。
11/11/2024 11:34:26 AM
LeCun赞转!类Sora模型能否理解物理规律?字节豆包大模型团队系统性研究揭秘
视频生成模型虽然可以生成一些看似符合常识的视频,但被证实目前还无法理解物理规律! 自从 Sora 横空出世,业界便掀起了一场「视频生成模型到底懂不懂物理规律」的争论。 图灵奖得主 Yann LeCun 明确表示,基于文本提示生成的逼真视频并不代表模型真正理解了物理世界。
11/8/2024 1:29:00 PM
机器之心
字节豆包大模型团队突破残差连接局限!预训练收敛最快加速80%
字节跳动豆包大模型团队于近日提出超连接(Hyper-Connections),一种简单有效的残差连接替代方案。 面向残差连接的主要变体的局限问题,超连接可通过动态调整不同层之间的连接权重,解决梯度消失和表示崩溃(Representation Collapse)之间的权衡困境。 在 Dense 模型和 MoE 模型预训练中,超连接方案展示出显著的性能提升效果,使收敛速度最高可加速 80%。
11/7/2024 2:36:00 PM
机器之心
资讯热榜
标签云
AI
人工智能
OpenAI
AIGC
模型
ChatGPT
DeepSeek
谷歌
AI绘画
机器人
大模型
数据
Midjourney
开源
Meta
智能
微软
用户
AI新词
GPT
学习
技术
智能体
马斯克
Gemini
图像
Anthropic
英伟达
AI创作
训练
LLM
论文
代码
算法
Agent
AI for Science
芯片
苹果
腾讯
Stable Diffusion
Claude
蛋白质
开发者
生成式
神经网络
xAI
机器学习
3D
RAG
人形机器人
研究
AI视频
生成
大语言模型
具身智能
Sora
工具
GPU
百度
华为
计算
字节跳动
AI设计
AGI
大型语言模型
搜索
视频生成
场景
深度学习
DeepMind
架构
生成式AI
编程
视觉
Transformer
预测
AI模型
伟达
亚马逊
MCP