豆包大模型
字节火山引擎澄清与老凤祥 AI 智能眼镜合作传闻
近日,有关字节跳动旗下的火山引擎与中国珠宝品牌老凤祥合作开发 AI 智能眼镜的消息引发关注。 根据6月11日的报道,一些知情人士透露,老凤祥即将推出多款搭载字节豆包大模型的 AI 眼镜,预计将在七月正式发布。 这些产品主要针对老年群体,具备视觉理解、语音对话、语义识别、电话接听等多种功能。
6/16/2025 10:09:58 AM
AI在线
字节跳动推出豆包大模型 1.6 和视频模型 Seedance1.0,前者客户使用成本降至三分之一
火山引擎今日发布豆包大模型1.6和视频生成模型Seedance 1.0 pro,豆包1.6在复杂推理、竞赛级数学等测试中表现全球前列,Seedance在文生视频、图生视频任务中排名首位。豆包大模型已服务全球TOP10手机厂商中的9家、8成主流汽车品牌等。#火山引擎# #豆包大模型#
6/11/2025 10:56:35 AM
远洋
全新豆包·视频生成模型明日发布 支持无缝多镜头叙事等功能
明日,2025FORCE原动力大会将盛大举行,此次大会上,豆包大模型家族的能力升级情况将揭晓。 同时,备受瞩目的全新豆包·视频生成模型也将正式发布。 据介绍,全新豆包·视频生成模型具备多项卓越特性。
6/10/2025 5:00:56 PM
AI在线
瑞幸咖啡接入豆包大模型 支持语音下单等功能
5月26日,瑞幸咖啡在官方APP和微信小程序正式推出首个AI智能体(1.0版),此智能体由瑞幸咖啡与火山引擎携手打造,借助豆包大模型技术,为用户带来语音下单、个性化推荐等便捷功能,引领咖啡消费进入全新智能化时代。 瑞幸咖啡AI智能体通过接入豆包大模型,运用意图识别与槽位抽取两大核心技术,化身“智能咖啡管家”,精准捕捉用户点单偏好,提供贴心服务。 用户只需简单语音指令或关键词输入,即可快速完成点单,系统同步解析规格、温度、口味等细节,自动匹配最优服务流程,大幅节省点单时间。
5/27/2025 4:01:00 PM
AI在线
刚刚,豆包1.5·深度思考模型上线,特供「视觉版本」,大模型多模态推理的时代真来了
这几天的大模型圈子,特别热闹。 凌晨是 OpenAI 的 o3 和 o4-mini,一觉醒来,国内这边的豆包大模型又上新了一波。 巧合的是,都是能看懂图像、能调用工具的新一代推理模型。
4/17/2025 8:49:00 PM
机器之心
豆包深度思考和文生图3.0模型正式开放API 对企业客户开放
豆包大模型近日发布了系列更新,其中豆包1.5·深度思考模型和豆包文生图模型3.0正式通过火山引擎开放 API,供开发者和企业客户使用。 这两款模型在推理任务和通用任务的综合表现达到了业界前沿水平,并在视觉推理和图像生成方面取得了显著进展。 豆包1.5·深度思考模型在专业领域推理任务中表现出色,数学推理 AIME2024测试得分追平 OpenAI o3-mini-high,编程竞赛 Codeforces pass@8得分接近 OpenAI o1,科学推理 GPQA 得分接近 o3-mini-high,均达到或接近全球第一梯队。
4/17/2025 2:01:15 PM
AI在线
推理能力飞跃?豆包1.5深度思考模型即将正式服务企业
火山引擎今日发布活动预热,正式宣布其新款豆包大模型将于明日(4月17日)在FORCE LINK AI创新巡展杭州站上隆重发布。 官方信息显示,此次发布会将带来豆包大模型家族的全新升级,并特别推出备受瞩目的豆包1.5深度思考模型。 此前已有消息透露,豆包APP和桌面端已针对“深度思考模式”进行了多轮实验性测试。
4/16/2025 6:01:15 PM
AI在线
字节跳动豆包大模型团队召开全员会,探索 AI 新高度
在人工智能领域蓬勃发展的背景下,字节跳动的豆包大模型团队(Seed)近日召开了一次全员会议,标志着该团队在未来发展方向上的重要决策。 会议由朱文佳与新任 AI 基础研究负责人吴永辉共同主持,这也是两位领导首次同台出席,吸引了业内的广泛关注。 会议上,朱文佳和吴永辉明确表示,Seed 团队的首要目标是 “探索智能上限”,这将成为团队未来工作的核心导向。
3/19/2025 9:39:00 AM
AI在线
字节跳动豆包文生图技术报告发布:数据处理、预训练、RLHF 全流程公开
据介绍,豆包大模型团队文生图模型 Seedream 2.0 于 2024 年 12 月初在豆包 App 和即梦上线,已服务上亿 C 端用户。
3/12/2025 1:26:51 PM
问舟
字节音效生成模型来了,一键生成大片感音效!已上线即梦
在 AIGC 持续突破视频生成边界的当下,音效制作仍是制约行业发展的瓶颈。 字节跳动豆包大模型语音团队最新提出的 SeedFoley 模型,通过端到端架构实现了视频音效的智能生成,将 AI 视频创作带入「有声时代」。 相关功能「AI 音效」已在即梦上线,用户使用即梦生成视频后,选择「AI 音效」功能,即可生成 3 个专业级音效方案。
3/11/2025 5:17:00 PM
机器之心
大模型效率狂飙:字节COMET技术开源,提速1.7倍
字节跳动旗下豆包大模型团队近日宣布,成功攻克混合专家模型(MoE)架构的关键瓶颈,并开源一项名为COMET的重大优化技术。 该技术显著提升了大模型的训练效率,实现了高达1.7倍的效率提升,并有效降低了40%的训练成本。 图源备注:图片由AI生成,图片授权服务商Midjourney据介绍,COMET技术已在字节跳动的万卡集群训练中得到实际应用,累计节省了数百万GPU小时的训练算力。
3/10/2025 5:59:00 PM
AI在线
字节跳动豆包上线「深度思考」推理模式,覆盖问答、搜索、写作和阅读场景
2025 年 3 月 5 日,豆包宣布上线「深度思考」推理模式,全面覆盖问答、搜索、写作和阅读场景。要想进入「深度思考」推理模式,用户只需在输入框打开「深度思考Beta」开关即可。
3/6/2025 10:24:47 AM
问舟
字节跳动豆包小范围测试深度思考模型,并非接入 DeepSeek
字节跳动旗下AI助手豆包正小范围测试自研深度思考模型,非DeepSeek接入。部分用户已体验思维链功能,官方确认正在测试不同实验版本。
2/25/2025 3:56:09 PM
问舟
超越DeepSeek-ProverV1.5!豆包首个形式化数学推理模型BFS-Prover来了,直接开源
AIxiv专栏是AI在线发布学术、技术内容的栏目。 过去数年,AI在线AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。 如果您有优秀的工作想要分享,欢迎投稿或者联系报道。
2/25/2025 2:11:00 PM
机器之心
豆包:视频生成模型 “VideoWorld” 已开源 实现纯视觉学习
据豆包大模型团队官方公众号消息,在北京交通大学和中国科学技术大学的联合研究下,由豆包大模型团队提出的 “VideoWorld” 视频生成实验模型近日正式开源。 这个模型的最大亮点在于,它不再依赖传统的语言模型,而是仅凭视觉信息就能认知和理解世界。 这一突破性的研究灵感来源于李飞飞教授在 TED 演讲中提到的 “幼儿可以不依靠语言理解真实世界” 的理念。
2/10/2025 2:22:00 PM
AI在线
Video Depth Anything来了!字节开源首款10分钟级长视频深度估计模型,性能SOTA
AIxiv专栏是AI在线发布学术、技术内容的栏目。 过去数年,AI在线AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。 如果您有优秀的工作想要分享,欢迎投稿或者联系报道。
1/27/2025 8:33:00 PM
机器之心
百万tokens仅需8毛,不蒸馏造出世界一流大模型,豆包全新1.5Pro不走捷径
马上就要进入蛇年了,国内的 AI 厂商们却完全没有闲下来的意思,正在春节前扎堆发布各自的新一代大模型。 本周一,豆包刚刚上线了全新的实时语音功能,可说是在中文语音对话方面做到了断崖式领先,为终端用户带来了智商与情商双高的实时语音助手和聊天伙伴。 第二天,月之暗面与 DeepSeek 都各自推出了可比肩满血版 o1 的推理模型,吸引了中外无数眼球。
1/23/2025 12:01:00 PM
机器之心
百万 tokens 降至 0.8 元后,消息称字节跳动豆包大模型毛利率达 50%
据界面新闻今日援引多个知情人士消息称,字节跳动旗下的豆包大模型在去年大幅降价后,毛利率仍然为正。
1/22/2025 6:13:02 PM
清源
资讯热榜
智谱AI全新企业级超级助手Agent CoCo正式上线
苹果发布全新Xcode 26开发者工具:内置ChatGPT先进AI功能
豆包App“一句话P图”功能全新升级 基于SeedEdit 3.0实现全面优化
DeepSeek前高管秘密创业,新AI Agent项目已获顶级VC押注
Google AI Studio 政策变动:Gemini2.5Pro 模型免费访问遭“限流”
那个男人回来了!Ilya现身多伦多大学毕业典礼:AI 像是用数字方式复制出来的大脑!不管你愿不愿意,AI都将深刻影响你的一生!
苹果向开发者开放本地AI能力,推出全新Foundation Models框架
支持MCP!开源智能体开发框架 Rowboat:打造你的智能助手只需几分钟
标签云
人工智能
AI
OpenAI
AIGC
模型
ChatGPT
DeepSeek
AI绘画
谷歌
数据
机器人
大模型
Midjourney
用户
智能
开源
微软
Meta
GPT
学习
图像
技术
AI创作
Gemini
论文
马斯克
Stable Diffusion
算法
英伟达
代码
Anthropic
芯片
开发者
生成式
蛋白质
腾讯
神经网络
训练
3D
研究
生成
智能体
苹果
计算
机器学习
Sora
AI设计
Claude
AI for Science
GPU
AI视频
人形机器人
搜索
华为
百度
场景
大语言模型
xAI
预测
伟达
深度学习
Transformer
LLM
字节跳动
Agent
模态
具身智能
神器推荐
工具
文本
视觉
LLaMA
算力
Copilot
驾驶
大型语言模型
API
RAG
应用
架构