AI在线 AI在线

字节跳动 AI 助手豆包上线图片理解功能,上传图片即可“读图”

据界面新闻3日消息,字节跳动旗下AI助手豆包现已上线图片理解功能,豆包App及豆包PC新增照片及相机按钮,上传图片后可识别图片内容。

据界面新闻 3 日消息,字节跳动旗下 AI 助手豆包现已上线图片理解功能,豆包 App 及豆包 PC 新增照片及相机按钮,上传图片后可识别图片内容。

字节跳动 AI 助手豆包上线图片理解功能,上传图片即可“读图”

豆包的“图片理解”功能可识别图片中包含的元素和基本特征。据悉,用户还可通过该功能询问某景点所处的位置或某个角色出自哪部影视作品。

另外,在不久之前的 11 月,豆包推出了视频生成内测功能,支持图片文字一键成片、动态运镜和多镜头一致性、风格比例随意挑选。

据AI在线此前报道,根据市场调研机构 IDC 9 月发布的移动端大模型应用市场竞争力分析研究报告,豆包在市场影响力、用户活跃度以及用户粘性方面均表现出色。然而,由于其偏娱乐化的产品定位,用户在体验上对其要求较高,同时在功能丰富度上发力不足,故用户体验维度还有待进一步提升。

相关资讯

字节跳动豆包 AI 文生图“喜提新技能”:App 可生成带有指定文字的图片

字节跳动旗下智能AI助手豆包现已升级文生图能力,支持一键生成指定文本。
12/5/2024 2:55:34 PM
清源

字节全新发布豆包AI视频模型:再见了Sora,你的时代过去了

刚刚,字节的火山引擎的发布会基本结束了。 我现在有点过于激动。 虽然发布会结束了,但是我觉得,一个颠覆行业的全新的起点,在这一刻,正式到来了。 字节正式发布了他们全新的两款 AI 视频模型: 豆包视频生成-PixelDance 模型和 Seaweed 模型。Seaweed 模型下次我再详细来说。这次,我想说这个豆包 PixelDance 模型,因为太屌了,屌炸了,我真的是全程惊叹着看完的。 他们正式宣布这玩意的那一刻,现场掌声雷动,我隔着屏幕都感觉快特么把房顶掀翻了。 真的,如果要给这个豆包 PixelDance
9/26/2024 1:49:52 AM

字节跳动豆包电脑版上线视频生成功能,内测用户每日可免费生成十支视频

字节跳动视频生成模型 PixelDance 已在豆包电脑版正式开启内测,部分用户已开通体验入口。内测页面显示,用户每日可免费生成十支视频。
12/10/2024 3:36:14 PM
沛霖(实习)

字节发布豆包视觉理解、3D 生成等新模型,豆包音乐模型可生成 3 分钟作品

豆包3D生成模型也在本次活动中正式亮相。将其与火山引擎数字孪生平台veOmniverse结合使用,可完成智能训练、数据合成和数字资产制作,官方称之为“一套支持 AIGC 创作的物理世界仿真模拟器”。
12/18/2024 11:33:56 AM
清源

豆包大模型发布各领域技术进展,首次披露 300 万长文本能力

字节跳动旗下豆包大模型今日对外公布了2024年全领域的技术进展,宣称自5月15日首次亮相的7个月以来,在通用语言、视频生成、语音对话、视觉理解等方面模型能力已经跨入国际第一梯队。
12/30/2024 9:31:32 PM
清源

字节跳动豆包全新上线 AI 编程功能:支持一键上传多个本地代码文件、实时引入 GitHub 开源仓库

豆包官方公众号显示,豆包电脑版和网页版全新上线AI编程功能。该功能支持一键上传多个本地代码文件、实时引入GitHub开源仓库,快速获取项目的完整上下文,不需再逐段复制代码。
1/17/2025 9:01:37 AM
浩渺

DeepSeek 反思潮:AGI 既被重新审视,又被持续低估

2 月很有意思。 一、DeepSeek 反思潮在 DeepSeek 的集体反思潮中,无论是大厂内部的“AGI 创业团队”、还是 AGI 的明星创业公司,都进行了战略调整。 很显然,DeepSeek 的暴击让整个行业都进行了一次深刻的反思,值得注意的几个变化是:首先,大模型创业公司重新将技术突破提升到一个新的高度、超越产品更新成为公司战略发展的优先级。
2/28/2025 11:45:00 PM
陈彩娴

字节跳动豆包大模型团队开源MoE架构优化技术,训练成本节省40%

字节跳动豆包大模型团队官宣开源一项针对 MoE(混合专家模型)架构的关键优化技术,可将大模型训练效率提升 1.7 倍,成本节省 40%。据悉,该技术叫做 COMET,已实际应用于字节的万卡集群训练,累计帮助节省了数百万 GPU 小时训练算力。
3/10/2025 5:42:41 PM
远洋

字节跳动豆包新版深度思考开启测试,支持边想边搜

据介绍,和之前的深度思考不同,新版功能将推理过程的思维链与搜索深度结合,支持边想边搜。思考过程中,豆包可基于推理多次调用工具、搜索信息,提供更加全面、准确的结果。
3/28/2025 9:30:23 AM
浩渺

字节跳动发布豆包 1.5 深度思考模型,同时升级文生图模型

字节跳动发布豆包1.5深度思考模型,采用MoE架构,总参数200B,激活参数20B,推理成本低于业界50%。新模型在数学、编程、科学推理及创意写作等任务中表现突出,还能结合视觉理解技术提供更多功能。#AI大模型##字节跳动#
4/17/2025 10:50:40 AM
远洋

火山引擎,「出击」Agent

作者 | 陈为锐编辑 | 陈彩娴2025 年已到年中,大模型的生死战已经进入下半场,其中一个鲜明的标志就是:今年除了 Agent,大模型领域几乎静悄悄。 一方面,下一代基础模型的技术壁垒已将具备竞争可能的团队逐渐收敛至中美数家,同时创新门槛在提高,“仅追随”而非“实际超越”难以吸引关注量,因此比拼底层技术的声量在降低。 以 Meta 为例,近日彭博社等媒体披露,由于扎克伯格对 4 月发布的 Llama 4 效果不满意、认为其在竞争中掉队了,计划在内部设立新的“超级智能小组”,准备下一轮冲刺。
6/13/2025 6:30:00 PM
陈为锐

告别代码恐惧症!豆包推出可视化AI编程,拖拽即可创建网页应用

字节跳动旗下AI助手豆包近日推出重磅功能更新,其AI编程"应用创造1.0"正式上线,为用户带来了前所未有的可视化编程体验。 豆包在6月16日的官方更新日志中宣布,"AI编程"功能已支持可视化编辑。 这一创新功能允许用户在生成网页应用后,可以直接在预览界面进行编辑操作,包括修改文字内容、智能更换图片,以及精准选择局部元素进行调整,操作便捷程度堪比编辑PPT文档。
6/24/2025 3:00:41 PM
AI在线

字节Seedream 4.0将全量开放!抢先评测来了,我们摸索出AI生图20种「邪修」玩法

打开多模态自由创作的大门。 谷歌 Nano Banana 掀起的全球创作狂欢尚未消退之际,字节又玩了把大的。 近日,字节跳动开始内测最新的豆包・图像创作模型 Seedream 4.0。
9/8/2025 5:26:00 PM
机器之心

​字节跳动布局AI智能眼镜,挑战下一代可穿戴设备市场

人工智能与可穿戴设备的融合:字节跳动研发AI智能眼镜人工智能与可穿戴设备的融合正掀起新的技术浪潮。 字节跳动(ByteDance)近期积极研发一款自家的AI智能眼镜,旨在将先进AI功能与高质量影像捕捉相结合,为用户带来创新体验。 AI驱动的智能眼镜:豆包模型或成核心据业内消息,字节跳动计划在其智能眼镜中集成类似自研AI模型“豆包”的功能,为设备注入强大的智能交互能力。
4/14/2025 10:01:26 AM
AI在线

中国科大与字节发布 MoGA 长视频生成模型:分钟级多镜头短片一键生成

中国科学技术大学与字节跳动即将联合发布一款具有里程碑意义的 端到端长视频生成模型。 该模型能够直接生成**分钟级长度、480p 分辨率、24帧/秒(fps)**的高质量视频,并支持多镜头场景切换,标志着国产视频生成技术在全球生成式 AI 竞赛中实现关键突破。 这项成果的核心创新在于其底层算法——MoGA(Modular Global Attention),这是一种全新的注意力机制,专为解决长视频生成中的上下文扩展与算力开销问题而设计。
10/24/2025 2:31:35 PM
AI在线

字节跳动豆包大模型掀起价格战:主力模型比行业低 99.3%,日均处理千亿级 Tokens

今日,字节跳动豆包大模型正式发布,宣布大模型价格进入“厘时代”。字节跳动火山引擎总裁谭待介绍称:经过一年时间的迭代和市场验证,豆包大模型正成为国内使用量最大、应用场景最丰富的大模型之一,目前日均处理 1200 亿 Tokens 文本,生成 3000 万张图片。“大的使用量,才能打磨出好模型,也能大幅降低模型推理的单位成本。豆包主力模型在企业市场的定价只有 0.0008 元 / 千 Tokens,0.8 厘就能处理 1500 多个汉字,比行业便宜 99.3%。”▲ 火山引擎总裁谭待公布豆包大模型定价,图源:字节跳动I
5/15/2024 10:46:06 AM
问舟

OPPO、vivo、荣耀、小米、三星、华硕、字节跳动成立智能终端大模型联盟

感谢在今日的字节跳动 2024 春季火山引擎 Force 原动力大会上,火山引擎与 OPPO、vivo、荣耀、小米、三星、华硕宣布成立智能终端大模型联盟。OPPO 小布助手、荣耀智慧办公智能助手、小米“小爱同学”,以及华硕笔记本电脑的豆叮 AI 助手等应用,均已接入火山引擎的大模型服务。2024 春季火山引擎 FORCE 原动力大会聚焦 AI 主题,以大模型应用为核心、以 AI 落地为导向,展示火山引擎在大模型、云计算领域的实践应用,携手汽车、手机终端、金融、消费、互联网等领域的专家和企业技术带头人,共同探讨 AI
5/15/2024 11:33:59 AM
汪淼

机构:字节跳动“豆包”成中国最受欢迎 AI 聊天机器人,文心一言紧随其后

综合彭博社、《财富》杂志报道,根据市场调研机构 Sensor Tower 的数据,字节跳动旗下 AI 聊天机器人“豆包”去年的下载量超过百度的文心一言。目前,“豆包”在中国 iOS 平台上拥有更多月度固定用户。数据显示,截至今年 4 月,豆包在苹果 iOS 平台一年内的下载量接近 900 万次,文心一言则凭借 800 万次的下载量紧随其后。月活用户方面,豆包的用户数量也达到近 400 万。这项调查不包括安卓应用商店。报道引述彭博行业研究分析师 Robert Lea 的观点称,中国新兴的 AI 服务领域正展开竞争,包
5/20/2024 10:41:16 PM
清源
  • 1