AI在线 AI在线

豆包上线视频通话功能:支持实时问答互动,具备视觉理解能力

豆包今日宣布在App端上线实时视频通话功能,用户在“打电话”界面点击视频按钮即可开启视频通话,支持基于真实场景与用户进行实时问答互动。

AI在线从豆包公众号获悉,豆包今日宣布在 App 端上线实时视频通话功能,用户在“打电话”界面点击视频按钮即可开启视频通话,支持基于真实场景与用户进行实时问答互动

譬如,用户可在旅行过程中通过该工具询问自身所处景点的历史背景、特色内容或路线规划等,其背后由豆包最新的视觉理解模型支持,可融合视觉与语言输入进行综合的深度思考、创作。

豆包视频通话功能还接入了联网搜索能力,实时获取互联网最新信息,以进一步提升对话的准确性与时效性。根据图像信息,豆包视觉理解模型还能完成多种复杂逻辑计算任务,包括解微积分题、分析论文图表、诊断真实代码问题等“挑战性”任务。

豆包上线视频通话功能:支持实时问答互动,具备视觉理解能力

相关资讯

OpenAI版《Her》全量来袭:实时视频对话,你每个动作AI都看得见

OpenAI“双十二”的*第六天,依旧重磅来袭——《Her》一样的视频通话功能,全量开发! 而且这次的版本名字也是非常应景,叫做Santa Mode(圣诞模式)。 现在(直到月底),你可以随时开启跟AI的实时对话,点击“雪花”就能让ChatGPT用圣诞老人的调调跟你对话:除此之外,你现在还可以打开摄像头,让ChatGPT睁开“眼睛”,边看边聊!
12/13/2024 7:35:40 AM

字节跳动发布豆包大模型,主力模型比行业价格低99.3%

5月15日,字节跳动豆包大模型在火山引擎原动力大会上正式发布。 火山引擎总裁谭待介绍,经过一年时间的迭代和市场验证,豆包大模型正成为国内使用量最大、应用场景最丰富的大模型之一,目前日均处理1200亿Tokens文本,生成3000万张图片。 “大的使用量,才能打磨出好模型,也能大幅降低模型推理的单位成本。
5/15/2024 11:15:00 AM
代聪飞

豆包推出实时语音大模型:号称中文对话断崖式领先、情商智商均在线

据介绍,豆包实时语音大模型实现了语音理解和生成一体化,实现了端到端语音对话。相比传统级联模式,在语音表现力、控制力、情绪承接方面表现惊艳,并具备低时延、对话中可随时打断等特性。
1/20/2025 4:29:51 PM
清源
  • 1