AI在线 AI在线

消息称 OpenAI 将推出多模态人工智能数字助理:可语音对话、识别物体

据 The Information 报道,OpenAI 最近向部分客户展示了一款新型多模态人工智能模型,该模型能够进行语音对话和物体识别。有消息人士透露,这或许就是 OpenAI 计划在即将到来的 5 月 13 日正式发布的内容之一。图源 Pexels报道称,相比于 OpenAI 现有的独立图像识别和文本转语音模型,该新型模型能够更快、更准确地处理图像和音频信息。例如,它可以帮助客服人员“更好地理解来电者的语气语调,判断他们是否在使用讽刺语气”。理论上,该模型还能辅助学生学习数学知识,或翻译现实世界中的标志文字。不

据 The Information 报道,OpenAI 最近向部分客户展示了一款新型多模态人工智能模型,该模型能够进行语音对话和物体识别。有消息人士透露,这或许就是 OpenAI 计划在即将到来的 5 月 13 日正式发布的内容之一。

消息称 OpenAI 将推出多模态人工智能数字助理:可语音对话、识别物体

图源 Pexels

报道称,相比于 OpenAI 现有的独立图像识别和文本转语音模型,该新型模型能够更快、更准确地处理图像和音频信息。例如,它可以帮助客服人员“更好地理解来电者的语气语调,判断他们是否在使用讽刺语气”。理论上,该模型还能辅助学生学习数学知识,或翻译现实世界中的标志文字。

不过,消息人士也指出,虽然该模型在某些问题解答方面能够超越 GPT-4 Turbo,但仍有可能出现自信地给出错误答案的情况。

消息称 OpenAI 将推出多模态人工智能数字助理:可语音对话、识别物体

IT之家注意到,开发者 Ananay Arora 发布了一张包含通话相关代码的截图,暗示 OpenAI 可能正在为 ChatGPT 加入打电话的功能。Arora 还发现了一些证据表明 OpenAI 正在配置用于实时音视频通信的服务器。

OpenAI 首席执行官萨姆・阿尔特曼 (Sam Altman) 已经明确否认即将发布的新品是代号为 GPT-5 的大型语言模型(据称其性能将大幅优于 GPT-4)。The Information 则表示,GPT-5 可能将在今年年底前正式亮相。阿尔特曼还表示,OpenAI 不会发布新的人工智能搜索引擎。

如果 The Information 的报道属实,OpenAI 的新品发布仍可能会对即将举行的 Google I / O 开发者大会产生一定影响。众所周知,谷歌也在测试利用人工智能进行电话呼叫的技术。此外,谷歌还有一个据传即将发布的项目,代号为“Pixie”。Pixie 是一款能够通过设备摄像头识别物体的多模态 Google Assistant 替代品,可以为用户提供诸如“如何前往购买地点”或“如何使用”等信息。

相关资讯

马斯克:人工智能模型 Grok 2 测试版即将发布

感谢特斯拉 CEO 马斯克当地时间 8 月 11 日晚在 X 平台上表示,人工智能模型 Grok 2 测试版即将发布。Grok 是马斯克旗下的 xAI 公司推出的大语言模型 Grok 2,上个月马斯克就在 X 平台上确认,Grok 2 将于数周后发布。在回应用户关于训练数据的提问时,他表示该模型“改进巨大”。马斯克和 xAI 目前尚未公布关于该模型的详细信息。今年三月,马斯克曾表示 Grok 2 将在“所有指标”上超越当前一代的 AI 模型。Grok 2 发布后将紧随 Grok 3,马斯克此前称其将在年底左右推出。
8/12/2024 7:29:47 AM
远洋

330 亿参数昆仑大模型发布:中国能源化工行业首个通过备案的大模型,中国石油携手中国移动、华为和科大讯飞打造

科大讯飞集团官方公众号发布博文,表示昨日(8 月 28 日)在北京举办的成果发布会上,中国石油发布 330 亿参数昆仑大模型,是中国能源化工行业首个通过备案的大模型。昆仑大模型简介AI在线援引新闻稿,昆仑大模型由中国石油、中国移动、华为公司和科大讯飞联合打造,于今年 5 月签署合作共建协议,按照“五个一”行动计划,训练了 8 个大模型、研发了 18 个应用场景。图源:科大讯飞昆仑大模型已于 8 月 23 日通过了国家生成式人工智能服务备案,是中国能源化工行业首个通过备案的大模型。在顶层设计具有三大特点:一是创新提出
8/29/2024 8:59:45 AM
故渊

​Meta 推迟 Behemoth 发布引发内部担忧,股价一度下跌超3%

据最新报道,Meta Platforms 计划推迟其旗舰 AI 模型 Behemoth 的发布。 原定于今年4月发布的 Behemoth,先是被推迟至6月,如今又预计将延迟到2025年秋季甚至更晚。 这一变动引发了公司内部对于 Meta 在 AI 领域数十亿美元投资方向的担忧。
5/16/2025 9:00:55 AM
AI在线
  • 1