融合视觉能力，OpenAI 向开发人员供应 GPT-4 Turbo with Vision

感谢OpenAI 宣布，具有视觉能力的最新 GPT-4 Turbo 模型 GPT-4 Turbo with Vision 现已通过 OpenAI API 向开发人员普遍供应。据IT之家了解，该模型延续了 GPT-4 Turbo 系列 128,000 个 token 的窗口大小以及截止至 2023 年 12 月的知识库，最大的革新之处在于其新增的视觉理解能力。在过去，开发者需要调用不同的模型来处理文本和图像信息，而 GPT-4 Turbo with Vision 则将两者合二为一，极大简化了开发流程，并带来了广泛的应

感谢OpenAI 宣布，具有视觉能力的最新 GPT-4 Turbo 模型 GPT-4 Turbo with Vision 现已通过 OpenAI API 向开发人员普遍供应。

据IT之家了解，该模型延续了 GPT-4 Turbo 系列 128,000 个 token 的窗口大小以及截止至 2023 年 12 月的知识库，最大的革新之处在于其新增的视觉理解能力。在过去，开发者需要调用不同的模型来处理文本和图像信息，而 GPT-4 Turbo with Vision 则将两者合二为一，极大简化了开发流程，并带来了广泛的运用前景。

OpenAI 也分享了一些开发者正在运用该模型的有趣案例。例如，AI 软件工程助手 Devin 行使 GPT-4 Turbo with Vision 辅助编程；健康健身运用程序 Healthify 运用该模型扫描用户饮食照片，通过图像识别供应营养分析；创意平台 Make Real 则行使该模型将用户的草图转化为可运行的网站。

目前，GPT-4 Turbo with Vision 尚未运用于 ChatGPT 或开放给大众运用，不过 OpenAI 暗示该功能即将登陆 ChatGPT。

{{userData.name}}已认证

融合视觉能力，OpenAI 向开发人员供应 GPT-4 Turbo with Vision

Instagram 短视频板块 Reels 测试 AI 同传性能，用户可用自己声音“说外语”

苹果介绍 Ferret-UI 多模态大谈话模型：更充分懂得手机屏幕实质

微软开源 bitnet.cpp 1-bit LLM 推理框架：不靠 GPU 可本地运行千亿参数 AI 模型，能耗最多降低 82.2%

秒变Midjourney高手！精选 52 条高级感的 sref 风格代码

Meta 用 AI 生成北极光图片，遭网友怒喷

中国电信自研 AI 节能系统：年均节电 8 亿度，节约电费 5.2 亿元

英伟达 CEO 黄仁勋展望公司未来：坐拥 5 万名员工、部署 1 亿个 AI 助手

成功率提升15%，浙大、碳硅智慧用LLM进行多属性分子优化，登Nature子刊

特斯拉人形机器人 Optimus 现场做饮料，员工证实有人在远程控制

中国移动推出“灵犀”家庭智能体，支持智能搜索、对话交互等功能