AI在线 AI在线

OpenAI内部大重组!模型行为团队并入Post Training,负责人另起炉灶

OpenAI又要成立新团队了! TechCrunch消息,OpenAI正在对其模型行为(Model behavior)团队进行重组。 模型行为团队,就是OpenAI内部专门塑造模型“个性”的核心研究小组。

OpenAI又要成立新团队了!

TechCrunch消息,OpenAI正在对其模型行为(Model behavior)团队进行重组。

模型行为团队,就是OpenAI内部专门塑造模型“个性”的核心研究小组。迄今已参与GPT-4、GPT-4o、GPT-4.5与GPT-5等版本的后训练工作。

随着重组的进行,其创始负责人Joanne Jang,也正在组建一个名为OAI Labs的新研究团队。

OpenAI内部大重组!模型行为团队并入Post Training,负责人另起炉灶

Joanne介绍,OAI Labs的职责是探索人与AI协作的新范式。

这是一个以研究为导向的团队,专注于发明和设计人们与人工智能协作的新接口。

OpenAI成立OAI Labs

作为模型行为团队改组行动的一部分,OpenAI将会成立新的OAI Labs。

其使命是“发明并原型化人类与AI协作的全新交互方式”,重点不再局限于聊天或Agent模式,而是把AI视作“具备思考、创作、学习、连接能力的工具”。

目前实验室仍处于组建早期,但已明确的研究方向包括两条主线。

其一是交互层面的探索,团队将围绕“互动工具”这一概念,设计可直接操控、可复用且能在迭代中实时反馈的多模态原型,帮助用户更直观地塑造模型意图、在创作流程中随时调转方向,并以可视化方式呈现AI的多种推理路径与中间结果。

其二是行为层面的延续研究,OAI Labs吸收了原模型行为团队在人格一致性、降低谄媚等处理方面的积累,将这些“后训练”调优机制与新的交互范式联动,使个性、安全性与创造力在同一框架内协同演化。

新团队负责人Joanne Jang还表示,她希望在新的接口实验中融入硬件维度。

Joanne此前是模型行为团队负责人,工作内容是引入新的模型能力,设计和实施模型的个性化特性、行为规范以及用户交互策略。

上周,Joanne发推称,她将离开模型行为团队,并“在OpenAI开启新的篇章”。OpenAI内部大重组!模型行为团队并入Post Training,负责人另起炉灶

Joanne于2021年加入OpenAI,最初担任产品经理,负责将GPT-4、TTS和DALL·E 2等研究成果转化为可供API和ChatGPT使用的产品。

学业方面,Joanne本科和硕士均在斯坦福就读。OpenAI内部大重组!模型行为团队并入Post Training,负责人另起炉灶

在加入OpenAI之前,她曾在Google Assistant从事自然语言理解方面的工作,专注于不确定性建模和对话机制的研究。

此外,她还曾担任Dropbox产品经理、斯坦福助教等工作,实习经历则包括苹果、迪士尼等。OpenAI内部大重组!模型行为团队并入Post Training,负责人另起炉灶

除了Joanne,模型行为团队的其他成员,也将进行重组。

模型行为团队重组

今年8月,OpenAI首席研究官Mark Chen在内部备忘录中宣布,该团队约14名研究人员将整体并入Post Training团队,未来将向Post Training负责人Max Schwarzer汇报。

模型行为团队是OpenAI内部专门塑造模型“个性”的核心研究小组,迄今已参与GPT-4、GPT-4o、GPT-4.5与GPT-5等版本的后训练工作。

这一改组的目的,将模型行为研究更紧密地融入核心开发流程,反映出了OpenAI对AI模型“个性”研究的重视。技术层面,模型个性塑造也将在指令微调与RLHF等后训练流程中同步完成。

OpenAI认为,只有把人格设计与核心性能迭代绑定,才能在“温度”与“非谄媚”之间取得稳定平衡,并提高对敏感场景的响应质量。

整合后,Post Training团队将把模型行为团队多年积累的检测指标、评估用例纳入其评测标准,使行为调优、事实一致性检查和推理能力测试共同决定迭代节奏。

内部文件称,这种“行为-性能一体化”流程将作为OpenAI后续模型的固定开发范式,避免人格调整滞后于模型升级。

除了模型行为团队,近期OpenAI内部也完成了一系列人事调整。

重点放在了Applications部门建立上,该部门将统筹管理ChatGPT、Codex等产品线。

Fidji Simo担任应用部门CEO,是“1号人物”。她于今年5月加入OpenAI,在2024年3月已加入董事会。曾带领Instacart成功上市,是IPO的关键人物。

ChatGPT的产品负责人Nick Turley、以及新加入的Vijaye Raji都向她汇报。

原来的首席产品官Kevin Weil将转岗至研究部门,担任新部门OpenAI for Science的副总裁,专注前沿创新,与Mark Chen紧密合作。

相关资讯

东京大学 | Adobe 提出InstructMove,可通过观察视频中的动作来实现基于指令的图像编辑

InstructMove是一种基于指令的图像编辑模型,使用多模态 LLM 生成的指令对视频中的帧对进行训练。 该模型擅长非刚性编辑,例如调整主体姿势、表情和改变视点,同时保持内容一致性。 此外,该方法通过集成蒙版、人体姿势和其他控制机制来支持精确的局部编辑。
1/20/2025 10:36:00 AM
AIGC Studio

阿里发布新ID保持项目EcomID, 可从单个ID参考图像生成定制的保ID图像,ComfyUI可使用

阿里妈妈发布了一个新的ID保持项目EcomID,旨在从单个ID参考图像生成定制的保ID图像,优势在于很强的语义一致性,同时受人脸关键点控制。 EcomID 方法结合了 PuLID 和 InstantID 的优点,以获得更好的背景一致性、面部关键点控制、更真实的面部以及更高的相似度。 目前,EcomID 的 Comfyui 原生实现官方插件也已经发布,大家可以从文章中的链接获取。
1/20/2025 11:00:00 AM
AIGC Studio

o1推理框架最新成果:斯坦福&伯克利提出元链式思维,升级模型推理能力

o1背后的推理原理,斯坦福和伯克利帮我们总结好了! 在最新的一篇长达100页的论文中,他们将o1模型背后的推理机制提炼成了一个通用的框架——元链式思维(Meta-CoT)。 这个元链式思维(Meta-CoT)到底是什么意思呢?
1/20/2025 1:08:25 PM
量子位
  • 1