AI在线 AI在线

放弃博士学位加入OpenAI,他要为ChatGPT和AGI引入记忆与人格

今天,一位研究者加入 OpenAI 的消息吸引了很多人的关注。 这位研究者名为 James Campbell,他才于 2024 年攻读 CMU 的计算机科学博士学位。 现在,他突然宣布要放弃博士学业,加入 OpenAI。

今天,一位研究者加入 OpenAI 的消息吸引了很多人的关注。

这位研究者名为 James Campbell,他才于 2024 年攻读 CMU 的计算机科学博士学位。现在,他突然宣布要放弃博士学业,加入 OpenAI。

在社媒 X 上,他表示自己在 OpenAI 的研究重心是「AGI 和 ChatGPT 的记忆 + 人格」,记忆将从根本改变人类与机器智能的关系。他将努力工作,确保正确地实现这一切。

放弃博士学位加入OpenAI,他要为ChatGPT和AGI引入记忆与人格

他的加入连 OpenAI 联合创始人、总裁 Greg Brockman 都表达了欢迎。

放弃博士学位加入OpenAI,他要为ChatGPT和AGI引入记忆与人格

还有人表示,「你为什么花了这么长时间才决定加入 OpenAI。」

放弃博士学位加入OpenAI,他要为ChatGPT和AGI引入记忆与人格

那么,这位老兄是何方神圣呢?他的加入为什么引起了这么多的关注?我们来看一下他的履历。

他本科毕业于康奈尔大学,专业是数学与计算机科学。本科期间,他致力于 LLM 可解释性和真实性的研究,还是两篇论文《Representation Engineering》和《Localizing Lying in Llama》的主要作者。

前一篇论文研究了表示工程:一种自上而下的 AI 透明性方法,后者研究了在 Llama 中定位谎言:通过提示、探查和修补来理解判断题上的不诚实指令。

  • 论文 1:Representation Engineering: A Top-Down Approach to AI Transparency,https://arxiv.org/abs/2310.01405
  • 论文 2:Localizing Lying in Llama: Understanding Instructed Dishonesty on True-False Questions Through Prompting, Probing, and Patching,https://arxiv.org/abs/2311.15131

他还在 Gray Swan AI(AI 安全公司)从事对抗鲁棒性和评估方面的工作,并曾从事计算神经科学、物理学和深度学习理论方面的工作。他也是 ProctorAI(监视用户工作状态的多模态 AI 系统)、AI-Timeline.org 的创始人,以及 AidanBench(AI 模 型基准测试工作)的合著者。

其中,ProctorAI 曾引发过广泛热议,该系统监视用户的屏幕,如果发现你有拖延,就会提醒你。它的工作原理是每隔几秒截取电脑屏幕截图,并输入到 Claude 3.5 Sonnet、GPT-4o、LLaVA 1.5 等多模态大模型中。如果发现用户注意力不集中,它会控制屏幕并用个性化消息提醒。

放弃博士学位加入OpenAI,他要为ChatGPT和AGI引入记忆与人格

项目地址:https://github.com/jam3scampbell/ProctorAI

2024 年,他进入 CMU 攻读博士学位,研究重心是理解通用智能的构成要素,并确保这些要素的安全性。

如今,他选择加入 OpenAI,开始了在产业界的探索。

其实, James Campbell 的加入有迹可循。几天前,在 OpenAI 宣布组建模型行为研究团队的帖子下面,二者便开始了互动。

放弃博士学位加入OpenAI,他要为ChatGPT和AGI引入记忆与人格

在更早的时候,James Campbell 发表过一些关于 ChatGPT 记忆方面的观点。

他赞同应该对 ChatGPT 的记忆及其导致更强幻觉的问题进行研究,并认为上下文污染和模式崩溃是真实存在的,但目前对它们的研究还不多。如果在每个 prompt 中塞入数千个 token 的记忆,它们便会变得更加活跃。

放弃博士学位加入OpenAI,他要为ChatGPT和AGI引入记忆与人格

看起来,James Campbell 的加入是一场双向奔赴。

相关资讯

性能依旧领先!OpenAI深夜上线o3满血版和o4 mini

昨天晚上 1 点,OpenAI 的直播如约而至。 其实在预告的时候,几乎已经等于明示了。 没有废话,发布的就是 o3 和 o4-mini。
4/18/2025 1:02:47 AM
数字生命卡兹克

零基础也能看懂的 ChatGPT 等大模型入门解析!

近两年,大语言模型LLM(Large Language Model)越来越受到各行各业的广泛应用及关注。 对于非相关领域研发人员,虽然不需要深入掌握每一个细节,但了解其基本运作原理是必备的技术素养。 本文笔者结合自己的理解,用通俗易懂的语言对复杂的概念进行了总结,与大家分享~一、什么是ChatGPT?
2/17/2025 1:00:00 PM
小喵学AI

NLLB 与 ChatGPT 双向优化:探索翻译模型与语言模型在小语种应用的融合策略

本文探讨了 NLLB 翻译模型与 ChatGPT 在小语种应用中的双向优化策略。 首先介绍了 NLLB-200 的背景、数据、分词器和模型,以及其与 LLM(Large Language Model)的异同和协同关系。 接着列举了实战与应用的案例,包括使用 ChatGPT 生成的样本微调 NLLB-200 和使用 NLLB-200 的翻译结果作为 LLM 的 prompt 等。
2/13/2025 8:44:56 AM
Huang Minghui
  • 1