PinnedPinnedPrivate
technologyreview.comChatGPT并不是一次凭空出现的技术跃迁,而是OpenAI把已有的GPT-3.5能力重新包装成更容易对话、更符合人类意图的产品。关键做法是在人类反馈强化学习基础上加入对话数据,让模型学会给出有帮助、较真实、较少有害的回答,并在请求不清楚时追问,在越界任务前拒绝。团队原本只把它当作研究预览,用公开使用来收集缺陷,却意外触发大规模传播。发布后最重要的工作变成持续对齐:观察用户如何越狱、制造偏见或虚假回答,再用对抗训练把成功攻击加入训练数据,推动下一轮修正。它的成功说明,模型能力之外,界面、可用性和反馈循环同样会改变技术的社会影响。马虎不得的是,事实性、偏见和拒绝边界仍是核心难题。OpenAI选择先发布再迭代,本质上是在真实世界压力下训练系统。