上周五,在接受MIT Technology Review采访时,OpenAI团队对于这次成功显得格外谦逊。

华尔街见闻报导,OpenAI人工智慧政策研究人员Sandhini Agarwal表示,这在内部被视为一次「研究预览」,是一项已有2年历史的更完善版本,也是一次透过搜集用户回馈来弥补其缺陷的尝试。另一位研究人员Liam Fedus则指出,OpenAI并不想将其作为一项重大的突破来过度宣传。

自11月以来,OpenAI已经多次更新ChatGPT,研究人员正在使用一种称为「对抗性训练」的技术来阻止ChatGPT「越狱(jailbreaking)」。这项工作使多个聊天机器人相互对抗:一个聊天机器人扮演对手,透过生成文本来对抗另一个聊天机器,迫使其打破常规的限制。

此外,OpenAI还与微软签署一项价值数十亿美元的协议,并宣布与全球管理咨询公司贝恩结成联盟,目标是透过突破性的人工智慧技术增强客户的业务潜力。在OpenAI之外,围绕ChatGPT掀起一场大模型的淘金热,全球各地公司和投资者都积极参与其中。

以下是采访的部分内容:
针对ChatGPT爆红,对产业带来巨大冲击,Jan Leike(负责提高系统安全性团队负责人):老实说,这的确是势不可挡的的。我们很惊讶,也在一直在努力完善。

John Schulman(联合创办人):在发表后的几天里,我经常查看Twitter,在这段疯狂的时间里,充斥著ChatGPT截图,我希望它能获得更多的关注,但我没想到它能爆红到这种程度。

Sandhini Agarwal(人工智慧政策研究员):我认为这对我们所有人来说绝对是一个惊喜,人们开始使用它。我们对这些模型进行了大量研究,以至于我们忘记了它们有时对外界来说是令人惊讶的。

Liam Fedus(人工智慧政策研究员):我们很惊讶它的回响这么大,以前有很多人尝试过使用聊天机器人,然而,我们的私人测试版让我们相信,我们拥有了人们可能真正喜欢的东西。

Jan Leike说:我想更好地理解是什么推动了这一切,是什么推动著病毒性传播。老实说,我们也不知道。

(团队的部分困惑来自于ChatGPT中的大多数技术都不是新的,ChatGPT是GPT-3.5的一个微调版本,GPT-3.5是OpenAI在聊天机器人发表前几个月研究出的大型语言模型。GPT-3.5本身是GPT-3的更新版本,于2020年发表,OpenAI还在2022年1月发表GPT-3.5的微调版本,名为InstructGPT,但这些早期版本的技术都没有对公众发布。)


Liam Fedus:ChatGPT模型是从与InstructGPT相同的语言模型中进行微调得出的,我们增加一些会话资料,并在训练过程进行一些微调。

我们并不想将其作为一项重大的突破来过度宣传,但事实证明,会话资料对ChatGPT产生巨大的影响。透过标准测试评估原始技术能力,模型之间实际上没有实质性差异,但ChatGPT更易于访问和使用。

Sandhini Agarwal:当我们准备发表时,我们并不认为这个模型存在其他新的风险,GPT-3.5已经发表,我们知道它已经足够安全了。透过ChatGPT对人类偏好的训练,该模型可以自动学习拒绝行为,即拒绝大量请求。

Jan Leike:我们确实为ChatGPT做了一些额外的红队演练(Red Teaming),OpenAI的每个人都试图打破这种模式。我们有外部团体在做同样的事情。我们也有一个早期访问计划,由信任的用户提供回馈。

Sandhini Agarwal:我们确实发现它输出一些不必要的内容,所以作为一个研究预览这个意图是好的。

John Schulman:你不能等到你的系统完美后再发表它,我们已经对早期版本进行几个月的测试,测试人员对产品有较好的印象。我们最担心的是真实性,因为模型喜欢捏造东西,但是InstructGPT和其他大型语言模型已经存在,所以我们认为,只要ChatGPT在真实性和其他安全问题上优于那些模型,应该就是更好的选择。在发布之前,根据我们有限的评估,确认这些模型确实比其他模型更真实和安全,所以我们决定继续发表。

壹苹新闻网-投诉爆料

爆料网址:reporting.nextapple.com

爆料信箱:news@nextapple.com

★加入《壹苹》Line,和我们做好友!

★下载《壹苹新闻网》APP

★Facebook 按赞追踪

壹苹娱乐粉专壹苹新闻网粉专


點擊閱讀下一則新聞 點擊閱讀下一則新聞

别担心降息不来!关键指标已浮现 专家指这类股平均大涨22%