简单的文本摘要和文本内容简介的自动创建已在诸多领域使用,OpenAI正在研发的一种新的AI模型能满足更高的需求——对成百上千页的书籍进行自动摘要和概述。
新 AI 模型使用的是文本 AI 模型GPT-3的一个专门的变体,该变体已经可以创建基本摘要。对于新书 AI,OpenAI 依赖于扩展的训练方法和迭代的文字处理过程。
事实上,在推出GPT-2 之后,OpenAI 即开始尝试书籍摘要。2019 年 10 月,Open AI 展示了经过人工反馈训练的 GPT-2 版本。这种强化学习的变体使用将近 60,000 条人工对生成的摘要的反馈作为训练信号。大约一年后,出现了另一个版本,该版本的AI 模型从人类反馈中学习,然后作为 GPT-2 的训练信号。
对于新模型的AI 训练,OpenAI 再次依靠人类反馈的强化学习。然而,对书籍内容摘要或概述的质量评估的要求要高得多,因为人们需要完整地阅读这本书。因此 OpenAI 使用了一个迭代过程,其中 AI 模型首先将整本书分成几部分进行总结,然后从创建的部分摘要或概述中创建整本书的摘要或概述。这样做,还绕过了GPT-3 等互感器模型的上下文限制。
对于 AI 训练和后续测试,OpenAI 仅使用了《爱丽丝梦游仙境》或《罗密欧与朱丽叶》等叙事作品。各部分的个人摘要和最终结果由人们评估并用作训练信号。
除了强化学习之外,OpenAI 还测试了其他学习方法,并且分别训练了两个具有 1750 亿和 60 亿参数的变体。然而,这些方法的表现要差得多。
[…] 除了强化学习之外,OpenAI 还测试了其他学习方法,并且分别训练了两个具有 1750 亿和 60 亿参数的变体。然而,这些方法的表现要差得多。【本文最初发布于反讽机器】 […]