OpenAI 将在 8 月 10 日的直播中揭示新一代编程AI模型 Codex 有哪些改进。据称,新版本将为 Codex 可能侵犯版权的问题提供解决方案。

Codex 是OpenAI 特别为开发人员带来的一项编程AI 服务。OpenAI称,Codex 接受了来自 Github 和其他互联网资源的数十亿行代码和英语语言数据的训练,可将自然语言直接转换为代码,且准确性越来越高。

目前,Codex尚未对外提供,仅通过GitHub的编程AI软件Copilot供被选定的开发人员使用。据OpenAI 介绍,Copilot 能够提供数十种编程语言的支持。由于Copilot “比任何其他代码助手理解更多的上下文”,因此OpenAI 和 Github 表示,Copilot “不仅仅是自动完成”代码编辑。

在此前的Copilot 演示中,OpenAI 承诺用户能在夏季通过自己的 API 接口访问 Codex,并有机会直接使用AI编程建议或将其集成到他们自己的软件中。而据投资方微软介绍,企业可以专门针对自己的编程需求对Codex进行调整。

然而,改进的版本可能存在一个核心问题。研究人员在 7 月的Codex 论文中揭示了这一问题:系统从当前上下文学习坏代码之后往往会生成更糟糕的代码。在实践中这意味着,如果用户提供的示例代码有错误,AI 模型更有可能产生进一步的错误。这种影响会随着模型的增大而增大。

因此 Codex 仍然有相当大的改进空间——毕竟 AI 模型原则上可以生成无错误代码。

1条评论