OpenAI 非常关心开发人员并致力于尊重他们的权利。我们希望 Codex 能够降低入门门槛,增加初级程序员的机会,提高专家级程序员的工作效率,并创建新的代码生成工具。
Codex 模型在数千万个公共存储库上进行了训练,这些存储库被用作 Codex 设计中用于研究目的的训练数据。我们认为这是变革性合理使用的一个例子。
来自这些公共存储库的源材料仅用于这些研究和培训目的;它无意逐字包含在法典输出中。分析表明,即使在开发的早期阶段,绝大多数输出 (>99%) 也不匹配训练数据。当然,与所有计算机程序一样,某些源材料包含常见的、广泛使用的解决方案,这些解决方案要么是标准的,要么是功能上规定的。
在 Codex 的早期开发阶段,我们继续以多种方式改进产品。我们欢迎开发人员提供反馈,包括他们在我们的免费测试期间对生成的输出可能有的任何问题或疑虑。
未经允许不得转载:表盘吧 » OpenAI 了解 Codex 培训数据和输出