原标题:版权倡导者炮轰GitHub Copilot AI编程辅助工具 来源:cnBeta.COM
6 月下旬,微软旗下代码托管平台 GitHub 推出了能够对整行或全部代码给出 AI 分析建议的 Copilot 编程辅助工具。然而这个支持多种语言和框架、能够直接以扩展程序的形式在 Visual Studio Code 中调用的功能,也遭到了一些版权倡导者的猛烈批评。据悉,GitHub Copilot 由 OpenAI Codex 项目提供支撑,并接受了数十亿行的开源代码训练。
以 Brian P. Hogan 为例,他认为 GitHub Copilot 会“剽窃”你的代码。而且在帮助 AI 完成了训练之后,它甚至会反过来向你收费。对于那些为此感到欢呼的人,@bphogan 感到很是失望。
至于 GitHub Copilot 是否直接从训练数据集中默背代码,Mark O.Riedl 的观点是 —— Copilot 使用了某个版本的 GPT3,并在基于 GPL 授权的代码上展开了训练。
但在某些情况下,@mark_riedl 指出 GitHub Copilot 会有直接从记忆中复诵代码片段的情况。
Armin Ronacher 则对 GitHub 持更加鲜明的反对态度,理由是平台拿竟然他的开源代码来训练这么个鬼东西。更让人无力吐槽的是,美国法律竟然允许任何人这么胡搞,尽管他非常确定不该进一步增强版权法。
对此,外媒 MSPU 的 @Pradeepviswav 表示,自己不理解 GitHub Copilot 怎么就侵犯了 GPL 代码版权的整个论点。
首先,机器生成的代码,不该被视作衍生作品。否则我们就无法用 AI 来创建音乐识别应用,因为您的 AI 模型将基于受版权保护的音乐内容。
其次,即使 Copilot 从训练数据集中生成了准确的短代码片段,也不应被视为侵犯版权。比如下面这段:
if(i<=0)
i=i+1;
你不该就此声明版权,因为该片段构不成所谓的原始代码。而且 GitHub Copilot 应该能够在不违反任何版权的情况下,向开发者推荐此类短代码片段。
至于微软和 GitHub 将在未来几天内给出怎样的回应,还请拭目以待。