国内代理服务器ip=“请不要在 GitHub 上传我的代码!
对多数程序员而言,GitHub 是一个神奇的开源社区:有丰富的学习资料、闻名的项目代码,新手小白也能和编程大佬直接沟通,帮别人“填坑”也能提高自我…… 因而,或许很难有人料想到,有一天 GitHub 竟成为了开发者抵制的存在——今天有个开发者(以下用 “T” 代称)写的文章登上了 Hacker News 热榜,标题是:“请不要在 GitHub 上传我的代码!” 制止 中止 禁令 “罪魁祸首”:Copilot 说实话,看到这个标题,相信许多人的第一反应便是:GitHub 怎么了,有什么问题吗?对此,T 在文中“开门见山”地指出:“GitHub 有很多问题,其间最值得重视的,便是一个名为 Copilot 的功用。” 没错,被程序员视为“AI 编码神器”的 Copilot,便是“罪魁祸首”。 依据官方介绍,GitHub Copilot 是一个 AI 配对程序员,由 OpenAI 创立的生成预练习 AI 模型 Codex 供给支持:“能够帮助你更快地编写代码,减少作业量,从注释和代码中提取上下文,即时主张个别行代码和整个函数。” 听起来很智能,也很高效,即 AI 能帮助生成代码——但问题在于,Copilot 是如何学会编码的? ▶ “GitHub Copilot 通过数十亿行代码的练习,将自然语言提示转化为数十种语言的编码主张。” ▶“OpenAI Codex 通过了开源代码和自然语言的培训,因而它适用于编程和人类语言……接受了公共的自然语言文本和源代码的练习,包括 GitHub 上公共存储库中的代码。” 简略来说,GitHub Copilot 的确会生成一些合适的代码,但追究其底子,其源头或许仍是别人写的代码——而这,显然涉及到了代码版权问题。 绕过 GPL 协议? 有一件事需求清晰:代码开源,并不意味着咱们能够自由免费地用这些源代码来随心所欲,因而衍生出了许多不同的开源协议(也称开源许可证 / 开源 License,如 GPL/LGPL 等),以此规定开源代码免费运用的规模和权利。 以最为闻名的开源协议 GPL 为例,其要求:只要在一个软件中运用了 GPL 协议的代码,则该软件产品有必要也选用 GPL 协议,既有必要也是开源和免费。 那么,问题就来了:实际上 Copilot 所学习的数十亿行开源代码,以及 GitHub 上公共存储库中的代码,其间不少都选用了 GPL 协议。而 Copilot 生成代码片段时,并不会显现原代码作者的信息,也没有提醒相关开源协议 这会导致部分遵循 GPL 协议的代码,被写入一些不开源的专有项目或商业项目中——既违反了许可证条款,也侵犯了原代码作者的知识产权。 因而,作为一名开源开发者,T 在文中呼吁:“咱们现已厌恶了这种法律上的乱用,咱们希望现在就中止!这也便是为什么咱们要求你,作为开源社区的其他开发人员,不要在 GitHub 上传咱们的代码。简而言之,咱们希望维护咱们的作业。” Copilot 的争议一向未断 伴随着近几个月的AIGC热潮,MidJourney、Stable Diffusion、Copilot等生成式 AI 遭到重视,但与此同时各种 AI 效果的版权问题也被推上了风口浪尖。事实上,有关 Copilot 的争议自其发布以来就一向没有隔绝,其间多数围绕的都是:Copilot 生成的代码到底是原生的仍是复制的? 据了解,早在 Copilot 刚发布不到一周时,就有开发者发现了 Copilot “复制代码”的实锤:Copilot 推荐的代码,还带着原代码“WTF”的注释。 图片 此事一度在圈内引起了不小的评论,当时便有开发者发话称,因为 Copilot严峻侵犯了版权所有者的权利,今后都不会再用 GitHub 了: 图片 因而事的过度发酵,2021年还身为 GitHub CEO 的 Nat Friedman 在推特进行了回应: 一般来说:(1)在公共数据上练习 ML 系统是合理运用(2)输出属于操作员,就像编译器相同。 咱们预计在未来几年,知识产权和人工智能将成为世界各地风趣的政策评论,而咱们巴望参加其间! 图片 不过此后,微软和 GitHub 方面再没有对 Copilot 生成代码的版权及开源许可证等争议做过任何相关处理和声明。 如今,“Copilot 会绕过 GPL 协议”,“Copilot 将开源代码变成商业著作”等说法愈演愈烈,那么作为开发者的你,对此又有什么看法呢?