大明1805(929)

作者:王子虚

“工人的纺织过程本身不存在创造性。

“其他人发明和购买机械化纺织机器，与工人并无直接的冲突和侵权行为。

“但是，如果工人自己设计了一种纺织图案和花纹，而不是传承多代人的常见图案和花纹。

“那使用机械化纺织的工厂，在未经工人许可的情况下使用相同图案，就是法律所禁止的侵权行为。

“而机器学习的对象，恰好都是有创造性的产品，绝大部分都是有版权的产品。

“所以机器学习应该取得学习目标的版权所有人的授权。”

朱靖垣听完之后看向朱迪钚：

“老二你认可这个理由吗？”

朱迪钚直接说：

“镧弟……你这样的说法是没有道理的，机器学习与纺织工人设计图案的比喻也是在狡辩。

“机器学习的过程，以及后续再创作的过程，都是与人的学习没有本质区别的。

“人学习别人的作品，本质上也是将作品元素完全打碎，变成分子乃至原子状态存进脑子里面。

“然后再自行组合这些原子状态的素材，组合出与原作看上去截然不同的作品。

“只是这些原子太小了，根本无法鉴别出于原作的直接雷同点。

“其实只是人类鉴定抄袭的规则基础上，继续向下无限细分到人类无法认知为止。

“相同的设计图案和段落是不是抄袭？相同的人物结构和大纲算不算抄袭？

“相同的抄设计元素和诗句算不算抄袭？相同的线条风格和词组算不算抄袭？

“相同的颜色范围搭配和词库范围算不算抄袭呢？

“这样继续细分下去，人类学习到最后使用可能是类似的颜色范围和词库。

“机器学习的深度可能比这个更加深入和细化。

“你用人类法律鉴定抄袭的标准，去鉴定机器学习创造出来的作品，是绝对鉴定不出抄袭来的。

“类比手工织布工匠和机械化纺织机的相同，只能算是使用了类似的棉花和颜色。

“所以为什么人类学习不算抄袭，机器干同样的事情就是抄袭？

朱迪镧笑着说：

“二哥你你可能理解错了我的意思。

“我没说机器学习和创造是抄袭，而人类的学习和创造不是抄袭。

“其实按照我自己的观点，两者都应该算是抄袭。

“就像二哥你说的，只要鉴定抄袭的标准无限深入，所有的学习都能够判定为抄袭。

“在这样的基础上，任何免费学习过别人的艺术作品的人，都不应该创作任何以盈利为目的的作品。

“想要创造以盈利为目的的作品，本人的所有的学习资料都应该是取得了盈利授权的材料。

“因为只要学习过，显然就会受到或多或少影响，不然也就不能称之为学习了。

“是否为抄袭的判断标准，更加准确的说法是允许抄袭到什么级别。

“二哥可以参考微积分和相对论的逻辑来理解这个说法。

“在这样的基础上，现实中的人类社会和人类创作者，已经经过实际上的社会实践和法律，默认授权了其他人类拥有特定级别以下的抄袭盈利许可。

“但是，人类还没有授权机器使用任何级别的抄袭盈利标准。

“比如说，我画了一幅画，默认允许二哥你学习画法。

“我允许你把我的画的原子结构甚至分子存在自己的脑子里随时使用。

“但没有允许你把他们存在机器里面供机器使用。

“机器要学习就要另外要授权。

“因为你说了，机器学习的逻辑，与人是相同的，但机器恰好又不是人类。

“机器学习相关又没有任何现行法律。

“机器学习还没有大规模出现，我并没有直接给过它授权，更加没有给过事实授权。

“甚至没有给过你使用机器学习的授权。

“现在，我们要拟定相关法律，决定默认授权机器学习到什么程度。

“我的建议是全部非默认，任何用于机器学习的资料，都必须得到创作者的直接授权。

“这样做的目的不是为了阻止机器学习继续进化。

“恰恰是要规范机器学习行业。

“未来是大数据的时代，机器学习的规模必然会越来越大。

“如果不限制机器学习的范围和规则，必然导致这个产业的混乱发展。

“必然导致机器学习开发者互相抄袭且不可控。

“抄袭数据原子当然不是抄袭，那抄袭数据库肯定就是抄袭了吧？

“就像照搬一个字库的范围不算抄袭，但照搬一本大词典那就绝对是抄袭了。

“在大数据和机器学习的新时代，数据资料应该是有新的权属规范。

“任何数据和资料，都应该是有权属的，都是有价值的。

“我认为这应该是下个时代的时代逻辑。

“有了这样的基础规则，有了规范的收费和授权的基本规则。

“相应的数据模型开发者，才有机会将通过有授权的数据，开发出同样有授权的数据模型。

“进而可以不受额外限制的使用机器生产的产品去盈利。

“否则，任何机器学习最终产生的作品，其著作权归属都是模糊和敏感的。

“机器不是人类，所以人类可以不保护机器的著作权，完全不认可机器创作的作品的著作权。

“只有将机器视为人类的机器，创作的作品的著作权属于其主人所有。

“才能以人类著作权的逻辑获得保护并盈利。

“但人类想要利用别人的素材盈利，就必须获得对方的授权了，这样也就形成了清晰的著作权归属。

“透过现象看本质的话，用机械智能完成以前只有人能够完成的工作，并且讲产量和速度提升几十几百倍，是又一次的产业革命。

“生产力会再次跨越式的提升，技术能够覆盖的产品的生产成本会大幅度下降，由此产生的效益大幅度提升。

“为智能机器成功运行起来提供原料的人，有分享这种生产力提升所带来的利益的权利。

“不能将个人欣赏学习的授权许可，用于研发和制造任何生产工具。

“这样数据资料有价论的逻辑也就清晰了。”

朱靖垣听完之后看向朱迪钚：

“老二你怎么看？”

朱迪钚沉默思考了几秒钟，最终慢慢的点着头说：

“我觉得迪镧的话有道理……

“用微积分的逻辑来评判和区分学习、模仿、抄袭的界限是个很不错的理念。

“未来的公共网络平台上，创作者上传自己的作品的时候。

“应该有一个是否允许机器学习的选项。

“同时也应该有一个是否使用大数据筛选和推荐信息的选项。”

朱迪镧听了马上附和说：

“我赞成二哥的意见。”

朱靖垣笑着说：

“既然你们哥俩都觉得可行，那这些事情就这么定了吧。

“不过问题是，你们怎么判断一个数据模型，是否用了未经授权的材料来训练呢？

“在数据分析层面你们有办法区分吗？”

朱迪钚想了想说：

“可以在未经授权的素材中添加一些验证数据，规避未经许可的机器学习的使用甚至污染数据模型。

“不过……单纯依靠技术手段是不行的，无法完全规避违规者的破解和甄别以及反破坏技术。

“所以还是要用社会和制度层面的限制以及事后处置方法……”

朱迪钚说到这里看向了弟弟。

朱迪镧想了想说：

“制度上有两个方向，一个是默认全部授权，同时默认全部收费。

“目前互联网上的大规模艺术作品平台，都是朝廷和四大产业集团的官方平台。

“民间厂商和用户想要自行建立数据模型，只能从这些平台上采集数据。

“所以可以规定，没有向现有平台之一付费取得授权资格的厂商，都直接按照违规处罚。

“另一个方向，是就由四大产业集团出面，各自设计一套基础软件框架。

“相当于一个带有强制过滤和筛选功能的装置。

“民间厂商做任何的数据训练，必须在这个基础软件框架之上开发。

总949页

尾页

上一篇：鱼肠剑（出书版）下一篇：从秦朝开始的长生之旅

52书库

大明1805(929)

同类小说推荐：