对于每一个文字工作者来说,抄袭或许可以称得上是最令人无法容忍的事情之一了。
尤其是对于出书的作家而言。
前BBC技术记者Rory Cellan-Jones对于自己写的那本回忆录十分上心,“和大多数作家一样,我经常在亚马逊上查看销售情况”。
然后这本书就出现了。
这天他照常关注着书的销售情况,然后发现在亚马逊搜索出来了Cellan-Jones的传记,封面设计得很幼稚,而作者,他从未听说过这个人。
“我当时想,这也太奇怪了——谁在写我的传记?Cellan-Jones告诉《观察家报》。我没有自欺欺人。我卖关于自己的书就已经很困难了,(更不用说)让其他人卖关于我的书了。”
但是,看了一会儿就会发现,Cellan-Jones成了有人企图借他的回忆录大做文章的牺牲品。因为书中的文字显然是由人工智能生成的,这是自ChatGPT出现以来大量人工智能中的一种,它使快速生成几页文字,而无需人们费心去写。
AI抄袭并出版了书,亚马逊推荐给了被抄袭者
Cellan-Jones的著作Ruskin Park: Sylvia, Me and the BBC,描述了他如何发现母亲写给他的一鞋盒信件,信中详细描述了母亲与他父亲的恋情。父亲是英国广播公司的电视导演,他母亲在23岁时与他相识,这本书“讲述了一个单身母亲和一个不在身边的父亲的成长故事”。
但Cellan-Jones表示,这本堪比一本家庭侦探小说的书“完全是虚构的”,他的父亲是一位学者,母亲是一名教师。
随后,然后亚马逊给他发了一封邮件,说“你可能会喜欢这本书”。他们的算法认为这是他想要的一本书,而不是去推荐他辛辛苦苦写了很久的书。
亚马逊实际上是在允许垃圾书的存在,并推荐给最讨厌它的人。
没过几天,亚马逊删除了这本假冒作者的传记和其他作品,但还有很多作品通过了旨在剔除低质量图书的过滤器。
利用亚马逊的Kindle Direct Publishing(KDP)系统,一些“作者”在一天内发布数十本图书。
比如一个名为Steven Walryn的人出版了30多本书,其中大部分是关于如何使用相机品牌的无意义且重复的指南,以及几本奇幻浪漫小说,其中15本书是在5月的同一天出版的。目前已被亚马逊删除。
人工智能正在“威胁”创作者
亚马逊拒绝透露有多少本书被阻止出版或有多少书被下架。
“随着人工智能生成的产品涌入其商店,亚马逊显然面临着重大挑战,而且它似乎正在迎头赶上。”作家协会(SoA)首席执行官Nicola Solomon表示。
几周前,该公司表示,KDP新出版物的出版商需要声明是否包含人工智能生成的内容,并且每天仅限出版三本书,此举受到Solomon的欢迎。
“但这些小修复似乎比读者和人类作者更有利于亚马逊的流程。”她补充道。SoA希望亚马逊将产品明确标记为人工智能生成,并允许读者过滤掉人工智能标题。
这个问题与音乐家遇到的问题类似,他们面临着向流媒体服务上传白噪音的人争夺Spotify版税的竞争。
玛格丽特·阿特伍德 (Margaret Atwood)、越南阮 (Viet Thanh Nguyen) 和菲利普·普尔曼 (Philip Pullman) 等作者也担心,他们的工作成果在未经他们同意、或任何补偿或信用的情况下被用于大型语言模型来训练人工智能。
特许IT机构BCS集团首席执行官Rashik Parmar表示,部长们需要制定立法,确保人工智能生成的材料包含数字水印,以便轻松追踪。
帕尔玛表示:“如果立法能够帮助英国IT专业人员展现更高的道德标准,那么英国在成为负责任计算的发源地方面具有得天独厚的优势。”
“‘英国编码’会成为某种特殊事物的绰号吗?”
亚马逊发言人表示,所有出版商都必须遵守其内容指南。“我们投入大量时间和资源来确保遵循我们的指南,并删除不遵守这些指南的书籍……虽然我们允许人工智能生成的内容,但我们不允许人工智能生成的内容违反我们的内容指南,包括创建令人失望的客户体验。”