硅谷再次准备利用他人的产品大赚一笔,以前所未有的规模攫取数据,这已经引发了诉讼和国会听证会。

聊天机器人和其他形式的生成式人工智能在最近几个月突然出现在科技领域,它们被输入从互联网上抓取的大量材料——书籍、剧本、研究论文、新闻报道、照片、艺术、音乐、代码等等——来生成答案、图像或声音,以响应用户的提示。

科技公司正在竭尽全力利用这种潜在利润丰厚的新技术。市值1.5万亿美元的谷歌(Google)在其竞争对手、市值2.4万亿美元的微软(Microsoft)向旧金山的生成式人工智能(generative AI)先驱OpenAI投资数十亿美元后,全力投入其聊天机器人巴德(Bard)。市值6800亿美元的meta刚刚宣布了在其应用程序中添加聊天机器人的计划。风险投资家正在向可生成的人工智能初创公司投入数十亿美元。

但一个棘手的、有争议的、后果重大的问题出现了:这些机器人的大量素材都是受版权保护的财产。

今年1月,湾区艺术家卡拉·奥尔蒂斯(Karla Ortiz)与俄勒冈州的一位漫画家和田纳西州的一位画家一起,在旧金山的美国地方法院起诉了总部位于英国的图像生成公司Stability AI,声称Stability在未经许可或赔偿的情况下,对从互联网上抓取的50多亿张受版权保护的图像进行了软件训练,侵犯了数百万艺术家的权利。

诉讼称:“它只是带走了他们。”该诉讼称,Stability AI的产出“完全来自”这些图像,并“将对艺术家作品的市场产生重大负面影响”。

在今年4月提交给法院的一份文件中,“稳定人工智能”辩称,其软件“能够让用户创造全新而独特的图像”,而且其技术不会产生与艺术家受版权保护的作品“有很大相似之处”的材料。

新一代人工智能的知识产权问题超越了艺术,进入了电影、电视、摄影、音乐、新闻媒体和计算机编码领域。批评人士担心,科技行业的主要参与者将自己置身于商业市场的生产者和消费者之间,将吸走资金,并消除制作电视剧本、艺术品、书籍、电影、音乐、摄影、新闻报道和创新软件的经济激励。

“这可能是灾难性的,”新闻/媒体联盟(News/Media Alliance)的首席执行官丹妮尔·科菲(Danielle Coffey)说。该联盟代表包括《纽约时报》在内的近2000家美国新闻出版商。“这可能会摧毁我们的行业。”

就像互联网搜索、社交媒体和外卖等硅谷的其他创新一样,这项新技术正迅速在消费者和企业中流行起来,可能会在监管机构和立法者收集知识和政治意愿来施加限制和减轻危害之前,就根深蒂固,并受到用户的喜爱。

“我们可能需要立法,”加州民主党众议员佐伊·洛夫格伦(Zoe Lofgren)说,她是众议院司法委员会(House Judiciary Committee)的成员,上个月听取了有关版权和生成人工智能的证词。“内容创作者有权利,我们需要找到尊重这些权利的方法。”

问题的核心是合理使用原则,该原则允许在某些条件下未经许可使用受版权保护的作品。洛夫格伦认为,法院将在国会采取任何行动之前就此事作出裁决。

旧金山湾区律师兼电脑程序员马修·巴特里克(Matthew Butterick)去年年底发起了第一次法律行动,代表两名未透露姓名的原告,对微软及其子公司GitHub及其合作伙伴OpenAI提起集体诉讼,声称人工智能编码助手GitHub Copilot是建立在“规模空前的软件盗版”基础上的。今年1月,被告公司在旧金山的美国地方法院进行了回击,声称其工具“凝聚了从数十亿行公共代码中获得的知识”,它“没有从公众可用的开源代码中提取任何东西”,并促进了学习、理解和合作。

对内容掠夺的愤怒正在高涨。照片销售巨头Getty也在起诉Stability AI。上个月罢工的好莱坞编剧引起了人们的担忧,他们担心电影公司将开始使用聊天机器人编写的剧本,这些剧本以编剧早期的作品为基础。唱片业已就版权音乐被用于训练人工智能向联邦当局提出申诉。

圣克拉拉大学法学院教授埃里克·戈德曼认为,法律倾向于使用受版权保护的材料来训练生成式人工智能。“所有的工作都建立在先例的基础上,”互联网法律专家戈德曼表示。“我们都可以自由地借鉴前人的作品。生成式人工智能所做的是加速这一过程,但这是相同的过程。这都是我们社会知识宝库进化的一部分。”

然而,加利福尼亚圣克鲁斯的著名野生动物摄影师弗兰斯·兰廷指出,技术进步有绕过内容生产者法律保护的历史。“版权法的神圣性越来越受到新技术的破坏,”兰亭说,他引用了“普通公众,尤其是科技公司的一种假设,即个人作品可以被复制……而无需对创作者进行署名或任何补偿。”一切都是免费的。”

兰亭担心,他自己的照片通常是关于人类对自然世界影响的故事,可能会被人工智能复制,并以破坏人们对他作品信任的方式呈现。

加州大学伯克利分校(University of California-Berkeley)工程讲师、风险投资家肖米特·戈斯(shomt Ghose)表示,生成式人工智能可能需要监管,以禁止直接模仿创造者的作品。但他说,人工智能有可能增强多种形式的创造力,这让他想起了漫画书和电影中的英雄钢铁侠,一个被技术增强的人类。戈斯说,很有可能,“未来就是钢铁侠。”

在新闻/媒体联盟(News/Media Alliance)的科菲看来,联邦立法者的关注为谨慎乐观提供了理由,尤其是考虑到硅谷的历史,谷歌和Facebook通过介入新闻生产者和消费者之间,吸走了数字广告收入的大部分,从而削弱了新闻业,而世界各地的立法者花了几十年的时间才做出回应。该联盟的“人工智能原则”表示,合理使用不适用于未经授权抓取出版商的内容,新闻制作人必须通过一个尚未开发的系统(可能是许可)获得报酬。

许可可能是一个有问题的解决方案。当市值接近3万亿美元的苹果(Apple)和300亿美元的Spotify等科技公司介入音乐家和听众之间,在网上提供音乐时,这些公司和唱片公司,以及一小部分音乐明星,攫取了大部分收入,而大多数音乐家的收入相对微薄。

洛夫格伦希望找到一种解决方案,既不牺牲美国在新技术及其承诺的进步方面的领导地位。“我们希望平衡我们的努力,以确保艺术家和其他人得到公平对待,”她说。“我们也不想把美国排在第二或第三位。”

加利福尼亚州森尼维尔市(Sunnyvale)的软件工程师约翰内斯·恩斯特(Johannes Ernst)是一家建立个人数据控制平台的初创公司Dazzle Labs的首席执行官,他表示,内容生产者可以在他们的工作中标注使用条件,而在网络上搜索人工智能素材的公司必须遵守这些条件。恩斯特说,关于法律保护的争论本末倒置。

“我们需要弄清楚这里的对错,”他说。“先不管律法怎么说,问问自己:‘应该怎样呢?’然后看看我们可以使用哪些法律来实现这一目标,以及可能需要哪些新的法律。”