与一段时间以来人工智能图像模型遭遇的情况一样,语言模型现在也正面临版权问题。毕竟,如果没有用以训练的庞大数据集,ChatGPT 等将毫无用处,而这些数据集包含了来自出版商受版权保护的文本。德国的联邦数字出版商和报纸出版商协会(BDZV)、自由新闻媒体协会(MVFP)日前在《每日镜报》发表联合声明,提出了一种许可模式。
此外,出版商担心新一代基于人工智能的搜索引擎在内容货币化方面的垄断,从而夺走他们的流量和收入。“如果谷歌的搜索在排名、覆盖率和知名度方面偏爱自己的人工智能内容,而不是竞争对手的出版商内容,这是垄断者的自我偏袒和对竞争对手的歧视,必须禁止。”BDZV和MVFP在联合声明中写道。
微软已经推出了基于OpenAI技术的必应(Bing)聊天机器人搜索,该搜索在搜索页面上提供完整的答案和进一步的引用。虽然微软首席执行官萨蒂亚·纳德拉(Satya Nadella)承诺优先考虑内容创作者的流量,但他没有透露聊天机器人搜索原则将如何与流量重定向齐头并进。谷歌也已推出AI聊天机器人“Bard”,并将用以扩展其搜索产品。
鉴于聊天机器人搜索结果可能会消除或至少减少与作为内容来源的页面的互动,出版商有理由担心这会大大降低外部网页的点击率。
据人工智能博客The Decoder的报道,在这之前,行业协会Corint Media已经在搜索引擎和出版商之间就网站文本片段的使用进行调解,支持和呼吁在聊天机器人使用新闻内容时给予“适当补偿”。“随着时间的推移,法律可能需要根据技术发展而收紧。”Corint Media的一位发言人说。