瑞士洛桑联邦理工学院的一项研究发现,近乎一半的所谓人类文本摘要事实上来自ChatGPT等人工智能工具。研究人员表示,人类重要的数据源正在被人工智能文本淹没,这种状况可能会产生严重的后果。
该项研究基于是亚马逊的 Mechanical Turk (MTurk) 众包平台,用户可以在该平台上提供和执行文本摘要等任务。人类工作者被要求总结大约 400 个单词的医学文本,然后研究人员结合使用击键识别和合成文本分类来检测 AI 语言模型的使用。
结果发现提交的摘要中有 33% 到 46% 是使用 AI 语言模型创建的。另外,AI 生成的文本通常与原始摘要几乎没有相似之处,这表明 AI 模型在生成新文本,而不是复制和粘贴原始摘要的部分内容。
研究人员指出,他们的研究结果表明,人类参与文本创作的趋势正在减少并被人工智能所取代,这可能会对众包平台上可用数据的质量和多样性产生负面影响,因为人类数据被认为是黄金标准。
不过,研究人员认为,“这并不意味着众包工作的结束,但它可能会导致众包工作者提供的价值发生根本性转变。”在这样的情况下,人类工作者可以充当重要的人工过滤器,以确定AI模型何时成功以及何时失败。