数据是人工智能的基础,图像分析AI通常是用手工标记的图像数据来训练的。最著名的AI训练数据集是ImageNet,拥有近1400万张图像,这些图像由人们通过亚马逊的微型作业平台“Mechanical Turk”手动分配到各个类别。但是这种方法有时很耗时,因此,许多AI研究人员研究用无监督训练(即使用无标记数据材料)来推进AI图像分析的方法。

现在,Nvidia研究人员提出了另一种方法:用AI工具DatasetGAN生成和标记图像来对图像分析AI进行监督训练。DatasetGAN承诺用很少的人力就可以获得无限的训练数据。

DatasetGAN以StyleGAN为内核。据Nvidia介绍,像StyleGAN这样的系统必须已经在内部表示了所有对象的语义结构,否则就无法生成逼真的图像。因此,研究人员训练了一个独立的神经网络(鉴别器),从StyleGAN的输出中读取语义结构,并在图片中标记它们。为此,Nvidia使用了一个手工标记的数据集,作为鉴别器的模板。经过训练后,该鉴别器能够自动将所需的标签添加到现有的语义结构中,并将它们放在生成的图像上。

借助 DatasetGAN,研究人员可以用一些有详细标记的样本图片生成数千张也带有这些详细标记的新图像,并用它们训练图像分析AI。

不过,这种合成训练数据是否适合在所有应用领域中替代真实和人工标记的图像,还需要通过进一步的测试加以证明。下一步,研究人员将用更多类别来扩展 DatasetGAN。