专注于AI图像生成的初创公司Midjourney 首席执行官David Holz预计,AI 媒体生成将继续快速发展,在两年内,应该能够以每秒 30 帧的高分辨率实时生成内容。
近3年来,人工智能在图像生成方面进步惊人。除了 OpenAI 的图像AI模型DALL-E 2,Midjourney也有令人信服的表现。虽然该系统生成的图像在一致性和细节上不如DALL-E 2,照片级真实感也逊于OpenAI系统,但它有时可以创建很吸引人的艺术主题。
MidTravely目前正在公测中。据Holz称,该系统目前拥有数十万客户,每天在大约 10,000 台服务器上生成数百万张图像。另外,Midjourney 的 Discord 社区有大约 100 万用户活跃。Holz 解释说,这个社区也是MidTravely的一部分——人们在集体中更有创造力,可以互相启发。
根据Holz的说法,每张图像涉及“数千万亿次运算”,这种计算机服务是前所未有的。据他介绍,图像 AI 的一次训练运行成本约为 50,000 美元,而每个训练过程需要多次(3 到 20次)运行,直到获得正确的结果为止。尽管初期成本很高,但中期应该有利可图,因此MidTravely至今一直自行融资营运。
关于AI 生成媒体的未来,Apple 最近推出的 AI系统GAUDI已经朝这个方向迈出重要一步,该系统可以由语句创建交互式 3D 场景。
Holz 相信,十年后将会有一款带有 AI 处理器的 Xbox 可以实时实现所有游戏的梦想。“从技术的角度来看,这些只是事实,无法回避。”Holz 表示,今天仍然“完全无法想象”的 AI 未来软件是他创业的重点。