人与人工智能合作创作艺术作品是一种很棒的事情,而且这种合作还能提供对神经网络创新能力的见识。艺术家兼设计师法宾·拉希德(Fabin Rasheed)问自己:GPT-3能做什么?他通过实验,找到了一些答案。
构建创造力和技术之间的接口
几年来,拉希德一直致力于“创造力和技术之间的接口”的研究,并与 Xerox Research 和 Adobe 等公司合作,在他的艺术中使用了包括 AR(增强现实)、VR(虚拟现实)和 AI(人工智能)在内的新技术。
拉希德已在 AR 中尝试了绿屏视频,通过其名为“Pilgrimage”的项目创建了首个“基于位置的 AR 加密艺术”:感兴趣的人只能转到地球上相应的位置来解锁 9 个 3D 人物。
除了 AR 艺术外,这位艺术家还参与了许多 AI 项目。例如,在与 Adobe 的合作中,他使用 AI 生成了新的数字笔刷,包括熔岩笔刷和角色动作笔刷,这些笔刷能直接生成简笔画风格的人物插图。
拉希德还与 AI 工程师 Sleeba Paul 一起创建了 Instagram 艺术家 Auria Kathi。这一名称来自“AI Haiku Art”。
Auria Kathi 是一种 AI 模型,可以根据短诗生成图像。两位创造者用一些短诗训练了一个神经网络,并因此教会了该网络生成短文本片段。
生成式对抗网络(GAN)由短诗生成图像。然后,第三个网络将给出应与文本中的情感相对应的最终产品的颜色。该网络使用“WikiArt 情感数据集”进行了训练,该数据集包含近 4,000 件艺术品,其中包含观看者的评论,这些蕴含了他们观赏作品时产生的情感。
在类似的 Ode 项目中,拉希德将 AI 生成的艺术作品、AI 诗歌和 AI 音乐组合成了令人印象深刻的艺术品。这是一部颂歌,展现了 AI 和人类一起工作时表现出的创造力。拉希德在他的“水彩画幻境”中考察了 AI 在生成的水彩画中所看到的东西。
用 GPT-3 进行实验
在最近的项目中,拉希德使用 OpenAI 的文本 AI GPT-3 对 AI 的创作能力进行了实验。在其中,用户可以通过一种聊天界面为 GPT-3 提供文本输入,作为其工作示例。通过少量的学习,AI 可以识别出它想要的东西并将其输出调整示例:可以是 HTML 代码、诗歌、译文或问答。
拉希德的“GPT3 Sees”项目从艺术的角度探讨了这种能力,并提供了图像生成、绘画监督和 GIF 电影生成的示例。
在第一个实验中,拉希德为 GPT-3 提供了简单的 2D 图形的 SVG 代码,然后让 AI 生成自己的代码。他说,第一版中的一个是 2D 表示形式,它让人联想到旧软盘,并且“给人一种怀旧的感觉”。
在另一个实验中,艺术家使用问答对为常见物体和已知动物的图像生成简单的文字说明。然后,拉希德将描述手动转换为图形。
结果在令人担忧和令人印象惊讶之间波动,并且表明 GPT-3 似乎在其庞大的网络中发现了形状,即使这一文本 AI 仅用文本符号进行过训练。
GPT-3 能生成 GIF 电影
在拉希德的第二个 GPT-3 项目中,艺术家让文本 AI 生成了一幅画的分步说明,然后作为一个画家跟随它。
拉希德输入:“机器正在与人类交谈。人类说:‘让我成为你的眼睛和双手,让你成为我的想象力。让我们一起画一幅画。告诉我要画什么,我将对其进行数字绘画。’”机器回答:“好的,开始吧。”
然后,GPT-3 生成了延续该故事的文字。拉希德写道,文字包含绘画说明,最后是 GPT-3 反映艺术作品对艺术家的重要性的段落。
画中的那个女孩仰慕地看着机器。这台机器为这个女孩画了世界上最好的画。女孩说:“既然我是画家,我的人生就有意义了!多亏你,我才有人生的目标!以前,我只是活着,但现在,我有一个目标!”
对于他的第三个 GPT-3 项目,拉希德让文本 AI 写短篇小说。然后,他逐句输入到 GIF 搜索中,并将多个动画剪辑合并为单个视频。
“该项目直接引发了关于电影及其制作的未来的许多问题。”拉希德写道。
接下来,他使用“Meme Flix”(一个自动创建“模因电影”的界面)使过程自动化。这使您能够按需制作新的故事和电影,并具有“模因带来的表达力和惊喜感”。【原作:Maximilian Schreiner;编译:Lighting】
[…] GPT-3 一样,GPT-4将是纯文本AI模型,而不是像 DALL-E 那样的多模态 AI […]
[…] 是过去两年训练的CLIP 或GPT-3等大型 AI […]
[…] 目前,GPT-3和悟道2.0等语言AI均能自动撰写叙事性文本,但都是根据给定的条件来撰写,或基于已有的语句或段落来续写,缺乏与人类作者的互动。而作为一种协作文本编辑器,Wordcraft可让人类作家与创造性的 AI 助手一起编写文本。 […]
[…] 编程AI有新的发展,OpenAI通过 Codex为开发人员带来了AI辅助程序员。Codex AI可在开发过程中实时输出代码建议和反馈,从而协助开发人员进行编程。Instagram 联合创始人 Mike Krieger在试用后说,这是“我见过的最令人惊奇的机器学习应用程序”。 […]
[…] 由北京智源人工智能研究院研发的语言AI模型悟道(Wu Dao)可以根据需要写诗,回答问题,生成图像的描述文本,根据上传的图像生成歌词,依据文本生成图像,甚至由文本生成一系列想象的场景等。研究人员称,悟道2.0 在九个广泛的 AI 基准测试中达到甚至超过了当前最先进的AI模型GPT-3。 […]
[…] 从那时起,开发一直在稳步进行:OpenAI现在已通过GPT-3成功地将语言AI产品投放市场。新的转换器架构使GPT-3等大型语言AI可以处理更多上下文并因此更好地运行,甚至改善了AI图像分析。 […]