澎湃Logo
下载客户端

登录

  • +1

AI会如何改变摄影?

2023-04-11 12:38
来源:澎湃新闻·澎湃号·湃客
字号

Charlie Engman, Office Chair III, 2023

AI会如何改变摄影?

今年早些时候,当我问摄影师劳里·西蒙斯 (Laurie Simmons) 为什么开始使用AI作为创作工具时,她说:“因为它存在!” 西蒙斯最初对 AI 的兴趣是在 COVID-19 大流行限制了短途旅行或拍照聚会时出现的,她最近使用 DALL-E(一种于 2021 年推出的流行文本到图像生成器)来创作新作品。在整个 2022 年人工智能引发的关于版权和原创性的争论中 ,她是越来越多的探索该技术内在潜力和问题的摄影师之一。

围绕人工智能和摄影的许多担忧来自于图像-文本生成器的结构或责任的缺乏,这些生成器从互联网上搜集数十亿张带有相关文本(标题、标签等)的图像,以供其数据库使用。一群艺术家最近以侵犯版权为由对 Stability AI 提起集体诉讼 ,图库摄影服务 Getty Images也是如此。对艺术之死的焦虑似乎伴随着当代艺术的每一次新发展,即使艺术家在他们的实践中采用和适应新工具也是如此。西蒙斯最近在由Web3平台Fellowship组织的在线合集 In and Around the House II中展示了她的一些新作品。

Laurie Simmons, (In and Around The House II #32), 2022

Laurie Simmons, (In and Around The House II #13), 2022

在许多方面,AI 是一个过于宽泛的术语,涵盖从自动驾驶汽车到电子邮件措辞提示再到个性化医疗建议的所有内容。它支持你的Google搜索以及Photoshop中的对象选择工具。对于许多艺术家来说,人工智能意味着可能性的彻底扩展,但这项技术也预示着许多创造性劳动的自动化。人们担心他们的工作。

艺术家们最初被一种被称为GANs的早期人工智能形式所吸引,即生成式对抗网络,它从包括图像在内的现有数据中创造出复合视觉效果。GANs允许艺术家编译个性化的数据集;例如,摄影师可以使用他们自己的图像档案来创作新作品。相比之下,文本到图像的生成器依赖于单个艺术家无法编译的海量数据集。直到最近,他们还需要开发人员的邀请才能访问这些生成器。但是,到 2022 年,随着技术的普及,越来越多的艺术家开始分享他们的实验,人们亲眼目睹了这些系统可以从一串简单的文字中创造出什么。

西蒙斯将使用DALL-E的体验比作观看显影剂溶液中出现的模拟照片。几乎在第一时间,艺术家就能够制作出再现她的作品所特有的家庭和心理内在的图像,包括家庭环境中的玩偶式的人物,扩展了她实践中普遍存在的女性主义话语。即使当她的AI人物在户外——在田野里散步或坐在露台上——她的构图也暗示着小插曲,营造出一种人物被物体和环境所包含或约束的感觉。一幅“自画像”描绘了一个女人在乡间小路上遛狗,与西蒙斯、她自己的狗,甚至她家附近的道路都惊人地相似。

在她早期与 DALL-E 的接触后不久,她对自己的创作过程更加慎重,并开始识别特征和属性,以仔细构建更准确和有效的文本提示。对于西蒙斯来说,这些提示感觉像是秘密——至少现在是这样——而且也充满了惊喜。“有时候我觉得自己像个AI低语者,其他时候我觉得自己很失败,”她说。

由于这些图像生成器的数据来源范围很广——从图片库照片、新闻图像、社交媒体帖子和个人网站等在线图像——结果可能是真实的也可能是离奇的。纽约摄影师查理·恩格曼 (Charlie Engman) 认为,AI 对身体的有限理解源于通过图像而不是生活经验来感知它们。凭借舞蹈和表演背景,恩格曼的作品涵盖时尚图象以及他母亲的合作肖像。他的人工智能实验进一步推动了这些想法,探索了技术如何能够和不能表达身体运动。

我们的身体姿态表达了内在的心理状态,但人工智能却难以处理情感的美感。悲伤或快乐可能会出现在 AI 生成的脸上,但不会复制到这些人物的姿势或手势中。恩格曼观察到,表演者的肢体语言包括随着时间的推移而培养的微妙动作的选择,以表达思想和感受,但很少能跨 AI 数据集准确读取这些动作。与图像关联的标签通常不说明情感和特定手势之间的关系。例如,一种情绪可能会被确定为快乐,因为许多带有微笑的图像都被标记为“快乐”,但 AI 可能不会被提示去辨别其他微妙的姿势或姿态,例如放松的肩膀。对恩格曼来说,这种差距是探索该技术的一个令人信服的理由。

Charlie Engman, Parking Lot I, 2023

Charlie Engman, Sweetcheeks, 2023

他使用Midjourney(另一种文本到图像生成器)制作的作品描绘了奇怪且不可能的扭曲,其中许多扭曲了物理定律和物理接近度。他已经能够使用这个工具来创造因为道德原因和生理上的限制他永远不会要求的情况。例如,他的身体图像融入椅子中,俏皮地讽刺现代办公室生活。其他实验已经产生了模仿时尚传播视觉语言的图像,他的版本以看起来既熟悉又不自然的细长模特为特色。恩格曼说,任何对制作图像感兴趣的人“至少要有好奇心”。

Charlie Engman, Fashion Design V, 2023

当 DALL-E 和 Midjourney 被广泛使用时,许多人也很好奇这些数据集如何解释各种身份和生活方式。跨学科的艺术家兼研究员明妮·艾泰路(Minne Atairu)在 2020 年对人工智能产生了兴趣,这是她作为哥伦比亚大学的博士生对创意技术不断进行研究的一部分。艾泰路的工作主要集中在技术如何重现或改变文化历史中的缺席,尤其是后殖民时代的尼日利亚。

最初,她训练了一个 GAN 数据集,根据她从 Instagram 下载的黑人模特图像生成肖像。当她转向 Midjourney 时,她发现该系统对黑人身份的成像能力产生了反复出现的刻板印象,尽管她在努力克服。在生成器中输入具体的描述——比如衣服的浅绿色——生成了一幅城市景观中的黑人形象,她发现其中的细节与她在哈林区的邻居非常相似。经过反复试验后,艾泰路推断 Midjourney通过将明亮的颜色和黑色联系起来推定一系列的社会经济条件。

就像构成它们的数据集一样,这些系统也不是中立的。Midjourney 的局限性进一步激发了 艾泰路对文本-图像生成器如何描绘黑人某些特征的研究。她的系列《金发辫子》(2023年至今)解决了这个问题和所需的纠正工作。要求“金发”作为她的文本提示的一部分产生了一个郊区的中产阶级环境,再现了广泛的文化刻板印象,强化了种族主义的想象。由于数据集中关于人的信息有限,生成器也可能陷入困境。艾泰路解释了美拉尼西亚人(斐济、印度尼西亚和巴布亚新几内亚的土著居民)如何自然地拥有浅色头发,但生成器难以描绘这一点表明它不熟悉这种身份。当她要求提示生成两个人的图像并指定黑色调时,两个人都会出现金色头发,但生成器似乎无法使他们具有相同的肤色;一个总是比另一个浅。

“编码的偏见和刻板印象无法通过调整文本提示和策划选择来消除,”她说。“相反,为了解决此类推理问题,开发人员需要审查用于训练模型的底层数据结构。” 艾泰路的照片可能并不代表真人,但它们反映了一种重要而持久的信息偏差。“无论多么超现实,”她补充道,“总会有小故障。”

Minne Atairu, Blonde Braids Study IV, 2023

Minne Atairu, Blonde Braids Study V, 2023

Minne Atairu, Blonde Braids Study II, 2023

All photographs courtesy the artists

现在仍处于早期阶段,许多人认为这是人工智能生成图像的特殊时期,甚至是脆弱时期。仅仅根据图像质量或真实性来诋毁这些陈述,就忽略了更大的问题,即它们所产生的文化的不平等--在社会习俗和在线数据方面都是如此。对这些系统进行实验是要求它们变得更好、更有包容性的第一步。当恩格曼和西蒙斯将他们的工作推向新的审美方向时,艾泰路提醒我们人工智能数据库背后的假设和不平衡。

人工智能可能已经开始从根本上改变我们对摄影的思考方式,但记住这样的讨论一直是媒介发展的一部分是有帮助的。围绕作者身份和创造力的旧争论将在这种新背景下重新出现,考虑图像美学和伦理的艺术家要求更认真地收集数据是正确的。随着 AI 与摄影的关系不断被定义,它仍将由艺术家以有趣、创造性和批判性的方式探索技术的极限来塑造。

作者:夏洛特·肯特 (Charlotte Kent) 是蒙特克莱尔州立大学的艺术作家和视觉文化助理教授。

原标题:《AI会如何改变摄影?》

阅读原文

    本文为澎湃号作者或机构在澎湃新闻上传并发布,仅代表该作者或机构观点,不代表澎湃新闻的观点或立场,澎湃新闻仅提供信息发布平台。申请澎湃号请用电脑访问http://renzheng.thepaper.cn。

    +1
    收藏
    我要举报

            扫码下载澎湃新闻客户端

            沪ICP备14003370号

            沪公网安备31010602000299号

            互联网新闻信息服务许可证:31120170006

            增值电信业务经营许可证:沪B2-2017116

            © 2014-2024 上海东方报业有限公司

            反馈