AI in museum(Introduction)
德古意特上关注了好久的一本书,或许是因为近两年AI发展的实在是太快了,所以从23年初到现在才正式出版,用GPTs简单翻译一下引言部分
引言
本卷源于在卡尔斯鲁厄的巴登州立博物馆举行的“人工智能文化:博物馆的新视角”会议,该会议于2022年12月1日和2日举行,并同时在网络上进行了直播。人工智能在文化世界中尚未成为主流话题,但在关于数字化和数字性的一般辩论中确实占有一席之地。然而,与常见假设相反,机器学习、神经网络和大型语言模型的使用已经多年来持续增长。除了著名的灯塔项目,对国际博物馆景观的初步调查列出了许多百个项目,这些项目通过新的方法解决传统博物馆工作和数字性辩论的问题。这个数字在不断增加,要获取所有发展的概览并不总是容易的。因此,在当前关于ChatGPT的热潮之前很久,就已经建立了讲英语和德语的关于人工智能和博物馆的网络,会议因此旨在将尽可能多的学科专家和代表聚集在一起,正是朝着这个方向讨论博物馆的新视角。
该会议是巴登州立博物馆与阿姆斯特丹的阿拉德·皮尔逊博物馆以及下萨克森基金会的LINK资助计划合作举办的。多年来,与阿拉德·皮尔逊博物馆有着密切的合作,范围从联合展览和博物馆营到正在进行的“创意用户赋权”项目,该项目利用人工智能为收藏提供新的访问方式,并在本卷中更详细地介绍。与下萨克森基金会的LINK计划也进行了长时间的密切交流,这在其他方面导致了德语区网络AI & Museums的建立。鉴于这一背景,联合举办这次会议是一个显而易见的步骤。出于提供更广泛视角的考虑,选择了稍微更通用的标题“AI in Museums”(人工智能在博物馆中)作为本次出版物的标题,其中还包括额外的论文;与副标题一致,该卷被划分为三个较大的部分,分别是关于人工智能在博物馆中的反思、视角和应用。
丹·布朗在他2017年的小说《起源》开篇中描绘了一个神秘的场景:主角罗伯特·兰登访问毕尔巴鄂古根海姆博物馆,参加由科技亿万富翁埃德蒙·基尔希举办的关于人类起源的壮观揭示。到达后,兰登被给予一副基尔希开发的耳机,所有参加活动的人必须使用这款耳机来体验博物馆的个性化导览。戴上耳机后,人工智能温斯顿介绍了自己,欢迎兰登,并解释了基尔希的想法:“他专门为博物馆设计了这套系统,希望能取代他所鄙视的团体游。这样,每位参观者都可以享受私人导览,按照自己的节奏移动,提出他在团体情况下可能会尴尬提问的问题。这实际上更加亲密和沉浸式”(布朗2017,29)。当然,这不仅仅是关于艺术的闲聊;在活动中,发生了一次暗杀企图,围绕全球展开了一场神秘的追逐,其中交织着所有关于人工智能和超人类主义优越性的陈词滥调。但无论人们对布朗及其悬疑惊悚小说的质量持何种看法:在2017年他的博物馆场景中还被视为科幻小说的内容,如今随着ChatGPT的发布,似乎已经近在咫尺。
人工智能作为一种技术和社会现象的影响已经无处不在。实际上,它或多或少渗透到人类生活的每一个方面,其影响在未来几年内肯定会加强。它的影响正在推动国际市场的转变,并改变全球范围内的职业和产业结构(Chui/Hazan/Roberts等2023);创意领域如电影、文学和艺术也在其影响下演变,产生了新的表达形式、学习方式和叙事,同时也改变了我们对文化本身的理解(德国文化理事会2023)。当前,多个科学学科正在参与其研究和发展,这强调了AI已经超越了仅限于计算机科学和研究的纯技术领域(Budelacci 2022;德国伦理委员会2023)。一种更包容的方法承认了它的多面性,并将该领域视为一本地图集,提供了一个平台来探索和培养多样化的概念化、应用、方法论和影响,并解开对技术及其现象的权力结构和抵抗(Crawford 2021)-所有这些将继续改变文化领域(Hochscherf/Lätzel 2023)。
人工智能并非只有一种形式。在其1950年的基础研究中,艾伦·图灵认为,智能人类的思考不能被精确定义,因此任何机器的输出,如果不能被人类识别出来,也应该被视为具有智能(图灵1950;Vater 2023);稍后不久,在1956年著名的达特茅斯研讨会上,人工智能研究领域得到了建立(McCorduck 2004;Moor 2006)。从那时起,AI的概念一次又一次地发生变化,被细分为专家系统、语音识别或计算机视觉等子领域,并经历了繁荣和衰退(Nilsson 2004;Seising 2021)。AI作为一个伞形术语,涵盖了多种技术方法,这些方法经常被视为对人类智能的挑战,定期触发幻想和恐惧。如果说得不那么夸张,那些遵循算法规则、识别数据中的模式,并解决特定任务的系统,对人类智能及相关类别如思考、意识、理性、创造力或意向性的挑战就不那么尖锐了。近年来唯一发生了戏剧性变化的是,这样的系统——从简单的机器学习到神经网络和大型语言模型的发展,已经达到了一种复杂性和效率的水平,常常产生惊人的结果。但要正确理解这一点,需要与图灵的思考方式相反:结果看起来可能是智能的,但它们并不是。这就引出了文化领域的核心问题,以及布朗神秘博物馆场景中仍缺失的一环:AI的方法基于数学原理、逻辑和概率,而文化则是关于意义和歧义的谈判。因此,中心问题是文化领域可以利用哪些策略,将这些方法用于意义的产生,并将它们综合成某种类似于文化智能的东西。
使用人工智能的方法也引发了许多其他问题。例如,生成式图像制作引发了关于版权的新问题,数据的可访问性和提供问题因此变得更加紧迫,同时作者身份正在重新协商,知识生产的形式在根本上发生了变化。在这个变革性发展的时代,技术和社会变革的快速步伐需要积极和包容性的策略。虽然规范和认证很重要,但它们本身并不足够。当前的需求是一个充满活力和包容性的讨论、知识交流和构建,通过教育、研究和开发部门之间的积极参与,可以做出重大贡献。文化机构和博物馆可以在这些变革过程中成为重要的参与者,因为它们在讨论和语境化有争议的问题以及从历史上反思这些问题方面拥有大量的专业知识。特别是那些致力于降低障碍和促进包容性的具有多样化员工队伍的机构,也拥有大量的高质量数据。然而,也必须指出,人工智能领域受到现有和新出现的排除机制的影响,这也加剧了围绕数字和文化不平等及参与的问题(O'Neil 2017;Benjamin 2019;Crawford 2021)。
本卷着眼于这些悬而未决的问题。它不可能也不声称完全回答这些问题,或提供一个关于博物馆中人工智能主题的全面概览。相反,目的是提供对这个迅速发展和变化领域的广泛和多声部的见解,汇集来自不同国家背景的理论家和实践者的光谱,并为进一步的讨论提供基础。贡献不是基于单一的AI定义或仅仅基于一个特定概念。贯穿本卷所有文本的共同线索是,博物馆中的人工智能领域迫切需要被关注和积极塑造,以便技术发展不仅仅从外部重塑博物馆。鉴于这一背景,本引言的目标是提供整个卷宗的概览,并突出较大的主题领域。根据卷宗的结构,它分为三个部分:反思(1),视角(2)和应用(3)。
反思
人工智能的使用是一项复杂的业务。虽然应用它需要技术专长,但至少同样重要的是系统性地反思在人工智能模型案例中涉及的技术责任和结构背景,特别是因为它们大多数来自全球运营公司的不透明背景。由于底层数据偏见而产生的种族定性、阶级和性别特定歧视的讨论案例可能不会在博物馆的背景下像在司法、社会信用系统或人力资源数据库中那样清晰地呈现自己。但这当然不会将根本问题放在透视中。在本节的开篇文章中,《文化在人工智能智能中的角色》,梅赛德斯·邦兹提出了这些问题,并首先提供了一次广泛的视野之旅。鉴于围绕人工智能的普遍误解,她为“机器智能”这一替代术语辩护。除了反思当前过程,文化领域可以从非常具体的机器学习方法中受益,以便转移文学方法如“远距离阅读”(Franco Moretti),并在文化数据中找到新的联系。面对资源和剥削问题,需要的是一个“批判性技术实践”(Phil Agre),它将各种参与者和利益相关者汇集在一起,与人工智能自身的逻辑和错误文化接轨,并利用其潜力来应对无处不在的信息洪流。
理论与实践之间的张力是对人工智能反思的核心。在他的论文《为什么人工智能不能思考——一个理论方法》中,丹尼尔·费格讨论了最近被广泛讨论的问题,即人工智能是否可以发展出意识并拥有理性。与图灵相对立,他认为将智能概念扩展到包括机器的输出是一个严重的错误。基于现象学和分析立场(特别是约翰·麦克道尔的立场),只有在不仅处理而且理解世界表征的情况下,才能谈论思考的存在——他的中心论点:思考的存在必须是某种生命形式的承载者。在他的论文《人工智能与艺术:实践的论据》中,阿诺·舒巴赫接受了由如Dall-E这样的图像生成器重新点燃的问题,即人工智能是否可以具有创造性并产生艺术。通过对迈克尔·诺尔1960年代实验作品的迷人回顾,他认为人类及其输入仍然是艺术生产中决定性的因素——因此,讨论应该更多关于如何将人工智能有效地整合到创造性实践中。在她的论文《人工智能的隐藏成本:从实践到理论的去殖民化》中,欧麦玛·哈杰里关注人工智能的伦理和社会方面。她反思了人工智能的工具性、基础设施和意识形态维度,并主张系统地提出“谁受益”的问题及其与社区歧视相关的问题——回归理论可以帮助突出某些先入为主的逻辑、使用的语言和人工智能领域倾向于“白色”的明显趋势,而不是因过度实践而迷失在技术解决方案中。
在建立人工智能项目时,博物馆需要考虑这些问题。在他的论文《死胡同还是出路?使用人工智能为绘画收藏生成关键信息》中,卢卡斯·福克斯格鲁伯接着哈杰里的一般观察进行讨论。在博物馆的具体背景中,他强烈反对一种技术解决主义,这种主义据称可以解决所有问题,如更好的可访问性或民主化。相反,博物馆应该完全透明地处理它们对人工智能的处理——从数据上的看不见的工作到与商业伙伴的合作,依赖于在数据生产中的广泛合作,并且首先将其理解为一个社会问题。在她的论文《权力、数据与控制:博物馆中的人工智能》中,奥纳·墨菲继续询问实验人工智能的博物馆如何在博物馆收藏和访客管理的背景下重新协商权力关系。作为有用的框架,她介绍了“数据伦理画布”、“后果扫描”方法和她共同开发的“博物馆+人工智能工具包”(Murphy/Villaespesa 2022)。在她的论文《管理人工智能:为博物馆制定战略和伦理指南》中,索尼娅·蒂尔提供了对“创意用户赋权”项目指南开发的更具体见解。她特别强调反思人工智能项目的规范前提和框架,强调有意识地使用大型语言模型和开放处理数据的重要性,并指出需要明确定义人工智能解决问题的要求。
最后,人工智能在博物馆中的日益使用本身就是一个重要的研究和研究对象。克里斯托夫·巴雷特在他的论文《博物馆-人工智能组合体:用于民族志和定性研究的概念框架》中概述了一种方法。他借鉴了组合体的概念(吉尔·德勒兹/费利克斯·瓜塔里/曼努埃尔·德兰达),这一概念在博物馆研究和数字转型的背景中已经证明了其价值,并且非常适合进一步发展成为“博物馆-人工智能组合体”,系统地调查人工智能、人类和对象之间不断变化的关系;该论文还不是一个实证研究,这意味着这种方法被试探性地应用于博物馆聊天机器人的例子。当将本节中的论文综合起来时,从对人工智能的一般反思,到其在博物馆中的伦理负责任的应用,再到对支持人工智能的博物馆的批判性调查,权力和解释权的问题就像一条线贯穿其中。新技术是复制现有的权力关系,加强它们,还是仅仅建立新的关系?或者转向下一节:它是否也能在必要的反思中开辟新的视角,有助于拆除不公平的权力关系,并使更多人能够访问博物馆?
视角
人工智能在博物馆的应用出人意料地广泛和多样。对国际博物馆界的调查揭示了众多的人工智能项目,这些项目致力于更好地理解模拟和数字访客及其行为,通过聊天机器人和其他应用开发新的博物馆体验,系统性地解决博物馆的数据基础,或试探性地探索博物馆工作的变化。近年来,许多研究项目开发了可以作为灵感来源并作为进一步研究和开发的开源基础的解决方案。毫无疑问,这些方法在未来几年将变得更加多样化。因此,“视角”部分以巴蒂斯特·卡拉米欧的论文《人工智能与博物馆及文化遗产》开篇,系统探索人工智能为博物馆和文化遗产领域带来的潜在机会,但也强调需要考虑其实施的社会文化和社会技术影响。
为了在人工智能领域发展视角,需要概览、最佳实践和资金支持。伊莎贝尔·胡夫施密特的论文《故障排查?全球博物馆中人工智能的绘图》,呈现了全球博物馆中人工智能使用的绘图,旨在理解采纳它的动机、背景、目标和挑战。来自图书馆和档案部门以及数据处理领域的具体最佳实践示例,旨在指引当前和未来的文化数据实践之路。克莱门斯·诺伊德克尔的论文《数字化管理和收藏对人工智能:文化遗产机构的机会和风险》,强调了人工智能对文化遗产机构在数字化和管理方面的好处,但也对未完全理解后果的情况下应用黑盒技术表示担忧。法比奥·马里亚尼、林恩·罗瑟和马克斯·科斯在他们的论文《教授人工智能掌握出处:博物馆数据的注释方案》中展示了人工智能如何利用自然语言处理(NLP)技术将博物馆出处记录转化为结构化数据,从而促进大规模对象历史分析。该论文提出了一个特定于出处的注释方案,以在构建出处链接开放数据(PLOD)时保留历史细微差别。最后,塔贝亚·戈尔加思的论文《资助计划LINK-人工智能和文化:五年后五个教训》,反思了人工智能对文化的影响,考察了人工智能在文化背景中的应用、对人类艺术家的影响以及作者概念的变化。
在人工智能的发展中,艺术已经发挥并继续发挥着关键作用,可能会进一步转变和重新设计创造性过程。生成性人工智能的增加,特别是大型语言模型(LLMs)的使用,已经导致公众对人工智能含义的理解发生扭曲。与此同时,这项技术在短时间内取得了惊人的发展跃进,GPT 2到3再到4的过渡很好地说明了这一点。卢巴·埃利奥特的论文《用人工智能发现文化》,提供了文化机构的创意人工智能实践概览,介绍了与人工智能的艺术探索,并突出了公众参与博物馆收藏的工具;如马里奥·克林格曼或安娜·里德勒等艺术家的艺术制作,开启了艺术对技术的反思能力,使生成性和多模态技术变得具体化。在她的论文《后真相。档案、GPT-2和假新闻》中,玛丽昂·卡雷展示了技术如何已经挑战了“档案”,并介绍了一个使用GPT-2创建虚构档案的项目,影响了关于信息真实性和可靠性的问题。另一方面,罗兰德·费舍尔的论文《冒名顶替者综合症:GPT-3在事实与虚构之间》,考察了在GPT-3背景下叙事和虚构的角色,揭示了人类和机器生成内容之间模糊的界限。综合起来,本节的论文提供了有用的视角和可能性,关于文化机构如何接近人工智能领域并重新定义它们作为反思、话语和教育空间在数字文化中的角色。
应用
尽管正在进行的项目数量众多,但人工智能在博物馆中的应用和实施仍处于起步阶段。为了使这个话题更具体和可感知,本卷的最后一部分介绍了一系列项目,主要来自德语博物馆实践,这些项目是在2018至2023年间实施的。由于ChatGPT的热潮,未来几年内,项目数量很可能会迅速增加,这不仅是因为商业供应商的开箱即用解决方案。这里故意聚焦于非商业性和在许多情况下可直接重用的项目,这些项目涉及到策展、互动和访客体验的新方法。在更广泛的反思和面向未来的视角之后,这些来自研究和开发的实践应用可以作为进一步话语和新概念的灵感来源。
一个令人兴奋的问题是,策展通过人工智能将如何改变。研究员和艺术家蒂尔曼·奥姆提出了一个最早期且相当创新的使用人工智能进行策展的例子。在他的论文《算法展览制作:用网络和词嵌入策展》中,他描述了使用网络分析和词嵌入技术人工策划展览的过程。重点是有效地链接艺术品和关键词,以创建连贯且主题聚焦的展览。在数字世界中创建过程开启了有趣的新视角,这些视角来自于将全球的数字对象组合起来创建新的联系、组合和洞察的可能性。这需要一种不同于孤岛式数据空间的思维模式,以及合作的意愿和建立共享且可持续的基础设施的意愿,如欧洲数字图书馆Europeana、欧洲数字遗产云或其他联盟——尼科尔·海-斯特斯卡尔和雷纳·西蒙在他们的论文《评估黑盒:通过AP链接维也纳艺术》中介绍了一个例子,即利用人工智能识别三个维也纳博物馆物件之间的联系的试点项目LiviaAI。该项目的目标是开发一个模型,学习不同收藏之间相似的视觉表现。同样,《符号云:数字策展项目》由卢卡什·皮尔卡提出,展示了一个旨在识别历史艺术作品中的符号和主题的实验性Web应用。这里使用了专有的神经网络来对来自中欧各博物馆的大量艺术作品数据库进行图像分析。
哪些由人工智能驱动的工具可以帮助导航穿越庞大的文化遗产收藏,以及公众使用它们时的需求是什么?在他们的论文《xCurator-人工智能支持的数字收藏探索和策展》中,索尼娅·蒂尔和埃蒂安·波斯图穆斯介绍了一个基于人工智能的策展工具,旨在使博物馆的数字收藏更易于访问,并鼓励用户自己策划收藏。此外,进行了几项用户研究,并开设了实验空间,以研究人工智能技术为博物馆目的带来的附加价值。该工具本身是开源开发的,并与基本的博物馆学规范数据一致,这意味着它可以适应未来的发展。除了“创意用户赋权”项目外,ZKM和德国博物馆的intelligent.museum项目在更广泛的意义上探索了在博物馆中应用人工智能的选项。在《说出图像,不要制作它:通过互动装置Wishing Well赋能人类-人工智能共创》中,亚尼克·霍夫曼和塞西莉亚·普赖斯介绍了一个例子,其中展览访客的愿望和梦想使用文本到图片模型转化为图像。
聊天机器人互动有潜力通过个性化的引导和互动以及提供无论地点或人员的访问权来增强访客体验。它们提供对问题的直接回答,解释艺术作品,分享有趣的故事,并帮助导航。它们还提供了在开放时间之外访问博物馆内容的途径,并可以增强教育体验。同时,设计良好的机器人与当前的用户行为相协调,这不仅仅是与数字内容互动,还包括参与交流互动。记住在大型语言模型开发之前的时代可能会在未来有所帮助,在《CHIM-博物馆中的聊天机器人:用基于语音的人工智能探索和解释博物馆物品》中,奥利弗·古斯克、斯特凡·沙弗和亚伦·鲁斯展示了斯泰德尔博物馆早期研究的一个例子,该研究开发了一个能够回答关于博物馆物品的开放式问题的聊天机器人原型。同样,在《通过人工智能了解艺术!通过IBM Watson与特洛伊的海伦等人聊天》中,梅兰妮·法登和安雅·盖伯尔展示了一个基于AI的聊天机器人的开发,该机器人能够与六个人工角色进行生动的对话,从而展示了聊天机器人在博物馆教育中的潜在角色。安娜·穆勒、迈克尔·希夫曼、安克·诺伊迈斯特和安雅·里切特的论文《探索展品之外:为公共空间中的社交机器人创建知识》通过评估访客如何与连接到人工智能对话系统的社交机器人互动,结束了关于机器人互动的部分。
一个重要且敏感的应用领域是访客跟踪和使用访客数据的主题。弗朗茨·科费尔、马蒂亚斯·祖尔、吉廷·贾米、金东·李、达里奥·赞卡和比约恩·埃斯科菲尔的贡献《追踪访客:博物馆中的访客研究光学室内系统》提出了一个大规模的光学跟踪管道,使用人员检测和一个框架来在访客同意下收集这些数据。最后,在《Symotiv:对交响乐团的虚拟洞察》中,迈克尔·佐尔纳、马库斯·博斯尔、迪尔克·维德曼和莫里茨·克劳斯描述了使用运动捕捉和VR/AR分析和向更广泛的观众展示交响乐团的工作方式,并在最后提示如何将数字体验转化为实体和包容性体验。这些论文总体上展示了人工智能技术有潜力以多种方式丰富和扩展博物馆实践,从收藏管理到展览设计,再到访客互动。它们提供了有关在博物馆领域实施人工智能所涉及的机会和挑战的重要见解。