聚焦人工智能文艺的“算法”—学术研究—深圳市社会科学网-k8凯发平台

　日期：2024-08-07 来源：中国社会科学网-中国社会科学报

　　2024年初，文生视频模型sora横空出世，在chatgpt基础上取得了重大突破，推动人工智能文艺实现又一次跨越性发展。虽然人工智能文艺的算法运算所基于的深度学习神经网络或大模型不同，但无论是卷积神经网络、循环神经网络、扩散模型、转换器模型还是不同模型间的组合、进化，都宣示了“算法”在人工智能文艺中的核心地位。算法不仅延伸了人类的智能，更拓展了人类的美学经验。在算法全面介入文学、艺术，驱动单模态甚至多模态文本生成、图像生成、动态影像生成的今天，人工智能文艺研究必然无法拒斥、回避算法。

　　算法的位移

　　人工智能和文艺的结合从未像今天进入大模型阶段后这样紧密和普遍，传统上利用算法进行文艺生产的能力仅仅被少数先锋艺术家掌握。譬如，20世纪60年代就出现了雷蒙·奎诺（raymond queneau）、乔治·佩雷克（georges perec）等艺术家和数学家组成的实验性团体“潜在文学工场”，也被称作“乌利波”（oulipo）。该团体的理念是通过数学逻辑和约束性创作原则挑战文学创作的界限，探索文学艺术创造力的边界，从而挖掘文学与数学、科学之间的关系。

　　虽然艺术家和艺术家团体开辟了算法文艺的先河，然而这种需要掌握复杂数学运算逻辑和运算技术的大胆文艺创作，对于普通人而言极具门槛，普通人甚至大多数艺术家都难以进入依靠运算进行艺术创新的先锋领域。直到大模型算法出现的今天，这样的算法文学、艺术创作权才在技术和资本的合作推动下赋予普通人。尼葛洛庞蒂所谓的“人人都有麦克风”在今天发生了新的形变，几乎人人都能够借助人工智能平台工具进行专业化的文艺创作。这是算法在文学艺术中的首要位移，不亚于摄影术诞生所带来的机械复制时代的艺术后果。

　　整体而言，作者、作品、读者和世界四要素纷纷被大模型算法渗透。作者不仅包括人类作者也包括人工智能这样的智能类主体，作品由数据和算法在人类关键词的引导下自动生成，读者的趣味受到算法策展的影响，世界也在算法转译下进一步编码为虚拟真实世界。四要素被算法渗透，也两两之间形成相互作用的循环。人与算法在关系、互动、相互渗透中塑造了今天人工智能文艺的基本图景。

　　进一步思考，大模型算法对四要素以及人工智能文艺图景的整体变革是在两个基点的基础上形成的。大模型算法一方面带来“人机交互”的进化，另一方面实现了对“虚拟真实”的进一步拓展。chatgpt和sora分别揭示了这两种底层逻辑。作为open ai发布的应用，chatgpt能够在与人类创作者的多轮对话中进行记忆、联想和推理，人机交互的流畅度和有效性提高了文艺生产效能；而sora的“模拟世界”能力体现在能够根据用户输入文本生成高清、连贯的一镜到底视频上，显示了其对现实世界的模拟甚至复制能力，塑造了大模型时代虚拟真实的地理学。

　　这两个基点使大模型文艺相较于前大模型时代的人工智能文艺实现了跨越式发展，这不仅是大模型时代之前的算法无法做到的，也是决定人工智能文艺未来发展方向的重要立足点。因此，在“人机交互”和“虚拟真实”两个基点层面算法实现了第二重位移。

　　算法对人本主义的僭越

　　古希腊哲学家普罗泰戈拉提出，“人是万物的尺度，是存在者存在的尺度，也是不存在者不存在的尺度”，人能够凭借逻各斯衡量万物。然而，一定程度上，人工智能文艺中的算法却僭越了人类作为万物尺度的法则。算法对人类的僭越不仅体现为算法能够通过计算生产出无法和人类作品相区分的作品以替代人类，还体现为算法能够僭越人类制定的艺术创作规则，以其能动性、自主性和偶然性实现对“潜在空间”的采集和开发，超越了人类文艺生产的边界。

　　随着生成对抗网络（gans）的出现，ai在视觉艺术创作过程中的使用显著加速。gans通过一个生成器和一个判别器来进行底层“不可见”的计算工作。生成器通过学习数据集的特征尽可能地生成和原数据集数据分布相同的数据，接下来判别器执行“判断”功能，对生成器生成的数据进行判断。如果被证伪，那么生成则是失败的。如果不能被证伪，判别器就会对数据“放行”，输出一个和原数据集相同的数据。gans很快成为人工智能中最重要的研究领域之一，并且出现了基于许多原始架构的特定变体，例如cyclegan、stylegan和biggan。我们很多时候无法分辨、区分gans和人类创作的作品。“跨物种”的风格传承使gans在“模仿”的合格性和有效性上具备了“替代”原作者的可能，人作为万物尺度的崇高性被算法消弭，形成了算法对人类的第一层僭越。

　　此外，算法文学的创作过程基于算法规则，而算法规则是通过智能算法学习人类文学创作的规则而来，它本身不创造规则。但是算法却能够僭越人类制定的规则，在偶然性的维度上拓宽人类的艺术创作边界。gans的创作由于过于“相似”使艺术品不具备唤起潜能（arousal potential），因此算法的进化方向即在“相像”的基础上发生风格的“偏移”。创意对抗网络（can）和gans相比，调整之处在于除了对“是否为艺术品”进行判别，还需要对“艺术风格分类”进行判断，判别器的两个判断过程可以指导生成器生成与艺术品近似的数据（art/not art）。以此为基础，算法通过“画风融合”（style ambiguity）生成难以判别风格类型的画风，从而实现风格的偏移、创新，达到唤起潜能的作用。以算法的创作冲动和创作偶然性脱离人类规则的束缚，以算法的自主性拓宽艺术以人为中心划定的边界，这是算法对人类的第二层僭越。

　　算法的价值偏差

　　基于算法在人工智能文艺中的位移和算法对人本主义的僭越，我们不仅可以确认算法在今天人工智能文艺中的重要性，并且可以发现算法及其文艺创作具有人类“无法掌控”的一面。这种不可控性不仅发生在实践上，还存在于文艺价值层面内含的算法偏差。

　　在长期以来反对“技术决定论”声音的影响下，“技术中立性”也似乎成为我们进行技术研究的基础逻辑前提。遵循此逻辑，算法是纯粹由数学逻辑驱动的计算程序，因此具有中立性、客观性，计算程序本身无价值偏差或文化偏向。但实际上，由于算法一般归平台所有，受平台资本及其意识形态影响，或由人类算法工程师、艺术家设计，训练算法的数据集则由人类某一领域或多个领域的数据痕迹、数字记忆构成，三个方面层层隐含着人类的价值偏向。

　　此外，从技术角度而言，算法计算过程的不透明性和偶然性也有可能导致算法偏差问题的发生。技术上的偏差与人类偏差相互作用，形成算法偏差。这样的算法偏差也存在于人工智能文艺中，由于艺术审美性、游戏性、无功利性的特质进一步掩盖了其内在的算法偏差，因此往往更加不易察觉，使欣赏者在算法输出和算法推动作用下全盘接受和内化其偏差。

　　人工智能文艺的算法研究应当揭开人机互动的复杂性过程，在设计、过程、行动、结果多层次上纠正算法偏差，强调人工智能文艺主体责任、保障数据挖掘的准确性、提高算法透明性和可解释性，通过设计和应用道德代码来规避算法偏差，确保科技向善。

　　综上，现实层面算法在人工智能文艺中的位移、算法对人本主义的僭越、算法的价值偏差导致了文艺研究聚焦算法的必然。目前，算法仍主要是计算机科学的研究内容，“算法黑箱”的存在和技术门槛上的障碍，使得文艺研究一定程度上仍然和算法保持距离。近年来，虽然有学者提出“算法阐释”（参见曾军《算法阐释：人工智能时代的文论问题》）、“算法批评”（参见秦兰珺《通向算法合成时代的文艺评论》）这种开拓性的观点和方法，然而文艺研究对算法的研究空间需要进一步拓宽。就可行性而言，虽然算法的技术结构和运作过程无法为创作者全面掌握，但这并不妨碍我们对其文艺生产的过程和后果进行研究。秦兰珺认为，算法合成时代的文艺需要给“人”的因素和“非人”的因素以同等重要的考量，这不仅是为了赋予“物性”以能动性，更是为了呈现和批判“物性”中内嵌或隐藏的“人性”。聚焦算法，界定算法在人工智能文艺中的位移、审思算法不可控性对人本主义的僭越、规避算法价值偏差带来的负面后果，探索人类与算法如何在关系性中拓展一种人类—非人类的美学体验，这是与人工智能文艺算法相遇时无法回避的追问。

　　（作者系杭州师范大学文化创意与传媒学院讲师）

理论前沿

学术研究

聚焦人工智能文艺的“算法”—学术研究—深圳市社会科学网-k8凯发平台