本文是一篇新闻媒体学论文,笔者认为深度伪造正是结合了这两种方式,利用神经网络和人工智能技术来创造虚假信息,以“智能欺骗”伪装成真实内容,并通过模因传播“呈现虚假信息”来加深公众偏见,进而降低视频信息的权威性和可信度,使视觉文本的制造者和阐释者不再是真相的最权威定义者和阐释者,起到以假乱真的效果。
第一章智能欺骗:深度伪造是如何解构世界的
第一节深度伪造解构世界的新路径:智能欺骗
欺骗理论最早的由美国心理学家理查德·劳夫特(Richard Loftus)提出,他于1970年发表了《欺骗理论》,提出了欺骗理论的基本概念并指出欺骗行为可以用来获取某些有利的结果,比如财务收益,社会地位,个人声望等。[55]此后,欺骗理论开始引起学界关注,但是大众所熟知的欺骗理论还是人际欺骗理论,由学者David Buller和JudeeBurgoon在1996年创立的,旨在探讨接受者和欺骗者思想和行为的相互关系[56],当欺骗者行使欺骗时不是试图与他人讲道理,而是操纵他人,通过有理有据的辩论引导目标对象相信欺骗者的言论,最终达到其控制意图。从概念来看,欺骗的概念是一个融合了多个社会科学学科的观点,并将参与者的意图、信息以及态度或行为结果巧妙地联系起来。因而本研究能够从理论上延伸欺骗研究,也能够揭示欺骗策略背后的权力问题。[57]因为深度伪造技术本质上就是一种智能欺骗,借助欺骗理论可以用来解释为什么人们会发布深度伪造的内容,以及如何辨别真实和虚假的深度伪造内容。此外,欺骗理论还可以用来探讨深度伪造如何改变社会结构,以及深度伪造如何帮助社会克服欺骗行为。[58]换言之,深度伪造制作出来的看似错误的伪造视频的背后实际上蕴含着操纵者的欺骗意图,所以需要对深度伪造技术始终保持警惕。
一、欺骗意图:深度伪造的媒介系统扭曲
传统意义上的欺骗更加强调传播误导、虚假的信息或者概念,其欺骗意图往往是为了个人利益,在其交往过程中导致传受双方产生背叛和不信任。[59]但是深度伪造技术的出现让欺骗意图隐蔽性更强,也更容易实现。常规情况下,欺骗的意图主要包括手段性动机(Instrumental):避免处罚或保护资源;关系性动机(Relational):维持关系或羁绊;身份性动机(Identity):保护面子或自我形象等三种,其意图更多局限于个人利益或者互动关系,但是深度伪造的欺骗意图更为复杂,它们可以包含政治意图、商业欺诈、文化侵袭、隐私侵犯等。例如一个政府机构可以利用伪造信息改变其市场、军队乃至法院裁决从而损害其竞争对手。
第二节深度伪造解构世界的运行机制
不可否认,深度伪造重新定义了欺骗的意图、内容和行为,从欺骗视角去分析深度伪造现象能够更好地探索背后的操纵意图和互动关系,得出结论:深度伪造的智能欺骗带来的最大的冲击是降低现存所有内容和信息的可信度,无论是真实的还是合成的,他们的可信度都会被削弱。视觉优势效应不复存在,传统意义上的真实世界将会被颠覆,因而需要分析深度伪造是如何产生并解构世界格局的,探讨深度伪造的运行机制。
一、视觉操纵与自动化生成的耦合:图片合成奠定伪造基础
合成媒体是指人工生产、操纵、通过自动方式修改数据和媒体,通过使用人工智能算法误导人们或改变原始含义。[66]从本质上来说,深度伪造技术是属于合成媒体的分支,也是其最常见的应用类型。[67]从这一定义不难看出,深度伪造并不是新鲜词,虽然只有短短几年的历史,但它的技术基础并不是近年来才出现的,并且伴随着社交媒体中的样本数据越多,计算机仿真结果越逼真。除此之外,带有意图地操纵视觉内容也不是从2017年才正式出现,作为深度伪造技术前生的照片处理甚至与摄像机相伴而生:自第一台相机问世以来,照片编辑的历史开始逐渐发展,其流程较为繁琐,耗时耗财,往往只有富有的摄影师才能稍微修改他们的图像。1857年,摄影师乔治·华盛顿·威尔逊(GeorgeWashington Wilson)通过拍摄对象的个人照片、剪下他们的图像并将它们组合成人群,然后拍摄由此产生的拼贴画,创造了上流社会的假合影。[68]虽然在那个时代图像合成技术还很落后,但经过加工的效果足以用来欺骗或者说服观众,也可以用来改善故事表达,更可以用于政治目的。[69]现存最知名、最古老的亚伯拉罕·林肯拍摄于1860年的肖像照也是一幅拼贴画,他的头巧妙地与约翰卡尔霍恩的身体相连,而约翰卡尔霍恩的照片早在1814年就已经存在了,这张合成的肖像画也被称为第一张被操纵的照片。
第二章深度伪造的现实影响:智能欺骗带来“拼接真实”
第一节经济利益驱使深度伪造干扰商业真实
众所周知,数字平台一直在利用算法技术收集用户数据和个人信息,越来越多的社交网络应用开始通过各种方法采集到大量的用户与隐私信息,对其进行聚类分析与预测,从而将人们对网络内容的认知与交互过程转化为可预见的大样本,从而为虚假信息的传播提供了有力的数据支持,甚至直接影响受众理解世界和互动的方式,当深度伪造进入商业化就意味着技术的可访问性将会得到进一步加强,无论公众是否愿意,越来越多的假图像、音频和视频都将被创建和共享。[92]音视频造假变得更为普遍,传播虚假信息也变得更容易,但是深度伪造也为非法行为提供了空间:对于个人而言,当自己的人脸数据或者声音数据被泄露可能面临经济损失的风险;对于企业而言,深度伪造的内容可能会涉及版权或者声誉损害的问题;对于市场而言,无论是在社交媒体环境还是在商业领域,深度伪造的欺骗行为都可能破坏原有的交易秩序和监管机制。
一、技术商用招致“假货”流行
深度伪造的可访问性增强决定着这一技术的商业化使用将成为必然,无论是深度伪造应用程序的出现带来的媒介技术互动还是平台借助“拼接真实”实现的不平等偏见和差异定价。[93]可以预见的是深度伪造技术的商用会带来互联网竞争的新高地,谁掌握了人、物之间价值匹配的最大化和功能整合的高度智能化,谁就能深刻改变整个社会秩序乃至“游戏规则”,这也是纽约面部识别供应商Clearview AI被诟病的原因,尽管Clearview可以向全世界的警方提供30多亿名人脸数据,但是将数据集商业化的方法占得了规则设定的先机,不符合社交媒体巨头Twitter和美国政界人士的利益。[94]所以,对于技术拥有者而言深度伪造也可能是一个新的机遇。一方面,深度伪造技术的多模态变迁会给教育、时尚、医疗等方面带来更多的可能性,公众可以借助身体合成实现“一键换装”,为后期的购买打下基础;医护人员可以通过深度伪造生成逼真的数据,用以开发和测试诊断或监测疾病,并且这种方法不会侵犯患者的真实隐私。
第二节深度伪造技术霸权破坏文娱真实
数字图像处理技术早已融入到我们的日常生活中,视听编辑软件的广泛应用、计算机处理能力的大幅提升都在一定程度上破坏着视觉真实,但是更多时候受众依然坚信视频作品是自然拍摄的,毕竟在他们认知中,镜头的运动图像和声音很难被简单的视听编辑软件所改变。事实上,以机器学习和人工智能技术为支撑的深度伪造的出现改变了这一现状:深度伪造最终呈现的效果始终需要通过音频或者视频作品来“欺骗”受众的听觉或者视觉,这种感官系统的破坏和混淆会营造一种以假乱真的景象,从而产生错觉。不可否认,音视频伪造将在影视行业大放异彩,好莱坞制片厂为了弥合幻想和现实之间的差距甚至不惜花费数十亿资金投资CG动画,如《阿凡达》和《复仇者联盟》系列电影就是典型。不过深度伪造技术的出现则减少了后期和重拍所耗费的成本,只需要大量和数据集和镜头就足以进行人脸替换或者重建人物形象,最为显著的例子是马丁·斯科塞斯的《爱尔兰人》(2019年),该片对主角罗伯特·德尼罗进行了数字化减龄,让他看起来年轻了30岁,而背后的原理则是深度伪造和3D建模的合谋。但受众很难判断视频是剪辑还是真实拍摄,甚至以为伪造视频是一种蒙太奇手法。所以从本质而言,深度伪造打破了“眼见为实”的社会共识,高质量的合成影音作品已经成为现实,低质量的伪造作品也一直存留与社交平台中,其中色情伪造最为普遍,这些作品通过破坏视觉真实对受害者进行数字侵犯和身体剥削,对用户实行欺骗。
第三章 深度伪造的数字监管:媒介化视域下的多元协同治理机制... 45
第一节 延伸:法律法规框定技术红线 ...................... 46
一、博采众长:政策立法遏制虚假信息扩散 ..................... 46
二、聚智共谋:联合公约推动深度伪造的跨国治理 ....................... 52
结语 ............................. 64
第三章深度伪造的数字监管:媒介化视域下的多元协同治理机制
第一节延伸:法律法规框定技术红线
近年来,全球虚假信息行动越来越呈现出复杂性和攻击性趋势,极权主义者通过制造假新闻,制造出了一种新的、具有侵略性的国际舆论,从而引发了一系列的“假新闻事件”。随着民主社会对言论和信息的高度重视,西方国家对假消息更加敏感。虽然深度伪造目前仍然处于萌芽阶段,但是其产生的虚假信息本身就是一种欺骗行为:它通过自动化生成和视听操纵进行战略传播,在此背景下生成的假新闻比真相传播更快、更广泛,从而产生不安全感、敌意或两极分化,试图破坏民主进程和公民基本权利。为了防止这场智能欺骗继续升级,我们还需要做更多的准备工作。[165]对于中国而言更需要在西方现有法律法规基础之上找到本土化经验。
一、博采众长:政策立法遏制虚假信息扩散
结语
与传统欺骗行为相比,深度伪造的欺骗行为具有一次生成、视觉优势和讽刺效果的特征。传统欺骗更加注重传播误导、虚假信息或概念,通常出于个人利益,随之带来背叛和不信任,而深度伪造技术的出现使欺骗意图更加隐蔽,也更易实现。深度伪造视频通过合成技术和视觉处理方法生成伪造信息,利