本文是一篇语言学论文,本文尝试使用一种新方法,即词向量技术以及语料库工具对“元宇宙”一词的语义演变进行量化分析。主要从词汇的指称意义和内涵意义出发,对语义演变的过程展开描述,结合相关理论知识对语义演变的认知方式和影响进行阐释。
第一章 绪论
第一节 “元宇宙”概念
“metaverse”是“元宇宙”的英文形式,该词源于美国作家尼尔·斯蒂芬森(Neal Stephenson)1992年创作的科幻小说《雪崩》(《Snow Crash》)。书中描绘的“元宇宙”是一个脱离了现实世界的虚拟世界,用户们通过一些视觉设备进入该虚拟场景,并以虚拟人物的身份进行和现实世界相同的社会活动,如经济交易、人际交流等(Stephenson,2003)。斯蒂芬森赋予了“元宇宙”最初的含义,把它想象为一个与现实世界分离的、平行的虚拟世界,同时“元宇宙”雏形也逐渐在游戏和科幻电影中显现。
“元宇宙”初期以网络虚拟游戏和科幻电影为载体。1995年,基于“元宇宙”场景创建的虚拟游戏《活跃世界》(《Active Worlds》)现世。2000年,《模拟人生》系列游戏开始发行,2003年美国Linden试验室推出《第二人生》。2006年,罗布乐思公司发行了一款名为《罗布乐思》的虚拟游戏,2009年大型互联网虚拟游戏《我的世界》上线。除了游戏之外,在科幻电影中“元宇宙”的形态蓝图也被一步步构建。从1999年全球上映的《黑客帝国》到2009年的《阿凡达》、2010年的《盗梦空间》再到2018年《头号玩家》。这些游戏和电影推动“元宇宙”概念进一步完善。2007年一个有代表性的元研究组织——加速研究基金会,把“元宇宙”视为现实世界和虚拟现实的连接点或组合,提出了它的四种概念类型,即增强现实、生活日志、镜像世界和虚拟现实。可以说,随着科技的不断进步和人类的不断尝试,“元宇宙”形态逐渐完善。
第二节 研究综述
一、“元宇宙”相关研究
目前,“元宇宙”已经成为学术界最受关注的热点课题之一,越来越多的学者投身“元宇宙”事业,对其概念和意义进行了解释。
苏振源(2022)表示从语义结构来看,“元宇宙”(metaverse)一词由表示超越、元的“meta”和表示宇宙的“verse”组成,可以理解为超越现实的虚拟宇宙或虚拟世界。刘凯龙(2023)指出“元宇宙”是一个复合词组,应当对其进行拆分,“元”字在甲骨文中表示“人头”,《说文解字》和《尔雅》中解释为“开始”,如果从历史的角度去审视“元宇宙”,它代表着人类的宇宙。
从空间角度看,袁会(2022)认为“元宇宙”不是一个突然出现的全新概念,而是多年来人们对空间原型的追求与想象。刘琳(2022)以术语学理论为依据,认为“元宇宙”主要指超出现实世界、现实宇宙的网络空间,它反映了科技迭代、资本扩张以及人们面对现代化进程的时空焦虑。胡泳(2022)表明“元宇宙”更像是一个具有交互、沉浸以及协作等特征的网络集合。Lee(2021)、蒋宇楼(2022)更进一步地说明,“元宇宙”不仅是一个虚拟和现实相互作用、共同进化的超越现实世界的宇宙空间,而且是一个能够承载社会、经济和文化活动的完全沉浸的多维数字环境。
从技术角度来说,黄焕贤(2022)认为“元宇宙”是多种技术的集合体,本质上是一种科学技术。主要以互联网、人工智能、区块链技术、人机交互技术和智能设备为支撑,整合众多技术特征的综合性概念(蒲清平,2022;喻国明,2021)。同样,黄千军(2023)也指出“元宇宙”是涵盖物联网、虚拟现实(VR)、区块链等新概念的信息通信技术领域的概念整合,具有开放性和不确定性。曾军(2023)表明今天的“元宇宙”带有鲜明的现代技术背景,是一个全新的、指向未来的概念,属于加强版的虚拟世界。它集现代数字技术、互联网技术之大成,具有超脱话语层面之外的社会意义和未来想象,正在尝试勾勒人类未来数字化生存的图景(Haihan,2021;黄欣荣,2022)。此外,全国科学技术名词审定委员会(以下简称全国科技名词委)在2022年9月把“元宇宙”定义为:“人类运用数字技术构建的,由现实世界映射或超越现实世界,可与现实世界交互的虚拟世界。”
第二章 语料与方法
第一节 语料来源
在确定本文的研究语料之前,我们需要对“元宇宙”的传播路径进行梳理。首先“元宇宙”主要通过扎克伯格的推广向经济领域传播,陆续引起企业家、经济学家等专家的关注,其次专家们在接收到这项新事物后,开始通过演讲、论坛、学术论文等多种途径进一步向大众传播,最终我们得以在新闻媒体、网络聊天、甚至线下语言景观中发现“元宇宙”的身影。因此,“元宇宙”一词的传播是从专业到一般再到大众的过程。根据这种特殊的传播路径,我们发现专家学者口中“元宇宙”的语义较普通大众而言更具准确性,从学者们撰写的学术论文中推论“元宇宙”的语义演变更具专业性和客观性。同时,媒体报道、小众报纸或者人们日常生活中的讨论难免会带有个人主观性和用词偏差。因此为了减少人们曲解语义所带来的误差,本文选取中国知网(CNKI)中的学术论文(包括“学术期刊”和“学位论文)作为研究语料。
中国知网是较权威的中文学术性数据库,包含的学术期刊、论文和报纸等真实文本,它与学术、社会生活联系在一起,能够反映学者们的思想和态度,从中提取的数据有利于感知社会发展和相关变化,包括词汇的语义变化。并且本研究使用的软件工具可直接导入知网数据,能够更便捷、更完整地获取所需的临近词和语义场数据。
“元宇宙”概念可追溯到1992年,汉语中“元宇宙”一词首次出现在2000年,为避免遗漏语料,保证数据的准确性,我们将语料的时间跨度设置为1992-2023年。语义演变是一个动态的、复杂的过程,为了更清楚的地展现这种变化,我们需要选择一个时间节点,将全程划分为两个阶段,用以区分语义。尽管扎克伯格的演讲使得“元宇宙”进入公共话语领域,但是自2021年3月“元宇宙第一股”罗布乐思(Roblox)上市起,它就陆续受到了关注。因此我们以Roblox上市为时间节点,通过对比1992-2021.2、2021.3-2023.3两段时间“元宇宙”临近词和语义场的差异,进而对语义演变的过程进行描述。
第二节 方法及工具
本研究使用词向量技术word2vec模型和语料库软件AntConc(4.0.11)两种工具,分别探索临近词和语义场的变化。
一、词向量技术word2vec模型
我们使用词向量技术捕捉“元宇宙”临近词的变化,从而分析可能发生的语义变化,并描绘语义演变过程。词向量技术的原理及优势在前文多有提及,此处不再赘述。由于词向量技术具有量化语义演变、捕捉不同类型的语义变化、甚至揭示语义演变定量规律的潜力(Kim,2014),并已被证明可以用于捕捉语义演变(Hamilton,2016)。因此,我们使用该技术基于“元宇宙”与文本中所有其他词汇之间的嵌入距离,提取“临近词”,通过观察相关“临近词”的变化推测特定词可能发生的语义演变。准确的来说,本文使用的是词向量技术算法模型之一的word2vec模型。word2vec是谷歌(Google)的托马斯·米科洛夫(Tomas Mikolov)在著作中提出的深度学习在自然语言处理中的基础部件,也是一种属于词向量技术的基础模型①。Mikolov(2013b)详细介绍了word2vec模型,并推动该模型从理论框架走向实际应用。word2vec模型囊括了词向量技术的相应特性,它利用线性代数中的向量概念来表示词汇的语义,并通过计算词汇之间的向量距离来揭示它们的语义关联。Java、RStudio、Python等软件均可以运行word2vec算法模型,本文使用Python的开源版本Anaconda.3.0②进行模型训练。
第三章 “元宇宙”语义演变的研究结果 ..................... 16
第一节 临近词的数据结果对比 .............................. 16
第二节 语义场的数据结果对比 ......................... 20
第四章 “元宇宙”语义演变的影响 ........................ 34
第一节 语义演变对相关词汇热度的影响 ........................... 34
第二节 语义演变与社会变化的相互作用 .............................. 38
结语 ........................... 47
第四章 “元宇宙”语义演变的影响
第一节 语义演变对相关词汇热度的影响
语言是一个非常复杂的现象,涉及生理、心理、社会、文化等各个方面。一个复杂系统内部具有不同类型的要素,要素之间通过不同的、变化的方式相互关联和作用。在语言这个复杂系统中,语言使用的动态发展和变化源于所面临的交际环境,语法、词汇、语音的变化都在语言使用中反复出现,一个词的变化可能会对同一环境下其他的语言要素(例如其他词)造成影响(拉森-弗里曼,2021)。复杂性理论对关联性、变化性和动态性的关注与人们现实生活相契合,数字化、全球化进程的加深、计算能力的增强导致词汇系统内部发生一系列变化,新兴科技词汇陆续产生,这些词可能会对词群中其他词汇造成影响。因此从复杂系统视角来看,我们认为“元宇宙”影响了同一语义场中其它词汇的使用。我们把与“元宇宙”处于同一语义场的其它词汇称为相关词汇。
前文提到,“元宇宙”本质上是一项整合多种科学技术的综合性概念。而“虚拟现实”“Web3.0”等在临近词和语义场数据结果中反复出现,且与“元宇宙”处于同一语境、语义相关的词汇属于单一性科技概念,“元宇宙”可以说是它们共性特征的整合。从语义场角度来看,同一语义场中,随着时间的推移,词与词之间