软件工程硕士论文栏目提供最新软件工程硕士论文格式、软件工程硕士硕士论文范文。详情咨询QQ:1847080343(论文辅导)

融合信任度及不确定上下文质量修正模型的本体建模探讨

日期:2021年10月06日 编辑:ad201107111759308692 作者:无忧论文网 点击次数:561
论文价格:150元/篇 论文编号:lw202109230918273988 论文字数:38852 所属栏目:软件工程硕士论文
论文地区:中国 论文语种:中文 论文用途:硕士毕业论文 Master Thesis
相关标签:软件工程硕士论文

本文是一篇软件工程硕士论文,本文针对上下文质量低的问题、模糊上下文问题、上下文完全缺失问题分别进行研究并给出了解决方案,并将它们进行了应用最后得到了较好的结果。


第 1 章  绪论


1.1 课题研究背景

在日常生活中,人与人在相互交流的时候,能够正确的传达相互的思想并且做出正确的反应而不会产生歧义。这是因为人与人在交流的过程中能够使用隐式的上下文信息来增加交流的带宽。但是在人与计算机交互的过程中却很难做到。在传统的交互式计算中用户和计算机的交互机制十分贫乏,比如通过键盘输入或者鼠标点击,但是如果想要做到更加智能的计算,我们就必须在人机交互中增加类似人与人交流时使用的隐式上下文。由此发展出了上下文感知计算这个研究领域。1994年 Schilit 和 Theimer 首次提出了上下文感知计算的概念[1]。上下文感知就是让计算机能够自动的收集环境中的潜在信息,并且智能的根据人类的需要进行计算和处理,最终达到人们期望的目的的过程[2]。上下文感知计算不只局限于对人或物体这些实体的感知,还包括对于文章等智力成果的感知。上下文感知计算的研究对于构建一个智能化的计算体系至关重要。

上下文感知计算可以应用于现有的诸多应用和软件中,比如现在的各种智能工作场景[3],从智能家居[4]、推荐系统[5]到各种智能搜索系统等。比如有的智能搜索系统可以根据用户的上下文信息来为用户提供个性化搜索结果。用户的上下文信息包括:用户的兴趣文档、用户的搜索历史、用户的专业背景等。有了这些隐式的上下文信息,搜索系统可以自动的感知到用户真正的搜索意图,这样就增加了机器与人的信息交流带宽。

然而,现有的上下文感知系统存在较多的问题,具体问题如下:

问题 1:有时候我们获取到的上下文信息并不一定是正确的,还有的时候我们虽然获取到了正确的上下文信息但是在传输的过程中出现了错误。这样在后来使用上下文时会导致得到错误的结果。为了预防这种情况的发生,于是引进了上下文质量。研究者给了上下文一个衡量标准,让上下文拥有质量,符合标准的上下文便属于高质量的上下文。这样就可以在使用上下文的过程中分辨哪些上下文是可用的哪些是不可用的。

问题 2:此外由于人的语言的模糊性使得人们产生的某些上下文具有很大的不确定性。人们在日常生活中往往会处于不同的情境中,复杂的上下文信息往往在不同的领域具有不同的含义,它们可能共享不同领域中的某些概念,但又可能在某些属性方面有显著不同。而目前的上下文本体模型研究难以涵盖上下文感知环境中所有关键的上下文元素,特别是一些由人产生的主观的且模糊的上下文。

..............................


1.2 主要研究目的和意义

本主要的研究内容是基于融合信任度及不确定上下文质量修正模型的本体建模研究,虽然上下文本体建模的研究现在已经取得了一定的进展,但是仍然存在着一些问题需要解决。

目的与意义 1:在很多研究中对于上下文的分类和建模做了详细的研究,但是并没有涉及到在建模的过程中如何获取到高质量的上下文。比如如何获取到能够正确描述现实世界并且对于最后计算结果有帮助的上下文。在对上下文进行建模的过程中,对于获取到的上下文数据,要评价它是否适合使用就要判断它能否真实的反应当前主体的状态,比如我们从一个温度传感器上所获取的温度是否是准确的实际温度。如果存在误差,那么误差在多少以内可以接受,并且不会影响到最后的计算结果。只有这样的上下文信息才能称作高质量的上下文。但是之前的研究很少有涉及到对上下文质量进行提升的研究,本文的目的是通过对上下文的定义、分类和建模进行研究从而提出新的建模方法来提升上下文的质量使得在获取上下文的过程中能够提取到高质量的上下文。其意义是可以应用于各种需要高质量上下文的场景中,比如在光伏发电预测系统中收集高质量的环境信息。

目的与意义 2:我们在日常生活中所接触到的上下文信息有很大一部分是不确定的[6],这是由人类语言的模糊性决定的。每一个概念在不同的领域或多或少都会有不同的理解,比如“苹果”在食物的领域是一种可以吃的水果,但是如果把它放到手机品牌的领域就是代表着一种手机。每个领域会有专家对某个概念做出一个定义,但是专家定义的概念并不一定能包含这个概念的完整理解。我们在对某个概念进行定义或者理解的时候一定要包含着上下文的信息来理解,这样才能更加正确完整的理解这个概念。所以本文目的是建立一个支持对不确定的上下文进行建模和推理的模型。意义是通过这样一个模糊本体模型可以对一些不确定的语义信息进行建模,比如应用在文章摘要领域提取作者所表达的真正意思。

表 2.1 OWL Lite 大纲

表 2.1 OWL Lite 大纲

..............................


第 2 章  相关理论与技术


2.1 上下文感知计算:

上下文感知计算就是对主体的环境信息进行获取、集成[22]、管理、计算和处理,然后得出对于主体来说有价值的信息,最后使用这些信息来使主体获得理想的信息和服务。上下文的研究主要涉及以下几方面:

2.1.1 上下文的定义和分类

Schilit 和 Theimer 通过列举的方法对上下文进行了定义。上下文可以是主体的名称,可以是主体的位置信息,还有主体将要做的事。但是通过枚举定义上下文的方法在不同的应用领域中定义的上下文也不相同。难以通过这种枚举的方式来列出所有的上下文。因此 Dey 给出了一个抽象化的定义:“所有的可以描述和刻画某个实体以及该实体所处环境的状态的信息,这些实体可以为人或物。”这种抽象的定义能包括更加广泛的范围,由此定义我们可知道上下文就是我们可以获得到的任何可以描述某个实体的任何信息。这个定义覆盖的范围较广,得到广泛的认可。对于上下文的分类,Schilit[8]等人认为主体所在的位置、主体周围其他的人或物、主体周围的计算设备等元素是重要的。Chen 认为对于许多应用程序来说,时间也是一个重要且自然的上下文。由于很难符合上述三种语境中的任何一种,建议增加第四个语境类别:时间上下文(例如一天的时间、一周的时间、一个月的时间和一年的季节等)[23]。许楠将上下文分为用户、位置、时间、物理环境、用户情境和服务这六种上下文。这种分类方法将主体的环境高度的抽象成了六种概念。有了某个主体的这些上下文就能够更好地感知主体和主题的环境。Oscar 将上下文分为:时间、预配置文件、环境、角色、地位和状态、位置、活动[9]。这种分类方法也有很大的借鉴意义。还有不同的领域分类方法也会出现很大的不同,可以根据所在领域来分类[24]。比如计算机领域的文章和生物领域的文章应当分为两类。

2.1.2 上下文的感知和获取

Chen 将上下文分为高层和低层上下文。底层上下文可通过物理设备直接得到,如附近对象、网络带宽、温度、速度等。高层上下文则是通过推理或者用户定义等方法得到,包括用户的各种活动、社会环境、健康状态等。将上下文感知按抽象层次分类这样的好处是可以近乎包含大部分的上下文类型,有助于整体上理解上下文。但是这样不够具体,而且有一些上下文很可能既属于低层又属于高层,造成分属不明确的问题。

.....................................


2.2 本体建模方法

本体是一个形而上学的概念。本体的本来含义是万物的本源以及万物的内在规律。随着计算机科学的发展,本体论被计算机领域专家用来描述物体以及物体的内部规律。计算机科学能够被广泛应用的原因是计算机通过抽象和建模可以将现实世界的所有一切反应到数字化的虚拟世界中。人们就可以将难以解决的问题建模,然后利用计算的手段解决问题。而建模世界万物就要用到本体论。本体论就是描述主体、主体与主体关系、主体与环境关系的这样的一个学科。

1993 年,Gruber 在其工作中将本体定义为了一种可以描述不同主体的概念说明,不同的主体具备着不同的说明。Borst 于 1997 年[30],加入了可共享的概念,可共享的意思是,所有人对于某一个概念所代表的意思的理解都是相同而无异议的。综合了前人的研究成果,Fensel 等人给出了最为系统的本体定义[31]。本体首先是一种形式化的定义,形式化的意思是本体是一种能够让计算机理解的形式化的表示。这种表示是机器语言可识别和操作的。本体还是对某些现实存在的概念的描述。本体所定义的概念必须是明确的,概念与概念之间不会有歧义。定义的概念还必须被领域内的专家共同都认可,即对于同一个概念,所有领域专家都有统一的理解。总之,本体是一种具有规范性、可共享性、能形式化的明确表示某些概念的说明。

2.2.1 本体的要素

本体是用来抽象和描述现实世界的各种概念的说明,因此本体需要将这些抽象的概念总结成为某些类别的要素。这样在利用本体建模时才能更加方便快捷。Perez 在其论文中将本体的基本要素进行了总结和归纳,他认为本体是由概念、关系、函数、公理及实例组成的约束下的体系[32]。Naing 认为概念的属性和关系的属性也应该加入进去[33]。由此,本体具有以下要素:

概念:概念是用来描述和表示某些主体以及同一类别主体的集合。概念还被称为类。

属性:属性是概念所具备的某些特征,这些属性共同决定了某个概念。相同属性的概念代表的是同一概念。

关系:不同的概念之间是存在一定的关系的,比如子类和父类之间存在依存关系。

概念与属性、概念与实例等要素之间也存在关系。 公理:是一组永远为真的逻辑表达式,表明了概念、属性、关系等要素的关联与约束。

函数:表示从一个集合到另一个集合的映射关系。

实例:实例表示一个具体存在的实体,他是类的具象化,它具备类的一切特征,并属于类。

综上所述,满足这些要素的知识表示体系才是本体,只有满足以上属性,本体才能正确描述实体。

..................