计算机论文范文栏目提供最新计算机论文范文格式、计算机论文范文硕士论文范文。详情咨询QQ:1847080343(论文辅导)

基于领域知识图谱的服务社区管理技术探讨

日期:2023年06月19日 编辑:ad201107111759308692 作者:无忧论文网 点击次数:309
论文价格:150元/篇 论文编号:lw202306131234031956 论文字数:36336 所属栏目:计算机论文范文
论文地区:中国 论文语种:中文 论文用途:硕士毕业论文 Master Thesis

本文是一篇计算机论文范文,本文主要基于服务社区以及服务社区中管理的原子服务和服务模式进行研究,首先,基于国内外相关研究成果,定义了服务社区、服务模式以及原子服务的模型,并对原子服务和服务模式存在的性质进行介绍;

第一章  绪

1.1 研究背景和意义

随着计算机技术的高速发展进步和实际应用深入化,大数据、云计算、服务互联网、信息服务等先进理念被提出,并且相关研究也逐渐成熟,加上国家“互联网+”时代政策的大力推行发展,我国现代信息技术正逐步与传统服务相结合,踏上了向服务化转型[1]的道路,越来越多的线下资源被服务中介商进行整理后上传到互联网上,用户通过互联网来调用服务,并获取其执行结果,从而实现共享使用,这使得互联网上的服务资源数量和种类与日俱增,趋向多样化,具备更高的研究意义与应用价值[2-3]。目前,服务也已经发展成为互联网上一种重要的计算资源和软件资产。与此同时,用户的数量以及种类大幅增加,并且用户的需求也变得愈渐繁杂,导致用户在面对大规模的服务资源时,现有的细粒度原子服务[4]或已不能满足其需求。在此背景下,为实现某一业务需求,基于多种原子服务进行组合、构建一个服务方案[5],这成为了一种可行的办法,因此,研究人员对服务组合[6-8]进行深入探究。在服务组合过程中,每个用户都存在个性化的需求,如果基于服务资源库逐一筛选原子服务,并按照一定的规则进行组合,构建一套满足要求的服务方案,其付出的时间成本以及效率代价是巨大的,甚至是难以接受的。因此,在此过程中,如何基于海量的原子服务快速构建服务方案是需要解决的首要问题。

通过对某个领域内海量的历史服务方案进行深入研究分析后,发现很多服务之间存在一定的业务逻辑交互关系,并且它们作为一种组合形式,存在一定的规律,它们经常以一种固定的流程片段形式出现在某个服务方案中并被用户调用,因此,将这样的流程片段定义为服务模式[9-11]。在构建服务方案的过程中,以这些大粒度的服务模式为基础,将不同的服务模式及原子服务组合起来,不仅可以满足不同用户提出的需求,而且可以简化服务方案的构建步骤,有效地提高服务方案的构建效率;如此一来,服务模式的重要性显而易见,因此,如何发现服务模式成为一个关键问题,所以本文对服务模式的模型以及相关挖掘方法进行分析和研究。

1.2 国内外研究现状

1.2.1 服务社区研究现状

随着互联网上各种类型服务的数量不断增加,服务社区的提出及应用有效地解决了服务的搜索、管理等问题。国内外大量的研究人员对服务社区进行了深入地研究。

关于服务社区发现方面的研究,可追溯到的最早研究是以图分割相关原理为基础进行的,Kernighan和Lin[20]提出的KL算法,结合二分法的原理和贪婪算法的思想,将节点不断归入社区中,完成社区的发现;之后,Barnes[21]提出了一种新的社区发现算法,谱二分法,这种算法是根据矩阵的特征值和特征向量来完成社区划分的。Newman和Girvan[22]提出了经典的基于分裂思想的GN算法,该算法通过不断移除边介数最大的边,直到每个节点成为一个社区,但该算法具有较高的复杂度以及缺乏关于结束的判断。为了解决这两个问题,Newman[23]又提出了FN算法,通过使用模块度来评判社区发现结果的优劣性。Amaral[24]等人提出的GA算法则是一种寻找到全局最优解的算法,主要通过控制节点模块内度数和节点参与系数来完成社区发现工作。后来,又提出了基于半监督聚类的方式进行社区发现,其主要思想是依据标签相似度来进行节点间的标签传播,从而实现聚类。Raghavan等人[25]提出的LPA算法就是依据上述思想,此算法具有较低的时间复杂度,但存在社区发现结果的稳定相差和准确率低等问题。为克服上述问题,许多研究人员继续对LPA进行改进,比如,赵卓翔[26]等人提出了基于标签传播的社区发现算法(LIB),该算法重点通过计算标签影响值来形成最终的社区;石立新[27]等人提出了基于数据场势函数的标签传播社区发现算法(LPAP),该算法通过引入高斯函数来激素那节点的势值,从而进行社区划分。这些针对LPA算法的改进,其社区发现过程的稳定性和结果的准确性得到增强,获得了高质量的社区。

第二章  基于领域知识图谱的服务社区模型及初始化

2.1 领域知识图谱对服务社区的作用分析

知识图谱,其概念最早可以追溯到语义网络[47],是对物理世界中的概念、实体以及它们之间的关联关系进行客观地描述。这一概念最早是谷歌于2012年在其知识工程相关研究的基础上提出的,当时是为了解决其搜索引擎的检索效率低的问题。随着研究的不断深入,目前对于知识图谱的构建及应用等相关研究领域已经有一套比较成熟的技术。 知识图谱主要采用RDF[48](Resource Description Framework,资源描述框架)这一模型来对现实世界中的知识进行表述,该模型被定义为一个SPO(subject,predicate,object)三元组[48],即“实体,关系,实体”,可以表示为(𝐸𝐸1,𝑅𝑅,𝐸𝐸2),其图形化表述如图2-1所示。

计算机论文范文怎么写

目前关于知识图谱主要分为两大类,一类是通用知识图谱,另一类是领域知识图谱。这两种知识图谱主要在覆盖范围和使用方式等两个方面存在差异。通用知识图谱面向通用领域,主要包含了大量的现实世界中的常识性知识,覆盖面广,强调融合更多的实体,其精确度不够高;领域知识图谱又称为行业知识图谱或垂直知识图谱,是面向某一特定领域的,由该领域的专业数据构成的行业知识库,因其基于行业数据构建,有着严格而丰富的数据模式,所以对该领域知识的深度、知识的准确性有着更高的要求。

2.2 服务社区模型

2.2.1 服务社区模型的表达

服务社区的定位是以用户为中心的服务模式及原子服务集合,其包含丰富的相关业务逻辑、功能定位,用户描述等信息,基于上述信息给出服务社区模型的定义,此定义为服务社区的初始化、更新等相关研究奠定了基础。以用户为中心的服务社区被表达为一个四元组,如下所示:

SC={𝐵𝐵𝐵𝐵𝐵𝐵𝐵𝐵𝐵𝐵𝐵𝐵𝐵𝐵𝐵𝐵𝐵𝐵 ,𝐶𝐶𝐵𝐵𝐵𝐵𝐶𝐶𝐵𝐵𝐵𝐵𝐵𝐵𝐵𝐵𝐵𝐵 ,𝑈𝑈𝐵𝐵𝑈𝑈𝑈𝑈𝑈𝑈𝐵𝐵𝑈𝑈𝐶𝐶𝑈𝑈𝐵𝐵𝐵𝐵𝐶𝐶 ,𝑆𝑆𝐶𝐶𝐵𝐵𝐶𝐶𝑢𝑢𝐵𝐵𝑠𝑠𝐵𝐵𝐶𝐶𝐵𝐵},其中:

1. BasicInfo:服务社区的基本信息,包含社区的各项基本信息描述;BasicInfo={ID ,Name ,Field ,FuncDesc ,Date},其中: 

ID:服务社区编号,作为社区的唯一性标识; 

Name:服务社区名称; 

Filed:服务社区中管理的服务模式集合所属的领域;

FuncDesc:服务社区的功能描述; 

Date:服务社区的创建日期;

2. ContnInfo:服务社区中管理的所有服务模式或原子服务;ContnInfo= { SM𝑖𝑖 || 𝑆𝑆𝑖𝑖 }, SM𝑖𝑖为集合中的一个服务模式,被定义为一个四元组,𝑆𝑆𝑆𝑆={MBasicInfo ,MCompInfo ,MFuncParam ,  QosInfo},𝑆𝑆𝑖𝑖 为集合中的一个原子服务,被定义为一个八元组,S=(SID,SName ,SFunc ,SIp ,SI ,SO ,Qos ,SRes ),具体关于服务模式及原子服务的定义在下一小节中进行详述。

3. UserPortrait:社区画像的标签集合。这里是考虑到服务社区是以用户为中心构建的,因此,对服务社区添加一个关于社区画像的属性,保证整个服务社区中资源是围绕用户进行管理的。具体表示为:UserPortrait={ tag1 ,tag2 ,tag3 ,……,tag𝑛𝑛},tag是