引言
1.1研究背景
在当今网络社会中,个人的电子信息,如Web, Email, QQ和BLDG等。这些事物反映出了个人所感兴趣的领域及其程度,我们可能通过分析这些信息从而得到这个人的社会关系。因此,随着互联网中各类服务的流行,社会网络分析(social networkanalysis SNA)研究日益吸引着研究人员的关注。
这些年来,SNA已经成为一门独立的学科,有着其专有的概念和术语。它致力于针对社会关系网络而进行的量化研究,在社会科学的研究中日渐成为一种新的范式
SNA有着其巨大的商业价值,这些年来逐渐成为数据挖掘中热门的方向之一,吸引了越来越多研究人员的关注。社会网络是由个体及其之间的相互关系所构成的网络,这种网络满足社会学结构特征,个体之间的关系可能是亲友、单位同事、同学等关系。社会网络所研究的对象是在数学、人类学、经验学、社会学、统计学、心理学等各类学科相互交织中产生出来的
如今,不少领域中已经出现了SNA的相关应用。例如:在项目工程领域里专家论文的引用网络、案例之间的相互引用网络等。在科学研究方面,应用于商业方面的个性化服务和互联网应用。近年来,一些研究人员将社团发现应用于反恐实践中,以此来得到恐怖组织中成员之间关系结构。表现了现实生活中的社会网络关系实例。
现如今,对复杂网络的研究正处于蓬勃发展的阶段。随着对复杂网络的不断深入研究,研究人员发现,在许多实际网络中都存在着“社团结构”特征。整个网络由大大小小“团(Cluster”或者称之为“群(Group)”构成,每个“团”之间的连接较为稀散,但是“团”的内部节点之间的连接就相对紧密很多。
怎么样才能发现网络中的社团结构?这对研究网络的各种特性有着实际而重大的意义。社团结构的研究可以应用于社会学、生物学、计算机图形学和物理学中。比如,现实社会网络中属于不同社团的人们会发现自己不同于其它社团中人的地方,如爱好、信仰、生活习惯等等;还有如生物分子反应网络中,节点通过聚合而形成功能性模块后,就可以承担某些特定的功能和角色。
近年来,很多有效而实用的算法被研究者和科学家提来,以实现对复杂网络中社团结构的查找。当前,绝大部分算法都着重于三个方面的研究:一、社团划分结果的有效性;二、社团结构重叠特征和层次特征在算法中体现;三、算法要以最小的时间代价处理尽可能大的网络规模。
相对而言,能够同时发现社团结构中的重叠特性和层次特性的算法相对较少。因此,是否可以提出一种时间代价上较小,并且能够同时发现这两种特性的算法,也将是一个充满挑战性的研究课题。
目前,针对一些规模较小的社会网络的研究技术已经相对成熟。但由于互联网前所未有的发展,其规模得到了空前的扩一大,并且由于网络用户之间联系统计过程的现实困难,目前对复杂网络的探索大多都只是在节点之连接无向并且不赋权重的网络中。但是,现实网络情况当然不会如此,如果我们放弃对复杂网络中联系的力一向性以及频繁程度的关注,想要有准确的研究结果,显然是一种奢望。
第三章 邮件网络的............ 25-31
3.1 邮件网络社团............ 25
3.2 邮件网络形式化............ 25-28
3.2.1 邮件中所提供............ 25-26
3.2.2 邮件网络关系............26-27
3.2.3 基本概念............ 27-28
3.3 实验数据集............ 28-30
3.3.1 实验语料集............ 28-29
3.3.2 数据集表............ 29-30
3.4 小结............ 30-31
第四章 邮件网络中............ 31-36
4.1 PageRank算法............ 31
4.2 邮件网络的社会............ 31-33
4.2.1 小社团稳............ 32
4.2.2 小世界性质............ 32-33
4.2.3 无尺度性质............ 33
4.3 社团发现算法............ 33-35
4.3.1 无尺度网络中............ 33-34
4.3.2 社团划分............ 34-35
4.4 小结............ 35-36
第五章 系统实现及实验............ 36-46
5.1 系统的整体框架............ 36-40
5.1.1 邮件信息............ 36-37
5.1.2 邮件信息预............37-38
5.1.3 网络分析............ 38-40
5.2 系统界面设计............ 40-41
5.3 用于对比算法............ 41-42
5.4 实验结果分析............ 42-45
5.5 小结............ 45-46
总结
如今,互联网信息日益丰富,随着WEB关联分析、博客关联信息的研究、从各类网络中提取社团结构等工作不断深入,形成了较多关于社会网络分析的研究成果。由于电子邮件通信的隐私性,邮件信息获取的困难性一直是邮件网络分析研究的障碍,但在已有的一些公开邮件信息中我们仍然能通过研究得到一些关于社会网络分析的有用信息。
复杂网络中的社团发现问题是一个跨越多个学科的研究问题,它吸引了众多研究领域的人士的参与,研究者从算法设计到实践应用,对社团发现问题进行了深入的研究与探索。在过去几年时间里,人们对于社团算法的研究主要关注于时间效率和划分效果。但是这两个问题本身就是一对矛盾,时间复杂度较小的算法能够得到的划分效果一般都较差,划分效果好的算法却往往又有较高的时间要求。因此,提出时间复杂度小的,划分效果好的算法始终是研究者们关注的课题。