本文是一篇软件工程职称论文,本文从移动社交网络的真实场景出发,重点从面向移动社交网络的位置内容分享、聚集近邻查询和兴趣点推荐三个层面出发,探究其中引发的的隐私泄露问题,分别提出隐私保护方法以及服务性能优化算法。论文的主要研究内容如下:(1)访问控制模型研究 针对内容分享问题,提出一种基于信任的合作访问控制模型,该模型是对基于分组的访问控制模型的改进,遵循“用户愿意将敏感位置分享给值得信任的朋友”的原则,为的是兼顾内容中涉及的利益相关者的位置隐私,以及防止不可信好友攻击。进一步地,针对用户间隐私偏好设置的差异性,提出一种基于让步意愿的冲突消解方法,从位置敏感度和目标好友的相对重要性去评估一个参与者改变其对冲突好友设置的原策略(授权/不授权)的愿意程度,进而找到使内容中参与者都能接受的冲突消解方案。
第一章 绪论
1.1研究背景及意义
近几年来,高速发展是移动互联网发展背景下的大势所趋,无论是移动互联网用户数量,还是社交网络用户数量,都已经达到了相当大的规模。移动社交网络(Mobile Social Network,MSN)是指基于位置信息,通过各种移动终端建立的以社交交互和内容共享为目的虚拟网络结构。作为传统在线社交网络的延伸,移动社交网络凭借其良好的开放性、参与性和互动性,已经成为人们生活中不可或缺的一部分。典型地,包括新浪微博和腾讯微信在内的诸多国内移动社交应用的用户数早己突破亿级大关,面对如此庞大的用户数,关于用户位置隐私信息的使用和保护的争论也是最为人所关注的,而位置的价值体现取决于具体服务本身。
现存问题罗列如下:首先,在内容分享服务(Content Sharing)中,它鼓励用户将分享内容绑定到其当前位置,使得其他用户可以了解某时某地发生的新鲜事,正是由于用户在移动社交网络上分享的位置信息是公开的,不仅用户的好友能够通过该信息掌握用户的行踪,甚至陌生人也能获取这些信息,因而存在信息被恶意使用的可能性,进而对用户安全产生潜在威胁。其次,在近邻查询服务(Nearest Neighbor Query)中,用户若想查询附近的商圈或是附近的好友,服务提供商必不可少地会釆集用户的位置信息,用户去了哪里、见过哪些人以及做了哪些事都可以通过承载位置信息的历史记录反映出来,而用户却并不知晓服务提供商是否将这些敏感信息进行了存储,从而造成自己的隐私泄露;最后,在兴趣点推荐服务(Points-of-Interest Recommendation)中,用户查询某个城市的前 10 个兴趣点在哪里,哪个购物中心在这个地区最受欢迎,以促进好友间的线下互动,这些都是在深入挖掘用户位置、轨迹信息之后的产物,但不可避免地知晓用户的兴趣爱好、行为习惯、宗教信仰等隐私信息,从而造成隐私泄露。甚至,许多移动社交网络平台允许第三方使用,一旦向其开放用户信息,便失去了对用户敏感信息的全权控制,仅靠现有的第三方监督机制根本无法确保用户的隐私安全。
........................
1.2 研究现状
在内容分享服务中,用户能够将内容发布到社交网络中,应支持用户自定义设置隐私策略,涉及安全访问控制技术,相关研究从单方访问控制到多方协作访问控制;在近邻查询服务中,用户若查询附近的 POI,涉及近邻查询技术,相关研究从单用户最近邻查询到多用户协作查询,再到多用户协作连续查询;在兴趣点推荐服务中,用户查询附近的热门兴趣点,涉及位置推荐技术,相关研究从单点推荐到行程推荐。上述服务保护用户的位置隐私,涉及位置隐私保护技术,相关研究从基于对手所掌握背景知识到不受对手掌握背景知识的限制。
1.2.1 安全访问控制研究现状
面向移动社交网络的访问控制模型通过分析社交网络的特点,提出了不同需求的访问控制方案,主要包括基于关系的、基于属性的以及基于语义的单方访问控制模型。
基于关系的访问控制模型以用户间关系作为内容访问的核心。文献[4]首次将“关系”这一概念引入到访问控制领域。文献[5]考虑到用户间关系的强弱,提出了基于信任的访问控制模型。随后,文献[6]又考虑到用户间关系的远近,根据跳数判断用户是否可以访问数据。文献[7]通过判断用户是否属于特定关系类型或分组,决定是否允许其访问,但缺乏细粒度性。
基于属性的访问控制模型利用实体的固有属性,有效解决了社交网络中实体动态性强、数量较大所带来的问题。文献[8]基于属性加密算法、传统公钥密码体制以及自动密钥管理机制提出了一个 Persona 模型,实现了用户对个人信息的自主管理,且能满足较高的安全需求,但问题往往在于以牺牲效率的方式换取较高的隐私保护力度,造成属性变化下实施代价昂贵。
.....................
第二章 相关背景知识介绍
2.1隐私保护技术
2.1.1 隐私定义
事实上,关于隐私的定义,每家都有不同的陈述,每个人都有不同的考虑因素。 目前普遍比较接受的说法是:“单个用户的某一些属性”可以被看做是隐私。 这个说法里所强调的是单个用户。 换句话说,如果它是一组用户的某个属性,那么就不属于隐私的范畴。
举个例子: 医院公布了一种趋势,说吸烟的人患肺癌的概率更高。 这不泄露任何隐私,但是如果医院说,张三因为抽烟,所以有了肺癌,那么这就构成了隐私泄露。 或者,医院正在宣传这种趋势后,然后大家又都了解到张三抽烟,那么张三是否会患上肺癌呢? 那么这是否构成隐私泄露呢? 结论是否定的,因为张三并不一定患有肺癌,每个人都只是通过这一趋势后的猜测。因此,从隐私保护的角度来看,隐私主体是单个用户,只有特定用户的信息被公开,才能被称为隐私泄露,发布有关群组用户的信息(通常称为统计信息)并不违反隐私。 再例如,高德地图曾发布过一张照片,内容是说凯迪拉克集团的员工喜欢去洗浴中心,很多人都说他们暴露了隐私。 事实上,从学术定义来看,这不是隐私泄露,因为并没有涉及到个人。
进一步,是否可以任意发布统计信息呢? 倒是未必。 设想这样一种情况: 医院发布了一则信息,说本月有 100 名患者,其中 10 名感染了艾滋病毒。 如果攻击者知道另外 99 人是否有艾滋病毒的信息,那么他只需要将他所知道的 99 个人的信息与医院公布的信息进行比较,就可以知道第 100 个人是否感染 HIV。 这种对隐私的攻击是叫做差分攻击,差分隐私便是为了防止差分攻击而存在,在数据发布场景中是最为安全的隐私保护技术,下文将详细介绍。
目前,隐私保护技术主要分为三种类型,包括数据失真、数据加密和访问控制。通常,一套解决方案中往往会涉及到这其中的多个,这些技术相辅相成,共同保障用户的隐私安全。
.......................
2.2 近邻查询技术
假设需要查找距离当前位置 1000 米内的餐馆信息 ,目前普遍采用的思路是对城市内所有餐馆(二维空间数据对象)建立索引存储,然后在该存储结构上通过相应的遍历方式找到所需要的结果。比较常见的空间索引结构主要基于四叉树和 R 树。
2.2.1 空间索引结构
基于四叉树的空间索引,如图 2.2 所示,原理是将平面空间以递归的方式进行四等分,直到达到某种要求后结束分割。每个树节点只存储完全属于它的二维空间数据对象,为了避免存储空间的浪费,不允许同一二维空间数据对象被重复存储。
.............................
第三章 动态分享服务中的隐私保护与访问控制算法研究 .................................... 17
3.1问题分析 .......................................... 17
3.1.1 参与者分析 ............................. 17
3.1.2 攻击者假设 ................................ 17
第四章 近邻查询服务中的隐私保护与聚集算法研究 ....................................... 30
4.1问题分析 .................................... 30
4.2基于近邻扩展策略优化的 ANN 算法 ....................................... 32
第五章 隐私保护移动社交网络服务分析系统实现 .................................. 45
5.1原型系统结构 .................................. 45
5.2原型系统实现 ............................... 46
第五章 隐私保护移动社交网络服务分析系统实现
5.1原型系统结构
基于可信第三方的系统架构,将 LBS 服务器的部分权利交由匿名服务器,使得用户不必直接提交数据与 LBS 服务器交互,为了方便监测与分析匿名服务器的服务效果,本文在匿名服务器端实现了基于位置隐私保护的移动社交网络服务分析系统。
............................
第六章 总结与展望
6.1总结
移动社交网络是移动、社交和位置的深度融合,主流技术包括内容分享技术、近邻查询技术和兴趣点推荐技术,作为移动社交网络平台的基础,对其涉及到的隐私保护问题展开研究具有广阔的研究前景和应用价值。本文从移动社交网络的真实场景出发,重点从面向移动社交网络的位置内容分享、聚集近邻查询和兴趣点推荐三个层面出发,探究其中引发的的隐私泄露问题,分别提出隐私保护方法以及服务性能优化算法。论文的主要研究内容如下:
(1