IDRMS 方案与现有方案的不同之处在于:第一,IDRMS 维持了满足可靠性需求下的最小副本数;第二,我们根据数据节点的容量、阻塞率和对数据包请求数量的预测,在网络中动态均匀地分配副本;第三,我们通过“流行度”的值来动态调整对节点的请求,将网络中的数据节点划分为热门节点和冷门节点,通过把热门节点中的访问转变为访问冷门节点,平衡节点间的工作负载。
...............................
第五章 总结与展望
5.1 工作总结
在环境恶劣、差错率较高的云存储网络中,数据存储问题是一个研究热点,其面临的主要挑战是存储的数据有可能被恶意纂改或发生丢失。本文围绕如何存储云网络中的数据以降低成本与时延、提高数据的可靠性、均衡网络负载展开研究,取得的主要成果如下:
(1)本文对现有的云存储系统中的数据存储策略进行了较为详细地归纳和分析,主要分为完全副本备份方式和纠删码冗余方式,发现完全副本方式虽然提高了数据的可靠性,且延迟小,但其消耗的空间成本是巨大的;而纠删码冗余存储的方式能节省大量的存储空间,但延迟与可靠性却不如完全副本方式。因此本文提出一种将碎片备份与 LT 码结合的自适应数据冗余策略 ADRS(Adaptive Data Redundancy Strategy)。该策略能根据当前网络状态动态调整参数以优化系统性能,当服务器节点发出的数据量较小时,以碎片备份方式为主;当服务器节点发出的数据量较大时,以 LT 码冗余方式为主。仿真结果表明,ADRS 充分融合了碎片备份和 LT 码冗余的优势,虽然增加了少量存储空间,但降低了平均时延,提高了系统的可靠性。ADRS 策略根据当前具体网络状态调整阈值、分块数、副本数、冗余度等参数,实现优化系统性能的目标。这种动态的方案更能适应云存储网络需求的多样化,尤其是网络条件恶劣,差错率较高的情况。
(2)为了动态地管理通过冗余方式产生的副本,本文对现有的云存储管理策略进行了研究,主要针对使用率更高的动态副本管理策略进行较为详细地描述和分析,发现大多方案着重于副本数或副本位置的某一方面,几乎没有对这两方面综合分析的策略;另外,在云存储网络中动态变化频繁,实时调整对不同环境要求下的副本管理方式也显得尤为重要。针对如何确定网络需要的最小副本数;副本存储的网络位置;当网络状态变化时,存储的副本如何实时更新以更好地适应当前网络等问题,本文提出一种改进的动态副本管理方案 IDRMS(anImproved Dynamic Replication Management Scheme)。通过引入预测模型,优化了副本在云存储节点中的分配,最小化总通信开销和网络延迟。当用户频繁请求距离较远的数据包时,为降低开销、提高数据的有效性,IDRMS 将副本移动到距离用户更近、所需成本更低的节点中。此外,我们使用 B*树取代 B+树存储当前网络中每个节点的阻塞率,加快了搜索阻塞率最小的节点的速度,采用最低阻塞率降低节点的工作负载。为了动态调整副本位置,我们重新定义了流行度的值,将网络中的节点分为热门节点和冷门节点,通过把访问热门节点中的请求转变为访问冷门节点,以此均衡网络中的负载。实验表明 IDRMS 方案通信成本更低、负载更均衡、更适用于动态云存储网络。
参考文献(略)