以上三种科学工作流模型都源自于现实生活中,其中Epigenomics模型由南加利福尼亚大学基因中心Pegasus团队创建,其目的是能自动化处理不同的基因组序列;LIGO模型主要应用在物理学领域,用于生成和分析双星系统引力波状态;Montage模型由NASA/IPAC提出,主要应用于天文学界,输入多个图像创造出一种定制天空马赛克现象。
现实生活中工作流规模并非一成不变,而不同规模工作流采用的调度算法也不尽相同。为了验证算法的有效性,且具有普遍性,本文选用三种不同规模案例进行实验分析,其分别为小规模(约为30个任务节点)、中规模(约为50个任务节点)、大规模(约为100个任务节点);考虑到现实任务调度过程中,资源具有特异性,即每种资源可处理的任务有限,由于本文探讨的是确定资源下工作流调度问题,本文将资源可得率划分为三种,分别是0.4、0.7和1.0,其中0.4代表该资源仅能处理任务总数×0.4左右的任务,以此类推,1.0表示该资源能处理工作流所有任务。
第5章 总结与展望
5.1总结
近年来,互联网技术快速发展,云计算环境下的工作流调度问题早已成为学界和工业界研究的热点问题,目前学者们已经有诸多研究成果。本文通过对比、分析现有云工作流调度优化算法,发现云工作流调度优化依然面临挑战,其中,部分优化算法在求解大规模工作流问题中略显乏力,通常需要更多时间且未必搜索到较优解;也有部分算法搜索解空间是不完备的,也就意味着存在找不到最优解的可能。本文在前人基础之上,对云工作流调度优化问题展开了深入研究,并提出了一种改进的蚁群算法(R_ACO)以求解云工作流调度问题。本文提出的R_ACO算法在任务调度顺序和虚拟机分配都采用了整数编码,以确保搜索空间完备,并针对任务调度顺序和虚拟机分配建立了对应信息素模型,根据信息素进行状态转移构成个体解。同时,在整体框架上设计了两阶段进化策略,分为两阶段进行迭代进化,在第二阶段增加了个体改进策略,以增强邻域搜索能力。R_ACO算法具备以下特点:1)采用局部更新和全局更新两种方式更新信息素,局部更新增加了当代蚁群多样性,全局更新提高了精英蚁群轨迹上的信息素浓度;2)状态转移概率规则中,启发式信息加入了虚拟机负载因素,以契合负载均衡思想;3)为增加算法邻域搜索能力,设计了两种改进策略,有效提高了算法搜索能力。在实验环节,本文首先设置了对比算法收敛条件,确保对比算法都收敛的情况下确定运行时间,随后采用正交实验获得最优参数组合,在相同行时间下对比R_ACO算法与HEFT、PEFT、HGA、GALCS、HPSO和APRE_EDA算法结果,经实验对比分析,R_ACO算法效果优于对比算法(HEFT、PEFT、HGA、GALCS、HPSO、APRE_EDA),验证了本文提出的R_ACO算法在云工作流调度问题中的有效性。
参考文献(略)