1.一种基于DQN的云计算资源调度优化方法,其特征在于,所述方法包括:确认任务和目标网络的服务器负载状态并根据任务情况和目标网络的服务器负载状态形成任务部署计划;
记录服务器当前负载状态为起始状态并根据任务部署计划将任务部署至服务器的虚拟机上;
记录任务部署后的服务器的负载状态为完成状态;
根据完成状态计算任务完工时间并根据任务完工时间形成第一回报值,根据目标网络的起始状态与完成状态形成第二回报值;
统计多次的任务部署后的第一回报值形成第一回报集,统计多次的任务部署后的第二回报值形成第二回报集;
将第一回报集及第二回报集分别进行最小-最大值归一化处理;
根据能源消耗权重、时间权重、归一化后的第一回报集及归一化后的第二回报集计算得最终回报集,所述能源消耗权重及时间权重为基于调整策略的能源消耗或时间因素的权重值;
根据最终回报集中的元素形成样本加入至样本池。
2.根据权利要求1所述的一种基于DQN的云计算资源调度优化方法,其特征在于,所述通过最终回报集中的元素形成样本加入至样本池的步骤具体包括:分析最终回报集中的一个元素结合其所对应的起始状态、完成状态及任务部署计划形成参考样本;
对最终回报集中的所有元素逐个进行分析后将分析结果作为样本加入样本池。
3.根据权利要求1所述的一种基于DQN的云计算资源调度优化方法,其特征在于,所述根据完成状态计算任务完工时间并根据任务完工时间形成第一回报值的步骤具体包括:根据完成状态计算任务部署所需的等待时间和执行任务所需的执行时间;
根据任务部署所需的等待时间及执行任务所需的执行时间的时间和的反比计算第一回报值。
4.根据权利要求1所述的一种基于DQN的云计算资源调度优化方法,其特征在于,所述根据目标网络的起始状态与完成状态形成第二回报值的步骤具体包括:计算起始状态的服务器总能源消耗及完成状态的服务器总能源消耗;
将起始状态的服务器总能源消耗及完成状态的服务器总能源消耗的差值作为第二回报值。
5.根据权利要求4所述的一种基于DQN的云计算资源调度优化方法,其特征在于,所述服务器总能源消耗为服务器的静态能源消耗和服务器的动态能源消耗之和。
6.根据权利要求1所述的一种基于DQN的云计算资源调度优化方法,其特征在于,所述获取任务并根据任务形成任务部署计划的步骤具体包括:获取任务并分析任务之间的依赖性;
采用粗粒度资源配置方式根据ε-greedy调度策略及任务之间的依赖性形成任务部署计划。
7.根据权利要求1所述的一种基于DQN的云计算资源调度优化方法,其特征在于,所述根据最终回报集中的元素形成样本加入至样本池的步骤后具体包括:当样本池的样本数量累积至阈值后,从样本池中随机抽取Mini-batch个样本,采用随机梯度下降法更新在线网络参数;
在线网络参数每更新一定次数,便将在线网络参数赋值给目标网络参数。