1.一种基于深度学习的作战策略生成方法,其特征在于,所述方法通过自我学习而产生作战案例样本和作战深度学习模型,包括:样本生成步骤:生成多个包括作战态势、作战意图、预设方的作战决策的第一作战案例样本;样本生成方式包括根据样本组成规则知识库和样本元素知识库生成样本,样本元素知识库中包含有样本的组成元素;
样本生成步骤具体包括:根据预设作战决策知识库生成所述第一作战案例样本中的作战决策;作战决策知识库中预先存储了作战决策构成规则子知识库、作战决策构成元素子知识库;作战决策构成规则子知识库包括作战的类型、作战的时间、作战的地点、作战的目标的组合规则;作战决策构成元素子知识库包括作战类型知识表、作战时间知识表、作战地点知识表、作战目标知识表;从作战类型知识表中随机获取作战类型的一个实例作为作战类型,从作战时间知识表中随机获取作战时间的一个实例作为作战时间,类似地获得作战地点、作战目标,然后组合形成预设方的作战决策;
模型初始化步骤:初始化深度学习模型,作为作战深度学习模型;所述作战深度学习模型的输入设置为作战态势、作战意图,输出设置为作战决策;
生成样本无监督学习步骤:使用所述第一作战案例样本对所述作战深度学习模型进行无监督训练;
样本筛选步骤:从多个所述第一作战案例样本中筛选出多个作战结果与所述第一作战案例样本中的预设方作战意图一致的所述第一作战案例样本,作为多个第二作战案例样本;
样本筛选步骤具体包括:在所述第一作战案例样本中的作战态势下对所述第一作战案例样本中的作战决策进行模拟执行,得到作战结果;所述作战态势下模拟执行所述作战决策通过战争模拟软件来实现,并获取模拟的结果;计算所述作战结果与所述第一作战案例样本中的预设方的作战意图的匹配度;判断所述匹配度是否大于预设阈值:是,则所述第一作战案例样本中的作战决策对于所述第一作战案例样本中的作战态势和所述第一作战案例样本中的作战意图有效,将所述第一作战案例样本作为第二作战案例样本,加入第二作战案例知识库;否,则所述第一作战案例样本中的作战决策对于所述第一作战案例样本中的作战态势和所述第一作战案例样本中的作战意图无效;
生成样本有监督学习步骤:使用所述第二作战案例样本对所述作战深度学习模型进行有监督训练;
决策生成步骤:获取作战态势、预设方的作战意图,将作战态势、作战意图作为所述作战深度学习模型的输入,通过计算得到所述作战深度学习模型的输出作为预设方的作战决策。
2.根据权利要求1所述的作战策略生成方法,其特征在于,所述生成样本有监督学习步骤之后还包括:
真实样本无监督学习步骤:获取多个用于训练的真实样本,对所述作战深度学习模型进行无监督训练;
真实样本有监督学习步骤:筛选出符合第二预设条件的多个用于训练的真实样本,对所述作战深度学习模型进行有监督训练。
3.根据权利要求2所述的作战策略生成方法,其特征在于,所述真实样本有监督学习步骤之后还包括:
模型验证步骤:筛选出输出与预期输出一致的多个用于测试的真实样本对所述作战深度学习模型进行验证;
验证判断步骤:判断所述验证是否通过:是,则所述作战深度学习模型通过验证,使用所述用于测试的真实样本对所述作战深度学习模型进行无监督训练和有监督训练;否,则转到样本生成步骤继续执行。
4.根据权利要求3所述的作战策略生成方法,其特征在于,所述验证判断步骤之后还包括:
输出生成步骤:获取输入数据作为所述作战深度学习模型的输入,计算得到所述作战深度学习模型的输出;
模型优化步骤:判断所述输出是否与预期输出一致:否,则回到样本生成步骤继续执行。
5.一种基于深度学习的作战策略生成系统,其特征在于,所述系统包括:样本生成模块:生成多个包括作战态势、作战意图、预设方的作战决策的第一作战案例样本;样本生成方式包括根据样本组成规则知识库和样本元素知识库生成样本,样本元素知识库中包含有样本的组成元素;
样本生成模块具体包括:根据预设作战决策知识库生成所述第一作战案例样本中的作战决策;作战决策知识库中预先存储了作战决策构成规则子知识库、作战决策构成元素子知识库;作战决策构成规则子知识库包括作战的类型、作战的时间、作战的地点、作战的目标的组合规则;作战决策构成元素子知识库包括作战类型知识表、作战时间知识表、作战地点知识表、作战目标知识表;从作战类型知识表中随机获取作战类型的一个实例作为作战类型,从作战时间知识表中随机获取作战时间的一个实例作为作战时间,类似地获得作战地点、作战目标,然后组合形成预设方的作战决策;
模型初始化模块:初始化深度学习模型,作为作战深度学习模型;所述作战深度学习模型的输入设置为作战态势、作战意图,输出设置为作战决策;
生成样本无监督学习模块:使用所述第一作战案例样本对所述作战深度学习模型进行无监督训练;
样本筛选模块:从多个所述第一作战案例样本中筛选出多个作战结果与所述第一作战案例样本中的预设方作战意图一致的所述第一作战案例样本,作为多个第二作战案例样本;
样本筛选模块具体包括:在所述第一作战案例样本中的作战态势下对所述第一作战案例样本中的作战决策进行模拟执行,得到作战结果;所述作战态势下模拟执行所述作战决策通过战争模拟软件来实现,并获取模拟的结果;计算所述作战结果与所述第一作战案例样本中的预设方的作战意图的匹配度;判断所述匹配度是否大于预设阈值:是,则所述第一作战案例样本中的作战决策对于所述第一作战案例样本中的作战态势和所述第一作战案例样本中的作战意图有效,将所述第一作战案例样本作为第二作战案例样本,加入第二作战案例知识库;否,则所述第一作战案例样本中的作战决策对于所述第一作战案例样本中的作战态势和所述第一作战案例样本中的作战意图无效;
生成样本有监督学习模块:使用所述第二作战案例样本对所述作战深度学习模型进行有监督训练;
决策生成模块:获取作战态势、预设方的作战意图,将作战态势、作战意图作为所述作战深度学习模型的输入,通过计算得到所述作战深度学习模型的输出作为预设方的作战决策。
6.根据权利要求5所述的作战策略生成系统,其特征在于,所述系统还包括:真实样本无监督学习模块:获取多个用于训练的真实样本,对所述作战深度学习模型进行无监督训练;
真实样本有监督学习模块:筛选出符合第二预设条件的多个用于训练的真实样本,对所述作战深度学习模型进行有监督训练;
模型验证模块:筛选出输出与预期输出一致的多个用于测试的真实样本对所述作战深度学习模型进行验证;
验证判断模块:判断所述验证是否通过:是,则所述作战深度学习模型通过验证,使用所述用于测试的真实样本对所述作战深度学习模型进行无监督训练和有监督训练;否,则转到样本生成模块继续执行。
7.根据权利要求6所述的作战策略生成系统,其特征在于,所述系统还包括:输出生成模块:获取输入数据作为所述作战深度学习模型的输入,计算得到所述作战深度学习模型的输出;
模型优化模块:判断所述输出是否与预期输出一致:否,则回到样本生成模块继续执行。
8.一种机器人系统,其特征在于,所述机器人系统中分别配置有如权利要求5至7任一项所述的作战策略生成系统。