1.一种土壤中微生物识别及相互作用分析方法,其特征在于,包括以下步骤:S100:获取微生物DNA序列,设立序列质量评分函数,进行序列预处理;
S200:通过深入分析微生物DNA序列的生物学性质,提取序列特征,设定特征向量为:,
其中,表示序列的特征向量,、、、和分别表示序列的含量和各碱基的频率;
基于对序列特征的分析和对不同特征的权重的综合考虑,计算序列之间的相似度;相似度计算的公式为:,
其中,表示序列和序列之间的相似度,是余弦相似度和加权欧氏距离的权重参数,是第个特征的权重参数,表示序列的第个特征;
在相似度计算的基础上,采用基于混合元启发式算法的融合方法对序列进行聚类;基于混合元启发式算法的融合方法引入基于信息熵的适应度函数和基于邻域搜索的变异操作;基于信息熵的适应度函数公式如下:,
其中,表示聚类方案的信息熵,是聚类方案中的一个聚类,表示序列在聚类中的出现概率;
具体的,根据相似度进行初始聚类,设立相似度阈值,当两个序列的相似度小于相似度阈值时,划分为同一类;从初始聚类方案的邻域中,选择一个候选聚类方案,计算候选聚类方案和当前初始聚类方案的信息熵,根据模拟退火准则来决定是否接受候选聚类方案;当接受候选聚类方案的适应度值比初始聚类方案高,或者满足接受概率准则,则接受候选聚类方案作为新的聚类方案;所述接受概率准则的具体内容是:当接受候选聚类方案的适应度值比初始聚类方案小时,以从当前聚类方案转移到新的聚类方案的接受概率去接受候选聚类方案;
S300:构建基于贝叶斯网络的概率图模型,节点表示微生物类别,边表示微生物之间的依赖关系,通过学习网络的结构和参数,得到每个节点的父节点集合;概率图模型分类的公式为:,
其中,表示给定聚类方案下微生物类别集合的概率,表示序列的微生物类别,表示给定其父节点的条件下,节点的条件概率,表示类别的父节点集合;是聚类方案中的一个聚类;
设计微生物相互作用网络构建算法,定量分析微生物之间的相互作用;每个微生物在每个时间点的特征向量被转换为新的表征形式,具体公式为:,
其中,表示深度生成模型,是模型参数;
基于演化动力学,提出动态权重计算方法,利用演化博弈论和动力学系统理论,分析微生物丰度数据的演化动态,从而计算出微生物之间的动态相互作用权重;动态相互作用权重计算公式为:,
其中,是动态相互作用权重,是激活函数,是权重调整参数,和分别表示微生物和的演化策略参数,表示演化动力学模型,是偏置项;
引入基于非对称信息准则的阈值设定方法构建微生物相互作用网络,计算不同阈值下,相互作用网络的非对称信息,并选择非对称信息最大的阈值作为最优阈值;最优阈值公式如下:,
其中,表示最优阈值,是阈值,是在阈值下,相互作用网络的非对称信息,是在阈值下,网络的密度,是权重参数;
基于构建的微生物相互作用网络,提出基于多维度分析的网络优化方法;在不同的维度下提取网络的多维特性,并进行多维度的网络分析,在每个维度上对网络进行投影,得到网络在该维度上的投影;应用多维数据分析理论,对每个维度上的网络投影进行分析,提取网络的多维特性;这一过程可以用以下公式表示:,
其中,是多维度分析结果,是各维度的权重参数,是在维度上的网络投影的分析结果。
2.如权利要求1所述的一种土壤中微生物识别及相互作用分析方法,其特征在于,所述步骤S100具体包括:在序列预处理阶段,设立了序列质量评分函数,该函数综合考虑了序列的变异性、纯度和复杂度,变异性得分衡量了序列中碱基的变异程度,纯度得分衡量了序列中是否存在杂质序列,复杂度得分衡量了序列的复杂程度,在序列预处理后,将预处理后的序列与参考数据库进行比对,剔除与任何已知序列都不匹配的序列。