1.一种物种间基因家族亲缘关系计算方法,其特征在于:
确定一个待分析的基因家族作为指定基因家族;
选择参考物种,获取其所述指定基因家族所包含的基因作为参考基因;
确定第一考察物种,获取其所述指定基因家族所包含的基因作为第一考察基因;
确定第二考察物种,获取其所述指定基因家族所包含的基因作为第二考察基因;
将参考基因与第一考察基因进行两两序列比对,从该序列比对结果中获取大于阈值条件的参考物种的非冗余基因数量作为第一考察物种的参考物种非冗余基因数量,所述阈值条件为匹配序列长度和匹配序列相似性值的组合,所述大于阈值条件为大于匹配序列长度且大于匹配序列相似性值,所述阈值条件的数量大于等于2个;
将参考基因与第二考察基因进行两两序列比对,从该序列比对结果中获取大于所述阈值条件的参考物种的非冗余基因数量作为第二考察物种的参考物种非冗余基因数量;
计算相同阈值条件时第一考察物种的参考物种非冗余基因数量与第二考察物种的参考物种非冗余基因数量的差值,确定差值的绝对值最大且参考物种非冗余基因数量较大的考察物种为与参考物种指定基因家族的亲缘关系更近。
2.如权利要求1所述的物种间基因家族亲缘关系计算方法,其特征在于,参考物种和考察物种均已被全基因组测序。
3.如权利要求1所述的物种间基因家族亲缘关系计算方法,其特征在于,所述序列为氨基酸序列。
4.如权利要求1所述的物种间基因家族亲缘关系计算方法,其特征在于,所述阈值条件中的匹配序列长度为所述指定基因家族的结构域序列长度的三分之二。
5.如权利要求1所述的物种间基因家族亲缘关系计算方法,其特征在于,所述阈值条件中的匹配序列相似性值为至少30%以上。
6.如权利要求5所述的物种间基因家族亲缘关系计算方法,其特征在于,所述匹配序列相似性值为至少30%以上包括30%,40%,50%,60%,70%,80%和90%。
7.如权利要求1所述的物种间基因家族亲缘关系计算方法,其特征在于,所述阈值条件的数量大于等于2个为7个阈值条件,所述7个阈值条件的匹配序列相似性值分别为30%,
40%,50%,60%,70%,80%和90%,匹配序列长度均为所述指定基因家族的结构域序列长度的三分之二。
8.如权利要求1所述的物种间基因家族亲缘关系计算方法,其特征在于,所述非冗余基因数量为非冗余基因的个数或非冗余基因的个数占参考物种的指定基因家族基因总数的比例。