欢迎来到知嘟嘟! 联系电话:13336804447 卖家免费入驻,海量在线求购! 卖家免费入驻,海量在线求购!
知嘟嘟
我要发布
联系电话:13336804447
知嘟嘟经纪人
收藏
专利号: 2020102196623
申请人: 西安理工大学
专利类型:发明专利
专利状态:已下证
更新日期:2025-12-18
缴费截止日期: 暂无
价格&联系人
年费信息
委托购买

摘要:

权利要求书:

1.鉴定疾病相关miRNA的方法,其特征在于,包括以下步骤:

步骤1、采用PRISMA流程收集某种特定疾病相关miRNA的数据集A;

步骤2、将所述步骤1得到的数据集A通过卡方检验筛选得到新的数据集A1。

2.根据权利要求1所述的鉴定疾病相关miRNA的方法,其特征在于,所述步骤1的具体步骤如下:从Medline、PubMed、Embase三个数据库获得疾病相关miRNA全部的文献,移除重复的文献后,审阅文章的标题和摘要排除不合适的文献,再审阅文献全文排除不合适的文献即得到所需的miRNA数据集A;

所述不合适的文献包括与人类或小鼠无关、与特定的疾病无关、案例报告和非原始的研究文献的文献。

3.根据权利要求1所述的鉴定疾病相关miRNA的方法,其特征在于,所述步骤2的具体步骤为:将步骤1得到的数据集A设计卡方检验公式(1)获得miRNA和疾病之间关联程度的统计量:式中,C11是摘要vg和摘要vd同时出现的数量;C12是摘要vg出现和摘要vd不出现的数量;

C21是摘要vg不出现和摘要vd出现的数量;C22是摘要vg和摘要vd都不出现的数量;g表示miRNA,d表示疾病;χ2表示卡方检验统计量;

对于数据集A中每个miRNA得到的卡方统计量通过查询卡方分布临界值表,保留p-value小于0.05的miRNA成为新的数据集A1。

4.推断疾病相关miRNA的富集信号通路的方法,其特征在于,采用权利要求1的方法,具体按照以下步骤进行:步骤1、采用PRISMA流程收集某种特定疾病相关编码蛋白基因的数据集B:所述步骤1的具体步骤如下:从Medline、PubMed、Embase三个数据库获得全部的文献,移除重复的文献,审阅文章的标题、摘要和正文排除不合适的文献,再审阅文献全文排出不合适的文献即得到所需基因数据集B;

所述不合适的文献包括物种不匹配、疾病不匹配、不是遗传学研究、案例报告和非原始的研究的文献;

步骤2、将步骤1得到的数据集B通过卡方检验筛选得到新的数据集B1:

具体步骤为:将步骤1得到的数据集B设计卡方检验公式(2)获得编码蛋白基因和疾病之间关联程度的统计量,从而获得新的数据集B1:式中,C11是摘要vg和摘要vd同时出现的数量;C12是摘要vg出现和摘要vd不出现的数量;

C21是摘要vg不出现和摘要vd出现的数量;C22是摘要vg和摘要vd都不出现的数量;g表示基因,d表示疾病;χ2表示卡方检验统计量;

对于数据集B中每个编码蛋白基因得到的卡方统计量通过查询卡方分布临界值表,保留p-value小于0.05的编码蛋白基因成为新的数据集B1;

步骤3、通过靶预测数据库获得权利要求1中数据集A1中miRNA-gene的调控关系:具体步骤为:将数据集A1中疾病相关miRNA在靶预测数据库中查询,若在数据库中查询到某一miRNA靶定的基因为同一个,即可以确定miRNA与靶定基因具有调控关系,将所有存在调控关系的miRNA及其靶基因收集在集合I中,否则,将此miRNA数据舍弃;

步骤4、通过步骤3推断miRNA富集的通路:

具体操作为:对步骤2数据集B1中全部的疾病相关的编码基因做KEGG通路富集分析,通路富集的疾病相关基因作为子集,卡方检验得到数据集作为全集,将全集的疾病相关基因依次在步骤3中集合I中查询得到靶定的miRNA集合,将子集疾病相关基因依次在步骤3集合I中查询得到靶定的miRNA集合,采用Fisher精确检验判断上述得到的总的miRNA集合是否与某些通路显著关联。

5.根据权利要求4所述的推断疾病相关miRNA的富集信号通路的方法,其特征在于,所述步骤2中数据集B1具体通过以下步骤得到:计算出卡方统计量后通过查询卡方分布临界值表,保留p-value小于0.05的编码蛋白基因即可。

6.根据权利要求4所述的推断疾病相关miRNA的富集信号通路的方法,其特征在于,所述步骤3中靶预测数据库为PITA,miRanda,miRTarBase和TargetScan,查询到miRNA靶定同一靶基因的数据库至少为两个。

7.根据权利要求4所述的推断疾病相关miRNA的富集信号通路的方法,其特征在于,所述步骤4中Fisher精确检验的公式(3)和(4)如下:N=∑iRi=∑iCi         (3)

式中,N为总的miRNA数量,P为某个miRNA在某个通路上富集的p-value,m为miRNA数量,Rm为集合内各行上的各个状态的数量,Ri为每个通路对应的miRNA的数量,i取值为从1~m;n为通路数量,Cn为集合内列上各个状态的数量,Cj为各个通路中的基因数量,j取值为从1~n;aij表示第i个miRNA对应第j个通路的数量;

若p-value小于0.05,则miRNA在其对应的通路上富集,否则miRNA在其对应的通路上未富集。