欢迎来到知嘟嘟! 联系电话:13336804447 卖家免费入驻,海量在线求购! 卖家免费入驻,海量在线求购!
知嘟嘟
我要发布
联系电话:13336804447
知嘟嘟经纪人
收藏
专利号: 2024108378248
申请人: 长春师范大学
专利类型:发明专利
专利状态:已下证
更新日期:2025-12-24
缴费截止日期: 暂无
价格&联系人
年费信息
委托购买

摘要:

权利要求书:

1.一种基于Transformer模型预测的单细胞RNA测序数据聚类方法,其特征在于所述方法包括如下步骤:步骤1)获取单细胞RNA测序数据:

从公共数据库获取公开的单细胞RNA测序数据集;

步骤2)数据预处理:

步骤21)对于步骤1)获取到的单细胞RNA测序数据,使用R包Seurat中的SCTransform函数对其进行预处理;

步骤22)将经过SCTransform处理后的Seurat对象中的标准化表达数据保存到新的CSV文件中;

步骤3)基于PCA和K-means的细胞簇类识别:步骤31)从步骤2)预处理后的基因表达矩阵中加载数据;

步骤32)确定要进行降维的目标维度集合,针对每个维度值,依次对基因表达矩阵进行PCA降维,将高维的基因表达数据转换为低维的特征空间;

步骤33)在降维的数据上分别应用K-means聚类算法,将细胞样本划分为预先定义K值的簇;

步骤34)将每个维度下得到的聚类结果整合;

步骤4)基于加权集成的元聚类方法处理:

步骤41)计算细胞权重;

步骤42)计算加权簇间相似度;

步骤43)基于加权簇间相似度矩阵进行聚类;

步骤44)通过投票方案确定最终结果;

步骤5)计算投票置信度划分训练集:

步骤51)每个细胞根据在多次聚类中被分配到的簇,进行投票;

步骤52)根据每个簇类的得票数,得出每个细胞在各个簇类上的置信度,拥有最高置信度的簇类被指定为细胞的所属簇类;

步骤53)对每个簇类中的细胞对应的置信度进行排序,并将置信度高的前30%的细胞提取出作为Transformer模型的训练集;

步骤6)引入基于Transformer模型的训练和预测:步骤61)将每个簇中置信度高的前30%的细胞以及每个簇类包含的所有细胞分别作为训练集和验证集;

步骤62)构建Transformer模型,并使用训练集数据对构建的Transformer模型进行训练;

步骤63)使用训练好的Transformer模型对预处理过的基因表达矩阵进行处理,对每个细胞样本进行聚类标签的预测,同时,将预测结果保存为一个新的聚类标签结果,供后续的数据分析和应用使用。

2.根据权利要求1所述的基于Transformer模型预测的单细胞RNA测序数据聚类方法,其特征在于所述步骤41)的具体步骤如下:步骤411)将每个降维维度下的聚类结果转换为共定位相似性矩阵步骤412)根据单细胞对之间的聚类结果一致性,将共定位相似性矩阵

3.根据权利要求1所述的基于Transformer模型预测的单细胞RNA测序数据聚类方法,其特征在于所述步骤42)的具体步骤如下:步骤421)根据权重矩阵

步骤422)计算加权簇间相似度:给定两个簇

4.根据权利要求1所述的基于Transformer模型预测的单细胞RNA测序数据聚类方法,其特征在于所述步骤43)中,采用"ward.D"的层次聚类方法对得到的相似度矩阵进行聚类。

5.根据权利要求1所述的基于Transformer模型预测的单细胞RNA测序数据聚类方法,其特征在于所述步骤44)中,根据步骤43)的聚类结果重组多个降维维度下的聚类结果,并通过投票方案确定每个细胞的所属簇类结果。