欢迎来到知嘟嘟! 联系电话:13336804447 卖家免费入驻,海量在线求购! 卖家免费入驻,海量在线求购!
知嘟嘟
我要发布
联系电话:13336804447
知嘟嘟经纪人
收藏
专利号: 2019110423185
申请人: 华东交通大学
专利类型:发明专利
专利状态:已下证
更新日期:2025-12-18
缴费截止日期: 暂无
价格&联系人
年费信息
委托购买

摘要:

权利要求书:

1.一种基于单细胞RNA测序数据识别细胞类型的方法,包括以下步骤:(1)基于单细胞RNA测序数据,定义一个基于低秩表示的同时刻画数据全局结构和局部关联特征结构的优化模型;

其中,

X表示含n个细胞m个基因的RNA测序数据;

E表示误差项,用于刻画数据噪声;

Z表示表征矩阵,用于度量细胞‑细胞间相似性;

||Z||*表示矩阵Z的核范数;

用于度量细胞i与细胞j间的相当距离关系,其中α为0‑1之间参数;

(2)基于优化模型建立增广的拉格朗日函数,采用交替方向乘子法ADMM来优化目标函数值,获得迭代优化后的细胞‑细胞间相似性矩阵S;

(3)采用谱聚类方法对所述的相似性矩阵S进行聚类,从而得到对应的细胞类型划分。

2.根据权利要求1所述的方法,其特征在于:步骤(2)所述的增广的拉格朗日函数具体为:其中,

S和U表示引入的变量,初始值都为Z;

C1、C2和C3表示拉格朗日乘子;

λ1、λ2和μ表示正则化参数,防止过拟合;

<·>表示矩阵内积;

||·||F表示Frobenius范数。

3.根据权利要求2所述的方法,其特征在于:步骤(2)所述的采用交替方向乘子法ADMM来优化目标函数值包括以下具体步骤:(2.1)通过如下公式更新Z(2.2)通过求解如下问题来更新S其中 di、ri分别为矩阵D、矩阵R的第i行,si表示矩阵S的第i行;

(2.3)通过如下公式更新U其中Θ表示奇异值阈值计算singular value thresholding operator;

(2.4)通过如下公式更新E其中υ表示收缩运算shrinkage operator;

(2.5)分别通过下列公式更新C1、C2、C3、μk k

C1=C1+μ(X‑XZ‑E)k k

C2=C2+μ(Z‑S)

k k

C3=C3+μ(Z‑U)

μ=min(μρ,μmax),其中ρ,μmax皆为给定常数;

进行迭代,迭代误差计算如下:Error_value=max(leq1,max(abs(L3(:)));

leq1=max(max(abs(L1(:))),max(abs(L2(:))));

k k k k k k

L1=X‑XZ‑E;L2=Z‑S;L3=Z‑U;

当迭代次数满足设定的最大迭代步数设定为100或者误差值Error_value小于设定1e‑T

5时终止迭代,得到优化后的Z;然后按照公式S=(|Z|+|Z|)/2计算得到迭代优化后的细胞‑细胞间相似性矩阵S。

4.根据权利要求1所述的方法,其特征在于:步骤(3)所述的采用谱聚类方法对所述的相似性矩阵S进行聚类包括以下具体步骤:‑1/2 ‑1/2

(3.1)构建规范化拉普拉斯矩阵L=D SD ,其中D为对角矩阵(3.2)计算矩阵L的特征值,得到k个最小特征值对应的特征向量V=[v1,v2,…vk];

(3.3)采用L2范数对V进行规范化(3.4)采用Kmeans方法对规范化的矩阵V进行聚类,得到k个类,每个类对应一种细胞类型。