1.外泌体circRNAs诊断早期肺腺癌的效率评估方法,其特征在于,该方法包括:S1、收集早期肺腺癌患者与健康志愿者的血清外泌体,并在外泌体circRNA转录组测序后,随机划分为训练队列与验证队列;
S2、基于支持向量机递归特征消除、套索‑逻辑回归以及受试者操作特征曲线,从所述训练队列中筛选早期肺腺癌的分子标签;
S3、基于所述分子标签的表达矩阵,建立评分体系,评估早期肺腺癌的诊断效率,并展示所述训练队列中样本的风险分布;
S4、基于曲线下面积模型及决策曲线,在所述验证队列中,论证所述分子标签的诊断效率,并展示所述验证队列的风险分布。
2.根据权利要求1所述的外泌体circRNAs诊断早期肺腺癌的效率评估方法,其特征在于,所述在外泌体circRNA转录组测序后,随机划分为训练队列与验证队列包括:S11、设定差异分析标准,执行外泌体circRNA转录组测序,筛选满足标准的差异circRNAs,其中,所述差异circRNAs的数量为64;
S12、将早期肺腺癌患者的与健康志愿者的差异circRNAs分别随机划分为训练与验证队列,且所述训练队列与所述验证队列的比例是1:1。
3.根据权利要求2所述的外泌体circRNAs诊断早期肺腺癌的效率评估方法,其特征在于,所述差异分析标准的表达式为:;
式中,log2FC表示基因在两个条件之间的表达水平的对数折叠变化;
pvalue表示差异分析的统计显著性水平;
&表示逻辑运算中的与。
4.根据权利要求2所述的外泌体circRNAs诊断早期肺腺癌的效率评估方法,其特征在于,所述基于支持向量机递归特征消除、套索‑逻辑回归以及受试者操作特征曲线,从所述训练队列中筛选早期肺腺癌的分子标签包括:S21、基于支持向量机递归特征消除,评估所述差异circRNAs的特征的重要性,从所述差异circRNAs中筛选出错误率最小且准确性最高的第一特征性circRNAs;
S22、基于套索‑逻辑回归,利用惩罚系数选择分类错误的最小目标参量,从所述差异circRNAs中筛选出第二特征性circRNAs;
S23、基于受试者操作特征曲线建立曲线下面积模型,并设定曲线下面积阈值,从所述差异circRNAs中筛选出符合所述曲线下面积阈值要求的第三特征性circRNAs;
S24、利用韦恩图选取三者的交集标签,作为有效的分子标签并展示。
5.根据权利要求4所述的外泌体circRNAs诊断早期肺腺癌的效率评估方法,其特征在于,所述第一特征性circRNAs的数量为32,所述第二特征性circRNAs的数量为22,所述第三特征性circRNAs的数量为21。
6.根据权利要求4所述的外泌体circRNAs诊断早期肺腺癌的效率评估方法,其特征在于,所述曲线下面积模型表示受试者操作特征曲线下的面积,所述曲线下面积阈值为0.7。
7.根据权利要求4所述的外泌体circRNAs诊断早期肺腺癌的效率评估方法,其特征在于,所述利用韦恩图选取三者的交集标签,作为有效的分子标签并展示包括:S241、利用所述第一特征性circRNAs、所述第二特征性circRNAs及所述第三特征性circRNAs绘制韦恩图;
S242、在韦恩图中选取三者的交集标签circRNAs,作为有效的分子标签,且所述分子标签的数量为7;
S243、绘制火山图与小提琴图展示所述分子标签在早起肺腺癌患者与健康志愿者之间的表达差异。
8.根据权利要求2所述的外泌体circRNAs诊断早期肺腺癌的效率评估方法,其特征在于,所述基于所述分子标签的表达矩阵,建立评分体系,评估早期肺腺癌的诊断效率,并展示所述训练队列中样本的风险分布包括:S31、提取所述分子标签的表达矩阵,并通过曲线拟合,构建评分体系;
S32、通过所述评分体系输出评分结果的灵敏度与特异度,计算生成最大约登指数,并根据最大约登指数映射至最佳临界值;
S33、利用曲线下面积模型比较所述分子标签中单个circRNA曲线下面积与全部circRNAs曲线下面积,拟论证最佳诊断正确性的分子标签;
S34、利用决策曲线比较所述分子标签中部分circRNA的净收益与全部circRNAs的净收益,拟论证最优净收益的分子标签;
S35、将所述训练队列中的样本按照评分结果由低至高排序,再按照所述最佳临界值划分为低风险与高风险两组,并绘制风险热图,展示所述训练队列的风险分布。
9.根据权利要求8所述的外泌体circRNAs诊断早期肺腺癌的效率评估方法,其特征在于,所述约登指数的计算表达式为:;
式中,J表示约登指数;
A表示敏感度;
B表示特异度。
10.根据权利要求2所述的外泌体circRNAs诊断早期肺腺癌的效率评估方法,其特征在于,所述基于曲线下面积模型及决策曲线,在所述验证队列中,论证所述分子标签的诊断效率,并展示所述验证队列的风险分布包括:S41、从所述验证队列中筛选早期肺腺癌的分子标签;
S42、利用曲线下面积模型比较所述分子标签中单个circRNA曲线下面积与全部circRNAs曲线下面积,拟论证最佳诊断正确性的分子标签;
S43、利用决策曲线比较所述分子标签中部分circRNA的净收益与全部circRNAs的净收益,拟论证最优净收益的分子标签;
S44、将所述验证队列中的样本按照评分结果由低至高排序,再按照最佳临界值划分为低风险与高风险两组,并绘制风险热图,展示所述验证队列的风险分布。