1.一种数据分析方法,其特征在于,所述数据分析方法包括:
访问预设数据库,从所述预设数据库中获取历史患者的时序样本指标,并通过显著性检验的方式在所述时序样本指标中筛选得到与所述历史患者的健康信息具有统计学关联的时序预测指标;
分析所述时序预测指标的数值随时间的变化关系,获得所述变化关系对应的数值变化斜率均值;
基于特征归因法和所述历史患者的历史分群结果分析所述数值变化斜率均值与历史分群结果之间的非线性关系,确定表征所述非线性关系的归类控制斜率,并根据所述归类控制斜率在预设坐标系模拟得到控制轨迹线;
根据所述时序预测指标的指标类型获取当前患者的时序检验指标,并根据所述时序检验指标在所述预设坐标系拟合得到对应的检验轨迹线;
将所述检验轨迹线与所述控制轨迹线进行位置比对,并根据所述检验轨迹线与所述控制轨迹线的位置关系、所述历史患者的历史分群结果确定所述当前患者的分群结果。
2.如权利要求1所述的数据分析方法,其特征在于,所述分析所述时序预测指标的数值随时间的变化关系,获得所述变化关系对应的数值变化斜率均值的步骤之前,还包括:对所述时序预测指标进行稳定性筛选,得到满足预设变化规律的目标预测指标;
所述分析所述时序预测指标的数值随时间的变化关系,获得所述变化关系对应的数值变化斜率均值的步骤包括:分析所述目标预测指标的数值随时间的变化关系,获得所述变化关系对应的数值变化斜率均值。
3.如权利要求2所述的数据分析方法,其特征在于,所述预设变化规律包括单调下降和/或单调上升,所述对所述时序预测指标进行稳定性筛选,得到满足预设变化规律的目标预测指标的步骤包括:通过第一公式对所述对所述时序预测指标进行稳定性筛选,得到满足单调下降规律的目标预测指标,所述第一公式为max(x(i+1)-x(i))<a,and
和/或,通过第二公式对所述对所述时序预测指标进行稳定性筛选,得到满足单调上升规律的目标预测指标,所述第二公式为max(x(i+1)-x(i))>b,and
其中,x(i+1)为i+1时刻的时序预测指标的数据值,x(i)为i时刻的时序预测指标的数据值;
a为大于零的常数,b为小于零的常数;
threshold1、threshold2均为大于零的常数。
4.如权利要求1所述的数据分析方法,其特征在于,所述基于特征归因法和所述历史患者的历史分群结果分析所述数值变化斜率均值与历史分群结果之间的非线性关系,确定表征所述非线性关系的归类控制斜率的步骤包括:将所述数值变化斜率均值作为特征变量,将所述历史分群结果作为结局变量,其中所述特征变量形成全集N;
从所述N中选择一个特征变量作为当前变量α,确定出所述N的包括当前变量α的所有子集Ri(γ+α),并确定Ri(γ+α)对应的不包括当前变量α的非α子集Ri(γ);
通过预设算法分别计算各Ri(γ+α)对所述结局变量的贡献度F[Ri(γ+α)],以及各Ri(γ)对所述结局变量的贡献度F[Ri(γ)];
分别计算各F[Ri(γ+α)]与对应F[Ri(γ)]的贡献度差值ΔFi,并计算各ΔFi的均值作为当前变量α的SHAP值;
依此分别计算所述N中各特征变量的SHAP值,根据各特征变量的SHAP值的大小确定出对所述结局变量具有典型影响的目标变量,并将所述目标变量对应的数值变化斜率均值确定为所述归类控制斜率。
5.如权利要求1所述的数据分析方法,其特征在于,所述将所述检验轨迹线与所述控制轨迹线进行位置比对,并根据所述检验轨迹线与所述控制轨迹线的位置关系、所述历史患者的历史分群结果确定所述当前患者的分群结果的步骤包括:通过所述控制轨迹线将所述预设坐标系的目标象限划分为至少两个子区域,其中各子区域分别与所述历史患者的历史分群结果一一对应;
确定所述检验轨迹线所处的目标子区域,并根据所述目标子区域所对应的历史分群结果确定所述当前患者的分群结果。
6.如权利要求1所述的数据分析方法,其特征在于,所述根据所述时序预测指标的指标类型获取当前患者的时序检验指标的步骤包括:从所述预设数据库中获取所述当前患者在预设周期内的周期体检数据,并根据所述时序预测指标的指标类型对所述周期体检数据进行筛选,获取与所述时序预测指标的指标类型对应的时序检验指标。
7.如权利要求1至6中任一项所述的数据分析方法,其特征在于,所述将所述检验轨迹线与所述控制轨迹线进行位置比对,并根据所述检验轨迹线与所述控制轨迹线的位置关系、所述历史患者的历史分群结果确定所述当前患者的分群结果的步骤之后,还包括:根据所述当前患者的分群结果从所述预设数据库中获取同类患者的历史健康数据,并将所述历史健康数据发送至对应终端。
8.一种数据分析装置,其特征在于,所述数据分析装置包括:
指标获取模块,用于访问预设数据库,从所述预设数据库中获取历史患者的时序样本指标,并通过显著性检验的方式在所述时序样本指标中筛选得到与所述历史患者的健康信息具有统计学关联的时序预测指标;
第一分析模块,用于分析所述时序预测指标的数值随时间的变化关系,获得所述变化关系对应的数值变化斜率均值;
第二分析模块,用于基于特征归因法和所述历史患者的历史分群结果分析所述数值变化斜率均值与历史分群结果之间的非线性关系,确定表征所述非线性关系的归类控制斜率,并根据所述归类控制斜率在预设坐标系模拟得到控制轨迹线;
轨迹拟合模块,用于根据所述时序预测指标的指标类型获取当前患者的时序检验指标,并根据所述时序检验指标在所述预设坐标系拟合得到对应的检验轨迹线;
位置比对模块,用于将所述检验轨迹线与所述控制轨迹线进行位置比对,并根据所述检验轨迹线与所述控制轨迹线的位置关系、所述历史患者的历史分群结果确定所述当前患者的分群结果。
9.一种数据分析设备,其特征在于,所述数据分析设备包括处理器、存储器、以及存储在所述存储器上并可被所述处理器执行的计算机程序,其中所述计算机程序被所述处理器执行时,实现如权利要求1至7中任一项所述的数据分析方法的步骤。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,其中所述计算机程序被处理器执行时,实现如权利要求1至7中任一项所述的数据分析方法的步骤。