1.一种异常就医行为检测方法,包括如下步骤:
1)构建就医行为网络;以患者历史就医行为数据为基础,构建就医行为网络集合, ,其中n表示患者数量, 表示第i个患者就医行为网络集合,T表示该患者就医行为总数量; 表示患者的第j个就医行为网络;V表示就医行为网络节点,E表示就医行为网络节点与节点之间的关系;
2)获取网络节点特征表示;提取节点和连边上的相关文本的词向量,作为节点和连边的特征;
3)构建网络邻接矩阵;基于1)构建的就医行为网络建立对应的邻接矩阵,;其中, 表示就医行为网络集合对应的邻接矩阵集合; 表示就医行为网络 对应的邻接矩阵,K表示邻接矩阵中的节点的数量;邻接矩阵由0,1构成,1表示两个节点之间存在关系,0表示两个节点之间不存在关系;
4)构建网络边特征矩阵;为了获取就医行为网络节点之间的关系特征,以就医行为网络的邻接矩阵为基础,构建对应的边特征矩阵 ;其中, 表示邻接矩阵 对应的边特征矩阵,边特征矩阵构建过程如下:邻接矩阵为1的地方替换为关系特征,等于0的地方则不做更改,公式如下: (1)其中, =1表示邻接矩阵 中节点p跟节点q之间存在关系, =0表示邻接矩阵 中节点p跟节点q之间不存在关系, 表示节点p跟节点q之间的关系特征;
5)构建网络伪特征矩阵 ,获取就医行为特征表示;网络伪特征矩阵 元素全由1组成,大小与节点特征矩阵 大小相同;基于构建的邻接矩阵、边特征矩阵以及伪特征矩阵,得到就医行为节点的特征表示,公式如下: (2)
(3)
(4)
其中, 表示就医行为节点聚合相邻节点以及边的特征后的输出, 表示激活函数,表示就医行为网络 的节点特征矩阵,D表示矩阵 的度值矩阵,IN表示单位矩阵,维度与邻接矩阵 相同,W,b表示网络的训练参数;
6)提取就医行为时间上的关联信息;患者就医行为在时间上存在关联性信息,采用GRU循环神经网络获取时间上的关联性信息,然而由于GRU循环神经网络输入特征之间时间间隔应该是相等的,对GRU网络结构进行更改,构建K-GRU网络,使其适用于就医行为特征提取,过程如下:
6.1)当前时刻的输入除了当前时刻的特征以外新增与上一次就医行为时间差特征, ,ti表示第i次就医行为的时间;
6.2)基于时间差特征 ,构建时间控制门kt,用来控制时间差特征对就医行为特征的影响,最终K-GRU网络公式如下: (5) (6)
(7)
(8)
(9)
(10)
(11)
(12)其中, 表示上一次就医行为状态信息输入; 表示时间控制门影响的部分就医行为状态信息, 表示激活函数;kt表示时间控制门,控制时间差 对就医行为状态信息的影响, 是时间差映射函数,令 ; 表示上一次就医行为经过时间控制门后的输出; 表示当前时刻的就医行为特征,rt是重置门,表示上一次的就医行为信息有多少保留到了当前时刻;记忆了当前时刻的就医行为状态信息,zt表示更新门,在0到1之间,越接近于1表示当前时刻就医行为信息保留下来的越多,ht表示当前时刻就医行为隐藏状态的输出,yt表示当前时刻就医行为的输出, 表示可训练参数;
7)就医行为特征压缩,聚类;基于步骤(6)得到的就医行为特征,经过一层非线性变换函数将其压缩到低维特征空间,然后采用k-means聚类算法将低维特征聚合成k簇,,公式如下: (13) (14)
其中: 表示第i个就医行为经过K-GRU神经网络特征的的输出, 表示可训练参数, 表示压缩后的就医行为特征,表示压缩后的特征维度,N表示就医行为网络总数量,M表示不同簇的中心点构成的矩阵, ,当 属于第j个簇时,此时 ,否则 , 表示聚类损失函数;
8)就医行为特征重构;将压缩后的就医行为特征经过非线性变换特征函数以及逆向K-GRU网络进行特征重构,使得重构后的特征趋近于原始就医行为特征;根据特征重构误差以及聚类误差训练模型;公式如下: (15)
(16)
其中, 表示重构模型函数, 表示重构模型的训练参数, 表示重构后的特征, 表示初始就医行为特征; 表示重构损失函数;
9)构建损失函数;基于重构损失以及聚类损失,得到总的模型损失函数L,公式如下: (17)
其中, 是权重系数,表示聚类损失与重构损失的权重大小;
10)模型优化,判断异常就医行为;交替优化聚类损失与重构损失,过程如下:
10.1)在最小化重构损失时,固定聚类损失参数M、Si,采用随机梯度下降算法最小化重构损失;
10.2)在优化聚类损失参数Si时,固定网络训练参数以及M,优化公式如下: (18)
其中 表示第 个簇的中心节点;
10.3)在优化聚类损失参数M时,固定网络训练参数以及Si, 最终使得总的损失函数L收敛,停止训练;如果被输入的就医行为不属于这k个簇中一个,则该就医行为属于异常就医行为。
2.如权利要求1所述的一种异常就医行为检测方法,其特征在于:步骤1)所述的节点与节点之间的关系,是药物和疾病之间的治疗关系、或者疾病和症状之间的表现关系。
3.如权利要求1所述的一种异常就医行为检测方法,其特征在于:步骤1)所述的就医行为网络节点V,由患者、医院、医生、药物、症状、疾病、检查方式构成。