1.一种基于深度学习的医学影像报告多标签分类方法,其特征在于,所述基于深度学习的医学影像报告多标签分类方法包括如下步骤:获取医学影像报告的文本数据和所述医学影像报告中的异常情况的标签数据;
根据所述文本数据和标签数据得到词向量和标签向量;
将所述词向量和所述标签向量输入多标签分类模型,得到多标签分类任务损失;
将所述词向量、所述文本数据和所述标签向量输入辅助任务模型,得到辅助任务损失;
根据所述辅助任务损失和所述多标签分类任务损失对所述多标签分类模型进行反向传播优化,得到训练多标签分类模型;
获取待检测医学影像报告的待检测文本数据;
将所述待检测文本数据输入训练多标签分类模型,确定所述待检测医学影像报告的异常问题。
2.根据权利要求1所述的基于深度学习的医学影像报告多标签分类方法,其特征在于,所述根据所述辅助任务损失和所述多标签分类任务损失对所述多标签分类模型进行反向传播优化,得到训练多标签分类模型的步骤,包括:将所述辅助任务损失和所述多标签分类任务损失进行加权融合,得到总损失值;
通过所述总损失值和所述梯度下降算法同时对所述多标签分类模型和所述辅助任务模型进行反向传播优化,得到训练多标签分类模型。
3.根据权利要求1所述的基于深度学习的医学影像报告多标签分类方法,其特征在于,所述将所述词向量和所述标签向量输入多标签分类模型,得到多标签分类任务损失的步骤,包括:
将所述词向量输入多标签并行模型,得到粗粒度多标签分类结果;
将所述粗粒度多标签分类结果和所述标签向量输入标签校正网络,得到预测多标签类别;
根据所述预测多标签类别对所述标签数据进行优化,得到多标签分类任务损失。
4.根据权利要求3所述的基于深度学习的医学影像报告多标签分类方法,其特征在于,所述将所述词向量输入多标签并行模型,得到粗粒度多标签分类结果的步骤,包括:利用恒等映射层对所述词向量恒等转换,得到转换向量;
将所述转换向量输入归一化层进行归一化,得到文本向量;
将所述文本向量输入循环神经网络中,得到表征字向量;
对所述表征字向量进行自注意力计算,确定每个文本数据中不同字的权重,并对不同字分别进行加权,得到第一表征句向量;
将所述文本向量输入卷积神经网络中,从所述文本向量的多个局部信息中得到卷积特征;其中,所述卷积神经网络采用若干个不同的卷积核以及若干个窗口;
利用最大池化函数对所述卷积特征进行重要性提取,并选取最重要的卷积特征进行聚合,得到第二表征句向量;
将所述第一表征句向量和所述第二表征句向量进行聚合,得到高维的文本特征;
将所述文本特征输入多标签分类网络,得到粗粒度多标签分类结果。
5.根据权利要求4所述的基于深度学习的医学影像报告多标签分类方法,其特征在于,所述多标签分类网络包括若干个串联的线性网络模块,所述线性网络模块包括两个并列的瓶颈层和特征层,以及将瓶颈层和特征层的结果进行聚合的聚合层,在聚合层后的ReLU变化层,以及在ReLU变化层后的线性分类器。
6.根据权利要求3所述的基于深度学习的医学影像报告多标签分类方法,其特征在于,所述将所述粗粒度多标签分类结果和所述标签向量输入标签校正网络,得到预测多标签类别的步骤,包括:
将所述粗粒度多标签分类结果输入低维线性映射层,得到低维映射结果;
通过Sigmoid激活函数对所述低维映射结果进行变换,得到第一拓展向量;
将所述粗粒度多标签分类结果输入若干个高维线性映射层,得到若干个高维映射结果;
通过SELU激活函数对每个高维映射结果分别进行激活变化,得到第二拓展向量;
将所述第一拓展向量、所述第一拓展向量和所述粗粒度多标签分类结果进行聚合,得到高维度向量;
将所述高维度向量与训练注意力矩阵相乘,得到高维度矩阵;
将所述高维度矩阵与所述标签向量进行加权,得到高维度加权向量;
将所述高维度加权向量输入线性分类层进行分类,得到预测多标签类别。
7.根据权利要求4所述的基于深度学习的医学影像报告多标签分类方法,其特征在于,将所述词向量、所述文本数据和所述标签向量输入辅助任务模型,得到辅助任务损失的步骤,包括:
根据所述文本数据和所述标签向量,计算得到所述文本数据中每条文本的各个标签分向量的词频逆文本频率指数值;
在每条文本中随机抽取两个标签分向量,比较两个所述标签分向量对应的词频逆文本频率指数值的大小,将较大的词频逆文本频率指数值作为辅助任务目标值;
将文本向量与进行比较的两个标签分向量进行拼接,得到拼接辅助任务;
将所述拼接辅助任务输入双向门控循环神经网络进行特征提取,得到特征向量;
通过自注意力层对所述特征向量进行局部加权,得到特征权重矩阵;
将所述特征权重矩阵与所述特征向量进行加权融合,得到注意力特征向量;
将注意力特征向量输入线性瓶颈层,得到瓶颈向量;
将所述瓶颈向量输入线性分类层,得到预测分类结果;
采用交叉熵损失函数将所述预测分类结果和所述辅助任务目标值进行损失计算,得到辅助任务损失。