欢迎来到知嘟嘟! 联系电话:13336804447 卖家免费入驻,海量在线求购! 卖家免费入驻,海量在线求购!
知嘟嘟
我要发布
联系电话:13336804447
知嘟嘟经纪人
收藏
专利号: 2023114610280
申请人: 临沂大学
专利类型:发明专利
专利状态:已下证
专利领域: 计算;推算;计数
更新日期:2026-04-02
缴费截止日期: 暂无
价格&联系人
年费信息
委托购买

摘要:

权利要求书:

1.一种智慧医疗病患问诊语料库构建方法,其特征在于,该方法包括以下步骤:

采集病患问诊以及相关疾病的医学描述数据作为医疗问诊数据,对数据进行分词处理;

根据患者问诊数据中各词出现的次数及总词数得到患者问诊数据中各词的出现概率;

获取患者问诊数据中各词与确诊疾病种类词语共同出现的概率;根据患者每条问诊数据中所述各词的出现概率以及所述共同出现的概率构建词症关联指数;结合患者问诊数据中各句每个词语与各类病症之间的词症关联指数得到各句对应病症种类的句症关联指数;将各句与每个病症之间所得到的句症关联指数组成各句的句症关联指数序列;通过患者问诊数据中各名词或动词出现的概率构建病症权重共现矩阵;对于患者问诊数据中的形容词,采用病症权重共现矩阵的获取方法得到病症种类关联共现矩阵;根据病症权重共现矩阵及病症种类关联共现矩阵各元素之间的关系得到各句对应疾病种类的双词修正指数序列;根据句症关联指数序列和双词修正指数序列得到各句的修正句症关联指数序列;

根据患者问诊数据中句子的修正句症关联指数序列结合BERT神经网络模型对患者问诊数据进行分类;结合各患者问诊数据类别更新智慧医疗病患问诊语料库。

2.如权利要求1所述的一种智慧医疗病患问诊语料库构建方法,其特征在于,所述根据患者问诊数据中各词出现的次数及总词数得到患者问诊数据中各词的出现概率,包括:统计各词在患者问诊数据中出现的次数,记为各词的单一次数,统计患者问诊数据的总词数,将各词的所述单一次数与患者问诊数据中总词数的比值作为各词的出现概率。

3.如权利要求2所述的一种智慧医疗病患问诊语料库构建方法,其特征在于,所述获取患者问诊数据中各词与确诊疾病种类词语共同出现的概率,包括:统计患者问诊数据中各词语与确诊疾病种类的词语共同出现的次数,记为各词的共有次数,将各词的所述共有次数与单一次数的比值作为各词与确诊疾病种类词语共同出现的概率。

4.如权利要求3所述的一种智慧医疗病患问诊语料库构建方法,其特征在于,所述根据患者每条问诊数据中所述各词的出现概率以及所述共同出现的概率构建词症关联指数,包括:计算各词的单一次数与确诊疾病种类的词语的单一次数的乘积,计算各词与确诊疾病种类词语共同出现的概率除以所述乘积的比值,将以2为底数的所述比值的对数的计算结果作为各词与确诊疾病种类之间的词症关联指数。

5.如权利要求4所述的一种智慧医疗病患问诊语料库构建方法,其特征在于,所述结合患者问诊数据中各句每个词语与各类病症之间的词症关联指数得到各句对应病症种类的句症关联指数,包括:对于患者问诊数据中的各句;

计算句中各词的与确诊疾病种类之间的词症关联指数,将句中所有词与第i种确诊疾病种类之间的词症关联指数的均值作为该句的第i个病症种类的句症关联指数。

6.如权利要求5所述的一种智慧医疗病患问诊语料库构建方法,其特征在于,所述通过患者问诊数据中各名词或动词出现的概率构建病症权重共现矩阵,包括:计算患者问诊数据中各名词或动词的出现概率,将任意两个名词或动词的出现概率的乘积作为病症权重共现矩阵中各元素。

7.如权利要求6所述的一种智慧医疗病患问诊语料库构建方法,其特征在于,所述根据病症权重共现矩阵及病症种类关联共现矩阵各元素之间的关系得到各句对应疾病种类的双词修正指数序列,包括:对于第i个疾病种类,统计第i个疾病种类的词与患者问诊数据句子中各名词或者动词组成的二元组在病症权重共现矩阵中的元素,计算病症权重共现矩阵中所有所述二元组的元素均值;统计第i个疾病种类的词与患者问诊数据句中各形容词或副词组成的二元组在病症种类关联共现矩阵中的元素,计算病症种类关联共现矩阵中的所有所述元素的均值;

将各句两个均值的乘积作为各句对应的第i个疾病种类的双词修正指数,将各句对应的所有疾病种类的双词修正指数组成双词修正指数序列。

8.如权利要求7所述的一种智慧医疗病患问诊语料库构建方法,其特征在于,所述根据句症关联指数序列和双词修正指数序列得到各句的修正句症关联指数序列,包括:将句症关联指数序列和双词修正指数序列对应位置元素的乘积作为各句的修正句症关联指数序列的各元素。

9.如权利要求8所述的一种智慧医疗病患问诊语料库构建方法,其特征在于,所述根据患者问诊数据中句子的修正句症关联指数序列结合BERT神经网络模型对患者问诊数据进行分类,包括:BERT神经网络模型输入是患者问诊数据以及修正句症关联指数序列,输出为患者问诊数据的类别,其中,损失函数采用交叉熵损失函数,优化器采用Adam,患者问诊数据类别包括“呼吸系统疾病”、“循环系统疾病”、“消化系统疾病”、“泌尿生殖系统疾病”、“内分泌系统疾病”、“神经系统疾病”、“免疫系统疾病”。

10.如权利要求9所述的一种智慧医疗病患问诊语料库构建方法,其特征在于,所述结合各患者问诊数据类别更新智慧医疗病患问诊语料库,包括:定期更新语料库,加入新的患者问诊数据,结合BERT神经网络模型获取新的患者问诊数据类别,不断更新智慧医疗病患问诊语料库。