1.一种生物医学命名实体识别的方法,其特征在于,包括:对于字符、词利用注意力机制进行特征采样分别得到单词嵌入的拓展,然后使用最大池化层来提取单词嵌入;
采用注意机制将不同层次的单词嵌入进行融合,得到多层次的单词嵌入;
将所述多层次的单词嵌入输入命名实体识别神经网络模型中进行训练,获得训练好的命名实体识别神经网络模型;
将待识别的生物医学命名实体输入训练好的命名实体识别神经网络模型,得到实体识别结果。
2.根据权利要求1所述的生物医学命名实体识别的方法,其特征在于,对于字符、词利用注意力机制进行特征采样分别得到单词嵌入的拓展,包括:采用多层次的注意力嵌入向量计算分别在局部字符、全局字符以及局部词中进行注意力探索,在不同的层次提取单词嵌入信息。
3.根据权利要求2所述的生物医学命名实体识别的方法,其特征在于,所述多层次的注意力嵌入向量计算,包括:基于字符的局部注意力计算,所述基于字符的局部注意力计算对单词内部的字符使用单热编码的形式进行建模,然后分别对建模的字符嵌入矩阵进行注意力计算,最后输出的对计算的注意力字符嵌入使用最大池化层采样选择合适维度信息。
4.根据权利要求3所述的生物医学命名实体识别的方法,其特征在于,所述多层次的注意力嵌入向量计算,包括:基于字符的全局注意力计算,所述基于字符的全局注意力计算对建模的字符嵌入矩阵先使用Bi‑GRU在句子字符上进行上下文信息探索,然后在进行注意力计算,最后使用最大池化层进行采样形成对应的单词嵌入。
5.根据权利要求2所述的生物医学命名实体识别的方法,其特征在于,所述多层次的注意力嵌入向量计算,还包括:基于词的局部注意力计算,所述基于词的局部注意力计算对单词嵌入进行注意力分布计算,提取单词嵌入之间的注意分布。
6.根据权利要求4或5所述的生物医学命名实体识别的方法,其特征在于,在计算注意力分布之前,先在句子内部对单词嵌入进行上下文探索,提取上下文信息。
7.根据权利要求1所述的生物医学命名实体识别的方法,其特征在于,所述采用注意机制将不同层次的单词嵌入进行融合,得到多层次的单词嵌入,包括:采用交叉注意力融合将两个不同层次的注意力加权到相应的嵌入信息之中进行融合,得到多层次的单词嵌入。
8.根据权利要求1所述的生物医学命名实体识别的方法,其特征在于,在所述对字符进行特征采样作为单词嵌入的扩展之前,还包括采用条件随机场对所述生物医学命名实体进行标记和划分。
9.一种生物医学命名实体识别的系统,其特征在于,包括:词嵌入模块,被配置为:对于字符、词利用注意力机制进行特征采样分别得到单词嵌入的拓展,然后使用最大池化层来提取单词嵌入;
特征融合模块,被配置为:采用注意机制将不同层次的单词嵌入进行融合,得到多层次的单词嵌入;
模型训练模块,被配置为:将所述多层次的单词嵌入输入命名实体识别神经网络模型中进行训练,获得训练好的命名实体识别神经网络模型;
输出模块,被配置为:将待识别的生物医学命名实体输入训练好的命名实体识别神经网络模型,得到实体识别结果。
10.一种计算机可读存储介质,用于存储计算机指令,其特征在于,所述计算机指令被处理器执行时,完成如权利要求1‑8任一所述的生物医学命名实体识别的方法。