1.一种基于改进图注意力网络的实体关系识别方法,其特征在于,包括以下步骤:获取待识别的文本数据;
根据获取的文本数据,得到文本数据中单词的向量表示;
根据得到的单词的向量表示,进行实体序列识别;
根据实体序列识别的结果进行节点化处理,根据节点化处理后的节点信息和改进的图注意力网络,得到文本数据中的实体类别与关系类别;
根据实体类别与关系类别进行文本中实体和实体关系的识别。
2.如权利要求1所述的基于改进图注意力网络的实体关系识别方法,其特征在于,节点化处理,具体为:根据实体序列识别的结果进行节点化处理,得到实体节点和关系节点,预测二元关系,进而得到实体关系图的邻接矩阵。
3.如权利要求2所述的基于改进图注意力网络的实体关系识别方法,其特征在于,邻接矩阵的获取方法,具体为:
假设同一句子中任意两个实体节点之间有关系;
构建关系节点;
获取预测的二元关系标签的概率;
如果概率大于或等于预设值,在实体关系图中设置第一实体节点与关系节点之间以及第二实体节点与关系节点之间具有连接,邻接矩阵中的对应位置元素为1;
如果概率小于预设值,在实体关系图中设置两个实体节点以及实体节点与关系节点之间不具有连接,邻接矩阵中的对应位置元素为零;
在实体关系图中加入自环,邻接矩阵的对角元素为1,其余位置设置为零。
4.如权利要求2所述的基于改进图注意力网络的实体关系识别方法,其特征在于,将得到的关系节点用softmax函数进行二元关系预测,得到实体关系图的邻接矩阵。
5.如权利要求1所述的基于改进图注意力网络的实体关系识别方法,其特征在于,根据节点化处理后的节点信息和改进的图注意力网络,对实体节点与关系节点信息进行抽取,抽取的信息与节点化处理后的节点信息进行拼接;
分别得到用于实体分类任务和关系分类任务的特征向量,使用softmax函数对用于实体分类任务和关系分类任务的特征向量进行分类,分别得到预测实体标签和关系标签。
6.如权利要求1所述的基于改进图注意力网络的实体关系识别方法,其特征在于,改进图注意力网络中的多头注意力机制,具体为:初始化注意力权重矩阵;
根据某一节点和它的一阶邻接点构成的矩阵以及注意力权重矩阵得到改进后的注意力函数;
将得到的注意力值赋值给邻接矩阵中的相应位置,得到注意力邻接矩阵;
引入度信息,通过拉普拉斯分解得到改进的图注意力网络卷积函数。
7.如权利要求1所述的基于改进图注意力网络的实体关系识别方法,其特征在于,通过预训练语言模型GloVe和词嵌入模型Word2Vec获取单词信息,通过CNN抽取单词的字符形态信息,根据单词信息和字符信息进行拼接后得到每个单词的向量表示;
或者,
采用BIEOU格式来标记实体序列,使用BiLSTM抽取实体序列信息并用softmax函数来预测单词对应的实体序列标签;
或者,
分别计算实体序列损失、实体类别损失、二元关系损失和关系类别损失,扰动损失;
将对抗样本与嵌入样本相加作为新的文本数据进行实体关系抽取步骤,计算扰动损失并累加全部损失值,进行参数更新。
8.一种基于改进图注意力网络的实体关系识别系统,其特征在于,包括:数据获取模块,被配置为:获取待识别的文本数据;
单词向量表示模块,被配置为:根据获取的文本数据,得到文本数据中单词的向量表示;
实体序列识别模块,被配置为:根据得到的单词的向量表示,进行实体序列识别;
类别划分模块,被配置为:根据实体序列识别的结果进行节点化处理,根据节点化处理后的节点信息和改进的图注意力网络,得到文本数据中的实体类别与关系类别;
识别模块,被配置为:根据实体类别与关系类别进行文本中实体和实体关系的识别。
9.一种计算机可读存储介质,其上存储有程序,其特征在于,该程序被处理器执行时实现如权利要求1-7任一项所述的基于改进图注意力网络的实体关系识别方法中的步骤。
10.一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的程序,其特征在于,所述处理器执行所述程序时实现如权利要求1-7任一项所述的基于改进图注意力网络的实体关系识别方法中的步骤。