1.一种面向煤岩知识图谱的关系感知门控神经网络链路预测方法,其特征在于,包括以下步骤:S1.加载煤岩知识图谱数据集;所述煤岩知识图谱数据集使用煤岩领域专用数据集CoalRockKG数据集,包括煤岩类型、物理性质、地质分布,分为训练集、验证集、测试集;
S2.基于知识图谱数据集生成提示图并获取提示图嵌入表示;具体步骤为:基于关系r在训练数据集中随机选择三元组作为示例三元组,规定示例三元组的头、尾实体相邻的实体作为实体的上下文,头实体和尾实体之间的关系路径作为关系的上下文;
实体上下文和关系上下文共同构成该示例三元组的上下文信息,根据示例三元组的上下文信息生成提示图,然后通过包含RPRU模块的L层消息传递神经网络获取提示图嵌入表示;
具体包括示例选择、提示图生成和提示图嵌入三部分;
所述提示图嵌入方法通过以下步骤实现:
首先,初始化提示图中实体和关系的嵌入表示,定义目标查询关系q的嵌入向量,作为模型推理的目标条件;
其次,通过包含RPRU模块的L层消息传递神经网络对提示图进行编码并进行消息传递;
在消息传递中,对于示例集合S中的示例三元组,三元组,作为中心实体,表示的邻居实体,通过RPRU模块融合实体、关系与查询关系的信息,将其嵌入表示分别输入至模块中,消息传递的过程如下:,
其中,为第层邻居实体u的嵌入表示,为第层节点(u,v)之间关系r的嵌入表示,为查询关系嵌入;表示经RPRU模块获取的特征信息;
所述RPRU的计算公式为:
,
,
,
,
其中,表示遗忘门,表示激活函数;为可训练的第一权重矩阵,用于对拼接后的、和进行线性变换,计算遗忘门;表示可训练的偏置项,调整变换后的遗忘门输出;表示候选隐藏状态,表示更新门;表示拼接操作;表示点积操作;为可训练的第二权重矩阵,用于对拼接后的、和进行线性变换,计算更新门;表示可训练的偏置项,调整变换后的遗忘门输出;为可训练的第三权重矩阵,用于对输入特征和进行线性变换,计算候选隐藏状态,这个矩阵是通过训练过程优化得到的;为可训练的偏置项,用于调整候选隐藏状态的计算结果;表示双曲正切函数;
,
其中,是邻居实体向中心实体v传递的消息,表示中心实体的邻居实体集合;是第层的可学习参数矩阵;是一个与关系和查询关系相关的注意力权重,表示关系r和查询关系q的相关性;
聚合所有邻居实体消息并更新中心实体v的表示:
,
,
其中,表示中心实体v第层的表示,表示关系r第层的表示;表示中心实体的邻居实体集合,是聚合函数;为映射函数;
在完成L层消息传递后,将每一层消息传递生成的关系表示依次拼接在一起,形成一个综合的关系表示矩阵作为提示图嵌入;
S3.利用获取的提示图嵌入表示对知识图谱数据集中的关系嵌入表示进行初始化,并基于N层GIN图神经网络结构作为知识图谱消息传递架构更新实体表示;
S4.利用更新后的实体表示为候选实体分配分数进行预测推理。
2.根据权利要求1所述的面向煤岩知识图谱的关系感知门控神经网络链路预测方法,其特征在于,步骤S1中所述知识图谱数据集包括训练数据集,训练数据集以三元组形式的事实构成,其中为头实体,为关系,为尾实体;
训练数据集中三元组集合的头实体和尾实体构成实体集,,关系构成了关系集,。
3.根据权利要求2所述的面向煤岩知识图谱的关系感知门控神经网络链路预测方法,其特征在于,所述示例选择,具体为:在S1加载的知识图谱数据基础下,根据查询关系q查找三元组集合中所有的三元组,在查找出来的三元组集合中去除头实体或尾实体相同的三元组,随机选择n个三元组加入示例集合,满足且,其中,表示第i个三元组对应的头实体和尾实体,表示第j个三元组对应的头实体和尾实体,表示三元组集合S的长度。
4.根据权利要求3所述的面向煤岩知识图谱的关系感知门控神经网络链路预测方法,其特征在于,所述提示图生成,具体为:基于示例集合S构建提示图,其中,为实体集合;为关系集合;知识图谱以异构图的拓扑结构表示,其中实体集合中的元素对应图节点,关系集合中的元素对应图边,两个相邻节点用节点对表示;示例集合中每个示例三元组由头实体、尾实体以及它们之间的关系构成;对于示例三元组,所构成提示图中包含头实体、尾实体的邻居实体,以及它们之间的k-跳关系路径:其中k是一个超参数,表示节点到的路径长度最大值,将、的邻居实体和它们k-跳关系路径中包含的实体构建实体集合,提取邻居实体之间的关系和k-跳关系路径中的关系构成关系集合。
5.根据权利要求1所述的面向煤岩知识图谱的关系感知门控神经网络链路预测方法,其特征在于,步骤S3具体包括:将知识图谱数据集中所有关系初始化为S2中获取的提示图嵌入,即,其中表示关系r初始嵌入表示;给定一个查询三元组,头实体的表示被初始化为关系的嵌入表示,即,其中表示头实体的初始嵌入表示,其他实体则被表示为零向量;将查询三元组、知识图谱数据集和实体与关系的嵌入表示传入GIN图神经网络获取实体更新表示,实体表示的更新如下:,
其中,为实体e第层的嵌入表示,是关系r第层嵌入表示,是实体e的邻居集合,是实体e与其邻居之间的关系集合;
经过N层消息传递后,获取更新后的实体的最终嵌入表示。
6.根据权利要求1所述的面向煤岩知识图谱的关系感知门控神经网络链路预测方法,其特征在于,步骤S4具体包括:根据S3中知识图谱消息传递时更新后的实体最终表示为候选实体分配分数,通过一个权重矩阵计算得分;
在缺少目标实体的问题中,对于给定的问答对;为候选实体集合,该集合由实体s的邻居实体构成,通过S3中的GIN图神经网络,获取集合中每个候选实体的嵌入表示,然后将每个候选实体的嵌入表示与权重矩阵Wscore的内积作为候选实体的得分,得分计算公式为:,
其中,表示候选答案是的得分;表示一个权重矩阵;表示实体在经过N层的GIN消息传递后的嵌入表示,计算出每个实体得分后,得分最高的实体作为问答对的答案。