1.一种融合多源特征跨图结构的药物相互作用类型预测方法,其特征在于,包括以下步骤:S1.获取药物数据,得到药物数据集,并进行预处理;
S2.所述药物数据经过Jaccard相似度计算得到药物的化学结构、生物靶标和酶作用多维数据表示,对多维数据表示进行拼接得到药物的初始特征表示;
S3.构建药物相互作用的异质图,所述药物的初始特征表示经过异质图进行更新,得到融合拓扑结构的药物表示;
S4.所述融合拓扑结构的药物表示经过注意力机制融合不同源的药物特征,得到最终的药物对表示;
具体步骤为:通过查找索引得到与药物相关联的药物,将两种药物进行配对得到药物对,并将药物对中两种药物的融合拓扑结构的药物表示记为和,将输入缩放点积自注意力中,得到优化的药物的特征表达具体计算公式如下:,
其中,,,分别表示查询、键、值的权重矩阵,表示药物的特征是键向量的维度,同理得到缩放点积注意力优化后的与药物相关联的药物的特征表达;将输入双线性自注意力进行处理,得到双线性自注意力优化后的药物的特征表达,计算公式如下:,
其中,表示药物的特征是键向量的维度;同理得到双线性注意力优化后的与药物相关联的药物的特征表达;将缩放点积注意力优化后优化的药物的特征表达和与药物相关联的药物的特征表达输入到缩放点积交叉注意力,得到第一药物对向量表示,计算公式如下:,
将双线性注意力优化后的药物的特征表达和与药物相关联的药物的特征表达输入到双线性交叉注意力,得到第二药物对向量表示,计算公式如下:,
将第一药物对向量表示和第二药物对向量表示进行拼接,得到最终的药物对表示;
S5.构建特征交织层,药物对中两种药物对应的融合拓扑结构的药物表示经过特征交织层,得到最终的综合表示;
S6.所述最终的药物对表示和最终的综合表示经过预测模块得到药物相互作用预测概率向量。
2.根据权利要求1所述的融合多源特征跨图结构的药物相互作用类型预测方法,其特征在于,所述步骤S1具体为:药物数据来自药物银行DrugBank数据库,所述药物数据包括药物、药物对以及相互作用事件类型;每种药物有四种类型特征,包括:化学亚结构、靶点、途径和酶;
对药物数据集进行预处理,根据药物对和药物相互作用事件类型,分别提取出药物对中的两个药物的名称,为每个药物分配一个唯一的索引,并将药物名称与对应的位置存储在字典中。
3.根据权利要求2所述的融合多源特征跨图结构的药物相互作用类型预测方法,其特征在于,所述步骤S2具体为:S21.特征提取:将药物的化学亚结构、靶标和酶三种生物特征转换为二元特征向量,每种生物特征对应一个二元特征向量;
S22.特征表示:基于步骤S21得到的药物的生物特征对应的二元特征向量,采用Jaccard相似度度量计算药物之间化学亚结构、酶和靶标这三种生物特征下的相似性,每一个药物都得到一个化学亚结构相似性特征表示、一个酶相似性特征表示以及一个靶标相似性特征表示,然后将所述、以及进行拼接,得到每个药物的初始特征表示,计算公式如下:,
其中,表示药物的初始特征表示。
4.根据权利要求3所述的融合多源特征跨图结构的药物相互作用类型预测方法,其特征在于,所述步骤S3具体为:S31.构建异质图,节点表示药物的集合,,表示药物的数量,边表示药物之间的相互作用事件类型构成的集合:采用邻接矩阵表示节点间的连接关系,表示在相互作用关系下的邻接矩阵,若药物i和药物j之间存在相互作用关系,则为1,否则为0;
S32.更新药物特征表示:将药物初始药物特征与邻接矩阵相乘,得到药物的融合拓扑结构的药物表示,计算公式如下:,
其中,表示节点的度,表示药物与药物之间存在相互作用,是药物由步骤S2计算得到的初始药物特征,表示针对关系类型的权重矩阵,是偏置,是激活函数,表示药物的融合拓扑结构的药物表示。
5.根据权利要求4所述的融合多源特征跨图结构的药物相互作用类型预测方法,其特征在于,所述步骤S5具体为:构建特征交织层:基于步骤S22中得到的药物在化学结构、靶标和酶三种生物特征下的Jaccard相似度,得到三个不同层面的同质图,其中的节点代表药物,边表示药物在当前属性下的Jaccard相似度,药物的节点特征通过以下公式进行更新:,
,
,
其中,、、分别表示药物在化学结构、酶和靶标三个层面归一化后的邻接矩阵,、、分别表示药物在化学结构、酶和靶标节点特征中的可训练权重矩阵,是第阶传播后的特征表示,初始值为配对后的药物的融合拓扑结构的药物表示,是激活函数,,,分别表示药物在三个同质图中基于邻居信息的特征更新结果;最终,通过将药物在不同层面特征的结果相加,得到药物的综合特征表示,计算公式如下:,
同理得到药物相关联的药物的综合特征表示;
根据药物的综合特征表示以及药物相关联的药物的综合特征表示,得到最终的综合表示,公式表示如下:。
6.根据权利要求5所述的融合多源特征跨图结构的药物相互作用类型预测方法,其特征在于,所述步骤S6具体为:所述预测模块包括全连接层和激活函数;
通过将最终的药物对表示和最终的综合表示进行拼接,得到药物对综合特征向量,公式表示如下:,
其中,表示拼接操作;所述药物对综合特征向量通过带有批量归一化层的第一全连接层进行线性变换和归一化处理,得到转换后的第一特征向量,公式表示如下:,
其中,表示第一全连接层操作,表示归一化操作,表示激活函数,表示正则化操作,第一全连接层的输入维度为3500,输出维度为858;转换后的第一特征向量经过带有批量归一化层的第二全连接层进行线性变换和归一化处理,得到转换后的第二特征向量,处理过程和得到转换后的第一特征向量的处理过程相同,第二全连接层的输入维度为858,输出维度为463;转换后的第二特征向量经过第三全连接层进行处理,得到药物相互作用预测概率向量,公式表示如下:,
其中,表示第三全连接层操作;第三全连接层的输入维度为463,输出维度为68。
7.一种融合多源特征跨图结构的药物相互作用类型预测装置,执行如权利要求1所述的融合多源特征跨图结构的药物相互作用类型预测方法,其特征在于,包括:数据获取单元:用于获取药物数据,得到药物数据集,并进行预处理;
相似度计算单元:用于将所述药物数据经过Jaccard相似度计算得到药物的化学结构、生物靶标和酶作用多维数据表示,并对多维数据表示进行拼接得到药物的初始特征表示;
第一构建单元:用于构建药物相互作用的异质图,所述药物的初始特征表示经过异质图进行更新,得到融合拓扑结构的药物表示;
特征融合单元:所述融合拓扑结构的药物表示经过注意力机制融合不同源的药物特征,得到最终的药物对表示;
第二构建单元:构建特征交织层,药物对中两种药物对应的融合拓扑结构的药物表示经过特征交织层,得到最终的综合表示;
预测单元:所述最终的药物对表示和最终的综合表示经过预测模块得到药物相互作用预测概率向量。
8.一种电子设备,其特征在于,包括:处理器、存储器和总线,所述存储器存储有所述处理器可执行的机器可读指令,当电子设备运行时,所述处理器与所述存储器之间通过总线通信,所述机器可读指令被所述处理器执行时执行如权利要求1至6中任一项所述的融合多源特征跨图结构的药物相互作用类型预测方法。
9.一种计算机可读存储介质,其特征在于,该计算机可读存储介质上存储有计算机程序,该计算机程序被处理器运行时执行如权利要求1至6中任一项所述的融合多源特征跨图结构的药物相互作用类型预测方法。