欢迎来到知嘟嘟! 联系电话:13336804447 卖家免费入驻,海量在线求购! 卖家免费入驻,海量在线求购!
知嘟嘟
我要发布
联系电话:13336804447
知嘟嘟经纪人
收藏
专利号: 202510578790X
申请人: 广东工业大学
专利类型:发明专利
专利状态:已下证
更新日期:2026-02-06
缴费截止日期: 暂无
价格&联系人
年费信息
委托购买

摘要:

权利要求书:

1.一种基于双曲图特征学习网络的药物与疾病关联预测方法,其特征在于,包括具体步骤如下:S1:从数据库获取药物疾病关联数据,用于构建药物相似度矩阵DR和疾病相似度矩阵DS,将其特征提取后映射到双曲空间中,得到双曲药物初始特征矩阵ZRH、双曲疾病初始特征矩阵ZDH,用于构建药物-疾病邻接矩阵A;

S2:对ZRH和ZDH应用双曲图特征重构器,得到双曲药物相似特征矩阵SRH和双曲疾病相似特征矩阵SDH,具体步骤如下:S21:运用双曲特征变换提取药物节点和疾病节点的中间特征向量;具体步骤如下:S211:对于药物疾病关联数据中的nr个药物节点,已知双曲药物初始特征矩阵ZRH,表示ZRH的第i行双曲药物初始特征向量;

S212:对于药物疾病关联数据中的任意药物节点dri,在第l层双曲图特征重构器中,首先进行双曲特征变换,将上一层的双曲空间映射到该层的双曲空间;

S22:计算双曲同质融合注意力,使用双曲同质融合注意力提取药物和疾病节点的双曲相似特征,具体步骤如下:S221,计算双曲同质融合注意力,所述双曲同质融合注意力由节点特征注意力、双曲距离注意力和结构注意力组成;

S2211:计算第l层中药物节点dri对药物节点drj的节点特征注意力S2212:计算第l层中药物节点dri对药物节点drj的双曲距离注意力S2213:计算药物节点dri对药物节点drj的结构注意力;

S2214:在第l层,将节点特征注意力双曲距离注意力和结构注意力融合得到双曲同质融合注意力;

S222:使用双曲同质融合注意力提取药物和疾病节点的双曲相似特征;

S2221:对进行双曲编码,得到药物节点dri在第l层的双曲相似特征S2222:对任意药物节点dri进行上述操作,经过h层迭代,最终可得双曲药物相似特征矩阵用表示SRh,H;

S2223:重复上述步骤,以得到双曲疾病相似特征矩阵S3:根据A构建异质图AG,基于AG使用GCN和双曲异质变动图转换器对ZRH和ZDH训练得到双曲药物异质特征矩阵HRH和双曲疾病异质特征矩阵HDH;

S4:拼接SRH和HRH,拼接SDH和HDH,使用MLP得到双曲药物特征矩阵FRH和双曲疾病特征矩阵FDH;

S5:基于FRH和FDH,运用正负融合难例采样策略构建双曲难例药物特征矩阵FR'H和双曲难例疾病特征矩阵FD'H;

S6:利用FR'H和FD'H,通过MLP输出预测结果。

2.根据权利要求1所述的一种基于双曲图特征学习网络的药物与疾病关联预测方法,其特征在于,所述S1的具体步骤如下:S11:构建药物相似度矩阵DR、疾病相似度矩阵DS,并将其通过MLP获取药物初始特征矩阵ZR和疾病初始特征矩阵ZD;

S12:将药物初始特征矩阵ZR、疾病初始特征矩阵ZD映射到双曲空间;

S13:构建药物-疾病邻接矩阵其中,nr表示药物节点数量,nd表示疾病节点数量。

3.根据权利要求2所述的一种基于双曲图特征学习网络的药物与疾病关联预测方法,其特征在于,所述S11的具体步骤如下:S111:从数据库获取药物疾病关联数据,构建药物相似度矩阵疾病相似度矩阵其中nr表示药物节点数量,nd表示疾病节点数量;

S112:使用MLP对DR和DS进行特征提取,得到药物初始特征矩阵ZR和疾病初始特征矩阵ZD,公式如下:ZR=MLP(DR)

ZD=MLP(DS)

其中,表示药物初始特征矩阵,d0是其特征维数,表示ZR的第i行药物初始特征向量,即药物节点dri的药物初始特征向量;表示疾病初始特征矩阵;表示ZD的第i行疾病初始特征向量,即疾病节点dsi的疾病初始特征向量;

所述S12的具体步骤如下:

S121:采用洛伦兹模型,令K=1,则表示为的原点,之后用表示S122:对于ZRi,将其映射到双曲空间中,公式如下:其中,表示药物节点dri的双曲药物初始特征向量,expo(·)作用是将变量映射到双曲空间中;(0,ZRi)满足表示闵可夫斯基内积;ZRi表示药物节点dri的药物初始特征向量;||.||2表示L2范数;

S123:通过对任意药物节点dri的药物初始特征向量ZRi进行上述操作,可获得双曲药物初始特征矩阵S124:重复上述步骤,获得双曲疾病初始特征矩阵所述S13的具体步骤如下:

获取药物疾病关联数据,构建邻接矩阵A,具体的构造方法如下:

4.根据权利要求1所述的一种基于双曲图特征学习网络的药物与疾病关联预测方法,其特征在于:在第0层,双曲药物相似特征矩阵如下:

SR0,H=ZRH

则表示SR0,H的第i行双曲药物相似特征向量;

在第l层的双曲特征变换公式如下:

其中,表示为药物节点dri在双曲特征变换之后的位于双曲空间的中间特征向量;是第l层的可训练参数,dl是第l层的维度;是药物节点dri在第l-1层的双曲药物相似特征向量;bl是第l层位于的欧氏向量,是可训练的参数;表示药物节点dri在下一层l的位于双曲空间中的中间变量;expo(·)的作用是将变量映射到下一层l的双曲空间logo(·)的作用是将变量映射到原点o的切空间作用是以点为中心,将变量映射到双曲空间中;将bl从原点o的切空间平行运输到点的切空间具体公式为:

其中,LeakReLU是激活函数;是可训练的参数;logo(·)的作用是将变量映射到原点o的切空间表示与执行矩阵乘法;

然后进行归一化得到最终的节点特征注意力公式如下:其中,表示药物节点dri的一阶邻居集合,包含它自己;当药物节点dri和药物节点drj在第l层的节点特征的相似性越高,越大;

具体公式为:

其中,δ和η是超参数,用于调整双曲距离;用于计算和之间的双曲距离;表示双曲距离的平方;

然后进行归一化得到最终的双曲距离注意力具体公式为:其中,表示药物节点dri的一阶邻居集合,包含它自己;当药物节点dri和药物节点drj在第l层的双曲距离越小,越大;

具体计算过程如下:

已知药物相似度矩阵DR,药物节点dri的度数在这里定义为:其中,该公式含义是对DR的第i行的每一列j求和,即药物节点dri对每一个药物节点drj的相似度进行求和;

药物节点dri对药物节点drj的结构注意力计算公式如下:其中,

然后进行归一化得到最终的结构注意力公式如下:其中,表示药物节点dri的一阶邻居集合,包含它自己;当药物节点dri和药物节点drj的度数越小,则越大;

公式如下:

其中wNF、wDS和wST是可训练的参数,初始化时都为1;

双曲编码的公式如下:

其中,作用是将变量映射到双曲空间中;σ是激活函数;表示药物节点dri的一阶邻居集合,包含自己;作用是将变量映射到的切空间中。

5.根据权利要求1所述的一种基于双曲图特征学习网络的药物与疾病关联预测方法,其特征在于,所述S3的具体步骤如下:S31:使用GCN获得双曲疾病异质初始特征矩阵和双曲药物异质初始特征矩阵;

S32:计算双曲异质变动注意力,使用双曲异质变动注意力学习药物节点与疾病节点的异质特征。

6.根据权利要求5所述的一种基于双曲图特征学习网络的药物与疾病关联预测方法,其特征在于,所述S31的具体步骤如下:S311:基于邻接矩阵A构建异质图AG,如下:其中,

S312:为了体现层数,令MR0,H表示为ZRH,MD0,H表示为ZDH;为了能使用GCN公式,将MR0,H、MD0,H进行拼接,得到:其中,E0是第0层由MR0,H、MD0,H拼接而成的特征矩阵;

S313:在第l层,基于异质图AG使用GCN获取El,公式如下:AG'=(AG+I)

其中,是El在第l层的第i行双曲异质初始特征向量;σ是激活函数;expo(·)作用是将变量映射到双曲空间是药物节点dri或疾病节点dsi的一阶邻居集合,包括它自己;是经过处理后的邻接矩阵,是第i行第j列的值;I是单位矩阵;是可训练的参数;logo(·)作用是将变量映射到原点o的切空间D矩阵用于计算S314:经过h层迭代可得到:

即从Eh中得到了双曲药物异质初始特征矩阵和双曲疾病异质初始特征矩阵所述S32的具体步骤如下:

已知双曲药物异质初始特征矩阵和双曲疾病异质初始特征矩阵,即MRh,H和MDh,H;

在第0层,双曲药物异质特征矩阵和双曲疾病异质特征矩阵分别为:HR0,H=MRh,H

HD0,H=MDh,H

双曲异质变动图转换器有三个输入:查询矩阵Q1和Q2、键矩阵K1和K2以及值矩阵V;若提取双曲药物异质特征,查询矩阵是通过HR0,H得到,而键矩阵和值矩阵则是通过HD0,H得到;若提取双曲疾病异质特征,情况正好相反;在第l层,输出分别是HRl,H和HDl,H;

在第l层时,得到HRl,H的过程如下:

其中,HRl-1,H是第l-1层的双曲药物异质特征矩阵;expo(·)作用是将变量映射到双曲空间logo(·)作用是将变量映射到原点o的切空间表示logo(HRl-1,H)和执行矩阵乘法,同理;

其中,HDl-1,H是第l-1层的双曲疾病异质特征矩阵;

定义第l层的药物节点dri的更新方程如下:

其中,表示在第l层的药物节点dri的双曲药物异质知识特征向量;Vj是V的第j行;表示洛伦兹范数;是HRl,H第i行的双曲药物异质特征向量;Norm是LayerNorm或者BatchNorm;expo(·)作用是将变量映射到双曲空间logo(·)作用是将变量映射到原点o的切空间RDIFij定义为:

其中RDIFij为双曲变动注意力分数,λl定义为:其中,λl是第l层的标量,是第l层的可学习的参数,λinit是超参数;

经过h层迭代,药物节点dri的双曲药物异质特征向量为进而得到双曲药物异质特征矩阵用HRH表示HRh,H;

类似地,在第h层也可得到双曲疾病异质特征矩阵HDH。

7.根据权利要求1所述的一种基于双曲图特征学习网络的药物与疾病关联预测方法,其特征在于,所述S4的具体步骤如下:计算双曲药物和疾病特征矩阵,公式如下:

FRH=expo(MLP(logo(SRH)||logo(HRH)))FDH=expo(MLP(logo(SDH)||logo(HDH)))其中,expo(·)作用是将变量映射到双曲空间logo(·)作用是将变量映射到原点o的切空间中;MLP的作用是将双曲药物和疾病的特征向量从降维到

8.根据权利要求1所述的一种基于双曲图特征学习网络的药物与疾病关联预测方法,其特征在于,所述S5的具体步骤如下:S51:构建药物负样本和疾病负样本;

S52:使用正负融合难例采样策略生成难例药物负样本和难例疾病负样本并得到双曲难例药物特征矩阵和双曲难例疾病特征矩阵;

所述S51的具体步骤如下:

511:先把双曲药物特征矩阵和双曲疾病特征矩阵映射为药物特征矩阵XR和疾病特征矩阵XD,如下:XR=logo(FRH)

XD=logo(FDH)

其中,logo作用是将变量映射到原点o的切空间中;

S512:获取药物疾病关联数据,生成异质图G,G包含了药物-疾病关系、药物-药物关系和疾病-疾病关系;从异质图G中找出所有正样本对和负样本对,首先要保证正样本对和负样本对数量一样,采取的策略为:从异质图G中随机筛选一部分负样本对以确保数量与正样本对相同,反之同理;最后再从筛选后的负样本对中筛选出药物负样本和疾病负样本;其中,药物负样本特征矩阵为疾病负样本特征矩阵为Nneg为负样本对的数量,即药物负样本和疾病负样本的数量;

所述S52的具体步骤如下:

S521:构建难例候选负样本特征矩阵;

对于异质图G中的任意节点,由所有的一阶和二阶邻居节点所组成的集合就称为该节点的邻居集合;

对于所有的药物负样本,找出它所有的一阶和二阶邻居,即邻居集合;

对于任意的药物负样本r,构建难例候选负样本特征矩阵的操作如下:首先,根据异质图G找出它的邻居集合内所有药物正样本,其药物正样本所组成的局部邻居药物正样本特征矩阵为:XRpl,然后对所有药物正样本的特征向量进行融合,得到药物融合正样本特征向量xpr,公式如下:其中是XRpl的第mr行的药物正样本特征向量;mr表示药物负样本r的邻居集合内药物正样本的数量;

类似地,对它的邻居集合内的所有疾病正样本的特征向量进行融合,得到疾病融合正样本特征向量xpd,公式如下:其中是XDpl的第md行的疾病正样本特征向量;md表示药物负样本r的邻居集合内疾病正样本的数量;

然后找到药物负样本r邻居集合内二阶邻居的疾病负样本,其组成的二阶邻居疾病负样本特征矩阵为:XDnl;根据xpr和xpd对药物负样本r邻居集合内二阶邻居的疾病负样本计算疾病负样本概率分布,公式如下:其中,表示XDnl的第q行特征向量;μ是超参数,用于平衡药物和疾病的影响;N表示药物负样本r邻居集合内二阶邻居的疾病负样本的数量;这个公式的含义是距离(xpr,xpd)越近的疾病负样本,被选为候选疾病负样本的概率越大;

之后根据疾病负样本概率分布去选取M个最大的概率值所对应的药物负样本r邻居集合内二阶邻居的疾病负样本,构造出大小为M的候选疾病负样本特征矩阵M为超参数;

接下来将疾病融合正样本特征向量xpd的信息注入到候选疾病负样本特征矩阵T中,构建出难例候选疾病负样本特征矩阵T',公式如下:T'i=αxpd+(1-α)Ti,α∈(0,1)其中,T'i是T'的第i行难例疾病负样本特征向量;α是超参数;Ti是T的第i行候选疾病负样本特征向量;

S522:获取双曲难例药物特征矩阵和双曲难例疾病特征矩阵;

对难例候选疾病负样本特征矩阵T'的每一行难例疾病负样本特征向量T'j与药物负样本r的药物负样本特征向量作点积,其公式如下:其中,是从T'中筛选出来的点积最大的难例疾病负样本特征向量;

由于药物负样本有Nneg个,故能生成Nneg个难例疾病负样本特征向量,构成难例疾病负样本特征矩阵同理,对于疾病负样本,能生成Nneg个难例药物负样本特征向量,构成难例药物负样本特征矩阵最后基于XR'n和XD'n更新XR和XD,进而得到难例药物特征矩阵XR'和难例疾病特征矩阵XD',其中,XR'和XR规模一样、XD'和XD规模一样;

然后再映射回双曲空间中得到双曲难例药物特征矩阵FR'H和双曲难例疾病特征矩阵FD'H,如下:FR'H=expo(XR')

FD'H=expo(XD')

其中expo作用是将变量映射到双曲空间中。

9.根据权利要求1所述的一种基于双曲图特征学习网络的药物与疾病关联预测方法,其特征在于,所述S6的具体步骤如下:S61:计算FR'H和FD'H的双曲距离Distanceij;

计算双曲难例药物特征向量和双曲难例疾病特征向量的双曲距离Distanceij,计算公式如下:其中,Distanceij越小,说明该药物-疾病关联的可能性越高;

S62:利用Distance,通过MLP判断药物-疾病的预测关联概率output;

output=MLP(Distance)

其中,