欢迎来到知嘟嘟! 联系电话:13336804447 卖家免费入驻,海量在线求购! 卖家免费入驻,海量在线求购!
知嘟嘟
我要发布
联系电话:13336804447
知嘟嘟经纪人
收藏
专利号: 2024113888626
申请人: 临沂大学
专利类型:发明专利
专利状态:已下证
更新日期:2026-04-02
缴费截止日期: 暂无
价格&联系人
年费信息
委托购买

摘要:

权利要求书:

1.一种基于Mamba的药物-靶标相互作用预测方法,其特征在于,包括以下步骤:S1.获取药物和靶标蛋白的分子序列,对所述药物和靶标蛋白的分子序列进行处理,得到药物和靶标蛋白的子结构序列;

S2.构建基于Mamba的药物-靶标相互作用预测模型,所述模型包括嵌入层、编码层、条件参数卷积层以及全连接层,所述编码层包括Mamba层、混合注意力机制层;

S3.所述药物和靶标蛋白的子结构序列经过所述基于Mamba的药物-靶标相互作用预测模型,得到药物靶标相互作用预测概率;

具体如下:

S31.所述药物和靶标蛋白的子结构序列经过所述基于Mamba的药物-靶标相互作用预测模型的嵌入层和Mamba层进行嵌入处理和特征提取,得到药物特征向量和靶标蛋白特征向量:嵌入处理:将所述药物和靶标蛋白的子结构序列中的每个词进行词嵌入和位置嵌入,得到词嵌入和位置嵌入的初步向量表示,然后将所述初步向量表示进行线性组合,得到药物和靶标蛋白子结构序列嵌入向量,公式表示如下:,

其中,表示词嵌入矩阵,表示药物和靶标蛋白的子结构序列中的第个词的索引,是位置嵌入矩阵,是词在药物和靶标蛋白的子结构序列中的位置,和分别表示词嵌入和位置嵌入的初步向量表示,和分别表示药物和靶标蛋白的子结构序列中词的数量,和分别表示药物和靶标蛋白子结构序列的嵌入向量;

特征提取:所述药物和靶标蛋白子结构序列的嵌入向量经过选择性状态空间模型SSM进行特征提取得到药物和靶标蛋白的特征向量,公式表示如下:,

其中,和分别表示药物和靶标蛋白的特征向量,表示对药物子结构序列嵌入向量的特征提取操作,表示对靶标蛋白子结构序列嵌入向量的特征提取操作;

S32.所述药物特征向量和靶标蛋白特征向量经过所述基于Mamba的药物-靶标相互作用预测模型的混合注意力机制层进行特征增强,得到融合的药物特征向量和靶标蛋白特征向量:所述混合注意力机制层包括混合注意力层生成向量单元、双线性变换单元、自注意力得分与输出向量单元和特征向量融合单元;

混合注意力层生成向量单元:所述药物和靶标蛋白的特征向量经过混合注意力层生成向量单元生成查询向量、键向量和值向量,公式表示如下:,

其中,表示查询向量对应的权重矩阵,表示键向量对应的权重矩阵,表示值向量对应的权重矩阵,表示特征向量,为药物特征向量或者靶标蛋白特征向量;

双线性变换单元:对所述键向量进行双线性变换得到双线性变换后的键向量,公式表示如下:,

其中,表示双线性变换的权重矩阵;

自注意力得分与输出向量单元:将所述查询向量和双线性变换后的键向量进行点积计算,得到注意力得分S,然后将所述注意力得分通过缩放因子进行正规化,得到注意力权重,将所述注意力权重与值向量进行乘积得到输出向量,所述输出向量经过输出线性层和层归一化得到最终的输出向量,公式表示如下:,

其中,表示每个头部分的维度,表示经过双线性变换的键矩阵的转置,是输出线性变换的权重矩阵,表示层归一化操作,经过上述过程得到药物特征向量对应的输出向量以及最终的输出向量,同理得到靶标蛋白特征向量对应的输出向量以及最终的输出向量;

特征向量融合单元:将药物特征向量和最终药物输出向量进行拼接得到融合的药物特征向量,同理得到融合的靶标蛋白特征向量,计算公式如下:,

其中,表示拼接操作;

S33.所述融合的药物特征向量和靶标蛋白特征向量经过所述基于Mamba的药物-靶标相互作用预测模型的条件参数卷积层进行特征交互,得到药物-靶标对的输出表征:通过交互函数对所述融合的药物特征向量和靶标蛋白特征向量进行交互处理,得到交互图,公式表示如下:,

其中,表示交互函数,表示交互图,是一个维度为的多维张量,表示为融合的药物特征向量的长度,表示为融合的靶标蛋白特征向量的长度,代表函数的输出大小;

所述交互图通过条件参数卷积进行处理得到药物-靶标对的输出表征,公式表示如下:,

其中,表示条件参数卷积操作,表示药物-靶标对的输出表征;

S34.所述药物-靶标对的输出表征经过所述基于Mamba的药物-靶标相互作用预测模型的全连接层进行药物靶标相互作用的预测,通过Sigmoid函数得到最终的药物靶标相互作用预测概率,计算公式如下:,

其中,表示权重矩阵,表示偏置参数,为对药物-靶标对的输出表征进行展平后的表示,表示函数操作,表示全连接层的输出,表示最终预测概率,。

2.根据权利要求1所述的一种基于Mamba的药物-靶标相互作用预测方法,其特征在于,所述步骤S1具体包括:将所述药物的分子序列转换为SMILES格式的药物序列,将所述靶标蛋白的分子序列转换为氨基酸序列,然后通过BPE算法将所述SMILES格式的药物序列和氨基酸序列分解成药物和靶标蛋白的子结构序列。