1.一种蛋白质相互作用预测方法,其特征在于,包括:
获取蛋白质相互作用网络中第i个蛋白质的氨基酸序列,i=1...n,n为蛋白质相互作用网络中的蛋白质总数;
以氨基酸序列的第j个氨基酸为起始,依次向后截取多个k-mer,直至剩下的氨基酸个数
利用Doc2vec模型预测第j个氨基酸子序列中每个滑动窗口中的中央k-mer,并进行聚合操作,得到第j个氨基酸子序列特征,包括:对第j个氨基酸子序列和其在第t个滑动窗口中的上下文k-mer的嵌入编码求取平均值,根据所述平均值进行分类预测,得到第j个氨基酸子序列中的第t个滑动窗口中的中央k-mer;
将k个氨基酸子序列特征进行均值操作,得到第i个蛋白质特征后,将第i个蛋白质特征输入堆叠的一维卷积网络处理,其中每一层一维卷积网络的处理过程为:将上一层一维卷积网络的输出作为当前层一维卷积网络的输入,将输入进行多次卷积操作后,经过Relu激活函数和最大池化层处理,得到当前一维卷积网络的输出;将经过堆叠的一维卷积网络处理后的第i个蛋白质特征,经过全连接层处理;
使用图同构卷积网络将第i个蛋白质多个邻居蛋白质的特征聚合到自身,得到更新后的第i个蛋白质特征,重复该步骤多次,得到第i个蛋白质聚合特征;
将第i个蛋白质聚合特征和与其形成相互作用的蛋白质聚合特征进行点积后输入分类器,得到第i个蛋白质相互作用的预测结果。
2.根据权利要求1所述的蛋白质相互作用预测方法,其特征在于,所述将第i个蛋白质多个邻居蛋白质的特征聚合到自身,得到更新后的第i个蛋白质特征,重复该步骤多次,得到第i个蛋白质聚合特征的公式表示为:;
其中,为上一次更新后的第i个蛋白质特征,为当前更新后的第i个蛋白质特征,为上一次更新后的第u个蛋白质特征,N(i)表示第i个蛋白质邻居蛋白质对应序号的集合,f()表示特征聚合,表示映射函数。
3.根据权利要求2所述的蛋白质相互作用预测方法,其特征在于,所述特征聚合采用累加的方式,所述映射函数采用多层感知机:其中,ε是超参数,MLP()为表示多层感知机。
4.根据权利要求1所述的蛋白质相互作用预测方法,其特征在于,所述分类器为多层感知机。
5.根据权利要求4所述的蛋白质相互作用预测方法,其特征在于,将第i个蛋白质聚合特征和与其形成相互作用的蛋白质聚合特征进行点积后输入分类器,得到第i个蛋白质相互作用的预测结果的公式表示为:;其中,为第i个蛋白质聚合特征,为与第i个蛋白质聚合特征形成相互作用的蛋白质聚合特征。
6.一种蛋白质相互作用预测装置,其特征在于,包括:
氨基酸序列获取模块,用于获取蛋白质相互作用网络中第i个蛋白质的氨基酸序列,i=1...n,n为蛋白质相互作用网络中的蛋白质总数;
氨基酸子序列获取模块,用于以氨基酸序列的第j个氨基酸为起始,依次向后截取多个k-mer,直至剩下的氨基酸个数
氨基酸子序列特征获取模块,用于利用Doc2vec模型预测第j个氨基酸子序列中每个滑动窗口中的中央k-mer,并进行聚合操作,得到第j个氨基酸子序列特征,包括:对第j个氨基酸子序列和其在第t个滑动窗口中的上下文k-mer的嵌入编码求取平均值,根据所述平均值进行分类预测,得到第j个氨基酸子序列中的第t个滑动窗口中的中央k-mer;
蛋白质特征获取模块,用于将k个氨基酸子序列特征进行均值操作,得到第i个蛋白质特征后,将第i个蛋白质特征输入堆叠的一维卷积网络处理,其中每一层一维卷积网络的处理过程为:将上一层一维卷积网络的输出作为当前层一维卷积网络的输入,将输入进行多次卷积操作后,经过Relu激活函数和最大池化层处理,得到当前一维卷积网络的输出;将经过堆叠的一维卷积网络处理后的第i个蛋白质特征,经过全连接层处理;
蛋白质聚合特征获取模块,用于使用图同构卷积网络将第i个蛋白质多个邻居蛋白质的特征聚合到自身,得到更新后的第i个蛋白质特征,重复该步骤多次,得到第i个蛋白质聚合特征;
蛋白质相互作用预测模块,用于将第i个蛋白质聚合特征和与其形成相互作用的蛋白质聚合特征进行点积后输入分类器,得到第i个蛋白质相互作用的预测结果。
7.一种蛋白质相互作用预测设备,其特征在于,包括:
存储器,用于存储计算机程序;
处理器,用于执行所述计算机程序时实现如权利要求1至5任一项所述一种蛋白质相互作用预测方法的步骤。
8.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1至5任一项所述一种蛋白质相互作用预测方法的步骤。