欢迎来到知嘟嘟! 联系电话:13095918853 卖家免费入驻,海量在线求购! 卖家免费入驻,海量在线求购!
知嘟嘟
我要发布
联系电话:13095918853
知嘟嘟经纪人
收藏
专利号: 2019100855549
申请人: 鲁东大学
专利类型:发明专利
专利状态:已下证
更新日期:2025-04-15
缴费截止日期: 暂无
价格&联系人
年费信息
委托购买

摘要:

权利要求书:

1.一种基于深度神经网络的蛋白质二级结构预测方法,包括如下步骤:

提取蛋白质序列特征:网络的输入特征是氨基酸的序列和结构信息,数据是从PDB下载并用DSSP系统标注;其中,氨基酸序列信息的特征个数是21,氨基酸结构信息的特征个数也是21,每个氨基酸有42个特征被用来预测其对应的二级结构;

多层组合卷积神经网络特征提取:使用多个不同层次的卷积神经网络分别提取特征,并与原始特征组合后传给下一层;

双向长短期记忆神经网络特征提取:使用双向长短期记忆神经网络提取特征并传给下一层;长短期记忆神经网络隐藏层的结点数为800,则前向和后向长短期记忆神经网络整合后输出的特征个数为1600;

全连接层建立特征映射:使用全连接层将特征映射到蛋白质8个不同的类别;

训练深度神经网络:使用RMSProp优化器基于labels和logits之间的交叉熵误差训练前面步骤中构建的深度神经网络,并用L2正则化方法防止过拟合。

2.根据权利要求1所述的基于深度神经网络的蛋白质二级结构预测方法,其特征在于,在多层组合卷积神经网络特征提取中,使用多个不同长度的一维卷积核模拟不同大小的窗口来提取氨基酸序列特征,具体组合卷积神经网络的构建方式,包括如下步骤:

1层一维卷积神经网络构建:分别用卷积核结点数为3, 5, 7, 9, 11的一维卷积网对蛋白质中的氨基酸序列进行卷积运算提取特征,卷积网的输入通道数为42,对应一个氨基酸的42个特征,输出通道数为50,然后将卷积网的输出用ReLU函数激活,最后用分批归一化函数防止模型过拟合;

2层一维卷积神经网络构建:比1层一维卷积神经网络特征提取多了1次卷积、激活和分批归一化运算;对于输入X依次进行2次卷积、激活和分批归一化运算;

3层一维卷积神经网络构建:比2层一维卷积神经网络特征提取多了1次卷积、激活和分批归一化运算;对于输入X依次进行3次卷积、激活和分批归一化运算;

原始特征与多个卷积神经网络输出特征组合输出:分别用1层、2层和3层一维卷积神经网络对氨基酸序列的特征进行提取,并与原始特征组合输出,则共有 个特征输出到双向长短期记忆神经网络中继续处理。