1.一种基于多实例学习的人体免疫状态预测方法,其特征在于,将多个人体内的T细胞受体序列视为实例,将人体免疫状态视为包,充分考虑T细胞受体序列与人体免疫状态之间的关系,可以对人体免疫状态进行直接预测,在包分类模块中使用卷积神经网络避免了传统多实例学习无法充分考虑实例与包之间关系的问题,该方法包括实例评分模块的构建、包分类模块的构建、模型训练三个步骤,其具体步骤如下:步骤1、使用三个并行的卷积神经网络模块和一个全连接层组成一个实例评分模块,用于获得每条T细胞受体序列的评分;
步骤2、使用三个并行的卷积神经网络模块和一个全连接层组成一个包分类模块;
步骤3、使用人体的免疫状态作为标签,人体的T细胞受体序列作为输入对整个模型进行训练。
2.根据权利要求1所述的一种基于多实例学习的人体免疫状态预测方法,其特征在于,通过并行的卷积神经网络模块来提取序列在不同维度的特征,可以对序列做出更为准确的评分,实例评分模块的构建的实现过程如下:在构建实例评分模块时,使用pytorch 的nn .Conv2d、nn .Relu、
nn.BatchNormalization、nn.Dropout构建三个具有不同卷积核大小的卷积模块,这三个卷积模块采用并行结构,使用nn.Linear函数构建一个全连接层。
3.根据权利要求1所述的一种基于多实例学习的人体免疫状态预测方法,其特征在于,使用卷积神经网络来提取各个实例之间的关系,更好根据实例评分来对包进行分类,包分类模块的构建的实现过程如下:在构建包分类模块时,使用pytorch 的nn.Conv1d、nn.Relu、nn.BatchNormalization、nn.Dropout构建三个具有不同卷积核大小的卷积模块,这三个卷积模块采用并行结构,使用nn.Linear函数构建一个全连接层。
4.根据权利要求1所述的一种基于多实例学习的人体免疫状态预测方法,其特征在于,通过维度的变化实现实例和包的转化,使得模型可以提取实例特征,也可提取实例与包之间的联系特征,模型训练的实现过程如下:将步骤1和步骤2构建的模块组成完整模型,以T细胞受体序列作为输入,在输入到实例评分模块前,将数据的包数量和实例数量进行合并,合并后的维度作为批处理量输入到模型中,在实例评分模块得到了每条实例的评分后,把批处理量重新拆分为包数量和实例数量,并以包数量作为批处理量输入到包分类模块中,最终得到模型对各个包的预测结果。