1.一种基于调制编码的DNA存储方法,其特征在于,包括以下步骤:获取调制码,将计算机文件转换为二进制字符串,根据所述调制码将所述二进制字符串进行调制编码,得到DNA存储序列;
将所述DNA存储序列合成得到DNA分子序列,将所述DNA分子序列进行存储;
将存储的所述DNA分子序列进行测序,得到所述DNA分子序列的读长,根据所述调制码对所述读长进行纠错,将纠错后的所述DNA分子序列恢复得到所述计算机文件。
2.根据权利要求1所述的一种基于调制编码的DNA存储方法,其特征在于,所述DNA存储序列包括索引值部分和数据域;所述获取调制码,将计算机文件转换为二进制字符串,根据所述调制码将所述二进制字符串进行调制编码,得到DNA存储序列这一步骤,其包括:根据所述数据域与所述索引值部分的数据长度的差值对所述二进制字符串进行分组,并构建得到二进制存储序列;
生成所述调制码的调制码序列;
将所述调制码序列以及所述二进制存储序列进行碱基替换得到所述DNA存储序列。
3.根据权利要求2所述的一种基于调制编码的DNA存储方法,其特征在于,所述调制码序列包括若干调制单元,所述生成所述调制码的调制码序列这一步骤,其包括:确定所述调制单元的长度,根据所述调制单元的长度以及预设的所述调制码序列长度,将所述调制单元拼接得到所述调制码序列。
4.根据权利要求3所述的一种基于调制编码的DNA存储方法,其特征在于,所述将存储的所述DNA分子序列进行测序,得到所述DNA分子序列的读长,根据所述调制码对所述读长进行纠错,将纠错后的所述DNA分子序列恢复得到所述计算机文件这一步骤,其包括:根据所述调制码进对所述读长中的错误进行校正,得到校正读长;
对所述校正读长进行分组,并确定每个分组中的一致性序列;
将所述一致性序列进行排序,去除排序后的一致性序列的索引值部分,转码拼接得到所述计算机文件。
5.根据权利要求4所述的一种基于调制编码的DNA存储方法,其特征在于,所述根据所述调制码对所述读长中的错误进行校正,得到校正读长这一步骤,其包括:对所述读长进行逐碱基替换得到观测调制码序列;
将所述观测调制码序列与所述调制码序列进行全局对比,根据比对的观测调制码结果对所述读长进行校正或校准得到所述校正读长。
6.根据权利要求4所述的一种基于调制编码的DNA存储方法,其特征在于,所述对所述校正读长进行分组,并确定每个分组中的一致性序列这一步骤,其包括:生成所述校正读长的读长校正信息,所述根据所述读长校正信息将所述校正读长分类得到无校正序列和有校正序列;
根据所述索引值部分将所述无校正序列进行分组,得到若干第一集合;
根据所述无校正序列的碱基内容对所述第一集合中的序列进行筛除,和/或选择所述有校正序列对所述第一集合进行扩充;
从所述筛除和/或扩充后的第一集合通过投票产生高频存储序列作为所述一致性序列。
7.根据权利要求6所述的一种基于调制编码的DNA存储方法,其特征在于,所述根据所述无校正序列的碱基内容对所述第一集合中的序列进行筛除这一步骤,其包括:确定分组纯化阈值,确定所述第一集合中的第一序列与其他序列的汉明距离均值大于所述分组纯化阈值,将所述第一序列从所述第一集合中删除。
8.根据权利要求6所述的一种基于调制编码的DNA存储方法,其特征在于,所述选择所述有校正序列对所述第一集合进行扩充这一步骤,其包括:根据所述读长校正信息以及所述索引值部分的汉明距离,将所述有校正序列进行排序得到第一列表;
确定所述第一列表中的第二序列与所述第一列表中其他序列的汉明距离均值小于所述分组纯化阈值,将所述第二序列添加至所述第一集合中。