1.一种基于霍夫曼编码的多类型数据分段压缩方法,其特征在于,包括以下步骤:获取待压缩数据,并判断所述待压缩数据是否需要分段压缩;
获取需要分段压缩的待压缩数据,并使用多种不同的分组方式对所述待压缩数据进行分组,获取每次分组后每组待压缩数据进行霍夫曼编码时的编码效率和编码时长;
根据每次分组后每组待压缩数据的编码效率和编码时长,获取每次分组后对待压缩数据的目标编码评分;根据所述目标编码评分获取最优编码评分,根据所述最优编码评分获取对所述待压缩数据的最优分组数;
根据所述最优分组数对所述待压缩数据进行分组,对分组后的所述待压缩数据进行霍夫曼编码,并对编码后的数据赋予标识码,得到分段压缩后的待压缩数据;
判断所述待压缩数据是否需要分段压缩的过程为:
获取所述待压缩数据进行第一霍夫曼编码时的第一编码效率和第一编码时长;根据所述第一编码效率和第一编码时长获取第一编码评分;
将所述待压缩数据分为两组,分别获取每组待压缩数据进行第二霍夫曼码时的编码效率和编码时长;根据每组待压缩数据进行第二霍夫曼编码时的编码效率和编码时长获取第二编码评分;当所述第二编码评分大于所述第一编码评分时,所述待压缩数据需要分段压缩;
所述第一编码评分通过第一编码效率与第一编码时长的比值得到;所述第二编码评分通过将每组待压缩数据的编码评分进行加和得到;
获取每次分组后对待压缩数据的目标编码评分的过程中,所述目标编码评分通过将每次分组后每组待压缩数据的编码评分进行求和得到。
2.根据权利要求1所述的基于霍夫曼编码的多类型数据分段压缩方法,其特征在于,根据所述最优编码评分获取对所述待压缩数据的最优分组数的过程中,将最大目标编码评分作为最优编码评分,并将最优编码评分对应的分组数确定为最优分组数。
3.根据权利要求1所述的基于霍夫曼编码的多类型数据分段压缩方法,其特征在于,根据所述最优编码评分获取对所述待压缩数据的最优分组数的过程为:根据每个分组数对应的目标编码评分拟合一个关于目标编码评分和分组数的函数,以所述分组数为横坐标,所述目标编码评分为纵坐标作曲线图;选取所述曲线图中最大目标编码评分对应的分组数作为最优分组数。
4.根据权利要求3所述的基于霍夫曼编码的多类型数据分段压缩方法,其特征在于,选取所述曲线图中最大目标编码评分对应的分组数作为最优分组数的过程中,当所述最大目标编码评分对应的分组数为非整数时,对所述非整数进行就近向上或向下取整数,并将所述整数作为最优分组数。
5.一种基于霍夫曼编码的多类型数据分段压缩系统,其特征在于,包括:
数据获取模块,用于获取待压缩数据,并判断所述待压缩数据是否需要分段压缩;
数据分组模块,用于使用多种不同的分组方式对所述数据获取模块获取的需要分段压缩的待压缩数据进行分组,获取每次分组后每组待压缩数据进行霍夫曼编码时的编码效率和编码时长;根据每次分组后每组待压缩数据的编码效率和编码时长,获取每次分组后对待压缩数据的目标编码评分;根据所述目标编码评分获取最优编码评分,根据所述最优编码评分获取对所述待压缩数据的最优分组数;
数据压缩模块,用于根据所述数据分组模块获得的最优分组数对所述待压缩数据进行分组,对分组后的所述待压缩数据进行霍夫曼编码,并对编码后的数据赋予标识码,得到分段压缩后的待压缩数据;
判断所述待压缩数据是否需要分段压缩的过程为:
获取所述待压缩数据进行第一霍夫曼编码时的第一编码效率和第一编码时长;根据所述第一编码效率和第一编码时长获取第一编码评分;
将所述待压缩数据分为两组,分别获取每组待压缩数据进行第二霍夫曼码时的编码效率和编码时长;根据每组待压缩数据进行第二霍夫曼编码时的编码效率和编码时长获取第二编码评分;当所述第二编码评分大于所述第一编码评分时,所述待压缩数据需要分段压缩;
所述第一编码评分通过第一编码效率与第一编码时长的比值得到;所述第二编码评分通过将每组待压缩数据的编码评分进行加和得到;
获取每次分组后对待压缩数据的目标编码评分的过程中,所述目标编码评分通过将每次分组后每组待压缩数据的编码评分进行求和得到。