1.一种汉简图像的自动缀合方法,其特征在于,包括以下步骤:A:对汉简图像进行人工分类,依据汉简图像对应的汉简的缺失部位信息对汉简图像进行分组;汉简图像的缺失部位信息包括缺上、缺下、缺左和缺右四种情况;然后将缺下分组中的汉简图像与缺上分组中的汉简图像进行缀合,将缺左分组中的汉简图像与缺右分组中的汉简图像进行缀合;
B:对汉简图像进行边缘检测以提取汉简图像的边缘线,得到每幅汉简图像对应的边缘线图像;
C:获取每幅汉简图像所对应的边缘线图像中的边缘线骨架,得到每幅汉简图像所对应的边缘线骨架图像,边缘线骨架指边缘线中居中的像素点;
D:测量汉简图像所对应的边缘线骨架图像的宽度及高度;
E:根据每幅汉简的真实物理尺寸信息,结合步骤D中得到的每幅汉简图像所对应的边缘线骨架图像的宽度和高度,分别计算得出每幅汉简图像所对应的边缘线骨架图像的宽度值和高度值恢复到真实物理尺寸的缩放比例,分别记为γ1和γ2;其中,β1为边缘线骨架图像的宽度值与汉简的真实宽度值的倍数关系,β2为边缘线骨架图像的高度值与汉简的真实高度值的倍数关系;
F:人工确定每幅汉简图像的边缘线骨架图像中的断边部分,得到每幅汉简图像对应的边缘线骨架标注图像;
G:对步骤F中得到的边缘线骨架标注图像中边缘线骨架的断边部分进行时间序列化处理,得到对应的二维数值型的时间序列化数据T;
T={(V1,W1),(V2,W2),(V3,W3),…,(Vi,Wi)},i为正整数,(Vi,Wi)表示边缘线骨架的断边部分的第i个像素数据的像素位置;
H:利用步骤E中得到的每幅汉简图像所对应的边缘线骨架图像的宽度值和高度值恢复到真实物理尺寸的缩放比例γ1和γ2,将步骤G中得到的每幅汉简图像的边缘线骨架的断边部分所对应的二维时间序列化数据T,转化为每幅汉简图像的边缘线骨架的断边部分恢复到真实物理尺寸后的二维时间序列化数据T′,T′={(V′1,W′1),(V′2,W′2),(V′3,W′3),…,(V′i,W′i)},i为正整数,(T′i,W′i)表示恢复到真实物理尺寸后的断边部分第i个像素数据的像素位置;
I:将步骤H中得到的二维时间序列化数据T′中的V′i和W′i分别进行归一化处理,得到归一化后的时间序列化边缘曲线数据T″v和T″w,T″v={V″1,V″2,V″3,…,V″i},T″w={W″1,W″2,W″3,…,W″i},i为正整数;
J:对两幅待缀合的汉简图像,根据步骤I中得到的边缘线骨架的断边部分经归一化处理后的时间序列化边缘曲线数据T″v和T″w,计算两幅汉简图像的相似度:计算两幅汉简图像的相似度时,对于缺上和缺下的分组中拟判定是否能够缀合的两幅汉简图像a和b对应的经归一化处理后的时间序列化边缘曲线数据T″wa与T″wb,先将汉简图像a和b放置到一幅新的空白图像c中,先后对汉简图像a和b的断边部分进行左对齐和右对齐,且T″wa均在上方,T″wb均在下方;在左对齐和右对齐后,保持汉简图像a在图像c中固定不变,先将汉简图像b以M像素为步幅在图像c中沿水平方向在设定的滑动范围内向左滑动,然后回到初始位置,最后沿水平方向在设定的滑动范围内向右滑动;在汉简图像b每次滑动后,计算两幅汉简图像a和b对应的归一化处理后的时间序列化边缘曲线数据T″wa与T″wb在水平方向上重合部分的子曲线T″was与T″wbs之间的时间序列匹配度s,并将时间序列匹配度s放入集合S中;最后求集合S中的最大值,即为汉简图像a和b之间的最大缀合度;
对于缺左和缺右的分组中拟判定是否能够缀合的两幅汉简图像a和b对应的经归一化处理后的时间序列化边缘曲线数据T″va与T″vb,先将汉简图像a和b放置到一幅新的空白图像c中,先后对汉简图像a和b的断边部分进行上对齐和下对齐,且T″va均在左侧,T″vb均在右侧;在上对齐和下对齐后,保持汉简图像a在图像c中固定不变,先将汉简图像b以M像素为步幅在图像c中沿竖直方向在设定的滑动范围内向上滑动,然后回到初始位置,最后沿竖直方向在设定的滑动范围内向下滑动;在汉简图像b每次滑动后,计算两幅汉简图像a和b对应的归一化处理后的时间序列化边缘曲线数据T″va与T″vb在竖直方向上重合部分的子曲线T″vas与T″vbs之间的时间序列匹配度s,并将时间序列匹配度s放入集合S中;最后,求集合S中的最大值,即为汉简图像a和b之间的最大缀合度;
K:对每幅汉简图像a,将其与待比较的文件夹中的每幅图像按照步骤J中的方法依次计算相似度;最后按照相似度值从大到小排序,若相似度相同则滑动像素值较小的优先,最后返回与汉简图像a相似度最高的前N幅图像,作为与汉简图像a缀合度较高的备选图像。
2.根据权利要求1所述的汉简图像的自动缀合方法,其特征在于:所述的步骤A中,在对汉简图像进行人工分类时,首先依据汉简内容类型和汉简图像有无纹路对汉简图像进行分组,然后在每个分组中依据汉简图像对应的汉简的缺失部位信息对汉简图像进行再次分组;汉简图像采用汉简的彩色图像。
3.根据权利要求1所述的汉简图像的自动缀合方法,其特征在于:所述的步骤B中,利用Canny算子边缘检测算法自动提取每幅汉简图像的边缘线;当首轮边缘线提取完成后,人工检查所提取到的每幅汉简图像的边缘线是否与真实情况相符,将不相符的边缘线所对应的汉简图像挑选出来作为待复检的汉简图像,然后对Canny算子边缘检测算法的参数进行调整,对待复检的汉简图像再次进行边缘提取,并人工检查所提取到的边缘线是否与真实情况相符;对于无法通过Canny算子边缘检测算法准确提取边缘线的汉简图像,由人工手动描绘其边缘线并保存;最终得到与真实情况相符的汉简图像的边缘线;最后,将每幅汉简图像对应的边缘线单独保存为背景透明、边缘线宽度为3像素、颜色为红色且图像格式为RGBA四通道的边缘线图像。
4.根据权利要求1所述的汉简图像的自动缀合方法,其特征在于:所述的步骤C中,对得到的每幅汉简图像对应的边缘线图像,依据像素阈值P将边缘线图像中的边缘线骨架增强,并将非边缘线骨架置为背景,得到每幅汉简图像所对应的边缘线骨架图像;
像素阈值P=174,利用颜色特征将边缘线图像中像素值小于等于(174,0,0,255)的像素点置为(0,0,0,0),否则置为(255,0,0,255)。
5.根据权利要求1所述的汉简图像的自动缀合方法,其特征在于:所述的步骤D中:计算宽度时,首先判断边缘线骨架的最宽处的宽度值与边缘线骨架中部的宽度值之比是否大于1.2且边缘线骨架中部没有凹陷;若是,则将经过边缘线骨架竖直方向上中点的水平直线两端的边缘线骨架像素点之间的距离,作为对应的汉简图像的边缘线骨架图像的宽度;若不是,则从上到下依次求取边缘线骨架图像上每一条水平直线两端的边缘线骨架像素点之间的距离,将求得的最大距离作为对应的汉简图像的边缘线骨架图像的宽度;
计算高度时,从左到右依次求取边缘线骨架图像上每一条竖直直线两端的边缘线骨架像素点之间的距离,将求得的最大距离作为对应的汉简图像的边缘线骨架图像的高度。
6.根据权利要求1所述的汉简图像的自动缀合方法,其特征在于:所述的步骤F中,对每幅汉简图像的边缘线骨架图像进行人工观察,并确定边缘线骨架图像中边缘线骨架的断边部分的起点与终点,分别使用像素笔描绘边长为1像素的蓝色色块并保存,得到每幅汉简图像对应的标注过断边部分起点与终点的边缘线骨架标注图像。
7.根据权利要求1所述的汉简图像的自动缀合方法,其特征在于:所述的步骤G中,对步骤F中得到的边缘线骨架标注图像中边缘线骨架的断边部分的每个像素数据的像素位置进行提取,然后将依次得到的像素数据的像素位置顺序组合在一起,构成边缘线骨架的断边部分所对应的二维时间序列化数据T,T={(V1,W1),(V2,W2),(V3,W3),…,(Vi,Wi)},i为正整数,(Vi,Wi)表示边缘线骨架的断边部分的第i个像素数据的像素位置;
在对断边部分的每个像素数据的像素位置进行提取时:对于缺上分组中的汉简图像,从左到右依次读取断边部分每列像素数据的最上端像素点的位置坐标作为边缘线骨架在该列像素数据的像素位置;
对于缺下分组中的汉简图像,从左到右依次读取断边部分每列像素数据的最下端像素点的位置坐标作为边缘线骨架在该列像素数据的像素位置;
对于缺左的分组中的汉简图像,从上到下依次读取断边部分每行像素数据的最左端像素点的位置坐标作为边缘线骨架在该行像素数据的像素位置;
对于缺右的分组中的汉简图像,从上到下依次读取断边部分每行像素数据的最右端像素点的位置坐标作为边缘线骨架在该行像素数据的像素位置。
8.根据权利要求1所述的汉简图像的自动缀合方法,其特征在于:所述的步骤H中,在将二维时间序列化数据T转化为二维时间序列化数据T′时,将二维时间序列化数据T中的Vi做运算Vi/γ1得到V′i,将二维时间序列化数据T中的Wi做运算Wi/γ2得到W′i。
9.根据权利要求1所述的汉简图像的自动缀合方法,其特征在于:所述的步骤I中,在进行归一化处理时,首先将二维时间序列化数据T′中的V′i和W′i分离得到一维时间序列化数据T′v和T′w,T′w={W′1,W′2,W′3,…,W′i},T′v={V′1,V′2,V′3,…,V′i},i为正整数;然后分别计算一维时间序列化数据T′v和T′w中的最小值min(T′v)和min(T′w),最后将对应的一维时间序列化数据T′v中的每个数据都分别减去min(T″v),将对应的一维时间序列化数据T′w中的每个数据都分别减去min(T′w),得到该边缘线骨架的断边部分归一化后的时间序列化边缘曲线数据T″v和T″w。
10.根据权利要求1所述的汉简图像的自动缀合方法,其特征在于:所述的步骤J包括以下具体步骤:
J0:首先,依据每个汉简对应的真实物理尺寸信息得到两幅待计算相似度的汉简图像a和b对应的厚度Tha和Thb,计算Tha和Thb之间的倍数关系α1、Thb和Tha之间的倍数关系α2以及Tha和Thb之间的差值D;若α1>1.5、α2>1.5或D>0.1,则判定两幅汉简图像不能缀合,重新开始步骤J0;否则,缺上和缺下的分组进入步骤J1,缺左和缺右的分组进入步骤J9;
J1:创建一幅新的空白图像c,首先将汉简图像a放入图像c的上部,然后再把汉简图像b放入图像c的下部,且使得汉简图像b的断边部分的左端点与汉简图像a的断边部分的左端点对齐;然后进入步骤J2;
J2:汉简图像b在图像c中的当前位置下,求汉简图像b归一化处理后的时间序列化边缘曲线数据T″wb与汉简图像a归一化处理后的时间序列化边缘曲线数据T″wa在水平方向上重合部分的子时间序列T″was与T″wbs,然后进入步骤J3;
J3:将归一化处理后的时间序列化边缘曲线数据T″wa和T″wb的各自的首尾端点直接连线,令所形成的线段长度分别为La和Lb;然后,将T″wbs的首尾端点直接连线,令所形成的线段长度为Lc;若Lc大于等于长度阈值,进入步骤J4;否则,进入步骤J5;
J4:计算子时间序列T″was与T″wbs之间的时间序列匹配度s,初始时时间序列匹配度s置为0;计算得到子时间序列T″was与T″wbs在每个对应位置的数据差值,所得到数据差值按顺序组成差值数组d,统计差值数组d中值小于等于差值阈值的元素个数,记为tc;时间序列匹配度s=tc/Lc,将时间序列匹配度s的值放入集合S中,然后进入步骤J6;
J5:将子时间序列T″was与T″wbs之间的时间序列匹配度s置为0,并将s的值放入集合S中;
然后进入步骤J6;
J6:以1像素为步幅,将汉简图像b在汉简图像c中以汉简图像a断边部分的左端点为参照点分别向左及向右滑动,且滑动范围不超过汉简图像a断边部分的左端点左右各8像素,每次移动后均重复步骤J2至J5,直至汉简图像b在图像c中滑动至滑动范围的边界;然后进入步骤J7;
J7:创建一幅新的空白图像c,首先将汉简图像a放入图像c的上部,然后再把汉简图像b放入图像c的下部,且使得汉简图像b的断边部分的右端点与汉简图像a的断边部分的右端点对齐,依次执行步骤J2至J5;然后进入步骤J8;
J8:以1像素为步幅,将汉简图像b在汉简图像c中以汉简图像a断边部分的右端点为参照点分别向左及向右滑动,且滑动范围不超过汉简图像a断边部分的右端点左右各8像素,每次移动后均重复步骤J2至J5,直至汉简图像b在图像c中滑动至滑动范围的边界;最终得到集合S;然后进入步骤K;
J9:创建一幅新的空白图像c,首先将汉简图像a放入图像c的左部,然后再把汉简图像b放入图像c的右部,且使得汉简图像b的断边部分的上端点与汉简图像a的断边部分的上端点对齐;然后进入步骤J10;
J10:汉简图像b在图像c中的当前位置下,求汉简图像b归一化处理后的时间序列化边缘曲线数据T″vb与汉简图像a归一化处理后的时间序列化边缘曲线数据T″va在竖直方向上重合部分的子时间序列T″vas与T″vbs,然后进入步骤J11;
J11:将归一化处理后的时间序列化边缘曲线数据T″va和T″vb的各自的首尾端点直接连线,令所形成的线段长度分别为La和Lb;然后,将T″vbs的首尾端点直接连线,令所形成的线段长度为Lc;若Lc大于等于长度阈值,进入步骤J12;否则,进入步骤J13;
J12:计算子时间序列T″vas与T″vbs之间的时间序列匹配度s,初始时时间序列匹配度s置为0;计算得到子时间序列T″vas与T″vbs在每个对应位置的数据差值,所得到数据差值按顺序组成差值数组d,统计差值数组d中值小于等于差值阈值的元素个数,记为tc;时间序列匹配度s=tc/Lc,将时间序列匹配度s的值放入集合S中,然后进入步骤J14;
J13:将子时间序列T″vas与T″vbs之间的时间序列匹配度s置为0,并将s的值放入集合S中;然后进入步骤J14;
J14:以1像素为步幅,将汉简图像b在汉简图像c中以汉简图像a断边部分的上端点为参照点分别向上及向下滑动,且滑动范围不超过汉简图像a断边部分的上端点上下各8像素,每次移动后均重复步骤J10至J13,直至汉简图像b在图像c中滑动至滑动范围的边界;然后进入步骤J15;
J15:创建一幅新的空白图像c,首先将汉简图像a放入图像c的左部,然后再把汉简图像b放入图像c的右部,且使得汉简图像b的断边部分的下端点与汉简图像a的断边部分的下端点对齐,依次执行步骤J10至J13;然后进入步骤J16;
J16:以1像素为步幅,将汉简图像b在汉简图像c中以汉简图像a断边部分的下端点为参照点分别向上及向下滑动,且滑动范围不超过汉简图像a断边部分的下端点上下各8像素,每次移动后均重复步骤J10至J13,直至汉简图像b在图像c中滑动至滑动范围的边界;最终得到集合S;然后进入步骤K。