欢迎来到知嘟嘟! 联系电话:13336804447 卖家免费入驻,海量在线求购! 卖家免费入驻,海量在线求购!
知嘟嘟
我要发布
联系电话:13336804447
知嘟嘟经纪人
收藏
专利号: 2016106137204
申请人: 湖北工业大学
专利类型:发明专利
专利状态:已下证
专利领域: 计算;推算;计数
更新日期:2024-01-05
缴费截止日期: 暂无
价格&联系人
年费信息
委托购买

摘要:

权利要求书:

1.一种基于多光谱成像技术的低质量文档图像二值化方法,其特征在于,包括以下步骤:步骤1:读取待处理文档的多光谱图像,并做线性归一化处理,获得到光谱分量图像;

步骤2:对光谱分量图像进行阈值化处理;包括局部对比度增强处理、高对比度像素检测处理、笔画宽度估计处理和局部精细二值化处理;

步骤3:目标检测;包括对步骤2中处理后的光谱分量图像进行光谱图像特征提取、估计自适应相干图像、基于梯度算子的图像阈值化和消除误判处理;

步骤4:阈值图像融合处理;包括二值图像融合和图像后处理。

2.根据权利要求1所述的基于多光谱成像技术的低质量文档图像二值化方法,其特征在于:步骤1中所述获得到光谱分量图像,包括1个紫外光谱(340nm)、3个可见光谱(500nm、

600nm、700nm)和4个红外光谱(800nm、900nm、1000nm、1100nm)。

3.根据权利要求1或2所述的基于多光谱成像技术的低质量文档图像二值化方法,其特征在于,步骤1中所述线性归一化处理,计算公式如下:

其中,I(x,y)和I′(x,y)分别表示归一化前、后的图像灰度值,Imax和Imin分别表示光谱分量图像的灰度最大值和最小值。

4.根据权利要求1所述的基于多光谱成像技术的低质量文档图像二值化方法,其特征在于,步骤2的具体实现包括以下子步骤:步骤2.1:对光谱分量图像进行局部对比度增强处理,计算公式如下:

其中,C(x,y)表示图像的局部对比度,Imax(x,y)和Imin(x,y)分别表示图像在以(x,y)为中心的3×3邻域内的灰度最大值和最小值;

步骤2.2:对于步骤2.1的输出图像进行高对比度像素检测处理;

对于步骤2.1的输出图像,记t∈[0,L-1]为图像前景与背景的分割阈值,L为灰度级分辨率;如果前景像素占图像比例 前景像素平均灰度值 背景像素占图像比例 背景像素平均灰度值 则图像的总体平均灰度值为 其中,pi表示归一化直方图;

定义前景和背景图像的类间方差为:

实现高对比度像素检测的准则是,通过确定全局最优阈值t0,使分割后的前景和背景差异最大,即:步骤2.3:基于步骤2.2检测出的高对比度像素进行笔画宽度估计处理;

步骤2.3.1:基于步骤2.2检测出的高对比度像素,利用Canny算子对图像进行边缘检测,每个边缘像素点p都具有一个方向梯度值dp;

步骤2.3.2:如果像素点p位于笔画边缘,计算p的方向梯度dp,并沿着射线r=p±n×dp(n≥0)梯度查找与之对应的另一个边缘像素点q,计算q的方向梯度dq,dp与dq的方向是大致相反的,即:步骤2.3.3:执行下述判断;

如果边缘像素点p找不到对应匹配的q或者其方向梯度dp与dq不满足大致相反的要求,则舍弃该射线r;

如果边缘像素点p找到对应匹配的q或者其方向梯度dp与dq满足大致相反的要求,则在[p,q]路径上的每个像素点都指定为笔画宽度属性值,即欧式距离dist=||p-q||,除非该像素点已经被指定了一个更小的笔画宽度属性值;

步骤2.3.4:重复步骤2.3.2,直到计算出所有未被舍弃路径上的像素笔画宽度值,并统计其分布直方图H(dist),则笔画宽度估计为:SWE=argmax[H(dist)];

步骤2.4:基于步骤2.3估计的字符笔画宽度进行局部精细二值化处理;

基于步骤2.3估计的字符笔画宽度确定滑动邻域窗尺寸,从而实现字符前景与页面背景的精细分割,具体公式为:

其中, 为w×w邻域内检测出的高对比度像素总数, 为w×w邻域内由文档字符笔画宽度确定的最少像素下限值,I(x,y)为图像(x,y)处的灰度值,μw(x,y)和σw(x,y)分别表示以(x,y)为中心的w×w邻域内光谱分量图像的灰度平均值和标准偏差,B0(x,y)表示获得的二值图像。

5.根据权利要求1所述的基于多光谱成像技术的低质量文档图像二值化方法,其特征在于,步骤3的具体实现包括以下子步骤:步骤3.1:基于步骤2中处理后的光谱分量二值图像B0(x,y)进行光谱图像特征提取处理;

步骤3.1.1:基于步骤2中处理后的光谱分量二值图像B0(x,y)估计多光谱图像前景像素灰度平均值μFG、背景像素灰度平均值μBG及其差值Δ=μFG-μBG;

步骤3.1.2:计算多光谱图像背景像素间的协方差矩阵:Σ=E[(I-μBG)T(I-μBG)],其中,I表示多光谱图像灰度矩阵,T表示矩阵转置,E表示数学期望;

步骤3.1.3:估计其广义逆矩阵Σ-1,使同时满足以下条件:

步骤3.2:估计自适应相干图像;

基于步骤3.1提取的多光谱图像特征,估计自适应相干图像 计算公式为:

并将其动态范围限制在[0,1]之间,即:步骤3.3:基于梯度算子的图像阈值化;

步骤3.2输出图像 在位置(x,y)处的梯度定义为:

其中, 和 分别表示图像 沿x和y方向的一阶导数;

针对梯度图像进行高对比度像素检测处理、笔画宽度估计处理和局部精细二值化处理,获得二值化输出图像B1(x,y);

步骤3.4:消除误判处理;

步骤3.4.1:基于步骤3.2估计的自适应相干图像 进行全局最优阈值化处理,得到二值图像B′1(x,y);

步骤3.4.2:将二值图像B0(x,y)和B′1(x,y)同时标记为前景的像素点视为真正的前景像素TP,并以此删除B0(x,y)中所有的伪前景点,得到二值图像B2(x,y):

其中, 为w×w邻域内检测出的TP前景像素总数, 为w×w邻域内预先确定的TP像素下限值。

6.根据权利要求1所述的基于多光谱成像技术的低质量文档图像二值化方法,其特征在于,步骤4的具体实现包括以下子步骤:步骤4.1:二值图像融合;

针对二值图像B1(x,y)和B2(x,y),采用以下公式进行二值图像融合:

其中,B(x,y)为融合后的二值图像;

步骤4.2:图像后处理

去除字符笔画边缘少于10个像素的椒盐噪声,并填充字符笔画内部少于10个像素的笔画空洞。