欢迎来到知嘟嘟! 联系电话:13336804447 卖家免费入驻,海量在线求购! 卖家免费入驻,海量在线求购!
知嘟嘟
我要发布
联系电话:13336804447
知嘟嘟经纪人
收藏
专利号: 2022107762212
申请人: 蒋锋
专利类型:发明专利
专利状态:已下证
专利领域: 计算;推算;计数
更新日期:2024-05-06
缴费截止日期: 暂无
价格&联系人
年费信息
委托购买

摘要:

权利要求书:

1.一种金融票据中手写汉字分割识别方法,其特征在于,该方法包括以下步骤:

采集金融票据的正面图像,获取所述正面图像中的手写汉字区域;

基于金融票据上的小写金额得到对应大写金额在所述手写汉字区域中的实际手写汉字和实际手写汉字总数量;计算所述手写汉字区域的宽度和所述实际手写汉字总数量之间的比值,得到单个实际手写汉字的理想宽度;使用垂直投影法对所述手写汉字区域进行粗分割,得到M个初始分割字符,M为正整数,基于初始分割字符的字符宽度和所述理想宽度对初始分割字符进行合并,得到N个分割字符,N为正整数且M不小于N,基于分割字符的字符宽度确认粘连字符和非粘连字符;

基于所述手写汉字区域中实际手写汉字的位置,利用改进的Otsu算法获取每个粘连字符中每个手写汉字的最优分割路径,基于所述最优分割路径完成所述手写汉字区域中各个手写汉字的最终分割,利用神经网络对最终分割后的所述手写汉字区域进行手写汉字识别;

其中,基于初始分割字符的字符宽度和所述理想宽度对初始分割字符进行合并的方法为:根据所述理想宽度设置单字符宽度阈值,对初始分割字符从左向右进行依次遍历,将初始分割字符的字符宽度小于单字符宽度阈值的两个相邻初始分割字符合并为一个分割字符,或者将初始分割字符的字符宽度小于单字符宽度阈值的单个初始分割字符与其右侧的初始分割字符合并为一个分割字符;将初始分割字符的字符宽度大于或等于单字符宽度阈值的初始分割字符作为一个分割字符;

其中,基于分割字符的字符宽度确认粘连字符和非粘连字符的方法为:统计每个分割字符的字符宽度,构成一个字符宽度集合,取所述字符宽度集合中最小字符宽度,利用最小字符宽度对所述字符宽度集合中的每个字符宽度进行归一化处理,得到归一化字符宽度集合,其中,令归一化处理的公式为: , 为第 个字符宽度的归一化字符宽度, 为字符宽度集合中第 个字符宽度, 为最小字符宽度;设定粘连字符宽度阈值,当归一化字符宽度大于或等于粘连字符宽度阈值时,确认对应的分割字符为粘连字符,当归一化字符宽度小于粘连字符宽度阈值时,确认对应的分割字符为非粘连字符;

其中,基于所述手写汉字区域中实际手写汉字的位置,利用改进的Otsu算法获取每个粘连字符中每个手写汉字的最优分割路径的方法为:基于历史分割识别数据,统计金融票据上的大写金额对应每种手写汉字的手写字符宽度集合,分别计算每个手写字符宽度集合对应的平均手写字符宽度,将所述平均手写字符宽度作为手写汉字的标准书写宽度;统计每个粘连字符对应的汉字数量,根据所述手写汉字区域上每个实际手写汉字的位置定位粘连字符对应的实际手写汉字,以得到粘连字符中从左至右每个手写汉字对应的标准书写宽度;根据当前粘连字符的所述汉字数量和每个手写汉字对应的标准书写宽度对标准书写宽度进行累加得到当前粘连字符对应的标准书写宽度总和;根据当前粘连字符中每个手写汉字对应的标准书写宽度和所述标准书写宽度总和,分别计算当前粘连字符中每个手写汉字的分割线位置;统计所述手写汉字区域中相邻两个分割字符之间的字符间距,得到平均字符间距;根据所述平均字符间距内的像素点分布概率和所述分割线位置对标准Otsu算法进行改进,利用改进的Otsu算法获取每个粘连字符中每个手写汉字的最优分割路径;

其中,所述改进的Otsu算法为:

其中, 为第 个粘连字符的垂直投影直方图上横坐标值 对应的分割阈值; 为第 个粘连字符的字符宽度; 为第 个粘连字符中第 个手写汉字对应的标准书写宽度; 为所述标准书写宽度总和; 为第 个粘连字符中第 个手写汉字对应分割线位置;

表示横坐标值 到第 个手写汉字对应分割线位置的距离; 为垂直投影直方图上横坐标值 上的像素点的分布概率; 为所述平均字符间距; 表示垂直投影直方图的横轴上横坐标值范围为 内所有像素点的分布概率总和;ICV表示标准Otsu算法。

2.如权利要求1所述的一种金融票据中手写汉字分割识别方法,其特征在于,所述利用改进的Otsu算法获取每个粘连字符中每个手写汉字的最优分割路径的方法,包括:利用改进的Otsu算法得到当前粘连字符对应的垂直投影直方图上每个横坐标值对应的分割阈值,取最大的分割阈值作为当前粘连字符中对应手写汉字的最优分割路径。