欢迎来到知嘟嘟! 联系电话:13336804447 卖家免费入驻,海量在线求购! 卖家免费入驻,海量在线求购!
知嘟嘟
我要发布
联系电话:13336804447
知嘟嘟经纪人
收藏
专利号: 2021110942432
申请人: 平安普惠企业管理有限公司
专利类型:发明专利
专利状态:已下证
专利领域: 计算;推算;计数
更新日期:2024-04-07
缴费截止日期: 暂无
价格&联系人
年费信息
委托购买

摘要:

权利要求书:

1.一种文字识别方法,其特征在于,包括:获取待识别图像;

将所述待识别图像输入至训练好的字符识别模型的特征提取子模型,得到所述特征提取子模型输出的待识别图像对应的第一特征矩阵;

基于所述字符识别模型的矩阵处理子模型,对所述第一特征矩阵进行分割及编码,得到多个第一特征子矩阵;

将所述多个第一特征子矩阵输入至所述字符识别模型的字符预测子模型,得到所述字符预测子模型输出的所述待识别图像上的文字信息;

输出所述文字信息。

2.如权利要求1所述的文字识别方法,其特征在于,所述对所述第一特征矩阵进行分割及编码,得到多个第一特征子矩阵,包括:按照预设的子矩阵的列数量,将所述第一特征矩阵分割为多个子矩阵;

对各所述子矩阵进行时序编码处理,得到多个第一特征子矩阵。

3.如权利要求1或2所述的文字识别方法,其特征在于,所述将所述多个第一特征子矩阵输入至所述字符识别模型的字符预测子模型,得到所述字符预测子模型输出的所述待识别图像上的文字信息,包括:

基于所述字符预测子模型的注意力计算网络,对所述多个第一特征子矩阵进行权重计算,得到多个第二特征子矩阵;

将多个所述第二子矩阵进行拼接,得到第二特征矩阵;

将所述第二特征矩阵输入至所述字符预测子模型的字符预测网络,得到所述字符预测网络输出的所述待识别图像上的文字信息。

4.如权利要求3所述的文字识别方法,其特征在于,所述基于所述字符预测子模型的注意力计算网络,对所述多个第一特征子矩阵进行权重计算,得到多个第二特征子矩阵,包括:

基于所述字符预测子模型的注意力计算网络,确定各所述第一特征子矩阵对应的权重值;

根据各所述第一特征子矩阵的权重值,对各所述第一特征子矩阵进行权重计算,得到各所述第一特征子矩阵对应的第二特征子矩阵。

5.如权利要求3所述的文字识别方法,其特征在于,所述将所述第二特征矩阵输入至所述字符预测子模型的字符预测网络,得到所述字符预测网络输出的所述待识别图像上的文字信息,包括:

基于所述字符预测网络的激活函数层,对所述第二特征矩阵进行预测处理,得到所述待识别图像上的文字信息。

6.如权利要求1或2所述的文字识别方法,其特征在于,所述方法还包括:获取训练数据,所述训练数据包括多个样本图像和各所述样本图像对应的目标文字信息;

根据所述训练数据对所述字符识别模型进行训练,得到训练好的字符识别模型。

7.如权利要求6所述的文字识别方法,其特征在于,所述根据所述训练数据对所述字符识别模型进行训练,得到训练好的字符识别模型,包括:将所述样本图像输入所述字符识别模型中,得到所述字符识别模型输出的所述样本图像对应的样本文字信息;

基于预设损失值计算公式,根据所述样本文字信息和所述目标文字信息计算损失值;

根据所述损失值调整所述字符识别模型的参数,得到训练好的字符识别模型。

8.一种文字识别装置,其特征在于,所述文字识别装置包括:图像获取模块,用于获取待识别图像;

特征提取模块,用于将所述待识别图像输入至训练好的字符识别模型的特征提取子模型,得到所述特征提取子模型输出的所述待识别图像对应的第一特征矩阵;

矩阵处理模块,用于基于所述字符识别模型的矩阵编码子模型,对所述第一特征矩阵进行分割及编码,得到多个第一特征子矩阵;

文字信息预测模块,用于将所述多个第一特征子矩阵输入至所述字符识别模型的字符预测子模型,得到所述字符预测子模型输出的所述待识别图像上的文字信息;

文字信息输出模块,用于输出所述文字信息。

9.一种计算机设备,其特征在于,所述计算机设备包括处理器、存储器、以及存储在所述存储器上并可被所述处理器执行的计算机程序,其中所述计算机程序被所述处理器执行时,实现如权利要求1至7中任一项所述的文字识别方法的步骤。

10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,其中所述计算机程序被处理器执行时,实现如权利要求1至7中任一项所述的文字识别方法的步骤。