欢迎来到知嘟嘟! 联系电话:13336804447 卖家免费入驻,海量在线求购! 卖家免费入驻,海量在线求购!
知嘟嘟
我要发布
联系电话:13336804447
知嘟嘟经纪人
收藏
专利号: 2019105096408
申请人: 广东小天才科技有限公司
专利类型:发明专利
专利状态:已下证
专利领域: 计算;推算;计数
更新日期:2025-11-04
缴费截止日期: 暂无
价格&联系人
年费信息
委托购买

摘要:

权利要求书:

1.一种文本识别方法,其特征在于,所述方法包括下述步骤:检测预设的文本识别触发事件;

当检测到所述文本识别触发事件时,获取待进行文本识别的目标图像;

通过光学字符识别算法获取所述目标图像中的文本数据;

通过预设的带权重字符串匹配算法,将获取到的所述文本数据与预先获取的目标书本数据进行匹配,获得文本匹配结果;

根据所述文本匹配结果,输出与所述目标图像中文本对应的最佳匹配文本。

2.如权利要求1所述的方法,其特征在于,获取待进行文本识别的目标图像的步骤之后,通过光学字符识别算法获取所述目标图像中的文本数据的步骤之前,所述方法还包括:根据所述目标图像,获取待进行文本识别的焦点文本。

3.如权利要求2所述的方法,其特征在于,获取待进行文本识别的目标图像的步骤,包括:通过智能笔中摄像头对所述摄像头当前焦距所对应的、待进行文本识别的文本区域进行拍照,获得所述文本区域对应的目标图像;

根据所述目标图像,获取待进行文本识别的焦点文本的步骤,包括:获取所述摄像头当前焦点在所述目标图像中的相对焦点坐标;

根据所述相对焦点坐标获取所述当前焦点在所述目标图像中对应的焦点文本。

4.如权利要求2或3所述的方法,其特征在于,通过光学字符识别算法获取所述目标图像中的文本数据的步骤之后,将获取到的所述文本数据与预先获取的目标书本数据进行匹配的步骤之前,所述方法还包括:根据所述焦点文本和所述文本数据中的所有行文本,对用户意愿的待识别句子进行预测。

5.如权利要求4所述的方法,其特征在于,对用户意愿的待识别句子进行预测的步骤,包括:将所述文本数据中的所有行文本与所述目标书本数据包含的句子内容文本列表中所有句子进行比较,根据比较结果和所述目标书本数据包含的单词在句子中的排版行号对所述焦点文本进行拼接,得到所述用户意愿的待识别句子。

6.如权利要求4或5所述的方法,其特征在于,将获取到的所述文本数据与预先获取的目标书本数据进行匹配的步骤,包括:将所述文本数据中的单字符与所述目标书本数据中的单字符进行相似度匹配,获得第一相似度匹配结果;

将所述用户意愿的待识别句子和所述目标书本数据包含的句子内容文本列表中所有句子进行相似度匹配,获得第二相似度匹配结果;

根据所述文本匹配结果,输出与所述目标图像中文本对应的最佳匹配文本的步骤,包括:根据所述第一相似度匹配结果、所述第二相似度匹配结果,并结合所述用户意愿的待识别句子的上下文信息,获得与所述目标图像中文本对应的所述最佳匹配文本,并输出所述最佳匹配文本。

7.一种文本识别装置,其特征在于,所述装置包括:触发事件检测单元,用于检测预设的文本识别触发事件;

目标图像获得单元,用于当检测到所述文本识别触发事件时,获取待进行文本识别的目标图像;

文本数据获取单元,用于通过光学字符识别算法获取所述目标图像中的文本数据;

匹配结果获得单元,用于通过预设的带权重字符串匹配算法,将获取到的所述文本数据与预先获取的目标书本数据进行匹配,获得文本匹配结果;以及匹配文本输出单元,用于根据所述文本匹配结果,输出与所述目标图像中文本对应的最佳匹配文本。

8.如权利要求7所述的装置,其特征在于,所述装置还包括:焦点文本获取单元,用于根据所述目标图像,获取待进行文本识别的焦点文本。

9.如权利要求8所述的装置,其特征在于,所述目标图像获得单元包括:图像获得子单元,用于通过智能笔中摄像头对所述摄像头当前焦距所对应的、待进行文本识别的文本区域进行拍照,获得所述文本区域对应的目标图像;

所述焦点文本获取单元包括:

焦点坐标获取单元,用于获取所述摄像头当前焦点在所述目标图像中的相对焦点坐标;以及文本获取子单元,用于根据所述相对焦点坐标获取所述当前焦点在所述目标图像中对应的焦点文本。

10.如权利要求8或9所述的装置,其特征在于,所述装置还包括:句子预测单元,用于根据所述焦点文本和所述文本数据中的所有行文本,对用户意愿的待识别句子进行预测。

11.如权利要求10所述的装置,其特征在于,所述句子预测单元包括:句子预测子单元,用于将所述文本数据中的所有行文本与所述目标书本数据包含的句子内容文本列表中所有句子进行比较,根据比较结果和所述目标书本数据包含的单词在句子中的排版行号对所述焦点文本进行拼接,得到所述用户意愿的待识别句子。

12.如权利要求10或11所述的装置,其特征在于,所述匹配结果获得单元包括:第一结果获得单元,用于将所述文本数据中的单字符与所述目标书本数据中的单字符进行相似度匹配,获得第一相似度匹配结果;以及第二结果获得单元,用于将所述用户意愿的待识别句子和所述目标书本数据包含的句子内容文本列表中所有句子进行相似度匹配,获得第二相似度匹配结果;

所述匹配文本输出单元包括:

文本输出子单元,用于根据所述第一相似度匹配结果、所述第二相似度匹配结果,并结合所述用户意愿的待识别句子的上下文信息,获得与所述目标图像中文本对应的所述最佳匹配文本,并输出所述最佳匹配文本。

13.一种图像处理设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至6任一项所述方法的步骤。

14.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至6任一项所述方法的步骤。