欢迎来到知嘟嘟! 联系电话:13336804447 卖家免费入驻,海量在线求购! 卖家免费入驻,海量在线求购!
知嘟嘟
我要发布
联系电话:13336804447
知嘟嘟经纪人
收藏
专利号: 2022104226266
申请人: 湖南师范大学
专利类型:发明专利
专利状态:已下证
专利领域: 计算;推算;计数
更新日期:2026-04-22
缴费截止日期: 暂无
价格&联系人
年费信息
委托购买

摘要:

权利要求书:

1.一种交通文本识别方法,其特征在于,包括:

利用主干网络模型对待识别图像进行特征运算获得特征图;其中,所述主干网络模型为预先经过学习训练并由FPN网络和ResNet50网络共同构建的模型;

对所述待识别图像进行SIFT特征算法运算,获得特征描述向量;

对所述特征图进行交通文本所在区域的检测识别,获得对交通文本所在位置区域进行标记的精细特征图;

将所述精细特征图和所述特征描述向量进行特征融合,获得融合特征;

对所述融合特征进行交通文本所在区域检测识别,确定所述待识别图像中交通文本所在位置区域,以便对所述位置区域内的交通文本进行语义识别;

对所述特征图进行交通文本所在区域的检测识别,获得对交通文本所在位置区域进行标记的精细特征图,包括:对所述特征图进行非文本特征剔除获得文本特征;

对所述特征图进行文本框粗检测,获得所述特征图中文本所在区域的粗检测框;

将所述粗检测框和所述特征图共同进行可形变卷积运算,获得检测框;

将所述文本特征和所述检测框共同进行精细检测运算,获得精细特征图;

对所述特征图进行非文本特征剔除获得文本特征,包括:将所述特征图通过文本分类头中的第一1×1卷积层、尺度归一层、第一激活层、第二1×1卷积层、第二激活层依次运算,生成文本分类得分图;

将所述文本分类得分图中分数小于预设阈值的特征作为非文本特征剔除,获得分数不小于所述预设阈值的特征作为文本特征;

对所述特征图进行文本框粗检测,获得所述特征图中文本所在区域的粗检测框,包括:将所述特征图通过粗检测模型中的3×3卷积层、尺度归一层、激活层以及1×1卷积层依次进行粗检测运算,获得粗检测框;

将所述文本特征和所述检测框共同进行精细检测运算,获得精细特征图,包括:将所述文本特征和所述检测框共同通过精细检测模型中的3×3卷积层、尺度归一层、激活层以及1×1卷积层依次进行精细检测运算,获得精细特征图。

2.如权利要求1所述的交通文本识别方法,其特征在于,对所述融合特征进行交通文本所在区域检测识别,确定所述待识别图像中交通文本所在位置区域,包括:对所述融合特征进行交通文本所在区域检测识别,获得多个文本检测框;

将任意两个重叠度大于预设重叠度的文本检测框中置信度分数小的文本检测框剔除;其中,所述置信度分数为所述文本检测框中的文本是交通文本的概率;

以剔除后的各个所述文本检测框所在区域作为所述待识别图像中交通文本所在位置区域。

3.如权利要求1所述的交通文本识别方法,其特征在于,所述主干网络模型的构建过程,包括:基于FPN网络和ResNet50网络构建卷积神经网络;

利用所述卷积神经网络对样本图像进行特征提取,获得样本特征;

将所述样本特征分别通过1×1卷积层和RBOX包围框,获得所述样本图像的预测文本位置和预测文本得分;

利用骰损失函数将所述预测文本位置和所述预测文本得分与所述样本图像的真实文本位置和真实文本得分进行误差损失运算,并根据运算结果对所述卷积神经网络进行优化,获得所述主干网络模型。

4.如权利要求1至3任一项所述的交通文本识别方法,其特征在于,在利用主干网络模型对待识别图像进行特征运算获得特征图,对所述待识别图像SIFT特征算法运算,获得特征描述向量之前,还包括:将所述待识别图像进行灰度化处理,获得灰度图像;

根据所述灰度图像中各个像素点的灰度值大小,确定所述待识别图像的明暗度是否达到要求明暗度;

若否,则通过Gamma校正对所述待识别图像进行图像增强运算;

根据经过增强运算之后的所述待识别图像,执行利用主干网络模型对待识别图像进行特征运算获得特征图,对所述待识别图像SIFT特征算法运算,获得特征描述向量的步骤。

5.一种交通文本识别装置,其特征在于,包括:

第一运算模块,用于利用主干网络模型对待识别图像进行特征运算获得特征图;其中,所述主干网络模型为预先经过学习训练并由FPN网络和ResNet50网络共同构建的模型;

第二运算模块,用于对所述待识别图像进行SIFT特征算法运算,获得特征描述向量;

第三运算模块,用于对所述特征图进行交通文本所在区域的检测识别,获得对交通文本所在位置区域进行标记的精细特征图;

第四运算模块,用于将所述精细特征图和所述特征描述向量进行特征融合,获得融合特征;

文本识别模块,用于对所述融合特征进行交通文本所在区域检测识别,确定所述待识别图像中交通文本所在位置区域,以便对所述位置区域内的交通文本进行语义识别;

所述第三运算模块具体包括:

文本剔除单元,用于对所述特征图进行非文本特征剔除获得文本特征;

粗检测单元,用于对所述特征图进行文本框粗检测,获得所述特征图中文本所在区域的粗检测框;

可形变卷积单元,用于将所述粗检测框和所述特征图共同进行可形变卷积运算,获得检测框;

精细检测单元,用于将所述文本特征和所述检测框共同进行精细检测运算,获得精细特征图;

文本剔除单元具体用于将所述特征图通过文本分类头中的第一1×1卷积层、尺度归一层、第一激活层、第二1×1卷积层、第二激活层依次运算,生成文本分类得分图;将所述文本分类得分图中分数小于预设阈值的特征作为非文本特征剔除,获得分数不小于所述预设阈值的特征作为文本特征;

粗检测单元具体用于将所述特征图通过粗检测模型中的3×3卷积层、尺度归一层、激活层以及1×1卷积层依次进行粗检测运算,获得粗检测框;

精细检测单元具体用于将所述文本特征和所述检测框共同通过精细检测模型中的3×3卷积层、尺度归一层、激活层以及1×1卷积层依次进行精细检测运算,获得精细特征图。

6.一种交通文本识别设备,其特征在于,包括:

存储器,用于存储计算机程序;

处理器,用于执行所述计算机程序,以实现如权利要求1至4任一项所述的交通文本识别方法的步骤。

7.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质用于存储计算机程序,所述计算机程序被处理器执行,以实现如权利要求1至4任一项所述的交通文本识别方法的步骤。