1.一种商标识别检索方法,其特征在于,包括以下步骤:通过检索样本图像数据库转化输入商标的图像数据,得到所述输入商标的图像特征描述符以及关联文本信息;所述样本图像数据库为预先建立的,包含样本图像的图像特征描述符、关联文本信息、最小单元以及组合单元数据的数据库;所述组合单元数据为表征图像任意局部信息的数据;
分别分割所述输入商标的图像特征描述符和关联文本信息,得到所述输入商标的各图像特征描述符最小单元、各关联文本信息最小单元;所述图像特征描述符最小单元为对应所述图像特征描述符所表示的任一图像特征点的一个或多个字符串;所述关联文本信息最小单元为对应所述关联文本信息所表示的任一文本信息特征点的一个文字或多个有含义的文字组合;
按照预设最小单元组合规则,分别组合所述输入商标的各图像特征描述符最小单元、各关联文本信息最小单元,得到所述输入商标的图像特征描述符组合单元数据、关联文本信息组合单元数据;
基于所述图像特征描述符组合单元数据、所述关联文本信息组合单元数据检索所述样本图像数据库中的样本商标数据库,得到匹配的各初步检索样本商标以及所述初步检索样本商标的各图像特征描述符最小单元、各关联文本信息最小单元;
根据所述初步检索样本商标的各图像特征描述符最小单元、各关联文本信息最小单元以及所述输入商标的各图像特征描述符最小单元、各关联文本信息最小单元,得到单项近似率;处理所述单项近似率,得到所述初步检索样本商标与所述输入商标的综合近似率;
对所述综合近似率符合预设要求的所述初步检索样本商标进行排序,得到检索结果。
2.根据权利要求1所述的商标识别检索方法,其特征在于,所述输入商标包括以图片形式录入的输入商标和以文字形式录入的输入商标;所述样本图像包括以图片形式录入的样本图像和以文字形式录入的样本图像;
所述样本图像包括商标图样、外观设计图样、著作权登记的美术作品图样、各汉语文字图样、各非汉语文字图样以及自定义图像;所述样本图像数据库还包括商标构成要素样本图像数据库、文字字典数据库以及词语词典数据库;
所述样本图像的关联文本信息包括已记录的所述样本图像的商标图形要素编码、所述样本图像所描述的事物名称和所述样本图像可认读的文字的文本及形音义特征;所述形音义特征包括所述样本图像的图形形状表现形式或文字的书写形式、读音、含义以及形近字、音近字和义近字;
所述图像特征描述符为采用相同或高度相似的字符串、对所述输入商标或所述样本图像中具有相同感知内容或特征进行记录,而采用不同的字符串对输入商标或样本图像中具有不同感知内容或特征进行记录的图像特征表示形式;所述图像特征表示形式为描述所述输入商标或所述样本图像的图像特征的一组或多组字符串的集合;
所述预设最小单元组合规则包括图像特征描述符最小单元组合规则和关联文本信息最小单元组合规则;所述图像特征描述符组合单元数据包括用于表示连通域组合单元数据、用于表示线段组合单元数据以及用于存储的字符串数据;所述关联文本信息组合单元数据包括文字组合单元数据、文字读音组合单元数据、文字含义组合单元数据以及商标图形要素编码组合单元数据;
通过检索样本图像数据库转化输入商标的图像数据,得到所述输入商标的图像特征描述符以及关联文本信息的步骤之前还包括步骤:建立所述样本图像数据库。
3.根据权利要求2所述的商标识别检索方法,其特征在于,所述关联文本信息中的文字包括中文文字、各语种的外国文字、数字以及符号;
建立所述样本图像数据库的步骤包括:收集各样本图像,提取并存储各所述样本图像的图像特征描述符;
录入所述样本图像的关联文本信息;
对图像特征描述符进行分割以及按照图像特征描述符最小单元组合规则的组合处理,得到各图像特征描述符最小单元以及各图像特征描述符组合单元数据;
逐个拆分所述样本图像的关联文本信息中的文字,得到所述关联文本信息最小单元;
按照关联文本信息最小单元组合规则对各所述关联文本信息最小单元进行组合,得到各所述文字组合单元数据;所述关联文本信息最小单元组合规则包括:将大小、颜色、语种相同并紧密相连接的文字确认为一个相连组合文字单元;将各预设文字数定长的所述相连组合文字单元确认为局部组合单元;其中,所述预设文字数定长的取值范围为在所述相连组合文字单元总文字数的20%以上取值;
从所述文字字典数据库中获取与所述文字组合单元数据相匹配的文字读音,根据所述文字读音标注各所述文字组合单元数据中的文字读音,得到所述文字读音组合单元数据;
从所述词语词典数据库中获取与各所述文字组合单元数据相匹配的词语组合,得到所述文字含义组合单元数据;
将样本商标标记的各商标图形要素编码,确认为所述商标图形要素编码组合单元数据。
4.根据权利要求2所述的商标识别检索方法,其特征在于,通过检索样本图像数据库转化输入商标的图像数据,得到所述输入商标的图像特征描述符以及关联文本信息的步骤包括:
提取所述以图片形式录入的输入商标的图像特征描述符;基于所述图像特征描述符检索所述样本图像数据库,将匹配的图像特征描述符对应的样本图像视为与输入商标的图像相同或高度近似的图像,并将样本图像已记录的图像特征描述符、关联文本信息确认为所述以图片形式录入的输入商标的图像特征描述符、关联文本信息;以及,基于所述以文字形式录入的输入商标的文字检索所述样本图像数据库,将匹配的样本文字对应的样本图像已记录的图像特征描述符、关联文本信息确认为所述以文字形式录入的输入商标的图像特征描述符、关联文本信息。
5.根据权利要求2所述的商标识别检索方法,其特征在于,所述图像特征描述符最小单元组合规则包括图像轮廓线的图像特征描述符最小单元组合规则和图像骨架线的图像特征描述符最小单元组合规则;
所述图像轮廓线的图像特征描述符最小单元组合规则包括:将任一图像轮廓线上的全部线段确认为一个图像整体组合单元;将任一图像轮廓线上的闭环线确认为一个连通域组合单元;将任一第一预设定长的图像轮廓线上的线段确认为一个线段组合单元;其中,第一预设定长的取值范围为大于或等于图像轮廓线上的线段总长的20%;
所述图像骨架线的图像特征描述符最小单元组合规则包括:将任一图像骨架线上的全部线段确认为一个图像整体组合单元;将任一图像骨架线上不间断的连线确认为一个连通域组合单元;将任一第二预设定长的图像骨架线上的线段确认为一个线段组合单元;其中,第二预设定长的取值范围为大于或等于图像骨架线上的线段总长的20%。
6.根据权利要求2所述的商标识别检索方法,其特征在于,所述图像特征描述符为用于表示图像轮廓线或图像骨架线任一像素点的位置数据与任一规格的标准坐标系坐标区域的对应关系的特征描述符;
所述图像特征描述符最小单元为所述任一规格的标准坐标系的任一坐标区域所对应所述图像轮廓线或所述图像骨架线的一个或多个像素点的位置数据;
所述关联文本信息最小单元为任一文字或文字组合所表示的关联文本信息对应具有含义的文字或词汇的数据。
7.根据权利要求1至6任意一项所述的商标识别检索方法,其特征在于,所述关联文本信息最小单元包括中文最小单元以及非中文最小单元;所述单项近似率包括中文单项近似率、非中文单项近似率以及图像特征单项近似率;
根据所述初步检索样本商标的各图像特征描述符最小单元、各关联文本信息最小单元以及所述输入商标的各图像特征描述符最小单元、各关联文本信息最小单元,得到单项近似率的步骤包括:
获取所述输入商标的中文最小单元的总数、非中文最小单元的总数和图像特征描述符最小单元的总数,所述初步检索样本商标匹配所述输入商标的中文最小单元合计数、非中文最小单元合计数和图像特征描述符最小单元合计数,所述初步检索样本商标不匹配所述输入商标的中文最小单元合计数、非中文最小单元合计数和图像特征描述符最小单元合计数;
基于以下公式得到中文最小单元匹配率:Ma1=(Ua1÷U01)×100%其中,Ma1表示中文最小单元匹配率,U01表示所述输入商标的中文最小单元的总数,Ua1表示所述初步检索样本商标匹配所述输入商标的中文最小单元合计数;
基于以下公式得到非中文最小单元匹配率:Ma2=(Ua2÷U02)×100%其中,Ma2表示非中文最小单元匹配率,U02表示所述输入商标的非中文最小单元的总数,Ua2表示所述初步检索样本商标匹配所述输入商标的非中文最小单元合计数;
基于以下公式得到图像特征描述符最小单元匹配率:Ma0=(Ua0÷U00)×100%其中,Ma0表示图像特征描述符最小单元匹配率,U00表示所述输入商标的图像特征描述符最小单元的总数,Ua0表示所述初步检索样本商标匹配所述输入商标的图像特征描述符最小单元合计数;
基于以下公式得到中文最小单元不匹配率:Mi1=(Uc1÷U01)×100%+(n1‑1)×ω1其中,Mi1表示中文最小单元不匹配率,U01表示所述输入商标的中文最小单元的总数,Uc1表示所述初步检索样本商标不匹配所述输入商标的中文最小单元合计数,n1表示所述初步检索样本商标与所述输入商标在中文最小单元组合连线上所不相匹配的处数,ω1表示所述处数n1的权数;其中,ω1的取值范围为小于或等于80%;
基于以下公式得到非中文最小单元不匹配率:Mi2=(Uc2÷U02)×100%+(n2‑1)×ω2其中,Mi2表示非中文最小单元不匹配率,U02表示所述输入商标的非中文最小单元的总数,Uc2表示所述初步检索样本商标不匹配所述输入商标的非中文最小单元合计数,n2表示所述初步检索样本商标与所述输入商标在非中文最小单元组合连线上所不相匹配的处数,ω2表示所述处数n2的权数;其中,ω2的取值范围为小于或等于80%;
基于以下公式得到图像特征描述符最小单元不匹配率:Mi0=(Uc0÷U00)×100%+(n0‑1)×ω0其中,Mi0表示图像特征描述符最小单元不匹配率,U00表示所述输入商标的图像特征描述符最小单元的总数,Uc0表示所述初步检索样本商标不匹配所述输入商标的图像特征描述符最小单元合计数,n0表示所述初步检索样本商标与所述输入商标在图像特征描述符最小单元组合连线上所不相匹配的处数,ω0表示所述处数n0的权数;其中,ω0的取值范围为小于或等于80%;
基于以下公式,获取所述中文单项近似率:M1=Ma1‑Mi1×β1
其中,M1表示中文单项近似率,β1表示Mi1的权数;其中,β1的取值范围为小于或等于
80%;
基于以下公式,获取所述非中文单项近似率M2=Ma2‑Mi2×β2
其中,M2表示非中文单项近似率,β2表示Mi2的权数;其中,β2的取值范围为小于或等于
80%;
基于以下公式,获取所述图像特征单项近似率:M0=Ma0‑Mi0×β0
其中,M0表示图像特征单项近似率,β0表示Mi0的权数;其中,β0的取值范围为小于或等于
80%。
8.根据权利要求7所述的商标识别检索方法,其特征在于,处理所述单项近似率,得到所述初步检索样本商标与所述输入商标的综合近似率的步骤包括:基于以下公式,得到所述综合近似率:M=(M1+M2+M0)÷μ
其中,μ表示M1、M2、M0不为0的项数。
9.根据权利要求7所述的商标识别检索方法,其特征在于,所述非中文最小单元为英文最小单元;所述非中文最小单元匹配率为英文最小单元匹配率;所述非中文最小单元不匹配率为英文最小单元不匹配率;所述非中文单项近似率为英文单项近似率;
所述图像特征描述符最小单元组合连线为图像特征线;所述中文最小单元组合连线为中文商标文字对应的形音义特征构成的最小单元、按排列顺序形成的轨迹线;所述非中文最小单元组合连线为非中文商标文字对应的形音义特征构成的最小单元、按排列顺序形成的轨迹线。
10.根据权利要求7所述的商标识别检索方法,其特征在于,对所述综合近似率符合预设要求的所述初步检索样本商标进行排序,得到检索结果的步骤包括:筛选出所述综合近似率大于或等于30%的所述初步检索样本商标,并对筛选出的所述初步检索样本商标进行排序,且取排序名次小于或等于500以内的所述初步检索样本商标作为所述检索结果。
11.一种商标识别检索装置,其特征在于,包括:转化模块,用于通过检索样本图像数据库转化输入商标的图像数据,得到所述输入商标的图像特征描述符以及关联文本信息;所述样本图像数据库为预先建立的,包含样本图像的图像特征描述符、关联文本信息、最小单元以及组合单元数据的数据库;所述组合单元数据为表征图像任意局部信息的数据;
分割模块,用于分别分割所述输入商标的图像特征描述符和关联文本信息,得到所述输入商标的各图像特征描述符最小单元、各关联文本信息最小单元;所述图像特征描述符最小单元为对应所述图像特征描述符所表示的任一图像特征点的一个或多个字符串;所述关联文本信息最小单元为对应所述关联文本信息所表示的任一文本信息特征点的一个文字或多个有含义的文字组合;
组合模块,用于按照预设最小单元组合规则,分别组合所述输入商标的各图像特征描述符最小单元、各关联文本信息最小单元,得到所述输入商标的图像特征描述符组合单元数据、关联文本信息组合单元数据;
检索模块,用于基于所述图像特征描述符组合单元数据、所述关联文本信息组合单元数据检索所述样本图像数据库中的样本商标数据库,得到匹配的各初步检索样本商标以及所述初步检索样本商标的各图像特征描述符最小单元、各关联文本信息最小单元;
获取近似率模块,用于根据所述初步检索样本商标的各图像特征描述符最小单元、各关联文本信息最小单元以及所述输入商标的各图像特征描述符最小单元、各关联文本信息最小单元,得到单项近似率;处理所述单项近似率,得到所述初步检索样本商标与所述输入商标的综合近似率;
排序模块,用于对所述综合近似率符合预设要求的所述初步检索样本商标进行排序,得到检索结果。
12.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至10中任一项所述方法的步骤。
13.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至10中任一项所述的方法的步骤。