1.一种商标查询结果近似度评价和排序方法,其特征在于,包括以下步骤:步骤S110:对样本商标图像及内容按预设的商标分卡标准进行商标分卡处理,具体处理过程包括:(1)、建立由预设的形状特征最小单元多种组合方案、读音特征最小单元多种组合方案和含义特征最小单元多种组合方案所构成的商标分卡标准,(2)、对样本商标是否有汉语文字、图形、字母、数字或符号构成要素进行识别,获取构成要素的内容,(3)、提取样本商标各构成要素的形状特征最小单元、读音特征最小单元和含义特征最小单元;(4)、根据已建立的商标分卡标准,提取每一组合方案所生成或转换得到的各种文字、图形的切分信息,将这些切分信息作为样本商标分卡信息,并设定每一预设的商标分卡标准的近似度评价分值;
步骤S120:对输入商标图像及内容按预设的商标分卡标准进行商标分卡处理,具体处理过程包括:(1)、建立由预设的形状特征最小单元多种组合方案、读音特征最小单元多种组合方案和含义特征最小单元多种组合方案所构成的商标分卡标准,(2)、对输入商标是否有汉语文字、图形、字母、数字或符号构成要素进行识别,获取构成要素的内容;(3)、提取输入商标各构成要素的形状特征最小单元、读音特征最小单元和含义特征最小单元;(4)、根据已建立的商标分卡标准,提取每一组合方案所生成或转换得到的各种文字、图形的切分信息,将这些切分信息作为输入商标分卡信息;
步骤S130:以输入商标分卡信息集合作为检索关键词对存储于商标存储器的样本商标分卡信息进行检索,获取相关的结果商标的分卡信息及分卡匹配信息;
步骤S140:按照预设的商标形近率、商标义近率、商标音近率和检索关键词匹配得分率计算公式,分别计算输入商标与结果商标之间的商标形近率、商标义近率、商标音近率和检索关键词匹配得分率;
步骤S150:按照预设的商标近似度综合量化值的计算公式,计算获取商标近似度综合量化值,然后利用商标近似度综合量化值的大小对结果商标进行排序。
2.根据权利要求1所述商标查询结果近似度评价和排序方法,其特征在于,步骤S110和步骤S120所述“形状特征最小单元、读音特征最小单元、含义特征最小单元”和“商标分卡标准”包括:
1)形状特征最小单元包括:
构成要素为汉语文字的形状特征最小单元,选如下之一:每一汉语文字,每一汉语文字的每一笔划;
构成要素为图形的形状特征最小单元,选如下之一:商标图形要素编码,预设定长的商标图像轮廓线上像素点集;
构成要素为字母的形状特征最小单元,选如下之一:每一语种的单词,每一个字母;
构成要素为汉语数字的形状特征最小单元,选如下之一:汉语数字的组合,每一单个的汉语数字;
构成要素为阿拉伯数字的形状特征最小单元,选如下之一:阿拉伯数字的组合,每一单个的阿拉伯数字;
构成要素为其他语种数字的形状特征最小单元,选如下之一:其他语种数字的组合,每一单个的其他语种数字;
构成要素为符号的形状特征最小单元:为每一单个的符号;
2)含义特征最小单元包括:
构成要素为汉语文字的含义特征最小单元:商标的整体汉语文字组合由汉语词典所记载的词语组合构成时,每个词语为含义特征最小单元,否则,商标的整体汉语文字组合为含义特征最小单元;
构成要素为图形的含义特征最小单元:商标图形要素编码所对应的每一事物的名称;
构成要素为字母的含义特征最小单元:商标的整体字母组合由英文词典所记载的单词组合构成,或其他语种词典所记载的单词组合构成时,每个单词为含义特征最小单元,否则,商标的整体字母组合为含义特征最小单元;
构成要素为汉语数字的含义特征最小单元,选如下之一:商标中被分隔的每一组汉语数字所对应的预设基准语种数字,商标中每一单个汉语数字所对应的预设基准语种数字,其中,所述预设基准语种数字为任何语种数字;
构成要素为阿拉伯数字的含义特征最小单元,选如下之一:商标中被分隔的每一组阿拉伯数字所对应的预设基准语种数字,商标中每一单个阿拉伯数字所对应的预设基准语种数字,其中,所述预设基准语种数字为任何语种数字;
构成要素为其他语种数字的含义特征最小单元,选如下之一:商标中被分隔的每一组其他语种数字所对应的预设基准语种数字,商标中每一单个的其它语种数字所对应的预设基准语种数字,所述预设基准语种数字为任何语种数字;
构成要素为符号的含义特征最小单元:商标中每一符号所对应的符号名称;
3)读音特征最小单元包括:
构成要素为汉语文字的读音特征最小单元,为每一汉语文字的拼音;
构成要素为图形的读音特征最小单元,为商标图形要素编码所对应的每一事物的名称的拼音;
构成要素为字母的读音特征最小单元,选如下之一:每一字母组合的读音、每一个字母的读音;
构成要素为数字或符号的读音特征最小单元,选如下之一:商标中被分隔的每一组数字的读音,每一单个数字的读音,商标中被分隔的每一组符号的读音,每一单个符号的读音;
4)商标分卡标准包括:
A、由构成要素为汉语文字的形状特征最小单元多种组合方案所构成的商标分卡标准,包括:分卡标准a1、a2、a3、a4、a5、a6、a7、a8、a9、a10、a11、a12、a13中的至少一种,其中,a1表示按顺序排列的商标整体所有语种文字及图形要素编码的组合切分为一个分卡,a2表示按逆序排列的商标整体所有语种文字及图形要素编码的组合切分为一个分卡,a3表示按顺序排列的商标中的汉语文字切分为一个分卡,a4表示按逆序排列的商标中的汉语文字切分为一个分卡,a5表示按顺序排列的商标中的汉语数字切分为一个分卡,a6表示按逆序排列的商标中的汉语数字切分为一个分卡,a7表示商标中每个相对独立的部分分别切分为一个分卡,a8表示商标文字中完整包含现有汉语文字商标,将该部分切分为一个分卡,a9表示商标中含有的繁体、异体字转换为简体字后切分为一个分卡,a10表示商标中每个文字替换为形近字后切分为一个分卡,a11表示商标中每相邻汉语文字分别切分为一个分卡,a12表示商标中首尾汉字组合切分为一个分卡,
a13表示商标中每个汉语文字切分为一个分卡;
B、由构成要素为字母、数字、符号的形状特征最小单元多种组合方案所构成的商标分卡标准,包括:分卡标准b1、b2、b3、b4、b5、b6、b7、b8、b9、b10、b11、b12、b13、b14中的至少一种,其中,b1表示按顺序排列的商标整体所有语种文字及图形要素编码的组合切分为一个分卡,b2表示按逆序排列的商标整体所有语种文字及图形要素编码的组合切分为一个分卡,b3表示按顺序排列的商标中的字母组合切分为一个分卡,b4表示按逆序排列的商标中的字母组合切分为一个分卡,b5表示按顺序排列的商标中含有的非汉语数字或每一单个的非汉语数字分别切分为一个分卡,
b6表示按逆序排列的商标中含有的非汉语数字或每一单个的非汉语数字分别切分为一个分卡,
b7表示按顺序排列的商标中含有的符号组合切分为一个分卡,b8表示按逆序排列的商标中含有的符号组合切分为一个分卡,b9表示商标中每个相对独立部分分别切分为一个分卡,b10表示商标中每个字母被形近字母替换后切分为一个分卡,b11表示商标中每相邻字母组合分别切分为一个分卡,b12表示商标中字母按照不同定序排列后分别切分为一个分卡,b13表示商标中首尾字母组合切分为一个分卡,
b14表示商标中每个字母或数字或符号分别切分为一个分卡;
C、由构成要素为图形的形状特征最小单元多种组合方案所构成的商标分卡标准,包括:分卡标准c1、c2、c3、c4中的至少一种,其中,c1表示商标图形要素编码集合整体切分为一个分卡,c2表示每一商标图形要素编码切分为一个分卡,
c3表示每种图像特征识别方法所产生的商标图像特征描述符整体分别切分为一个分卡,
c4表示每种图像特征识别方法所产生的商标图像特征描述符预设定长分别切分为一个分卡,所述商标图像特征描述符预设定长是指预先设置的商标图像轮廓线上连续相连的像素点的长度,连续相连的像素点以特征字符串集、或数字集表示,取值范围为商标图像特征描述符、或数字集总长度的0.1%-50%;
D、由构成要素为汉语文字的读音特征最小单元多种组合方案所构成的商标分卡标准,包括:分卡标准d1、d2、d3中的至少一种,其中,d1表示商标中每个汉语文字的拼音音节切分为一个分卡,d2表示商标中整体汉语文字对应的拼音切分为一个分卡,d3表示商标中每个汉语文字被替换为形近字后的拼音音节切分为一个分卡;
E、由构成要素为字母、数字、符号的读音特征最小单元多种组合方案所构成的商标分卡标准,包括:分卡标准e1、e2、e3、e4中的至少一种,其中,e1表示商标中每个英文单词的读音音节切分为一个分卡,e2表示商标中字母组合被音近字母组合替换后得到的整体字母组合分别切分为一个分卡,
e3表示商标中每个数字的读音音节切分为一个分卡,e4表示商标中每个符号的读音音节切分为一个分卡;
F、由构成要素为图形的读音特征最小单元多种组合方案所构成的商标分卡标准,包括:分卡标准f1,其中,f1表示商标的图形要素编码所对应的每一事物的名称的拼音切分为一个分卡;
G、由构成要素为汉语文字的含义特征最小单元多种组合方案所构成的商标分卡标准,包括:分卡标准g1、g2、g3、g4中的至少一种,其中,g1表示商标中完整包含商标服务器中现有汉语文字商标、且商标整体无含义,将含有现有汉语文字商标的部分切分为一个分卡,
g2表示商标中与汉语词典所收录的词汇或商标服务器中现有汉语文字商标的汉字组合全部匹配的,将匹配部分分别切分为一个分卡,
g3表示商标中含有的汉语词汇替换为近义词后分别切分为一个分卡,g4表示商标整体无含义的,整体汉语文字切分为一个分卡;
H、由构成要素为字母、数字、符号组合的含义特征最小单元多种组合方案所构成的商标分卡标准,包括:分卡标准h1、h2、h3、h4、h5、h6、h7、h8、h9中的至少一种,其中,h1表示商标的整体字母组合由英文词典或其他语种词典所记载的单词组合构成,整体单词组合切分为一个分卡,
h2表示商标中含有英语词典或其他语种词典所收录的单词,每个单词切分为一个分卡,h3表示商标中含有英语词典或其他语种词典所收录的单词,将每个单词的近义词切分为一个分卡,
h4表示商标的整体字母组合与英文词典或其他语种词典所记载的单词不匹配的,整体字母组合切分为一个分卡,
h5表示商标中被分隔的每一组数字切分为一个分卡,h6表示商标的整体数字组合切分为一个分卡,
h7表示商标的整体符号组合切分为一个分卡,
h8表示商标的每一符号切分为一个分卡,
h9表示商标完整包含商标服务器现有字母组合商标、且商标整体无含义,将含有现有字母组合商标的部分切分为一个分卡;
I、由构成要素为图形的含义特征最小单元多种组合方案所构成的商标分卡标准,包括:分卡标准i1、i2中的至少一种,其中,
i1表示商标图形要素编码所对应的每一事物的名称切分为一个分卡,i2表示商标图像特征描述符对应有商标图形要素编码,商标图形要素编码所对应每个事物名称切分为一个分卡;
Y、由构成要素为例外调整文字的最小单元多种组合方案所构成的商标分卡标准,包括:分卡标准y1、y2中的至少一种,其中,
y1表示商标中含有例外调整文字,将例外调整文字整体切分为一个分卡;
y2表示商标中含有例外调整文字,将例外调整文字每个文字分别切分为一个分卡,所述例外调整文字包括如下的一种以上的文字:县级以上行政区域地名,公众知晓的外国地名,通用商品名称,表示商品的质量、主要原料、功能、用途、重量、数量及其他特点的词语,商品服务通用名称,显著性弱的文字,所述显著性弱的文字指自定义的不具备商标显著性特征的文字。
3.根据权利要求2所述商标查询结果近似度评价和排序方法,其特征在于,步骤S120所述“输入商标分卡信息”包括:U0、β1、V0、β2、M0、Y0,其中,U0表示输入商标基于商标分卡标准a13、b14、c2、c4或其组合所得的分卡数;β1表示输入商标中含有的例外调整文字的基于分卡标准a13、b14、c2、c4所得分卡数或文字数;V0表示输入商标基于商标分卡标准d1、d2、d3、e1、e2、e3、e4或其组合所得的分卡数;β2表示输入商标中含有的例外调整文字的基于分卡标准d1、d2、d3、e1、e2、e3、e4所得分卡数或音节数;M0表示输入商标去除例外调整文字后与结果商标基于商标分卡标准g1、g2、g3、g4所得分卡中相匹配的分卡数;Y0表示输入商标基于商标分卡标准y1或y2所得的分卡数;
步骤S130所述“结果商标的分卡信息及分卡匹配信息”包括Ya、Ua、Ub、Uc、Va、Vb、Vc、M1、M2、M3、M4、Ji、n、ki、r、Ti,其中,Ya表示结果商标基于商标分卡标准y1或y2所得的分卡数;Ua表示结果商标去除例外调整文字后与输入商标基于商标分卡标准a13、b14、c2、c4或其组合所得分卡中相匹配的分卡数;Ub表示结果商标去除例外调整文字后与输入商标基于商标分卡标准a10、b10或其组合所得分卡中相匹配的分卡数;Uc表示结果商标与输入商标基于商标分卡标准a13、b14、c2、c4或其组合和a10、b10或其组合所得相匹配的分卡中间插入不匹配分卡的处数;Va表示结果商标去除例外调整文字后与输入商标基于商标分卡标准d1、d2、e1、e3、e4或其组合所得分卡中相匹配的分卡数;Vb表示结果商标去除例外调整文字后与输入商标基于商标分卡标准d3、e2或其组合所得分卡中相匹配的分卡数;Vc表示结果商标与输入商标基于商标分卡标准d1、d2、e1、e3、e4或其组合和d3、e2或其组合所得相匹配的分卡中间插入不匹配分卡的处数;M1表示结果商标去除例外调整文字后与输入商标基于商标分卡标准g1的匹配分卡数;M2表示结果商标去除例外调整文字后与输入商标基于商标分卡标准g2的匹配分卡数;
M3表示结果商标去除例外调整文字后与输入商标基于商标分卡标准g3的匹配分卡数,M4表示结果商标去除例外调整文字后与输入商标基于商标分卡标准g4的匹配分卡数;Ji表示结果商标与输入商标相匹配的第i个分卡所对应的商标分卡标准的预设近似度评价分值;n表示结果商标与输入商标相匹配的分卡项目数;ki表示结果商标与输入商标在第i特征类型相匹配的各分卡所对应的商标分卡标准的预设近似度评价分值的平均分值,r表示结果商标与输入商标相匹配的特征类型数;Ti表示结果商标与输入商标在第i特征类型相匹配的各分卡所对应的商标分卡标准的预设近似度评价分值中的最高分值;
所述特征类型是通过预设的分类标准对商标分卡信息进行分类所得到的分卡类别。
4.根据权利要求3所述商标查询结果近似度评价和排序方法,其特征在于,其中,所述特征类型,按形音义划分包括:形状特征类型、读音特征类型、含义特征类型;按构成要素内容划分包括:汉语文字特征类型、字母文字特征类型、数字文字特征类型、符号文字特征类型、图形要素编码图形特征类型、图像特征描述符图形特征类型。
5.根据权利要求3所述商标查询结果近似度评价和排序方法,其特征在于,其中,步骤S140所述“预设的商标形近率、商标义近率、商标音近率和检索关键词匹配得分率计算公式”,包括:
1)商标形近率计算公式包括:
Wunit=Ua/(U0-β1)+[Ub/(U0-β1)]×λ1–[Uc/(U0-β1)]×λ2其中,Wunit表示商标形近率,λ1、λ2为预设的调整权数,λ1和λ2的取值范围均在10%至
300%之间;
2)商标音近率计算公式包括:
Ssound=Va/(V0-β2)+[Vb/(V0-β2)]×μ1–[Vc/(V0-β2)]×μ2其中,Ssound表示商标音近率,μ1、μ2为预设的调整权数,取值范围均在10%至300%之间;
3)商标义近率计算公式包括:
Smeaning=[(M1+M2×α1+M3×α2+M4×α3)/M0]-θ其中,Smeaning表示商标义近率,α1、α2、α3分别表示对M2、M3、M4的调整参数,取值规则:当出现M1、M2、M3、M4中二个及以上参数同时不为0时,在M1、M2、M3、M4中排列最前参数为有效参数,其余为无效参数,当M1不为0时,α1、α2、α3的值为0;当M1为0且M2不为0时,α1为1,α2、α3的值为
0;当M1、M2为0且M3不为0时,α2为1,α3为0;当M1、M2、M3为0且M4不为0时,α3为1;θ表示输入商标与结果商标文字数不相同的调整参数,取值范围在1%至90%之间;
4)检索关键词匹配得分率计算公式包括如下至少一项:检索关键词匹配综合平均得分率,检索关键词匹配分类平均得分率,检索关键词匹配分类最高得分率,检索关键词匹配分类加权最高得分率,即:Skeywork=S1或Skeywork=S2或Skeywork=S3或Skeywork=S4其中,Skeywork表示检索关键词匹配得分率,S1表示检索关键词匹配综合平均得分率,S2表示检索关键词匹配分类平均得分率,S3表示检索关键词匹配分类最高得分率,S4表示检索关键词匹配分类加权最高得分率;
其计算公式分别为:
S1=(J1+J2+J3+……+Jn)÷n
S2=(k1+k2+k3+…+kr)÷r
S3=(T1+T2+T3+…+Tr)÷r
S4=T1×ω1+T2×ω2+T3×ω3+…+Tr×ωr其中,ω1、ω2、ω3、……ωr分别表示结果商标与输入商标在第1特征类型、第2特征类型、第3特征类型、……、第r特征类型相匹配的各分卡所对应的分卡标准的预设近似度评价分值中的最高分值的计算权数,ω1、ω2、ω3、……ωr的取值范围在1%至80%之间,全部计算权数的合计为100%。
6.根据权利要求5所述商标查询结果近似度评价和排序方法,其特征在于,其中,步骤S150所述“商标近似度综合量化值的计算公式”包括:TMnear=Wunit×Q1+Ssound×Q2+Smeaning×Q3+Skeywork×Q4其中,TMnear表示商标近似度综合量化值,Wunit表示商标形近率,Ssound表示商标音近率,Smeaning表示商标义近率,Skeywork表示检索关键词匹配得分率,Q1、Q2、Q3、Q4分别表示商标形近率、商标音近率、商标义近率和检索关键词匹配得分率的权重数,Q1、Q2、Q3、Q4取值范围在
5%至95%之间,全部权重数合计为100%。
7.一种商标查询结果近似度评价和排序装置,其特征在于,包括:样本商标分卡预处理模块:用于对样本商标图像及内容按预设的商标分卡标准进行商标分卡处理,具体处理过程包括:(1)、建立由预设的形状特征最小单元多种组合方案、读音特征最小单元多种组合方案和含义特征最小单元多种组合方案所构成的商标分卡标准,(2)、对样本商标是否有汉语文字、图形、字母、数字或符号构成要素进行识别,获取构成要素的内容,(3)、提取样本商标各构成要素的形状特征最小单元、读音特征最小单元和含义特征最小单元;(4)、根据已建立的商标分卡标准,提取每一组合方案所生成或转换得到的各种文字、图形的切分信息,将这些切分信息作为样本商标分卡信息,并设定每一预设的商标分卡标准的近似度评价分值;
输入商标分卡处理模块:用于对输入商标图像及内容按预设的商标分卡标准进行商标分卡处理,具体处理过程包括:(1)、建立由预设的形状特征最小单元多种组合方案、读音特征最小单元多种组合方案和含义特征最小单元多种组合方案所构成的商标分卡标准,(2)、对输入商标是否有汉语文字,图形,字母、数字或符号构成要素进行识别,获取构成要素的内容;(3)、提取输入商标各构成要素的形状特征最小单元、读音特征最小单元和含义特征最小单元;(4)、根据已建立的商标分卡标准,提取每一组合方案所生成或转换得到的各种文字、图形的切分信息,将这些切分信息作为输入商标分卡信息;
商标检索模块:以输入商标分卡信息集合作为检索关键词对存储于商标存储器的样本商标分卡信息进行检索,获取相关的结果商标的分卡信息及分卡匹配信息;
商标形近率计算模块:用于按照预设的商标形近率计算公式,计算输入商标与结果商标之间的商标形近率;
商标义近率计算模块:用于按照预设的商标义近率计算公式,计算输入商标与结果商标之间的商标义近率;
商标音近率计算模块:用于按照预设的商标音近率计算公式,计算输入商标与结果商标之间的商标音近率;
检索关键词匹配得分率计算模块:用于按照预设的检索关键词匹配得分率计算公式,计算输入商标与结果商标之间的检索关键词匹配得分率;
商标近似度综合量化值的计算模块:用于按照预设的商标近似度综合量化值的计算公式,计算获取商标近似度综合量化值,然后利用商标近似度综合量化值的大小对结果商标进行排序。