欢迎来到知嘟嘟! 联系电话:13336804447 卖家免费入驻,海量在线求购! 卖家免费入驻,海量在线求购!
知嘟嘟
我要发布
联系电话:13336804447
知嘟嘟经纪人
收藏
专利号: 2019112961500
申请人: 杭州电子科技大学
专利类型:发明专利
专利状态:已下证
专利领域: 计算;推算;计数
更新日期:2024-01-05
缴费截止日期: 暂无
价格&联系人
年费信息
委托购买

摘要:

权利要求书:

1.基于词性分解的深度用户点击特征的细粒度图像分类方法,其步骤如下:步骤(1):分词性构建字典集

首先,对训练图像的用户查询文本运用分词、词干提取、词性标注,选定若干词性,并针对不同词性的单词集,选择点击次数较高的单词构建字典;

其次,从各字典中取出设定数量的关键词构建生成TF‑IDF特征的语料;

步骤(2):构建图像的TF‑IDF点击张量

首先,针对任意一种词性,根据TF‑IDF算法,利用相应单词语料和用户点击数据,将图像表征为TF‑IDF点击向量;其次,利用外积操作、将不同词性下的TF‑IDF点击向量组构建成TF‑IDF点击张量;

步骤(3):训练深度点击网络

首先,利用卷积层和全连接层构建一个相对浅层的点击神经网络分类模型,每个卷积层后经过激活函数和归一化层,并利用随机梯度下降方法训练此网络;

步骤(4):基于深度点击网络进行细粒度图像分类

对图像进行如上(1)‑(3)步骤的操作,提取图像的深度点击特征向量,从而实现基于深度点击特征的细粒度图像分类;

步骤(1)所述的分词性构建字典集,具体操作如下:

1‑1.利用一个包含n张图像、m′条查询文本的点击数据集;针对图像的任意一条文本点击数据(xi,qj,ci,j)其中,xi、qi、ci,j分别为图像、查询文本、对应的图像‑文本点击次数,利用分词技术将任意一条文本点击数据(xi,qj,ci,j)转化为如下单词点击集:((xi,wi,j,1,ci,j),(xi,wi,j,2,ci,j),(xi,wi,j,3,ci,j),...)     公式(1)

1‑2.对所有的文本点击数据施行公式(1)的操作,得到由(xi,wi,j,k,ci,j)构成的单词点击集,对这个集合中的单词依次进行词性还原、重复单词合并、词性标注,得到由图像、单词、对应的图像‑单词点击次数构成的点击矩阵C′;对于C′中的单词,依照词性划分成M个互不相交的集合;对于第m种词性的集合来说,选取其点击次数最多的前ρm个单词,构成第m种词性的字典 将其表示为:中的单词就构成了用以生成第m种词性下TF‑IDF特征所需要的语料; 是表示中的第j个单词。

2.根据权利要求1所述的基于词性分解的深度用户点击特征的细粒度图像分类方法,其步骤(2)所述的图像的TF‑IDF点击张量的具体构建步骤如下:

2‑1.利用步骤1‑2中的C′和 构建图像xi的第m种词性的TF‑IDF点击向量;选取单词其对应的点击次数记作 其中 为图像xi在第m种词性单词wj下的总点击次数;利用C′和TF‑IDF算法,构建图像xi的第m种词性的TF‑IDF点击向量 其第j个元素定义如下:其中, 为指示函数;n为图像总数;ρ′j表示第j个元素在所有图像中的频率,用于计算TF‑IDF算法中的逆文档频率;

2‑2.对所有M个中词性经过步骤1‑2所示后,将获得M个不同词性下的TF‑IDF点击向量;

将这些不同词性TF‑IDF点击向量组成的向量集合记作Vi,其定义如下:

2‑3.利用词性分解的TF‑IDF点击向量集Vi,构建图像的TF‑IDF点击张量t,该张量的元素构建如下:其中, 为词性融合函数,它可被定义为任一合理的融合操作,包括乘积、求和、平均值、最值;TF‑IDF点击张量t是一个M模张量。

3.根据权利要求2所述的基于词性分解的深度用户点击特征的细粒度图像分类方法,其步骤(3)所述的网络的具体结构如下:

3‑1.网络总体结构:

采用了4个卷积层加上2个全连接层的结构;网络的前半部分是卷积层,后半部分是全连接层;每个卷积层后都添加了一个Pooling层、BN层和ReLU层;两个全连接层之间添加一个失活率为0.8的Dropout层;

3‑2.在步骤3‑1描述的四个卷积层中,每个卷积层的结构均为M模1维卷积,它是由M个连续的一维卷积核组成的卷积模块,其中第m个卷积核是对点击张量的m模展开进行的,从而使网络更好地适配数据。