欢迎来到知嘟嘟! 联系电话:13336804447 卖家免费入驻,海量在线求购! 卖家免费入驻,海量在线求购!
知嘟嘟
我要发布
联系电话:13336804447
知嘟嘟经纪人
收藏
专利号: 2019101465333
申请人: 浙江工业大学
专利类型:发明专利
专利状态:已下证
专利领域: 计算;推算;计数
更新日期:2023-12-11
缴费截止日期: 暂无
价格&联系人
年费信息
委托购买

摘要:

权利要求书:

1.一种基于K-means和MMD的人脸图像深度聚类方法,包括以下步骤:(1)采用预训练的自动编码器提取人脸图像的特征信息;

(2)采用K-means聚类方法对特征信息进行聚类,并计算每张人脸图像对应的特征信息被划分至K个类簇的概率p和每个类簇中该特征信息应该被该类簇吸引的概率q;

(3)将概率p和概率q之间的MMD距离作为自动编码器中编码器部分的损失函数,并构建自动编码器的损失函数,对自动编码器进行训练,采用反向梯度传播算法优化自动编码器的模型参数;

(4)当loss函数趋于稳定时,将人脸图像再次输入步骤(3)训练得到的自动编码器中,并对自动编码器输出的特征信息再进行K-means聚类,重复步骤(2)和步骤(3),直至满足终止条件时,停止循环,得到训练好的自动编码器;

(5)使用训练好的自动编码器提取待处理的人脸图像的特征信息,再使用K-means聚类方法对特征信息进行聚类,输出聚类结果。

2.如权利要求1所述的基于K-means和MMD的人脸图像深度聚类方法,其特征在于,自动编码器包括编码器和解码器,其中,编码器包括依次连接的第一卷积层、池化层、第二卷积层、第三卷积层、第一全连接层以及第二全连接层;

解码器的结构与编码器对称,依次包括第一全连接层、第二全连接层,第三反卷积层、第二反卷积层、反池化层以及第一反卷积层;

预训练自动编码器时,损失函数L为:

其中,xi表示第i个人脸图像,f(xi)表示xi经过自动编码器后得到的输出。

3.如权利要求2所述的基于K-means和MMD的人脸图像深度聚类方法,其特征在于,在获得预训练的自动编码器后,提取自动编码器的编码器,将人脸图像输入至提取的编码器中,经计算获得每张人脸图像的特征信息。

4.如权利要求1所述的基于K-means和MMD的人脸图像深度聚类方法,其特征在于,步骤(2)的具体过程为:(2-1)采用K-means聚类方法对特征信息进行聚类,确定K个聚类中心;

(2-2)聚类中心确定后,对于每张人脸图像对应的特征信息,计算该特征信息被划分至K个类簇的概率p,具体计算公式为:其中,zi表示第i张图像经编码器得到的特征信息,cm表示第m个类簇的聚类中心,pim表示zi属于第m个类簇的概率;

(2-3)对于一张图片生成的特征信息,在确定其对应的概率p后,再针对概率p,计算每个类簇中该特征信息应该被该类簇吸引的概率q,具体计算公式为:其中,qim表示第i张图像的特征信息被第m个类簇吸引的概率,pi和qi都是根据聚类结果而对图像i的特征信息做出的一个概率分布,且qim是对pim在各个类簇中所占概率比例的一个期望概率。

5.如权利要求1所述的基于K-means和MMD的人脸图像深度聚类方法,其特征在于,步骤(3)中,概率p和概率q之间的MMD距离的计算公式为:其中,i和j表示任意两张图像,pi、pj、qi、qj分别表示图像i和图像j经K-means计算后得到的不同概率分布,k(·)表示两个向量的核函数运算,指定k(pi,pj)代表向量pj与向量pi之间的欧氏距离,F表示映射集合。

6.如权利要求5所述的基于K-means和MMD的人脸图像深度聚类方法,其特征在于,步骤(3)中,自动编码器的损失函数为:L′=αMMD[F,p,q]+(1-α)L

其中,0<α<1是一个常数,L表示步骤(1)中,预训练自动编码器时的损失函数。

7.如权利要求6所述的基于K-means和MMD的人脸图像深度聚类方法,其特征在于,设置α=0.8。

8.如权利要求1所述的基于K-means和MMD的人脸图像深度聚类方法,其特征在于,步骤(4)中,当相邻两次K-means的聚类结果误差小于5%时,停止迭代。