欢迎来到知嘟嘟! 联系电话:13336804447 卖家免费入驻,海量在线求购! 卖家免费入驻,海量在线求购!
知嘟嘟
我要发布
联系电话:13336804447
知嘟嘟经纪人
收藏
专利号: 2024109532021
申请人: 江苏大学
专利类型:发明专利
专利状态:已下证
专利领域: 计算;推算;计数
更新日期:2026-05-15
缴费截止日期: 暂无
价格&联系人
年费信息
委托购买

摘要:

权利要求书:

1.一种基于深度字典低秩残差表示的人脸识别方法,其特征在于,包括如下步骤:步骤1、获取原始人脸图像,并对其进行预处理;

步骤2、构建并训练适用于深度字典低秩残差表示的深度网络模型,将预处理后的人脸图像输入该深度网络模型进行训练得到对应特征向量;深度网络模型包括特征提取模块、字典训练模块和稀疏表示模块:所述特征提取模块提取预处理后的人脸图像得到特征向量X;字典训练模块利用特征向量X来训练字典D;稀疏表示模块找到一组字典中的基底,使得人脸数据表示为这些基底的线性组合,进而输出稀疏特征;

所述适用于深度字典低秩残差表示的深度网络模型表达式如下:

上式的约束项如下:

s.t.PTP=I,E=X-DA

H(Ω)表示编码器,用于提取数据的高级特征;G(Ω)表示解码器,用于对输入数据的恢复;D=[d1,d2,…,dn]表示低维字典,所有输入数据的基向量;A=[a1,a2,…,an]表示稀疏向量,‖A‖1是一种稀疏约束,使得稀疏向量A中的元素包含较少的非0元素,用于对D中原子的线性组合;通过提取残差E中的边缘结构低秩结构;P为低维字典D与残差E的降维投影矩阵,通过使P的张量子空间与字典D中的结构保持一致;

对适用于深度字典低秩残差表示的深度网络模型进行训练的方法为:

步骤I、将特征提取模块得到的特征矩阵作为自编码器网络的输入,在编码过程中学习其中更高级的特征表示,同时在解码阶段重构出的数据与原始数据做残差计算进入下一阶段;学习残差中的低秩结构信息,同时在字典学习阶段更新字典以及稀疏表示系数;

步骤II、不断训练网络参数,并计算重构数据和原始数据的loss值,同时利用深度网络的反向传播更新网络参数,以不断的降低loss值;迭代一定次数修改梯度下降权重,从而更好的满足目标要求;

步骤III、重复步骤I和步骤II,以优化和调整函数的各个参数,最终得到一个满意的loss值,当loss值小于设定的阈值,说明达到训练要求;

步骤3、采集摄像头中的真实人脸图像,将真实人脸图像输入步骤2训练好的深度字典低秩残差表示的深度网络模型得到对应的人脸稀疏向量,将该人脸稀疏向量在数据库中进行对比检索:数据库中和该人脸稀疏向量差值最小的特征向量,若满足预期误差,则认为是系统能识别出的人脸图片。

2.根据权利要求1所述的基于深度字典低秩残差表示的人脸识别方法,其特征在于,所述步骤2深度网络模型中特征提取模使用SIFT算法来提取特征,所得人脸特征向量X=[x1,x2,…,xN]表示;xi表示一个滑动窗口的二维数据的向量化,具体方法为:将输入的人脸图像划分为8×8的小图像块,使用SIFT算法对各个图像块进行处理,将处理后的8×8方块矩阵进行向量化操作进而得到64×1的特征向量,最后将所得特征向量排列在一起得到一个64*N的矩阵,N为特征向量的个数,X=[x1,x2,…,xN]。

3.根据权利要求1所述的基于深度字典低秩残差表示的人脸识别方法,其特征在于,所述步骤2深度网络模型中字典训练模块训练字典的过程如下:通过解码器对降维后的数据恢复得到重构数据,然后计算重构数据与原始人脸图像的差值,得到残差结构即残差E,残差E中包括有边缘结构信息;

通过编码器对残差E进行PCA降维得到低秩残差结构,更新字典D时使用低秩残差结构来增强字典D对特征的表示,使得训练的字典矩阵中的原子向量对特征的表示更具判别性。

4.根据权利要求1所述的基于深度字典低秩残差表示的人脸识别方法,其特征在于,通过步骤2深度网络模型中稀疏表示模块获得稀疏特征向量的方法为:将字典训练模块所得字典D与特征提取模块所得特征向量X结合,并求解更新对应的稀疏向量A。

5.根据权利要求1所述的基于深度字典低秩残差表示的人脸识别方法,其特征在于,所述步骤3的详细方法为:将真实人脸图像的人脸稀疏向量与数据库中已有的人脸特征向量进行检索比对,依据二者相似程度对人脸的身份信息进行识别判断,设定一个阈值threshold,当误差不大于阈值threshold时就把匹配得到的结果输出,认为识别成功;

阈值threshold的计算公式如下:

threshold≤‖a1-a2‖2;

a1表示测试的特征向量,a2表示根据字典得到数据库中最相似的特征向量,通过计算它们之间的误差判断,表明它们之间具有较高的相似度。