欢迎来到知嘟嘟! 联系电话:13336804447 卖家免费入驻,海量在线求购! 卖家免费入驻,海量在线求购!
知嘟嘟
我要发布
联系电话:13336804447
知嘟嘟经纪人
收藏
专利号: 2023106223591
申请人: 南通大学
专利类型:发明专利
专利状态:已下证
专利领域: 计算;推算;计数
更新日期:2026-01-27
缴费截止日期: 暂无
价格&联系人
年费信息
委托购买

摘要:

权利要求书:

1.一种基于空间池化的轻量级ViT弱监督人群计数方法,其特征在于,包括以下步骤:步骤1:获取训练图像数据集并进行预处理,将数据集中的所有训练图像分割成不重叠的图像区域,并且将分割后的区域作为伪彩色处理的输入;

步骤1-1:载入图像数据

步骤1-2:计算出步骤1-1输入的纵向图像的纵向和横向缩放比例,将所述纵向图像的横纵缩放比互换并调整至指定大小,此时图像数据变为步骤1-3:计算出步骤1-1输入的横向图像的纵向和横向缩放比例,将所述横向图像的横纵缩放比互换并调整至指定大小,此时图像数据变为步骤1-4:将步骤1-2和步骤1-3的图像路径进行判断,若为训练数据则将步骤1-5:读取步骤1-4生成新文件夹的地址,制作npy文件,将裁切后的步骤2:对步骤1中分割后的图像区域进行伪彩色处理后,使用位置编码对图像区域进行平铺处理;

步骤2-1:首先对

步骤2-2:对图像

其中,补丁嵌入过程如公式(1)所示:

其中pos是块在图中的位置,i是补丁嵌入的位置,d步骤2-3:将每个块的位置进行编码后叠加到块上,得到转换后的图像块PE步骤3-1:对于步骤2中输入的块和位置编码进行空间池化操作,完成块混合,将X变化为块混合结果Y,进入步骤3-2;

步骤3-2:对Y中每个块使用非线性激活的双层MLP混合,MLP包含两个全连接层,一个激活层,和两个随机失活层,混合完成后Y变化为结果Z,进入步骤3-3;

步骤3-3:重复执行步骤3-1至步骤3-2,当混合次数达到一定值后将提取完的特征作为输入,进入步骤3-4;

步骤3-4:对步骤3-3的输出进行全局平均池化,然后通过一个线性分类器,输出一个特定维的向量;

步骤4:将提取的特征输入深度回归器中,预测人群数量,得到LCTrans-CC模型;

采用深度回归器来对步骤3的输出做回归预测,更换激活函数为LeakyReLU深度回归器的计算过程用公式(5)表示:Pre=W

其中Pre为人群数量的预测值,Z为步骤3的输出,LeakyReLU(·)表示整流激活函数,步骤5:设定迭代次数M及最终轮次,使用L1损失来衡量预测值与真实值之间的差距,清空优化器的梯度缓存,进行反向传播并更新LCTrans-CC模型参数;

步骤6:检查训练图像数据集中所有图像是否都已经全部通过LCTrans-CC模型,若没有则返回步骤3,否则进入步骤7;

步骤7:若当前轮次大于M且小于最终轮次,且为一定倍数时进入测试流程,若等于最终轮次,输出最优权重文件,得到训练完成的LCTrans-CC模型,否则返回步骤3;

步骤8:利用训练好的LCTrans-CC模型进行人群数量预测。

2.根据权利要求1所述的一种基于空间池化的轻量级ViT弱监督人群计数方法,其特征在于,采用的块混合表示为公式(2):Y=TokenMixer(Norm(X))+X                     (2)其中Norm(·)表示归一化,TokenMixer(·)表示用于块信息融合的模块,由ViT中的空间MLP实现,非线性激活的双层MLP,表示为公式(3):Z=σ(Norm(Y)W

其中两个可学习特征

其中j和k分别为图像的横向和纵向的相对位置编码,T是平均池化输入的数据,T′为平均池化后的结果,

3.根据权利要求1所述的一种基于空间池化的轻量级ViT弱监督人群计数方法,其特征在于,步骤4具体包括:步骤4-1:将步骤3的输出,使用全连接层,使其变化为指定维度,进入步骤4-2;

步骤4-2:将步骤4-1的输出放入一个整流激活函数中,对输入数据中负值数据赋予一个系数值,进入步骤4-3;

步骤4-3:将步骤4-2中的输出放入一个随机丢弃层,在训练过程中学习多个独立的特征表示,进入步骤4-4;

步骤4-4:将上一步的输出放入一个全连接层,转换维度;

步骤4-5:如果此时的维度不是1,则返回步骤4-2,否则结束进入步骤5。

4.根据权利要求1-3任一所述的一种基于空间池化的轻量级ViT弱监督人群计数方法,其特征在于,步骤5中使用L1损失衡量模型在训练过程中的性能,L1损失的具体表达如公式(6):其中n为训练图像的数量,对训练轮次中所有的预测值

5.根据权利要求1-3任一所述的一种基于空间池化的轻量级ViT弱监督人群计数方法,其特征在于,步骤7中测试流程包括以下步骤:步骤A:设置批处理大小为1,并创建一个用于测试的数据加载器,该加载器按顺序加载预处理过的测试数据,并对其进行数据标准化处理,并将模型切换到评估模式;

步骤B:初始化平均绝对误差和均方误差,进入步骤C;

步骤C:遍历验证数据加载器中的每个批次,将图像数据移动到显卡中,并根据输入数据的形状进行图像调整;

步骤D:在不计算梯度的情况下,将调整后的图像数据输入训练过程得到的模型并获得预测结果;累加预测结果以计算总人数,进入步骤E;

步骤E:计算批次中预测值与真实值之间的绝对误差和平方误差,与最小值比较,如果误差达到最小值,保存此时的模型权重文件,否则不做操作;完成测试后返回训练步骤。