欢迎来到知嘟嘟! 联系电话:13336804447 卖家免费入驻,海量在线求购! 卖家免费入驻,海量在线求购!
知嘟嘟
我要发布
联系电话:13336804447
知嘟嘟经纪人
收藏
专利号: 2025109968181
申请人: 石家庄铁道大学
专利类型:发明专利
专利状态:已下证
专利领域: 计算;推算;计数
更新日期:2026-02-06
缴费截止日期: 暂无
价格&联系人
年费信息
委托购买

摘要:

权利要求书:

1.一种融合空频特征的无人机图像小目标检测方法,其特征在于,包括如下步骤:S1,将原数据集划分为训练集、验证集、测试集;

S2,将图像数据输入到小目标特征保持网络,所述小目标特征保持网络由空域特征提取分支和频域特征提取分支构成,空域特征提取分支由ResNet提取浅层、中间层和深层空域特征图,频域特征提取分支提取频域特征图,所述的频域特征提取分支包括:亚像素-激励模块:所述亚像素-激励模块以原始RGB图像为输入,通过亚像素处理增加特征信息,通过Focus策略,将增加的亚像素保存在通道维度,通过压缩激励机制,学习重要通道权重标量,得到带有通道权重的特征图;

频域特征提取模块:所述频域特征提取模块接收带有通道权重的特征图,通过频带分离将各通道特征图分解为不同频带的子图,通过卷积来提取图像的频域特征,再结合注意力机制筛选出关键的频域特征,得到频域特征图;

S3,将频域特征图与空域特征图进行融合,得到空频融合特征图;

S4,对提取的特征图进行混合编码,得到图像特征序列,所述的混合编码包括:自注意力编码:所述自注意力编码以空频融合特征图为输入,得到包含全局上下文信息的编码特征图;

跨尺度特征融合:所述跨尺度特征融合以编码特征图、浅层空域特征图和深层空域特征图为输入,通过双向特征聚合网络,进行逐层融合,输出图像特征序列;

S5,进行特征筛选,由带有辅助预测头的解码器完成目标类别和位置检测,迭代训练,保存模型参数;

S6,将测试集的图片输入检测模型来对图像中目标进行识别定位。

2.如权利要求1所述的融合空频特征的无人机图像小目标检测方法,其特征在于,所述的亚像素-激励模块,包括:使用双线性插值法,对H×W×3的图像进行2倍上采样,得到2H×2W×3的亚像素图像;

对图像进行切片处理,在图像的宽度和高度方向上每隔一个像素进行采样,并在通道维度上进行拼接,得到H×W×12的特征图;

进行压缩处理,使用全局平均池化来生成通道级统计量;

使用sigmoid激活门控机制来进行激励,得到通道权重标量;

将通道权重标量加权到每个通道灰度图上,再进行一次1×1的卷积操作,得到带有通道权重的特征图。

3.如权利要求1所述的融合空频特征的无人机图像小目标检测方法,其特征在于,所述的频域特征提取模块,包括:通过频带分离将输入特征图中的每个通道特征图,都分解为8个不同频带的子图;

对所有子图,在通道维度上进行拼接,得到初始频域特征图;

对初始频域特征图进行通道注意力处理,得到通道权重矩阵,将权重值与初始频域特征图进行点乘,得到加权后的特征图,以此筛选出重要的频带通道;

对加权后的特征图进行空间注意力处理,得到空间注意力权重,再将空间权重值乘到加权后的特征图上,得到最终的频域特征图。

4.如权利要求3所述的融合空频特征的无人机图像小目标检测方法,其特征在于,所述的频带分离流程实现过程如下:首先,对灰度图进行离散傅里叶变换;

然后,构造两个滤波器,分别为高斯低通滤波器和高斯高通滤波器;

接着,将频谱图与滤波器相乘后进行反傅里叶变换,得到分别包含低频信息和高频信息的灰度图;

最后,采用二维离散小波变换分别对高频灰度图和低频灰度图进行再次分解,得到四个频率子带:水平细节、垂直细节、对角线细节和近似子带,由此将每个单通道图,分解为8个具有不同频带的子图,并且每个子图的分辨率被下采样到原图的一半。

5.如权利要求3所述的融合空频特征的无人机图像小目标检测方法,其特征在于,所述的通道注意力处理在计算注意力权重时采用两组不同的参数矩阵,计算公式如下:Mc(U1)=σ(W2(W1(Favg(U1)))+W4(W3(Fmax(U1))))式中,σ代表sigmoid函数,W1、W2、W3、W4代表不同参数矩阵,Favg()代表全局平均池化,Fmax()代表全局最大池化,U1代表输入特征图,Mc代表输出的通道注意力权重矩阵。

6.如权利要求1所述的融合空频特征的无人机图像小目标检测方法,其特征在于,所述的频域特征图与空域特征图进行融合,先通过n次3×3的卷积进行下采样,并调整频域特征图尺寸,使其与中间层空域特征图尺寸大小一致,再将其与中间层空域特征图在通道维度进行拼接。

7.如权利要求1所述的融合空频特征的无人机图像小目标检测方法,其特征在于,所述的自注意力编码由4个堆叠的编码器层实现,每个编码器层包含两个关键子层:多头自注意力层和前馈神经网络层,每层均配有层标准化和残差连接。