知嘟嘟-专利交易平台_专利购买_专利出售-买专利,上嘟嘟

欢迎来到知嘟嘟！联系电话：13095918853 卖家免费入驻，海量在线求购！卖家免费入驻，海量在线求购！

嘟嘟会员

帮助中心网站地图

查出售查高校查求购查年费

我要发布

首页转移热力图Hot 专利交易委托购买高校专区科技服务专利求购年费查询行业资讯

联系电话：13095918853

知嘟嘟经纪人

一种基于编解码结构的多模态显著性对象检测方法

￥50300

专利号： 2020104947398

申请人：杭州电子科技大学

专利类型：发明专利

专利状态：已下证

专利领域：计算；推算；计数

更新日期：2024-01-05

缴费截止日期：暂无

价格&联系人

年费信息

委托购买

专利简介

专利详情

委托购买说明

需准备材料

常见问题

摘要:

权利要求书:

1.一种基于编解码结构的多模态显著性对象检测方法，其特征在于，步骤如下：步骤1、根据应用的真实环境选择合适的数据集，确定数据的格式、分布、数量，划分训练集和测试集；

步骤2、确定网络模型的组成部分，设计执行流程，选择合适的损失函数；

步骤3、设置参数，选择优化器，训练模型，得到模型参数；

步骤4、使用测试集对训练后的模型进行测试。

2.根据权利要求1所述的一种基于编解码结构的多模态显著性对象检测方法，其特征在于，步骤1选择合适的数据集，并进行预处理，划分训练集和测试集，具体操作如下；

彩色图像采用RGB颜色空间的格式，深度图像采用0-255灰度值表达深度信息的格式，数据集中深度图像的像素值含义要与深度感知设备保持一致；对选取的数据采用水平镜像翻转、旋转90°、旋转180°、旋转270°，从而实现五倍的数据集扩增，并将数据集中深度图像的像素值进行线性变换，像素值0代表深度为0，像素值255代表深度为255。

3.根据权利要求2所述的一种基于编解码结构的多模态显著性对象检测方法，其特征在于，步骤2、确定网络模型的组成部分，设计执行流程，选择合适的损失函数，具体操作如下；

网络模型分为显著性对象预测分支和对比度特征学习分支；

显著性对象预测分支以彩色图像为输入的，基于编解码结构，用于完成显著性对象预测任务；编码部分使用ResNet-34网络，解码部分为对比度引导的多模态特征混合解码器，所述的对比度引导的多模态特征混合解码器对彩色特征和对比度特征进行充分融合，首先使用拼接操作，将对比度特征中的信息补充到显著性对象预测过程中，然后再次使用彩色特征与对比度特征生成特征滤波器，对颜色特征进行增强；在解码部分每个阶段均有损失函数进行监督，损失函数如公式(1)所示，采用最后一个阶段的输出作为最终的显著性对象预测结果；

显著性对象预测分支的损失函数：

Lrgb＝YlogP+(1-Y)log(1-P) (1)该损失函数为交叉熵损失函数，Y代表显著性结果真值，P代表算法预测的结果；

对比度特征学习分支以深度图像为输入，采用编解码结构，用于从深度图像中学习对比度特征，并作为先验信息补偿到显著性对象预测分支，在对比度特征学习分支解码部分的最后一个阶段使用对比度损失函数进行监督，对比度损失函数如公式(2)所示；

对比度特征学习分支的损失函数：

Ldepth＝a*(Lfore+Lback)+b*Lboth (2)Lfore＝-log(1-4*Dfore)

Lback＝-log(1-4*Dback)

Lboth＝-log(Dfore-Dback)2

其中，a、b为超参数，设置为a＝1，b＝10；Dfore代表深度图像中，前景区域即显著性对象区域的像素方差，Dback代表深度图像中，背景区域即非显著性对象区域的像素方差；

具体执行流程：

1)将深度图像输入对比度特征学习分支，学习得到对比度特征

2)将彩色图像输入显著性对象预测分支中，经过编码器作用，学习得到彩色特征

3)将相应特征层级的对比度特征的彩色特征输入显著性对象预测分支解码部分的对应解码器中，得到融合特征并将融合特征并输入下一级解码器，重复执行；