知嘟嘟-专利交易平台_专利购买_专利出售-买专利,上嘟嘟

欢迎来到知嘟嘟！联系电话：13336804447 卖家免费入驻，海量在线求购！卖家免费入驻，海量在线求购！

嘟嘟会员

帮助中心网站地图

查出售查高校查求购查年费

我要发布

首页转移热力图Hot 专利交易委托购买高校专区科技服务专利求购年费查询行业资讯

联系电话：13336804447

知嘟嘟经纪人

基于深度学习的图像识别方法及识别系统

￥19000

专利号： 202411046361X

申请人：佛山职业技术学院

专利类型：发明专利

专利状态：已下证

专利领域：计算；推算；计数

更新日期：2026-01-27

缴费截止日期：暂无

价格&联系人

年费信息

委托购买

专利简介

专利详情

委托购买说明

需准备材料

常见问题

摘要:

权利要求书:

1.一种基于深度学习的图像识别方法，其特征在于，识别方法包括以下步骤：利用卷积神经网络提取待识别图像的多尺度特征向量，其中，所述多尺度特征向量包括对应于所述待识别图像中每个像素的多尺度特征元素；

遍历所述待识别图像中每个像素，并采用Softmax激活函数将像素的多尺度特征元素转换成类别概率值；

具体包括：

对每个像素的多尺度特征元素进行平坦化处理，得到每个像素的一维向量；

通过全连接层将每个像素的一维向量映射到类别空间，得到每个像素的类别向量；

利用Softmax函数将每个像素的类别向量转换为类别概率值；

将每个像素的多尺度特征元素映射至特征空间，并在所述特征空间内将每个像素的多尺度特征元素与对应的类别概率值进行拼接，得到每个像素的特征-概率向量；

具体包括：

将每个像素的多尺度特征元素通过非线性变换映射至预先定义的高维特征空间，以在所述高维特征空间将每个像素的多尺度特征元素表示为特定向量；

在所述高维特征空间中，采用串联方式对每个像素的特定向量与对应的类别概率值的类别向量进行拼接，形成包含特定向量与类别向量的特征-概率向量；

将每个像素的特征-概率向量逐一输入预训练的阈值预测网络进行预测，输出动态概率阈值；

通过比较每个像素的类别概率值与动态概率阈值，将高于所述动态概率阈值的像素分配给目标物的类别，得到所述目标物对应的识别结果。

2.根据权利要求1所述的一种基于深度学习的图像识别方法，其特征在于，所述利用卷积神经网络提取待识别图像的多尺度特征向量，包括：构建基于U-Net架构的卷积神经网络；

对所述待识别图像进行图像预处理，其中，所述图像预处理包括尺寸调整和归一化；

通过基于U-Net架构的卷积神经网络中具有不同大小卷积核的卷积层提取预处理后的所述待识别图像的不同尺度的特征；

通过上采样将不同尺度的特征进行融合，得到所述待识别图像的多尺度特征向量；

对所述待识别图像的多尺度特征向量进行像素级分割，得到所述待识别图像中每个像素的多尺度特征元素。

3.根据权利要求2所述的一种基于深度学习的图像识别方法，其特征在于，所述阈值预测网络的构建步骤包括：收集包括样本特征-概率向量及相应的样本阈值标签的数据集，并分为训练集和验证集；

利用所述训练集通过反向传播算法优化基于神经网络的阈值预测网络的网络权重，直至所述阈值预测网络收敛；

利用所述验证集评估所述阈值预测网络，并根据评估结果调整所述阈值预测网络的参数，以得到训练好的阈值预测网络。

4.根据权利要求3所述的一种基于深度学习的图像识别方法，其特征在于，所述将每个像素的特征-概率向量逐一输入预训练的阈值预测网络进行预测，输出动态概率阈值，包括：将每个像素的特征-概率向量依次输入到预训练的阈值预测网络中；

通过所述阈值预测网络对输入的特征-概率向量进行前向传播，最终输出动态概率阈值。

5.根据权利要求4所述的一种基于深度学习的图像识别方法，其特征在于，所述通过比较每个像素的类别概率值与动态概率阈值，将高于所述动态概率阈值的像素分配给目标物的类别，得到所述目标物对应的识别结果，包括：遍历所述待识别图像中的每一个像素，将每个像素的类别概率值与动态概率阈值进行比较，若类别概率值大于或等于动态概率阈值，则认为像素属于目标物的类别；否则，认为像素不属于目标物的类别；

根据比较的结果，将高于动态概率阈值的像素分配给目标物的类别；

汇总所有像素的分配结果，得到所述待识别图像的目标物识别结果。

6.一种基于深度学习的图像识别系统，执行如权利要求1至5任意一项所述的一种基于深度学习的图像识别方法，其特征在于，识别系统包括：多尺度特征提取模块，用于利用卷积神经网络提取待识别图像的多尺度特征向量，其中，所述多尺度特征向量包括对应于所述待识别图像中每个像素的多尺度特征元素；

概率预测模块，用于遍历所述待识别图像中每个像素，并采用Softmax激活函数将像素的多尺度特征元素转换成类别概率值；

特征-概率融合模块，用于将每个像素的多尺度特征元素映射至特征空间，并在所述特征空间内将每个像素的多尺度特征元素与对应的类别概率值进行拼接，得到每个像素的特征-概率向量；

动态阈值预测模块，用于将每个像素的特征-概率向量逐一输入预训练的阈值预测网络进行预测，输出动态概率阈值；

结果生成模块，用于通过比较每个像素的类别概率值与动态概率阈值，将高于所述动态概率阈值的像素分配给目标物的类别，得到所述目标物对应的识别结果。