欢迎来到知嘟嘟! 联系电话:13336804447 卖家免费入驻,海量在线求购! 卖家免费入驻,海量在线求购!
知嘟嘟
我要发布
联系电话:13336804447
知嘟嘟经纪人
收藏
专利号: 2019107652761
申请人: 三峡大学
专利类型:发明专利
专利状态:已下证
专利领域: 计算;推算;计数
更新日期:2025-10-16
缴费截止日期: 暂无
价格&联系人
年费信息
委托购买

摘要:

权利要求书:

1.基于深度学习的太阳胶片图像时间戳信息提取方法,其特征在于包括以下步骤:步骤1:对太阳色球胶片图像中的时间戳信息区域定位、并剪裁;

步骤2:单字符分割,即将时间戳信息区域的字符进一步分割,得到单个字符;

步骤3:字符识别,即先采用大量的样本训练网络,然后将步骤2分割得到的单个字符使用训练好的网络对其进行识别,并将其识别结果整合并保存。

2.根据权利要求1所述基于深度学习的太阳胶片图像时间戳信息提取方法,其特征在于:所述步骤1包含以下步骤:步骤1.1,基于垂直投影的太阳球面切除步骤:

对图像在垂直分量上进行累加操作得到一个1×n的向量,假设图片的大小是m×n,像素在i行j列的像素值为fij(x,y),则在垂直方向投影为:其中,S1j表示图像第i列像素点求和的结果,S1j的大小为1×n;通过计算图片在垂直方向的投影可以进一步判断太阳球面的位置;在S1j向量[400,1800]之间为太阳色球部分投影的结果;又因为太阳是对称的,所以只需要得知在向量S1j中的最大值,即可定位太阳圆心的位置,然后根据太阳球面在垂直方向所占的像素长度,将包含太阳球面部分的图片去除;

步骤1.2,基于方差判断时间戳位置及翻转校正:

包含时间戳的图片的方差,远远大于不包含时间戳的图片的方差;从而判断出时间戳所在的图片,得知时间戳所在图片后,需要对图片进行反转校正,若为左侧图片则需顺时针翻转90度,反之逆时针旋转90度;

步骤1.3,基于投影法的时间戳字符区域精分割:

对于大小为m×n的图片,像素在i行j列的像素值为xij,则在水平方向和垂直方向投影分别为:其中,S1j表示图像第i列像素点求和的结果,S1j的大小为1×n;Si1表示图像第j行像素点求和的结果,Si1的大小为m×1;通过计算图片在水平方向和垂直方向的投影,能够进一步时间戳区域的具体位置从而实现图片的精确分割。

3.根据权利要求2所述基于深度学习的太阳胶片图像时间戳信息提取方法,其特征在于:基于步骤1.3得到的图片在水平和垂直方向的投影结果,对图片进行切割:为了保证图片的连续性不被破坏,以第一个大于均值的点作为起点,最后一个大于均值的点作为终点,保留起点到终点区域的所有图像;假设原图S的大小为m×n,切割后图片P的大小为m′×n′,其切割公式为:P=S(a:b,c:d),(a,c>1,b

其中:

式中,S(a:b,c:d)表示图片S中,a到b行,c到d列;x表示在水平投影中某点的值,表示水平投影中各点均值;y表示在垂直投影中某点的值, 表示垂直投影中各点均值;

表示在投影向量中,x大于 的位置的最小值; 表示在投影向量中,x大于 的位置的最大值。

4.根据权利要求1所述基于深度学习的太阳胶片图像时间戳信息提取方法,其特征在于:所述步骤2中,单字符分割的过程为:

首先采用顶帽运算对图片的背景进行去除,然后采用局部二值化算法去除噪声,最后采用连通域算法提取字符区域;该算法默认字符颜色为白色,若字符颜色为黑色则经过连通域提取后将提取不到任何有效区域,所以若不存在有效区域则返回到局部二值化部分,对局部二值化后的图片进行颜色翻转即可。

5.根据权利要求4所述基于深度学习的太阳胶片图像时间戳信息提取方法,其特征在于:采用顶帽运算算法进行背景去除,其算法原理是原图像与原图像开运算结果做差;图片经过顶帽运算后能够消除一部分背景噪声,并且能够突出图像中的字符。

6.根据权利要求4所述基于深度学习的太阳胶片图像时间戳信息提取方法,其特征在于:采用Sauvola局部二值化算法进行噪声去除;只需要将符合字符大小的连通域提取出来就可以完成字符的切割。

7.根据权利要求4所述基于深度学习的太阳胶片图像时间戳信息提取方法,其特征在于:采用连通域算法进行字符区域提取,通过判断每个连通域是否符合标准字符的长度,宽度以及长宽比来进一步删除无效区域;字符的高度在[90,110]之间,字符宽度在[10,60]之间,字符的长宽比不小于1;

根据二值图中每个连通域的位置对应原图中的位置,能够将原图中的单个字符区域分别切割出来;为了保证得到的图片尺寸一致,该算法分别对每张图片进行填充,并将其大小变换为28×28的标准图片。

8.根据权利要求1所述基于深度学习的太阳胶片图像时间戳信息提取方法,其特征在于:所述步骤3中,字符识别的过程为:

采用深度学习中的卷积神经网络算法来进行字符识别,搭建的字符识别的卷积神经网络包含两个卷积层,两个池化层和一个全连接层,第一个卷积层通过6个尺寸为5×5的不同的卷积核对输入尺寸为28×28的字符图片进行卷积,经过第一层卷积后,原字符图片变为

24×24×6的特征图;第一个池化层采用滑动窗口为2×2的池化函数对第一个卷积层的结果进行特征再提取,经历该层池化后,变为12×12×6的特征图;第二个卷积层采用12个尺寸为5×5的不同卷积核对池化层的特征图进行特征再提取,经提取后的特征图尺寸为8×8×12;第二个池化层对第二个卷积层卷积后的特征图进行池化,池化后特征图尺寸变为4×

4×12;将第二次池化操作后的特征图输入全连接层,得到该字符的特征向量;最后将字符的特征向量进行分类并与实际数字相对应便完成了时间戳中时间字符识别;

将训练得到的卷积神经网络,对太阳色球胶片图中的时间信息中的单个字符进行识别,将识别出来的字符按顺序组合起来与原图的文件名相对应并填入Excel表中,用于后期人工核对以及建立数据库。

9.根据权利要求1所述基于深度学习的太阳胶片图像时间戳信息提取方法,其特征在于:还包括步骤4,人工核对日期:对于一段时间内的色球图像,只需要输入第一张图像的年、月、日信息,能够自动推算得出之后的每张图片的拍摄日期;中间偶尔会存在一些未进行太阳观测的日期,采用人工核对的方式,将自动生成的有误的日期信息进行修改。