欢迎来到知嘟嘟! 联系电话:13336804447 卖家免费入驻,海量在线求购! 卖家免费入驻,海量在线求购!
知嘟嘟
我要发布
联系电话:13336804447
知嘟嘟经纪人
收藏
专利号: 2020111786812
申请人: 青岛科技大学
专利类型:发明专利
专利状态:已下证
专利领域: 计算;推算;计数
更新日期:2024-02-23
缴费截止日期: 暂无
价格&联系人
年费信息
委托购买

摘要:

权利要求书:

1.基于深度学习生成文档图像集的方法,其特征在于,包括以下步骤:步骤A、向量空间投影建模:将文档图像页面中的对象视为一个序列,序列中每一个节点对应一个对象的类型,得到文档对象序列和与其一一对应的对象类型序列,并将对象类型序列重排得到其对应的二维矩阵,从而将对象类型序列从一维向量空间投影至二维向量空间;

步骤B、深度卷积生成对抗网络建模:所述对抗网络包含判别网络和生成网络;判别网络采用已有文档图像进行训练,其作用在于训练生成网络;生成网络训练好后,训练后的生成网络用以生成二维矩阵,旨在后续自动生成文档图像集;

步骤C、训练网络模型参数:对步骤B构建的对抗网络进行训练并求解网络参数;将现有文档图像中的文档对象类型序列重排为二维矩阵,用于训练判别网络;

并使用训练好的判别网络对生成网络进行训练,在对对抗网络进行训练时,具体采用以下方式:(1)利用KL散度定义网络的损失函数:

i i

其中,NS表示样本数量,1≤i≤NS;A 表示步骤A所述二维矩阵的第i个样本点;Ρ表示生成网络输入端输入的随机向量的第i个样本点;

(2)基于步骤A得到的二维矩阵作为输入训练网络,采用梯度下降法求解网络参数,梯度函数为:其中,D(para‑d)为判别网络结构,para‑d为判别网络参数;G(para‑g)为生成网络结构,para‑g为生成网络参数;

在训练过程中,首先用二维矩阵训练判别网络,并使用训练后的判别网络训练生成网络;

步骤D、生成对象类型序列:基于训练好的生成网络自动输出新的二维矩阵;然后,将该新的二维矩阵投影至一维向量空间,得到新的文档对象类型序列;

步骤E、生成文档对象内容:采集各种文档对象数据,并根据步骤D生成新的文档对象类型序列,自动生成文档对象的具体内容;

步骤F、将步骤E生成的文档转换成文档图像,生成文档图像集,所述文档图像集包含文档图像、文档对象坐标信息和文档对象具体内容。

2.根据权利要求1所述的基于深度学习生成文档图像集的方法,其特征在于:所述步骤A中,所述对象的类型包括页眉、文本、图、图注、表格、公式、页码和页脚;

(1)将文档图像页面中的若干个对象定义为文档对象序列,即:DOi,i=1,2,3...N                        (1)其中,DOi表示第i个文档对象;N表示文档对象的数量;

并将与文档对象序列对应的类型序列定义为对象类型序列,即:yi,i=1,2,3...N                         (2)yi∈{Typej|j=1,2,3...M}                       (3)其中,yi表示第i个文档对象对应的类型,M表示对象类型的数量,Typej表示类型;

(2)将每一页文档图像页面中的文档对象序列视为一个向量,将公式(1)和公式(2)表示为向量形式:DO=[DO1,DO2,DO3,...DON]                    (4)Y=[y1,y2,y3,...yN];                        (5)(3)设有p页文档图像,将第p页的文档对象序列和对象类型序列分别表示成向量形式:其中,上标p表示第p页,下标Np表示第p页中文档对象的数量,第p页的第i个对象的类型为 1≤i≤Np,第p页共有Np个文档对象,第p‑1页共有N(p‑1)个文档对象;

(4)将1~p页的对象类型序列按照页码顺序排列, 在整个序列中的位置为:其中Ni表示第i页中的文档对象个数,将式(8)投影至二维矩阵中,K表示二维矩阵的行数和列数,行数等于列数,二维矩阵的列坐标为:二维矩阵的行坐标为:

进而可以得到:

(5)对二维矩阵定义如下:

A=[ak1,k2]K×K                            (13)其中,1≤k1,k2≤K,根据式(9)~(11)将式(13)中元素与第p页的第i个对象的类型建立一一对应的关系。

3.根据权利要求1所述的基于深度学习生成文档图像集的方法,其特征在于:所述步骤B中,所述判别网络包括从左至右依次连接的四组卷积核和一个全连接层,四组卷积核使用的激活函数均为ReLU;所述生成网络包括从左至右依次连接的全连接层和四组卷积核,四组卷积核使用的激活函数分别为:ReLU、ReLU、ReLU和Tanh。