欢迎来到知嘟嘟! 联系电话:13336804447 卖家免费入驻,海量在线求购! 卖家免费入驻,海量在线求购!
知嘟嘟
我要发布
联系电话:13336804447
知嘟嘟经纪人
收藏
专利号: 2024101098778
申请人: 江西师范大学
专利类型:发明专利
专利状态:已下证
专利领域: 计算;推算;计数
更新日期:2025-12-26
缴费截止日期: 暂无
价格&联系人
年费信息
委托购买

摘要:

权利要求书:

1.一种基于对比学习的中学几何问题自动求解方法,其特征在于:方法步骤如下:步骤S1,数据集构建:收集若干道中学几何题及答案;并分别按照训练集、验证集、测试集对收集若干道几何题及答案进行划分,得到所需的中学几何数据集;

步骤S2,任务形式化定义:给定包含N条中学几何数据集,经过题型分类器划分成:无图中学几何题数据集B和有图中学几何题数据集C;

步骤S3, 无图中学几何题数据集B中有y道需要自己作图的几何题型by和有图中学几何题数据集C中z道自带图形的几何题型cz输入到中学几何问题自动求解模型中的BERT特征编码器中;获取中学几何题题干中的所有字嵌入特征向量;

步骤S4,将BERT特征编码器获得的无图中学几何题题干中的字嵌入特征向量输入到几何图像生成器中,几何图像生成器基于对比学习模型训练与微调得到,用于生成中学几何题所需要的几何图形,采用人工监督的方式进行对比学习模型训练,通过均方误差损失函数计算几何图形生成损失Lprior,优化更新BERT特征编码器和几何图像生成器的参数,获得几何图形;

步骤S5,将BERT特征编码器获得的有图中学几何题题干中的字嵌入特征向量以及无图中学几何题和几何图像生成器所生成对应的几何图形输入到有图解题器中,然后有图解题器中内含的图形编码器将几何图形进行编码并特征提取,与BERT特征编码器的字嵌入特征向量进行中学几何题干与几何图形的对齐操作得到最终的多模态特征向量;

步骤S6,有图解题器中的程序解码器在多模态特征向量的引导下顺序生成解题程序,采用负对数似然损失函数计算解题错误的生成损失Lg,得到准确率高的解题答案;

步骤S7,将几何图像生成器和有图解题器合在一起测试,形成一个既能解决需要自己作图的无图几何题型,也能解决自带图形的几何题型的统一大模型;

步骤S4中的几何图像生成器,具体内容包括:

步骤S41,输入数据到几何图像生成器中,输入数据为无图中学几何题题干中的相应字嵌入特征向量;

步骤S42,几何图像生成器是改编的对比学习模型,对比学习模型是一个文本‑图像对的分类模型,对对比学习模型进行训练和微调来达到生成几何图像的下游任务;

步骤S43,对对比学习模型进行训练:

收集并整理有图几何题数据集,得到中学几何题干和对应的几何图形;

w

分别对中学几何题干和对应的几何图形进行特征提取得到字嵌入特征向量ei和几何CNN图形特征h ,形成文本‑图像对;

将文本‑图像对的特征输入到文本‑图像对的分类模型中去做对比学习,在人工监督的情况下将其中互相匹配的文本‑图像对标记为正样本,不匹配的文本‑图像对标记为负样本;

文本‑图像对的分类模型能通过正样本、负样本得到中学几何题干和对应的几何图形,w CNN即给出一个字嵌入特征向量ei找出对应的几何图形特征h ;

步骤S44,对对比学习模型进行微调:

定义文本为x, 几何图形为y,产生的图形编码引入Prior: ,计算过程如公式(2)所示,其中Prior产生的图形编码由对比学习模型的图形编码当作真值训练得到;

        (2);

其中, 表示根据本文x来生成几何图形y;  表示为经过对比学习模型w CNN

训练后,能够根据字嵌入特征向量ei来生成几何图形特征h ;  表示根据文本CNN CNNx找到几何图形特征h ,然后将几何图形特征h 解码生成几何图形y;  表示CNN为根据文本x找到几何图形特征h 以及解码后对应的几何图形y, 表示为根据文CNN本x找到几何图形特征h ;

步骤S45,几何图形生成损失Lprior:根据对对比学习模型微调中的Prior,采用均方误差损失函数进行几何图形的预测,计算过程如公式(3)所示;

             (3);

其中,Lprior表示几何图形生成损失, 表示将前i次几何图形生成损失进行求和,T为次CNN CNN数,h(i) 表示为第i次生成的几何图形特征h ; 表示用文本x来第i次生成的几CNN何图形特征h(i) ; 表示用文本x来第i次生成的几何图形特征CNN CNN

h(i) 与几何图形特征h 做差,其中 为可调的参数量。

2.根据权利要求1所述的一种基于对比学习的中学几何问题自动求解方法,其特征在于:步骤S1中数据集构建,收集若干道中学几何题型及答案,执行以下任务;具体为:步骤S11,去除重复的中学几何题型及答案;

步骤S12,将中学几何题型及答案分类成两种几何题型,有图形的自动分类为有图中学几何题,只有题干而没有几何图形的分类为无图中学几何题;

步骤S13,对中学几何题型进行分类检验,即对同一中学几何题型分类结果采用人工检查和校验;

步骤S14,经过人工检查和校验后,按照训练集:验证集:测试集的比例=8:1:1对中学几何题型及答案进行划分;

步骤S15,中学几何题型及答案进行划分后,将训练集以及验证集的中学几何题型进行人工的解题标注;根据答案将解题步骤提炼出来,采用人工方式将解题步骤标注成计算机能识别的程序语言。

3.根据权利要求2所述的一种基于对比学习的中学几何问题自动求解方法,其特征在于:步骤S3中的BERT特征编码器,使用Transformer模型架构中的编码器模块,由多层双向编码器组成,计算过程如公式(1)所示;

                        (1);

w

其中,ei为第i个字令牌wi经过BERT特征编码器得到的相应字嵌入特征向量。

4.根据权利要求3所述的一种基于对比学习的中学几何问题自动求解方法,其特征在于: 步骤S5中有图解题器,包含双向LSTM层、图形编码器、联合推理模块以及程序解码器四大模块;具体内容包括:步骤S51,输入数据到有图解题器中,输入数据包括BERT特征编码器获得的有图中学几何题题干中的字嵌入特征向量以及无图中学几何题和几何图像生成器所生成对应的几何图形;

步骤 S52,双向LSTM层:BERT特征编码器获得的有图中学几何题题干中的字嵌入特征w向量ei输入到双向LSTM层中,利用双向 LSTM层获取数学几何文本中第i字对应的上下文语w义特征向量,即将字嵌入特征向量ei 分别对应输入到前向的LSTM层和后向的LSTM层中,如公式(4)所示;

             (4);

LSTM

其中,hi 为数学几何文本中第i字对应的上下文语义特征向量,LSTMf、LSTMb分别表示前向LSTM层的输出向量和后向LSTM层的输出向量, 表示级联操作;

CNN

步骤S53,图形编码器:采用CNN卷积神经网络的方式来提取几何图像特征h ,CNN卷积神经网络包括卷积层、非线性激活函数和池化层组件;在卷积层中通过滑动卷积核对几何图像进行卷积操作,捕捉局部特征;同时引入非线性激活函数,增加CNN卷积神经网络的表达能力,池化层组件降低特征图的维度,保留几何图形的关键特征;多层堆叠的卷积层使CNNCNN卷积神经网络逐渐提取更高级别的几何特征;通过全连接层得到几何图形特征h ;

LSTM

步骤 S54,联合推理模块:通过注意力机制将第i字对应的上下文语义特征向量hi 与CNN几何图形特征h 进行融合,实现跨界语义融合和对齐,获得蕴含注意力机制的第i字对应LSTM CNN的上下文语义特征向量hi 与几何图形特征h 信息的第i个字对应的多模态特征向量Mi,计算过程如公式(5)、公式(6);

             (5);

              (6);

其中,Attention表示注意力机制,Q、K、V分别表示查询向量、键向量和值向量,Softmax为归一化指数函数,dd为查询向量Q、键向量K的第二维度大小, 、 、 分别表示自注意力机制时第i字对应的查询向量Q、键向量K和值向量V的投影参数矩阵;令 、,其中 为线性层学习的参数矩阵,D表示转置;

步骤 S55,程序解码器:多模态特征向量Mi馈入线性层以获得初始状态s0,双向LSTM层在时间步长t处的隐藏状态st与关注结果级联,用Softmax函数馈送到线性层,以预测下一个程序令牌Pt的分布。

5.根据权利要求4所述的一种基于对比学习的中学几何问题自动求解方法,其特征在于:步骤S6中生成损失Lg采用目标程序的负对数似然,其计算公式如(7)所示;

)  ;

其中,θ是损失函数的参数,是程序令牌,yt为要生成t时刻的目标程序,yt‑1为要生成t‑1时刻的目标程序,Mi是多模态特征向量。

6.根据权利要求5所述的一种基于对比学习的中学几何问题自动求解方法,其特征在于:中学几何问题自动求解模型,分为BERT特征编码器、几何图像生成器、有图解题器和统一大模型四大模块,BERT特征编码器分别串行几何图像生成器与有图解题器,几何图像生成器与有图解题器呈并行结构,之后串行统一大模型。