1.一种基于多元线性回归算法预测炼铁高炉炉芯死料柱温度的方法,其特征在于,其步骤为:
1)对采集到的数据进行炉芯死料柱温度目标值DMTgoal计算;所述的炉芯温度目标值的计算公式如下:
其中,约束条件为:500≤FR≤530,单位为kg/t;‑20≤Δt≤120,单位为℃;30≤Dpcoke≤
40,单位为毫米;
式中:DMT为炉芯死料柱温度;tf为理论燃烧温度;Vbosh为炉腹煤气量;D为炉缸直径;FR为燃料比;Δt为炉渣流动性指数;ηCO,C为炉身探针测得的炉中心CO利用率;Dpcoke为炉芯死料柱焦炭尺寸;
当FR=500kg/t,Δt=‑20℃,Dpcoke=30mm时,DMT取得最小值DMTmin;当FR=530kg/t,Δt=120℃,Dpcoke=40mm时,DMT取得最大值DMTmax;取DMTmin与DMTmax的均值为目标值,目标值记为DMTgoal;
2)对目标值进行处理,处理的内容包括目标值填充与目标值异常值删除;
3)分析DMTgoal与目标值处理完成的数据的相关性,并在此基础上初步选取建立多元线性回归模型的条件变量;
4)分析步骤3)中选择出来的条件变量间的相关性并选取建立多元线性回归模型的条件变量;
5)使用最小二乘法以及基于AIC的变量筛选准则筛选条件变量建立多元线性回归模型;
6)对步骤5)中得到的多元线性回归模型进行拟合优度检验与回归系数的检验,然后将模型作用于测试集,验证多元线性回归模型的有效性。
2.根据权利要求1所述的一种基于多元线性回归算法预测炼铁高炉炉芯死料柱温度的方法,其特征在于:步骤2)所述的目标值填充部分,将一天24小时内,缺失的一个小时数据按照该小时的前一个小时和后一个小时的数据的平均值填充;
目标值异常值删除部分,删除炉芯温度小于1300℃,大于1500℃的炉缸炉芯死料柱温度目标值;删除tf,Vbosh,ηCO,C异常的数据,tf,Vbosh,ηCO,C异常的判断标准为tf,Vbosh,ηCO,C各自的散点图中孤立点的数据。
3.根据权利要求2所述的一种基于多元线性回归算法预测炼铁高炉炉芯死料柱温度的方法,其特征在于:步骤3)中相关性的分析使用Pearson相关性;当二元数据样本为(x1,y1),(x2,y2),...,(xn,yn),其中,xi为变量x第i个样本的样本值,yi为变量y第i个样本的样本值,n为总样本容量;其相关性系数r定义为:其中,
样本的Pearson相关系数的绝对值越大,条件变量与目标值DMTgoal之间的相关性就越强;完成相关性分析后,观察数据中各条件变量与目标值之间的相关系数与是否通过显著性检验,当条件变量的置信度小于0.05时变量通过显著性检验;初步选取与目标值强相关的数据且通过显著性检验的变量作为条件变量来建立多元线性回归模型。
4.根据权利要求3所述的一种基于多元线性回归算法预测炼铁高炉炉芯死料柱温度的方法,其特征在于:步骤4)中相关性的分析依然使用Pearson相关性;完成相关性分析后,观察条件变量之间的相关性,如两条件变量之间的相关系数高于0.9999,且在步骤3)中得到目标值与该两条件变量之间的相关系数的差值的绝对值小于等于0.0500,在模型建立之前将其中一变量拒绝出模型,进而确定引入多元回归模型的条件变量。
5.根据权利要求4所述的一种基于多元线性回归算法预测炼铁高炉炉芯死料柱温度的方法,其特征在于:步骤5)建立的多元线性回归模型为:yi=β0+β1xi1+...+βpxip+εi,i=1,...,n其中,xip是n次不同状态下获得的条件变量,p为条件变量的总样本数,yi为目标变量,ε2
~N(0,σ),且εi都是相互独立且服从同一正态分布的随机变量。
6.根据权利要求5所述的一种基于多元线性回归算法预测炼铁高炉炉芯死料柱温度的方法,其特征在于:步骤5)中多元线性回归模型不含偏差项的估计函数形式为:Y是由n次不同状态下获得的目标变量构成的n维向量;X是由n次不同状态下样本的条件变量构成的n×(p+1)阶矩阵;
2
令 为多元线性回归方程的残差向量,基于残差向量得到σ的估计为:2
此时 被称为σ的无偏估计;
多元线性回归方程中涉及很多变量,通过检验某个变量对应的回归系数是否为0,对多元线性回归模型做显著性检验,如果为0就将该变量剔除最终的模型。
7.根据权利要求6所述的一种基于多元线性回归算法预测炼铁高炉炉芯死料柱温度的方法,其特征在于:步骤5)在条件变量的选择过程中引入AIC准则来选择最优模型,对于建立的多元线性回归模型,AIC的定义为:其中,N为样本中条件变量的个数; 是所建立模型包含的自变量个数,Q为所建立模型包含的自变量个数;在所有备选模型中,使得AIC值最小的模型被视为最优模型。