1.一种信用评估模型的训练方法,其特征在于,它包括以下步骤:
S11,获取已有正确信用评估结果的用户在征信系统中的用户数据以及评估结果;
S12,对收集到的用户数据中的用户数据进行预处理,转换为数值数据;
S13,构建m个SDT子分类器,m为正整数,另构建一个SDT权重生成器,用以生成m个SDT子分类器的权重概率分布,该模型即为WSDF;
S14,利用预处理后的用户数据对具有m+1棵软决策树的WSDF模型进行端到端的训练。
2.如权利要求1所述的训练方法,其特征在于,S13具体包括:
构建m个SDT子分类器和一个SDT权重生成器,并初始化模型参数;
将所述预处理后的用户数据依次通过m个SDT子分类器,直至每个所述用户数据分配至每个SDT子分类器的叶子节点,此时每个子分类器叶子节点上的输出为预测用户信用信息好坏的概率分布;再将所述预处理后的用户数据通过SDT权重生成器,直至每个所述用户数据分配至该SDT的叶子节点,此时权重生成器每个叶子节点上的输出为对m个SDT子分类器的权重概率分布;对用户信用信息的最终预测的概率分布则为权重生成器叶子节点上的权重概率分布与每个子分类器的叶子结点的概率分布的加权求和。
3.如权利要求1所述的训练方法,其特征在于,S14中端到端的训练具体包括:设已拥有预处理后的用户数据集T,使用该数据集对S13的WSDF模型进行训练:首先,将数据集T随机划分成S组mini-batch;在每组mini-batch上分别计算本申请定义的损失函数的函数值,使用梯度下降算法进行参数更新;计算完S组mini-batch的损失函数值后,重新划分数据集并更新参数,重复N次。
4.一种通过权利要求1-3任一权利要求所述的训练方法训练出来的WSDF信用评估模型。
5.一种信用评估的方法,使用权利要求4所述的WSDF信用评估模型,其特征在于,包括以下步骤:S21,获取待信用评估的用户在征信系统中的用户数据;
S22,对收集到的用户数据中的用户数据进行预处理,转换为数值数据;
S23,使用已训练好的WSDF信用评估模型对用户的信用信息进行预测;
S24,对所述WSDF信用评估模型中的参数值进行可视化,即可得到每一棵SDT的直观决策过程。
6.如权利要求5所述的信用评估方法,其特征在于,所述使用已训练好的WSDF信用评估模型对用户进行预测,包括:将所述预处理后的用户数据依次通过所述已训练好的WSDF信用评估模型中的m个SDT子分类器,直至每个所述用户数据分配至每个SDT子分类器的叶子节点,此时每个子分类器叶子节点上的输出为预测用户信用信息好坏的概率分布;再将所述预处理后的用户数据通过SDT权重生成器,直至每个所述用户数据分配至该SDT的叶子节点,此时权重生成器每个叶子节点上的输出为对m个SDT子分类器的权重概率分布;对用户信用信息的最终预测的概率分布则为权重生成器叶子节点上的权重概率分布与每个子分类器的叶子结点的概率分布的加权求和。
7.如权利要求5所述的信用评估方法,其特征在于,S24中对所述WSDF信用评估模型中的参数值进行可视化,即可得到每一棵SDT的直观决策过程,包括:提取出除叶节点外的每个SDT内部节点的权重值,并分别按绝对值从大到小排序,即可得到影响用户信用信息权重较大的特征,若知晓用户属性的具体含义,也可以从中归纳出具有现实意义的信用评估决策规则。
8.一种信用评估模型的训练装置,用于训练权利要求4所述的WSDF信用评估模型,其特征在于,包括:数据获取模块S31,用于获取用户在征信系统中的用户数据以及评估结果,即模型训练数据;
数据预处理模块S32,用于对收集到的用户数据进行预处理;
模型构建与初始化模块S33,用于构建WSDF模型,并对模型参数初始化;
模型训练模块S34,该模块利用预处理后的用户数据对WSDF模型的参数进行迭代更新,训练出WSDF信用评估模型;
所述模型构建与初始化模块,包括:构建m个SDT子分类器和一个SDT权重生成器,并初始化模型参数;
所述模型训练模块,包括:设已拥有预处理后的用户数据集T,使用该数据集对模型进行训练:首先,将数据集T随机划分成S组mini-batch;在每组mini-batch上分别计算本申请定义的损失函数的函数值,使用梯度下降算法进行参数更新;计算完S组mini-batch的损失函数值后,重新划分数据集并更新参数,重复N次。
9.一种信用评估的装置,采用如权利要求4所述的WSDF信用评估模型,其特征在于,包括:数据获取模块S41,用于获取用户在征信系统中的用户数据以及评估结果,即模型训练数据;
数据预处理模块S42,用于对收集到的用户数据进行预处理;
预测模块S43,用于对待信用评估的用户进行预测;
可视化模块S44,用于可视化信用评估模型的具体决策过程;
所述可视化模块,包括:提取出除叶节点外每个SDT内部节点的权重值,并分别按绝对值从大到小排序,即可得到影响用户信用信息权重较大的特征,若知晓用户属性的具体含义,也可以从中归纳出具有现实意义的信用评估决策规则。
10.根据权利要求9所述的一种信用评估的装置,其特征在于,所述预测模块包括:将所述预处理后的用户数据依次通过所述WSDF信用评估模型中的m个SDT子分类器,直至每个所述用户数据分配至每个SDT子分类器的叶子节点,此时每个子分类器叶子节点上的输出为预测用户信用信息好坏的概率分布;再将所述预处理后的用户数据通过SDT权重生成器,直至每个所述用户数据分配至该SDT的叶子节点,此时权重生成器每个叶子节点上的输出为对m个SDT子分类器的权重概率分布;对用户信用信息的最终预测的概率分布则为权重生成器叶子节点上的权重概率分布与每个子分类器的叶子结点的概率分布的加权求和。