1.基于排序学习和集成学习的异常电话主动预测方法,其特征是,包括:
步骤(1):采集电话样本,提取每个电话号码的数据特征;
其中,对电话样本特征进行选择,每个电话样本特征原始的特征有53个,通过分析和组合,选取其中的9个作为基础特征,c1为用户话单覆盖天数,c2为日均主叫次数,c3为日均主叫时长,c4为日均被叫次数,c5为日均被叫时长,c6为日均长途次数,c7为日均漫游次数,c8为日均主叫联系人,c9为前9位相同;所述前9位相同是指用户拨打的电话前9位电话数字相同的电话数量;
步骤(2):将采集的电话样本分为训练集M和测试集N;所述训练集M,包括:a条正常电话号码和b条异常电话号码;所述测试集N,包括:待测试的电话号码;
步骤(3):基于排序学习算法构建排序模型,将训练集M每个电话号码的数据特征输入到排序模型中,将训练集M每个电话号码对应的设定分数作为排序模型的输出值,对排序模型进行训练,得到训练好的排序模型;
将测试集N输入到已经训练好的排序模型中,输出测试集N中每个电话号码对应的分数;将分数按照从大到小进行排序,选择排序靠前的p个电话号码作为新的测试集P;
步骤(4):从测试集N中随机选取n组电话号码,每组是q个电话号码;将每一组q个电话号码分别与b条异常电话号码组合,构成新的训练集Qi,i的取值范围是1到n;
将新的测试集P与新的训练集Qi进行组合,得到数据集Yi;
将数据集Yi输入到已经训练好的排序模型中,输出结果Zi;
步骤(5):利用集成学习中的平均法,计算结果Zi的平均值,输出最终得分。
2.如权利要求1所述的基于排序学习和集成学习的异常电话主动预测方法,其特征是,所述排序学习算法,包括:RankingSVM算法或Ranknet算法。
3.如权利要求1所述的基于排序学习和集成学习的异常电话主动预测方法,其特征是,所述电话样本,包括正常电话号码、异常电话号码和待测试的电话号码。
4.基于排序学习和集成学习的异常电话主动预测系统,包括存储器和处理器以及存储在存储器上并在处理器上运行的计算机指令,所述计算机指令被处理器运行时,完成权利要求1-3任一方法所述的步骤。
5.一种计算机可读存储介质,用于存储计算机指令,所述计算机指令被处理器执行时,完成权利要求1-3任一方法所述的步骤。