1.一种基于移动数据的车主身份识别方法,其特征在于,包括:
根据用户语音维度概率、短信维度概率和车主类Apps维度概率计算用户为车主身份的总概率,如果用户为车主身份的总概率大于第一阈值,则判断用户为车主身份。
2.根据权利要求1所述的基于移动数据的车主身份识别方法,其特征在于,根据用户语音维度概率、短信维度概率和车主类Apps维度概率计算用户为车主身份的总概率包括:根据公式,计算用户为车主身份的总概率P为:
PV表示语音维度概率,PS表示短信维度概率,PApp表示车主类Apps维度概率;WV1表示语音维度第一权重,WS1表示短信维度第一权重,WApp1表示车主类Apps维度第一权重,WS1+WV1+WApp1=1。
3.根据权利要求2所述的基于移动数据的车主身份识别方法,其特征在于,所述语音维度概率PV包括:其中,TYPE_ID表示设置语音端口号,v1表示包括车险专线及违章咨询电话;v2表示包括全国高速公路报警救援电话;v3表示包括车险、汽车品牌4s店电话;CMC表示用户与各端口的交互次数,CMS表示各语音端口一段时间内总的交互次数,PN表示一段时间内与语音维度表中端口号TYPE_ID有过交互的用户人数,weightv表示端口号TYPE_ID为v2对车主身份判定的确定度。
4.根据权利要求2所述的基于移动数据的车主身份识别方法,其特征在于,所述短信维度概率PS包括:其中,TYPE_ID表示设置短信端口号,s1表示包括违章短信发布平台、交巡警平台及ETC专用端口;s2表示包括交通服务热线;weights表示端口号TYPE_ID为s2对车主身份判定的确定度。
5.根据权利要求2所述的基于移动数据的车主身份识别方法,其特征在于,所述车主类Apps维度概率PApp包括:PApp=weightapp,Fre>3
其中,Fre表示使用相应App的次数,weightapp的设置包括:
将车主类Apps分为n类,通过设定不同的权重将n类车主类Apps分类,第1类车主类Apps到第n类车主类Apps对车主身份判定的确定度依次表示为w1,w2,...,wn。
6.根据权利要求2所述的基于移动数据的车主身份识别方法,其特征在于,语音维度第一权重WV1、短信维度第一权重WS1、车主类Apps维度第一权重WApp1采用以下方式获得:根据各维度对车主身份识别的贡献度,设定短信、语音、车主APP维度的初始权重及初始阈值,包括,短信维度第二权重WS2,语音维度第二权重WV2,车主类Apps维度第二权重WApp2,其中,WS2+WV2+WApp2=1;
采用交叉验证来调整各维度权重,得到语音维度第一权重WV1、短信维度第一权重WS1、车主类Apps维度第一权重WApp1。
7.根据权利要求6所述的基于移动数据的车主身份识别方法,其特征在于,所述交叉验证具体包括:将语音维度中与语音端口号v1有交互的用户构建为第一测试集,将第一测试集中与短信端口号有交互的用户构建为第一验证集,将第一测试集中包含车主类Apps的用户构建为第二验证集;
将短信维度中与短信端口号s1有交互的用户构建为第二测试集,将第二测试集中与语音端口号有交互的用户构建为第三验证集,将第二测试集中包含车主类Apps的用户构建为第四验证集;
把第一验证集占第一测试集的大小叫做第一占比,把第二验证集占第一测试集的大小叫做第二占比,第三验证集占第二测试集的大小叫做第三占比,把第四验证集占第二测试集的大小叫做第四占比;
计算第一验证集中与短信端口号交互的频次叫做第一频次;
计算第二验证集中车主类Apps的频次叫做第二频次;
计算第三验证集中与语音端口号交互的频次叫做第三频次;
计算第四验证集中车主类Apps的频次叫做第四频次;
比较第一占比和第二占比的大小,若第一占比大于第二占比,则增大短信维度第二权重WS2得到短信维度第一权重WS1,同时减小车主类Apps维度第二权重WApp2得到车主类Apps维度第一权重WApp1;若第三占比小于第四占比,则减小语音维度第二权重WV2得到语音维度第一权重WV1,同时增大车主类Apps维度第二权重WApp2得到车主类Apps维度第一权重WApp1;
比较第一频次与第二频次大小,若第一频次大于第二频次,则增大则增大短信维度第二权重WS2得到短信维度第一权重WS1,同时减小车主类Apps维度第二权重WApp2得到车主类Apps维度第一权重WApp1;若第三频次小于第二频次,则减小语音维度第二权重WV2得到语音维度第一权重WV1,同时增大车主类Apps维度第二权重WApp2得到车主类Apps维度第一权重WApp1。
8.根据权利要求1所述的基于移动数据的车主身份识别方法,其特征在于,所述第一阈值Pt根据所要求的车主身份识别率动态确定。