欢迎来到知嘟嘟! 联系电话:13095918853 卖家免费入驻,海量在线求购! 卖家免费入驻,海量在线求购!
知嘟嘟
我要发布
联系电话:13095918853
知嘟嘟经纪人
收藏
专利号: 2018102877707
申请人: 杭州连银科技有限公司
专利类型:发明专利
专利状态:已下证
专利领域: 计算;推算;计数
更新日期:2024-04-18
缴费截止日期: 暂无
价格&联系人
年费信息
委托购买

摘要:

权利要求书:

1.一种基于去隐私数据的金融贷款大数据风险评估方法,其特征在于,包括:获取目标客户的历史交易信息数据;对所述历史交易信息数据进行分类处理,将所述历史交易信息数据划分为账户信息数据和交易信息数据;建立账户信息数据和交易信息数据的分类参考集合,从历史已经成功提取的数据积累当中,提取一定数量已知的账户信息数据和交易信息数据,分别汇合为账户信息数据和交易信息数据的分类参考集合;对账户信息数据和交易信息数据的集合当中的原始信息进行语法分词,并参照停用词表去除停用词;对于账户信息数据和交易信息数据的分类参考集合当中的关键词,根据预设的语料库扩展其同义词,扩充形成由每个关键词及其同义词组成的分类参考集合;  对于待提取的原始交易信息数据,执行分词、去除停用词和同义词扩展处理,获得待分类的关键词集合,然后查询该关键词集合与各个分类参考集合相对应的匹配度,取匹配度最大的分类参考集合,根据该分类参考集合是属于账户信息数据还是属于交易信息数据,将当期待分类的关键词判定为属于账户信息数据还是属于交易信息数据;其中,计算匹配度的公式如下:其中,M表示待分类关键词集合与某一个分类参考集合的匹配度,tk表示待分类关键词集合,tc表示分类参考集合;f(tk) ,f(tc)分别表示待分类关键词集合、分类参考集合中的词数量,f(tk,tc)表示待分类关键词集合、分类参考集合二者当中相同的词数量;生成所述账户信息数据的替代信息数据,并建立所述账户信息数据和所述替代信息数据的对应关系;用所述替代信息数据替换所述账户信息数据,并根据所述交易信息数据和所述替代信息数据对所述目标客户的收支情况进行分析处理,生成处理结果,所述处理结果包括所述替代信息数据和收支能力分析结果;基于所述对应关系,将所述处理结果中的替代信息数据替换为所述账户信息数据,并生成最终的收支能力评估结果;所述对所述历史交易信息数据进行分类处理,将所述历史交易信息数据划分为账户信息数据和交易信息数据,具体包括:基于所述历史交易信息数据中的关键词,对所述历史交易信息数据进行分类处理,将所述历史交易信息数据划分为账户信息数据和交易信息数据。2.根据权利要求1所述的方法,其特征在于,所述获取目标客户的历史交易信息包括:基于关键字段从数据库中筛选关于所述目标客户的交易记录,生成所述目标客户的历史交易信息数据。3.根据权利要求1所述的方法,其特征在于,所述历史交易信息数据包括账户信息、账户类型和交易记录,所述将所述历史交易信息数据划分为账户信息数据和交易信息数据,包括:将所述账户信息和所述账户类型划分为账户信息数据,将所述交易记录划分为交易信息数据。4.根据权利要求1所述的方法,其特征在于,所述生成所述账户信息数据的替代信息数据,并建立所述账户信息数据和所述替代信息数据的对应关系,具体包括:将随机生成的字符串作为所述替代信息数据,并建立所述替代信息数据和所述账户信息数据的索引,对所述索引进行存储。5.根据权利要求4所述的方法,其特征在于,所述基于所述对应关系,将所述处理结果中的替代信息数据替换为所述账户信息数据,并生成最终的收支能力评估结果,具体包括:基于所述索引,根据所述替代信息数据查找对应的账户信息数据,并将所述处理结果中的替代信息数据替换为所述账户信息数据,将所述账户信息数据和对应的收支能力分析结果作为最终的收支能力评估结果。6.一种基于去隐私数据的金融贷款大数据风险评估系统,其特征在于,包括:信息获取模块,用于获取目标客户的历史交易信息数据;信息分类模块,用于对所述历史交易信息数据进行分类处理,将所述历史交易信息数据划分为账户信息数据和交易信息数据;建立账户信息数据和交易信息数据的分类参考集合,从历史已经成功提取的数据积累当中,提取一定数量已知的账户信息数据和交易信息数据,分别汇合为账户信息数据和交易信息数据的分类参考集合;对账户信息数据和交易信息数据的集合当中的原始信息进行语法分词,并参照停用词表去除停用词;对于账户信息数据和交易信息数据的分类参考集合当中的关键词,根据预设的语料库扩展其同义词,扩充形成由每个关键词及其同义词组成的分类参考集合;  对于待提取的原始交易信息数据,执行分词、去除停用词和同义词扩展处理,获得待分类的关键词集合,然后查询该关键词集合与各个分类参考集合相对应的匹配度,取匹配度最大的分类参考集合,根据该分类参考集合是属于账户信息数据还是属于交易信息数据,将当期待分类的关键词判定为属于账户信息数据还是属于交易信息数据;其中,计算匹配度的公式如下:其中,M表示待分类关键词集合与某一个分类参考集合的匹配度,tk表示待分类关键词集合,tc表示分类参考集合;f(tk) ,f(tc)分别表示待分类关键词集合、分类参考集合中的词数量,f(tk,tc)表示待分类关键词集合、分类参考集合二者当中相同的词数量;信息替代模块,用于生成所述账户信息数据的替代信息数据,并建立所述账户信息数据和所述替代信息数据的对应关系;分析处理模块,用于用所述替代信息数据替换所述账户信息数据,并根据所述交易信息数据和所述替代信息数据对所述目标客户的收支情况进行分析处理,生成处理结果,所述处理结果包括所述替代信息数据和收支能力分析结果;信息还原模块,用于基于所述对应关系,将所述处理结果中的替代信息数据替换为所述账户信息数据,并生成最终的收支能力评估结果。7.根据权利要求6所述的系统,其特征在于,所述信息获取模块包括关键字段识别单元,所述关键字段识别单元用于基于关键字段从数据库中筛选关于所述目标客户的交易记录,生成所述目标客户的历史交易信息数据。8.根据权利要求7所述的系统,其特征在于,所述信息分类模块包括关键词识别单元,所述关键词识别单元用于基于所述历史交易信息数据中的关键词,对所述历史交易信息数据进行分类处理,将所述历史交易信息数据划分为账户信息数据和交易信息数据。9.根据权利要求7所述的系统,其特征在于,所述历史交易信息数据包括账户信息、账户类型和交易记录,所述将所述历史交易信息数据划分为账户信息数据和交易信息数据,包括:将所述账户信息和所述账户类型划分为账户信息数据,将所述交易记录划分为交易信息数据。