1.一种基于跨境电商平台的大数据用户挖掘方法,包括数据源、ETL数据处理单元、联机分析处理模块、序列挖掘、聚类分析、关联挖掘和决策树挖掘,其特征在于,还包括以下具体步骤:步骤一:数据源挖掘,且数据源包括内部数据和外部数据,所述外部数据包括互联网数据和物联网数据,以内部数据和外部数据建立初步的数据库;
步骤二:建立ETL数据处理单元,且ETL数据处理单元包括数据提取模块、数据转换模块和任务创建模块,所述ETL数据处理单元还包括数据加载模块和数据输出模块,将内部数据和外部数据建立汇总的初步数据库通过建立ETL数据处理单元对数据搜索所有与目标对象有关的内部和外部数据信息,并从中选择出适用于数据挖掘应用的数据;
步骤三:建立联机分析数据库,将适用于数据挖掘应用的数据通过联机分析处理模块研究数据的质量,为进一步的分析做准备,并确定将要进行的挖掘操作的类型;
步骤四:将数据转换成一个分析模型,并依次建立序列挖掘、聚类分析、关联挖掘和决策树挖掘单元,且针对挖掘算法建立分析模型,随后对得到的经过转换的数据进行挖掘;
步骤五:建立知识库,将挖掘后的数据导入知识库,以供于在软硬件领域、跨境电商网络平台和企业内部网解决方案以及数据库方面提供经济高效的计算资源,以保存极大量的数据供分析使用,并允许使用多种数据访问技术。
2.根据权利要求1所述的一种基于跨境电商平台的大数据用户挖掘方法,其特征在于:所述决策树挖掘单元是根据条件来进行判断的逻辑框架,其中,判断的条件,即提出有区分性的问题,以及对于不同的回答下一步的反映,以及最终的决策给出标签。
3.根据权利要求1所述的一种基于跨境电商平台的大数据用户挖掘方法,其特征在于:所述决策树算法为:1.选取包含所有数据的全集为算法的初始集合A0;2.对于当前的集合A,计算所有可能的“问题”在训练集上的F(A,D);3.选择F(A,D)最大的“问题”,对数据进行提问,将当前的集合由“问题”的不同回答,划分为数个子集;4.对每个子集,重复b、c,直到所有子集内所有元素的类别相同;5.在实际应用中,数据往往有很多特征,因此,“问题”往往是选取数据的某一特征,而“回答”则是此特征对应的值。
4.根据权利要求1所述的一种基于跨境电商平台的大数据用户挖掘方法,其特征在于:所述互联网数据包括跨境电商网络平台数据和线上流量。
5.根据权利要求1所述的一种基于跨境电商平台的大数据用户挖掘方法,其特征在于:所述内部数据包括企业内部业务数据,异业数据、私域裂变和员工拓客信息采集数据。