1.基于决策树的店铺选址方法,其特征在于,包括:
在预设范围内获取与欲开设店铺相同类型的已有店铺的多个第一信息,多个第一信息中包括外卖送达最远距离和地理位置;
通过可视化聚类的方法对已有店铺进行聚类,以将已有店铺分为k个簇,得到簇集A={A1、A2、…、Ak},每个簇包含符合相应簇条件的多个已有店铺;
根据外卖送达最远距离划定每个簇的影响范围Ω,获取两个或两个以上簇影响范围相交区域的集合获取所有处于两个或两个以上簇影响范围相交区域中的待出租门面的多个第一信息;
使用已有店铺的多个第一信息构建CART决策树模型;
将待出租门面的多个第一信息输入CART决策树模型,得到最佳店铺选址;
多个第一信息中还包括盈利额,使用已有店铺的多个第一信息构建CART决策树模型的过程包括:S1、以盈利额为因变量因素,以其他第一信息为自变量因素,通过计算皮尔森相关系数的方法得出已有店铺的多个第一信息中,盈利额分别与其他第一信息的相关系数;
S2、计算已有店铺的每个其他第一信息的数据集方差,选择方差小于第一预设值且相关系数大于第二预设值的其他第一信息,组成特征集Z;
S3、从特征集Z中选择方差最小的其他第一信息作为CART决策树结点,在该结点数据集中选择能使分裂后左右子数据集的总方差最小的数值进行结点分裂;
S4、重复S3,直至当分裂后,结点的数据量小于第三预设值时,结点停止分裂;
将待出租门面的多个第一信息输入CART决策树模型,得到最佳店铺选址的过程包括:将每一待出租门面的多个第一信息输入CART决策树模型中,得到该待出租门面的环境分支归类,统计每个环境分支归类中包含的待出租门面的数量,选取包含最多待出租门面数量的环境分支归类作为最佳店铺选址环境,而最佳店铺选址环境中包含的待出租门面地理位置即均为最佳店铺选址。
2.如权利要求1所述的基于决策树的店铺选址方法,其特征在于,获取已有店铺的多个第一信息后,还对已有店铺的多个第一信息进行归一化处理。
3.如权利要求1所述的基于决策树的店铺选址方法,其特征在于,所述第一信息还包括:人流量、交通情况和顾客消费信息;
其中,所述地理位置为经纬度,所述人流量为预设时长内每天采集到的门前道路人流量数据的平均值,所述交通情况为预设时长内每天采集到的门前道路交通堵塞值的平均值,所述交通堵塞值为门前道路每天堵塞时长与24h的比值,所述顾客消费信息为预设时长内每天采集到的交易订单总数的平均值,所述盈利额为预设时长内每天采集到的盈利额数据的平均值;
将每一待出租门面的多个第一信息输入CART决策树模型时,待出租门面的盈利额由待出租门面所在簇中的多个已有店铺的盈利额均值替代,待出租门面的顾客消费信息由待出租门面所在簇中的多个已有店铺的顾客消费信息均值替代。
4.如权利要求1所述的基于决策树的店铺选址方法,其特征在于,S1中盈利额与其他第一信息的相关系数的计算公式为:(q)
其中,x 为第q个其他第一信息,y为盈利额,xpq为第p个已有店铺的第q个其他第一信息,yp为第p个已有店铺的盈利额值, 为所有已有店铺的第q个其他第一信息的数据均值,为所有已有店铺的盈利额的数据均值,n为第q个其他第一信息的数据量,σx(q)为第q个第一信息的数据标准差,σy为盈利额的数据标准差。
5.如权利要求4所述的基于决策树的店铺选址方法,其特征在于,S2中已有店铺的每个其他第一信息的数据集方差的计算公式为:
6.如权利要求5所述的基于决策树的店铺选址方法,其特征在于,所述第一预设值为其中,m为除盈利额外的其他第一信息的种类总数。
7.如权利要求6所述的基于决策树的店铺选址方法,其特征在于,所述第二预设值为
0.6。
8.如权利要求7所述的基于决策树的店铺选址方法,其特征在于,所述第三预设值为
10。