1.一种基于大数据的出租车实时巡游路线推荐系统,其特征在于:所述推荐系统包括候选路线获取模块和实时巡游路线选取模块,所述候选路线获取模块用于获取多条出租车实时巡游的候选路线,所述实时巡游路线选取模块用于从候选路线中选取实时巡游推荐路线;
所述候选路线获取模块包括起始位置读取模块、目标位置输入模块和候选路线生成模块,所述起始位置读取模块用于读取出租车当前所在位置,所述目标位置输入模块用于司机输入目标位置,所述候选路线生成模块根据出租车当前所在位置和目标位置生成若干条从当前所在位置到达目标位置的候选路线;
所述实时巡游路线选取模块包括客运中心搜索模块、人群密集指数评估模块和实时巡游推荐路线确定模块,所述客运中心搜索模块用于搜索每条候选路线上是否存在客运中心,所述人群密集指数评估模块用于评估每条候选路线上的人群密集指数,所述实时巡游推荐路线确定模块根据客运中心搜索模块的搜索结果或人群密集指数评估模块的评估结果确定实时巡游推荐路线;
所述人群密集指数评估模块包括间隔距离获取模块、间隔波动计算模块、搜索次数获取模块、搜索次数计算模块、消费人次获取模块、消费人次计算模块、路线长度获取模块、人群密集指数计算模块和候选路线排序模块,所述间隔距离获取模块用于获取每条候选路线上相邻商家之间的距离,所述间隔波动计算模块用于计算每条候选路线上相邻商家之间的距离的波动程度,所述搜索次数获取模块用于获取第一目标时间段中每条候选路线上的商家在服务器上的被搜索次数,所述搜索次数计算模块用于计算在某条候选路线上平均每个商家在服务器上被搜索的次数,所述消费人次获取模块用于获取每条候选路线上每个商家在第二目标时间段中的每天的某一时间段中的消费人次,所述消费人次计算模块用于计算在某条候选路线上的所有商家在某一时间段的平均消费人次,所述路线长度获取模块用于获取每条候选路线的长度,所述人群密集指数计算模块根据计算某条候选路线的人群密集指数,所述候选路线排序模块用于根据每条候选路线的人群密集指数进行排序评估。
2.一种基于大数据的出租车实时巡游路线推荐方法,其特征在于:所述推荐方法包括以下步骤:
S1:获取候选路线;
S2:在候选路线中选取出租车的实时巡游推荐路线;
所述推荐方法进一步包括以下步骤:
S1:读取出租车当前所在位置,司机输入目标位置,获取出租车当前位置到目标位置的所有候选路线A1、A2、A3、…An,n为候选路线的条数;
S2:搜索每条候选路线上是否存在客运中心,若存在候选路线上存在客运中心,则出租车的实时巡游推荐路线为候选路线,若不存在候选路线上存在客运中心,则评估每条候选路线的人群密集指数,并根据每条候选路线的人群密集指数选取出租车的实时巡游推荐路线;
所述步骤S2中评估每条候选路线的人群密集指数包括以下步骤:S21:分别获取每条候选路线上相邻商家之间的距离A11=[B11、B12、B13、…、B1(m1-1)]、A21=[B21、B22、B23、…、B2(m2-1)]、A31=[B31、B32、B33、…、B3(m3-1)]、…、Ai1=[Bi1、Bi2、Bi3、…、Bij、…、Bi(mi-1)]、…、An1=[Bn1、Bn2、Bn3、…、Bn(mn-1)],其中,Ai1为第i条候选路线上相邻商家之间的距离的合集,Bij为第i条候选路线上第j个商家和第j+1个商家之间的距离,m1、m2、m3、…、mi、…mn分别为候选路线A1、A2、A3、…、Ai、…、An上商家的个数,1<=i<=n,针对每条候选路线,利用下述公式计算第i条候选路线上相邻商家之间的距离的波动程度:
其中,Li为第i条候选路线上出租车当前所在位置往目标位置方向上第一个商家与最后一个商家之间的路线距离,Ei为第i条候选路线上相邻商家之间的距离的波动程度,mi为第i条候选路线上的商家的总个数;
S22:分别获取第一目标时间段T1中每条候选路线上的商家在服务器上的被搜索次数A12=[C11、C12、C13、…、C1m1]、A22=[C21、C22、C23、…、C2m2]、A32=[C31、C32、C33、…、C3m3]、…、Ai2=[Ci1、Ci2、Ci3、…、Cij、…、Cimi]、…、An2=[Cn1、Cn2、Cn3、…、Cnmn],其中,Ai2为第i条候选路线上每个商家在服务器上的被搜索次数的合集,Cij为第i条候选路线上第j个商家在服务器上被搜索次数;
针对每条候选路线,利用下述公式计算在第i条候选路线上平均每个商家在服务器上被搜索的次数:
S23:分别获取每条候选路线上每个商家在第二目标时间段T2中的每天的某一时间段T3中的消费人次,并利用下述公式计算该条候选路线上的所有商家在某一时间段T3的平均消费人次:
其中,Xi表示第i条候选路线上的所有商家在某一时间段T3的平均消费人次,Pjk为第i条候选路线上第j个商家在第二目标时间段T2中第k天的某一时间段T3中的消费人次,mi为第i条候选路线上商家的个数,T2表示第二目标时间段的天数,S24:分别获取每条候选路线的长度S1、S2、S3、…Sn,Si为第i条候选路线的长度,针对每条候选路线利用下述计算公式计算该条候选路线的人群密集指数:其中,Yi为第i条候选路线的人群密集指数,Hi为第i条候选路线上平均每个商家在服务器上被搜索的次数,Ei为第i条候选路线上相邻商家之间的距离的波动程度,Xi为第i条候选路线上的所有商家在某一时间段T3的平均消费人次;
S25:将所有候选路线的人群密集指数按照从大到小的顺序排序,取密集指数排名第一所对应的候选路线为实时巡游推荐路线;
所述客运中心包括汽车站、火车站和高铁站。