1.一种基于BCS-DBSCAN的出租车载客热点可视化方法,其特征在于,包括以下步骤:(1)对数据进行清洗,提取GPS数据轨迹中的上车数据点和下车数据点;
(2)将提取的上车数据点或下车数据点写入轨迹点队列并分组后放入线程池中进行聚类,根据设定的扫描半径和最小簇点数采用DBSCAN算法聚类,并对每个类簇内的相关样本点的簇号属性标记簇序号;
(3)对每个簇内各点进行密度计算,找出簇中密度最大点的作为簇心;
(4)清空轨迹点队列,并将簇心集合重新写入轨迹点队列中再次分组聚类、找出簇心,直到最终簇心集合数量达到设定的载客热点数量范围;
(5)遍历最后一次轨迹点队列中的所有轨迹点,通过各类簇序号标记,分别统计出各类簇中的样本点数量,得到相应类簇中心对应的区域热力;热力值在热力图可视化中反应当前高亮区域颜色的指数;
(6)对各类簇样本点数量进行聚类,选取聚类中心结果中最大值作为全局热力图最高热力值;
(7)设定热力图最高热力值,结合各类簇簇心和样本点数量对城市地图中载客热点热力图进行渲染,实现出租车上车或下车热点可视化。
2.根据权利要求1所述的基于BCS-DBSCAN的出租车载客热点可视化方法,其特征在于,还包括:通过兴趣点POI逆地址解析,将簇心集合转化为相应的实际真实地理位置数据集,结合各载客热点热力值,输出至Excel表格。
3.根据权利要求1所述的基于BCS-DBSCAN的出租车载客热点可视化方法,其特征在于,步骤(1)中对数据进行清洗包括剔除干扰数据,方法为:设定出租车最大行驶速度为Vmax;在GPS数据轨迹中提取一段时间内的GPS数据轨迹点,记为GPS轨迹序列{p1,p2,...,pk},k为序列中的轨迹点数;选择保留满足下式的GPS数据轨迹点:式中:distance(pi+1,pi)表示pi+1到pi的地球曲面距离;tpi表示采集pi轨迹点的时间,(tpi+1-tpi)表示pi+1点到pi点之间的时间差;
若pi不满足上式,则pi为跳变点,剔除该GPS数据轨迹点。
4.根据权利要求1所述的基于BCS-DBSCAN的出租车载客热点可视化方法,其特征在于,步骤(3)找出簇心的方法为:在获取类簇操作时,记录每一簇内节点的邻居点集中点的个数;对每一簇内的点进行密度计算,所述密度为该点的邻居点个数占簇内总点数的比例;找出簇中密度最大即所含邻居节点数最多的点,作为该簇的簇心。
5.根据权利要求1所述的基于BCS-DBSCAN的出租车载客热点可视化方法,其特征在于,步骤(3)中根据两个数据点之间的曲面距离来发现扫描半径内的邻居节点;其中确定两个数据点之间的曲面距离的方法为:设两个数据点之间的曲面距离为L,则:
a=lat1-lat2
b=lon1-lon2
式中,lat1表示第一个数据点的纬度,lat2表示第二个数据点的纬度,lat1表示第一个轨迹点的经度,lat2表示第二个轨迹点的经度,R表示地球半径。
6.根据权利要求1所述的基于BCS-DBSCAN的出租车载客热点可视化方法,其特征在于,GPS数据点设有簇号属性和簇心属性;所述簇号为类簇编号,是每一类簇唯一的标识,用于区分各个类簇;所述簇心属性用于标记计算出的类簇中心点。
7.根据权利要求1所述的基于BCS-DBSCAN的出租车载客热点可视化方法,其特征在于,步骤(6)中采用K-Means++算法对各类簇样本点数量进行聚类。
8.一种基于BCS-DBSCAN的出租车载客热点可视化系统,其特征在于,包括:预处理模块,用于对数据进行清洗,提取GPS数据轨迹中的上车数据点和下车数据点;
多线程分块循环聚类模块,用于将提取的上车数据点或下车数据点写入轨迹点队列并分组后放入线程池中进行聚类,根据设定的扫描半径和最小簇点数采用DBSCAN算法聚类,并对每个类簇内的相关样本点的簇号属性标记簇序号;对每个簇内各点进行密度计算,找出簇中密度最大点的作为簇心;以及,清空轨迹点队列,并将簇心集合重新写入轨迹点队列中再次分组聚类、找出簇心,直到最终簇心集合数量达到设定的载客热点数量范围;
热点区域及热力确定模块,用于遍历最后一次轨迹点队列中的所有轨迹点,通过各类簇序号标记,分别统计出各类簇中的样本点数量,得到相应类簇中心对应的区域热力;热力值在热力图可视化中反应当前高亮区域颜色的指数;
最高热力值确定模块,用于对各类簇样本点数量进行聚类,选取聚类中心结果中最大值作为全局热力图最高热力值;
以及,热力图渲染模块,用于设定热力图最高热力值,结合各类簇簇心和样本点数量对城市地图中载客热点热力图进行渲染,实现出租车上车或下车热点可视化。
9.根据权利要求8所述的基于BCS-DBSCAN的出租车载客热点可视化系统,其特征在于,还包括数据导出模块,用于通过兴趣点POI逆地址解析,将簇心集合转化为相应的实际真实地理位置数据集,结合各载客热点热力值,输出至Excel表格。