1.一种地理信息异常数据快速检测分析方法,其特征在于,该方法包括以下步骤:采集地理信息的点云数据;
对点云数据通过聚类得到若干初始聚簇;根据初始聚簇内点的分布及初始聚簇外其他点的分布,得到每个初始聚簇的分布异常因子;
根据初始聚簇在不同平面的投影点分布,获取每个初始聚簇的剖面异常因子;结合分布异常因子,得到每个初始聚簇的综合异常程度;
根据综合异常程度得到各点的自适应邻域半径,通过自适应邻域半径对点云数据重新聚类进行异常检测;
所述对点云数据通过聚类得到若干初始聚簇,包括的具体方法为:
对点云数据进行DBSCAN聚类,距离度量为点云数据中点之间的欧式距离,将三维点云数据构建为R‑tree索引结构,点云数据中每个点被插入到R‑tree中,R‑tree的节点根据点的空间位置动态地划分为子节点,根据点的R‑tree索引进行DBSCAN聚类,根据点云数据中任意两点之间的欧式距离设置邻域半径;该次聚类为第一次聚类,通过该次聚类得到若干聚簇,记为初始聚簇;
所述得到每个初始聚簇的分布异常因子,包括的具体方法为:
根据初始聚簇内点的分布及初始聚簇外点的分布,以及邻域半径,获取每个初始聚簇的最小外接立方体及若干层外围邻域;对于任意一个初始聚簇,该初始聚簇的分布异常因子 的计算方法为:,
其中, 表示该初始聚簇中点的数量, 表示该初始聚簇的最小外接立方体的体积,表示该初始聚簇内每个点与该初始聚簇内其他点之间的欧式距离最小值, 表示该初始聚簇中所有点的 的方差,表示该初始聚簇的外围邻域层数, 表示该初始聚簇的第 层外围邻域中点的数量, 表示该初始聚簇的第 层外围邻域中点的数量;为超参数, 表示求绝对值, 表示以自然常数为底的指数函数, 、 及 为参考权重;
所述每个初始聚簇的剖面异常因子,具体的获取方法为:
根据初始聚簇在xy面、xz面及yz面的投影中投影点的分布,得到每个初始聚簇在每个面上若干条直线及每条直线上投影点的数量与分布长度,以及初始聚簇在每个面内的任意两个投影点的欧式距离;对于任意一个初始聚簇,该初始聚簇的剖面异常因子 的计算方法为:,
其中,表示平面的数量, 表示该初始聚簇在第 个平面内每个投影点与其他投影点之间的欧式距离最小值, 表示对该初始聚簇在第 个平面内所有投影点的 的方差, 表示该初始聚簇在第 个平面投影得到的直线数量, 表示该初始聚簇在第 个平面投影得到的第 条直线的分布长度, 表示该初始聚簇在第 个平面投影得到的第 条直线上投影点的数量; 为超参数, 表示以自然常数为底的指数函数, 与 为分配权重;
所述得到每个初始聚簇在每个面上若干条直线及每条直线上投影点的数量与分布长度,以及初始聚簇在每个面内的任意两个投影点的欧式距离,包括的具体方法为:对于任意一个初始聚簇,获取该初始聚簇中所有点分别在xy面、xz面及yz面的投影,记为每个点在对应面的投影点,获取该初始聚簇在每个面内的任意两个投影点的欧式距离;
通过对初始聚簇在每个平面内投影点进行霍夫变换,获取每个初始聚簇在每个面上若干条直线,以及每条直线上投影点的数量与分布长度;
所述每个初始聚簇在每个面上若干条直线,以及每条直线上投影点的数量与分布长度,具体的获取方法为:对于任意一个初始聚簇及任意一个面,对该初始聚簇内所有点在该面的投影点进行霍夫变换,得到若干直线,得到每条直线包含投影点的数量;
对得到的每条直线转换回该面中,将任意一条直线上距离最远的两个投影点之间的欧式距离,作为该条直线的分布长度;
所述根据综合异常程度得到各点的自适应邻域半径,包括的具体方法为:
对于任意一个初始聚簇,将该初始聚簇的综合异常程度与第一次聚类设定的邻域半径相乘,得到的乘积记为该初始聚簇的自适应邻域半径,将自适应邻域半径赋予到该初始聚簇每个点,得到该初始聚簇中每个点的自适应邻域半径。
2.根据权利要求1所述的一种地理信息异常数据快速检测分析方法,其特征在于,所述每个初始聚簇的最小外接立方体及若干层外围邻域,具体的获取方法为:对于任意一个初始聚簇,获取该初始聚簇中所有点的坐标中x轴最小值及最大值、y轴最小值及最大值,以及z轴最小值及最大值,根据得到的三个坐标轴上的最小值及最大值,构建该初始聚簇的最小外接立方体;
预设外围邻域层数,获取该初始聚簇的中心点,以邻域半径为初始球面半径,步长为邻域半径,共迭代外围邻域层数次,得到若干球面半径,根据中心点与每个球面半径得到若干球面,将第二个得到的球面与第一个得到的球面之间的空间记为该初始聚簇的第一层外围邻域,将第三个得到的球面与第二个得到的球面之间的空间记为该初始聚簇的第二层外围邻域,得到该初始聚簇的若干层外围邻域。
3.根据权利要求1所述的一种地理信息异常数据快速检测分析方法,其特征在于,所述得到每个初始聚簇的综合异常程度,包括的具体方法为:对于任意一个初始聚簇,将该初始聚簇的分布异常因子与剖面异常因子的均值,作为该初始聚簇的综合异常程度。
4.根据权利要求1所述的一种地理信息异常数据快速检测分析方法,其特征在于,所述通过自适应邻域半径对点云数据重新聚类进行异常检测,包括的具体方法为:通过各点的自适应邻域半径,对点云数据中所有点重新进行DBSCAN聚类,得到若干聚簇,记为若干最终聚簇;根据最终聚簇中点的分布,对点云数据进行异常检测。