欢迎来到知嘟嘟! 联系电话:13095918853 卖家免费入驻,海量在线求购! 卖家免费入驻,海量在线求购!
知嘟嘟
我要发布
联系电话:13095918853
知嘟嘟经纪人
收藏
专利号: 2020112255539
申请人: 长安大学
专利类型:发明专利
专利状态:已下证
专利领域: 计算;推算;计数
更新日期:2024-01-05
缴费截止日期: 暂无
价格&联系人
年费信息
委托购买

摘要:

权利要求书:

1.一种基于峰值聚类高速公路收费数据异常事件检测方法,用于对待检测的高速公路一段时间内的异常事件类型进行检测,其特征在于,所述的方法按照以下步骤执行:步骤1、获取待检测的高速公路一段时间内的原始高速公路收费数据集;

步骤2、对所述的数据集进行数据质量提升,获得数据质量提升后的数据集;

步骤3、将所述的数据质量提升后的数据集输入至检测模型中,获得异常事件数据;

其中所述的检测模型包括依次连接的聚类层、插值层以及检测层;

所述的聚类层用于对所述的数据质量提升后的数据集进行聚类,获得多个数据簇;

所述的插值层用于对每一个数据簇进行插值修复,获得多个修复后的数据簇,获得修复后的数据集;

所述的检测层用于采用快速峰值聚类算法对所述的修复后的数据集进行分类,获得异常事件数据;

其中所述的快速峰值聚类算法的簇中心集采用以下步骤获得:步骤a、采用式Ⅰ计算修复后的数据集中第i个数据的特征值γi,其中i=1,2,3,…,n,n表示修复后的数据集中数据的个数,n为正整数:γi=ρi×δi                        式Ⅰ其中ρi为第i个数据的局部密度的值,δi为第i个数据的簇中心距离的值;

步骤b、重复步骤a,直至获得n个特征值;

步骤c、对步骤b获得的所有特征值进行降序排列,获得特征值序列;

步骤d、获得特征值序列中所有特征值斜率差的平均值β;

步骤e、采用式Ⅱ获得第一特征值点的序号p:

p=max{a|||ka|-|ka+1||≥β,a=1,2,…,n-2}       式Ⅱ其中ka表示第a个特征值与第a+1个特征值之间的斜率;

步骤f、采用式Ⅲ获得伪簇中心集中每一个伪簇中心点的序号集合SP:SP={q|γq≥γp,q=1,2,…,p}               式Ⅲ其中q表示伪簇中心的序号,q∈i,p∈i;

步骤g、根据步骤f获得的序号集合SP,获得伪簇中心集;

步骤h、构建簇中心集,所述的簇中心集的初始值为空集;

步骤i、将步骤g获得的伪簇中心集中特征值最大的一个点作为初始簇中心点放入簇中心集中后,将所述的初始簇中心点从伪簇中心集中剔除;

步骤j、对于伪簇中心集中的任一伪簇中心点,计算该伪簇中心点与簇中心集中每个簇中心点的距离,若该伪簇中心点与簇中心集中每个簇中心点的距离均大于最小簇间距离,则将该伪簇中心点放入簇中心集后返回步骤j,直至对伪簇中心集中每一个伪簇中心点都进行了步骤j的处理后,获得所述的簇中心集;

步骤4、根据所述的异常事件数据,获得异常事件类型。

2.如权利要求1所述的基于峰值聚类高速公路收费数据异常事件检测方法,其特征在于,所述的步骤2中对所述的数据集进行数据质量提升时,采用式Ⅳ对每一个数据进行处理:其中,xj*表示第j个数据经过数据质量提升后的值,xj表示第j个数据的值,xmin表示数据集中的最小值,xmax表示数据集中的最大值。

3.如权利要求2所述的基于峰值聚类高速公路收费数据异常事件检测方法,其特征在于,所述的聚类层对所述的数据集进行聚类时,采用K均值聚类算法,获得多个数据簇。

4.如权利要求3所述的基于峰值聚类高速公路收费数据异常事件检测方法,其特征在于,所述的插值层对每一个数据簇进行插值修复时,采用拉格朗日插值方法、平均插值方法以及牛顿插值方法分别对每一个数据簇进行插值修复,获得每一个数据簇对应的三种插值结果;将每一个数据簇对应的三种插值结果进行融合,获得每一个数据簇对应的修复后的数据簇,获得多个修复后的数据簇。

5.如权利要求4所述的基于峰值聚类高速公路收费数据异常事件检测方法,其特征在于,所述的将每一个数据簇对应的三种插值结果进行融合时,采用均值法。

6.一种基于峰值聚类高速公路收费数据异常事件检测装置,用于对待检测的高速公路一段时间内的异常事件进行检测,其特征在于,所述的装置包括数据获取模块、数据质量提升模块、数据检测模块以及类型检测模块;

所述的数据获取模块用于获取待检测的高速公路一段时间内的原始高速公路收费数据集;

所述的数据质量提升模块用于对所述的数据集进行数据质量提升,获得数据质量提升后的数据集;

所述的数据检测模块用于将所述的数据质量提升后的数据集输入至检测模型中,获得异常事件数据;

其中所述的检测模型包括依次连接的聚类层、插值层以及检测层;

所述的聚类层用于对所述的数据质量提升后的数据集进行聚类,获得多个数据簇;

所述的插值层用于对每一个数据簇进行插值修复,获得多个修复后的数据簇,获得修复后的数据集;

所述的检测层用于采用快速峰值聚类算法对所述的修复后的数据集进行分类,获得异常事件数据;

所述的检测层包括簇中心确定子模块;

所述的簇中心确定子模块包括特征值计算单元、特征值序列获得单元、斜率差平均值获得单元、特征点序号获得单元、簇中心序号获得单元、伪簇中心集获得单元、簇中心集构建单元、初始簇中心点筛选单元以及簇中心集获得单元;

所述的特征值计算单元用于采用式Ⅰ计算修复后的数据集中第i个数据的特征值γi,其中i=1,2,3,…,n,n表示修复后的数据集中数据的个数,n为正整数:γi=ρi×δi                        式Ⅰ其中ρi为第i个数据的局部密度的值,δi为第i个数据的簇中心距离的值;

获得n个特征值;

所述的特征值序列获得单元用于对获得的所有特征值进行降序排列,获得特征值序列;

斜率差平均值获得单元用于获得特征值序列中所有特征值斜率差的平均值β;

所述的特征点序号获得单元用于采用式Ⅱ获得第一特征值点的序号p:p=max{a|||ka|-|ka+1||≥β,a=1,2,…,n-2}       式Ⅱ其中ka表示第a个特征值与第a+1个特征值之间的斜率;

所述的簇中心序号获得单元用于采用式Ⅲ获得伪簇中心集中每一个伪簇中心点的序号集合SP:SP={q|γq≥γp,q=1,2,…,p}               式Ⅲ其中q表示伪簇中心的序号,q∈i,p∈i;

所述的伪簇中心集获得单元用于根据获得的序号集合SP,获得伪簇中心集;

所述的簇中心集构建单元用于构建簇中心集,所述的簇中心集的初始值为空集;

所述的初始簇中心点筛选单元用于将伪簇中心集中特征值最大的一个点作为初始簇中心点放入簇中心集中后,将所述的初始簇中心点从伪簇中心集中剔除;

所述的簇中心集获得单元用于对于伪簇中心集中的任一伪簇中心点,计算该伪簇中心点与簇中心集中每个簇中心点的距离,若该伪簇中心点与簇中心集中每个簇中心点的距离均大于最小簇间距离,则将该伪簇中心点放入簇中心集,对伪簇中心集中每一个伪簇中心点都进行了计算处理后,获得所述的簇中心集;

所述的类型检测模块用于根据所述的异常事件数据,获得异常事件类型。

7.如权利要求6所述的基于峰值聚类高速公路收费数据异常事件检测装置,其特征在于,所述的数据质量提升模块对所述的数据集进行数据质量提升时,采用式Ⅳ对每一个数据进行处理:其中,xj*表示第j个数据经过数据质量提升后的值,xj表示第j个数据的值,xmin表示数据集中的最小值,xmax表示数据集中的最大值。

8.如权利要求7所述的基于峰值聚类高速公路收费数据异常事件检测装置,其特征在于,所述的聚类层对所述的数据集进行聚类时,采用K均值聚类算法,获得多个数据簇。

9.如权利要求8所述的基于峰值聚类高速公路收费数据异常事件检测装置,其特征在于,所述的插值层对每一个数据簇进行插值修复时,采用拉格朗日插值方法、平均插值方法以及牛顿插值方法分别对每一个数据簇进行插值修复,获得每一个数据簇对应的三种插值结果;将每一个数据簇对应的三种插值结果进行融合,获得每一个数据簇对应的修复后的数据簇,获得多个修复后的数据簇。

10.如权利要求9所述的基于峰值聚类高速公路收费数据异常事件检测装置,其特征在于,所述的将每一个数据簇对应的三种插值结果进行融合时,采用均值法。