1.一种基于卷积神经网络的高校异常行为学生识别方法,其特征在于:该方法包括以下步骤:S1:获取后台数据库的原始行为数据,创建数据集;
S2:数据集预处理,划分训练集和测试集;
S3:创建多分支的卷积神经网络模型,引入DBSCAN密度聚类算法替代softmax函数作为分类输出;
S4:使用创建好的数据集来训练和测试深度神经网络模型;
S5:利用训练好的模型对待识别的数据进行分类。
2.根据权利要求1所述的一种基于卷积神经网络的高校异常行为学生识别方法,其特征在于:所述S1具体为:首先通过学校后勤中的数据库将学生在学校刷卡、电子支付、进出图书馆和进出学校记录的行为抽取出来,再清洗数据异常部分后进行数据工程,将数据进行归一化处理。
3.根据权利要求2所述的一种基于卷积神经网络的高校异常行为学生识别方法,其特征在于:所述S2具体为:基于数据集,对单个样本X,构建一个二值化的三维张量对其进行表示,即其中,t、l和d分别表示校园行为数据中含有的时段数、地点个数和天数;对数据的记录时间进行离散化,取时间区间为6点至24点,以半个小时为单位进行时间切片,将每天分为
36个时间段,则t值为36;根据已有数据维度,得出l值和d值;如果X于第k天第i时段在第J个地点存在刷卡行为,则Xijk值为1,否则为0;将构建出的数据以7∶3的比例划分为训练集和测试集。
4.根据权利要求3所述的一种基于卷积神经网络的高校异常行为学生识别方法,其特征在于:所述S3具体为:构建神经网络模型;基于以上构建的数据,将“日期”维度作为深度,设计卷积核维度为a×l,a为卷积核的高度,l为卷积核宽度,表示对学生日常行为的轨迹的特征提取,定义为:利用卷积核 对学生样本X进行卷积操作;卷积核的高度为a且深度为日期方向,对学生样本X进行卷积操作,每次卷积捕获学生在d天中相应a个时段的被记录行为,记录为:{X(i,i+a‑1}1,...,X{i,i+a‑1}(d‑1),X(i,i+a‑1}d}其中,X{i,i+a‑1}1表示第j个时间段节点开始的a个时间段内的记录的行为信息;1≤j≤d,j≤i≤t;然后,把每天在此a个时间段内的信息连接起来,形成一个三维张量,计为则卷积公式定义为:(1) (1)
其中,W 与b 为网络第一层需学习的参数,*表示卷积操作运算;f为激活函数,采用常用的ReLU激活函数,表示为:f(z)=max(0,z)
z表示函数输入值,z若大于0,则输出z,否则输出为0;
以日期为深度,构建第二个卷积核,抽取数据的变化性和周期性特征,表示为:其中l取值为1,表示每次只对一个地点的刷卡信息进行卷积操作,样本X于d天内在该地点的刷卡信息定义为:{X{addr}1,...,X{addr}(d‑1),X(addr}d}将给定的在addr的记录信息连接为序列,表示为张量 结合卷积核带入上述公式*进行卷积操作;
采用DBSCAN密度聚类算法对深度卷积神经网络抽取的多维度特征值进行聚类的过程包括:S31:从提取的特征值中已标注的目标特征值的选出核心样本点及其邻居;
S32:遍历所有筛选出的样本点,判断筛选出的样本点p是否为核心样本点,是则给p分配一个簇标签;不是核心样本点,则将样本点p标记为噪声;
S33:访问核心样本点p的所有邻居,并将点p的簇标签分配给所有邻居;
S34:判断每个被访问的邻居是否为核心样本点,若是则点p依次访问各核心样本的邻居,并将点p的簇标签分配给所有访问的邻居点,直到点p的邻居没有核心样本点为止;
S35:选取筛选出的样本点中另一个未被访问过的点,返回步骤S2重复上述过程,直至所有样本点都被分配簇标签或被标记为噪声,完成聚类。
5.根据权利要求4所述的一种基于卷积神经网络的高校异常行为学生识别方法,其特征在于:所述S4具体为:利用训练集训练该网络,迭代通过反向传播算法不断优化,调整卷积神经网络的超参数以达到最高的分类准确率。