1.一种基于密度峰值聚类特征选择的三维手写字符识别方法,其特征在于:步骤一、建立数据集,数据集包括m个手写字符的三维离散点集;
步骤二、将m个三维离散点集各自依序连接,得到m个手写字符的三维轨迹;
步骤三、对m个三维离散点集分别进行预处理;
步骤四、对预处理后的三维离散点集提取特征,特征分成三大类,分别是书写方向,曲率,坐标差,共计16个特征,具体如下:
4.1、三维离散点集中任意点的书写方向对应三个特征,分别为其相邻两点的连线与x轴、y轴、z轴夹角的余弦值;
4.2、三维离散点集中任意点的书写方向对应十个特征,分别为该点与相邻两点所成圆的圆心坐标、半径、圆心到相邻两点连线中点的向量坐标、圆心到改点与下一点连线中点的向量坐标;
4.3、三维离散点集中任意点的曲率特征对应三个特征,分别为其相邻两点的x轴、y轴、z轴的坐标差值;
步骤五、计算任意两个特征间的对称不确定性;第i个特征Xi与第j个特征Xj之间的对称不确定性SU(Xi,Xj)的表达式如式(4)所示;i=1,2,…,16;j=1,2,…,16;
式(4)中,H(Xi)、H(Xj)分别是特征Xi、Xj的信息熵,其表达式如式(5)所示;IG(Xi,Xj)表示特征Xi与特征Xj的信息增益,其表达式如式(6)所示;
H(Xi)=-∑p(xik)log2(p(xik)) 式(5)式(5)中,p(xik)表示特征Xi第k个取值xik对应的概率;
IG(Xi,Xj)=H(Xi)-H(Xi|Xj) 式(6)式(6)中,H(Xi|Xj)是条件熵,其表达式如式(7)所示;
H(Xi|Xj)=-∑p(xjl)∑p(xik|xjl)log2(p(xik|xjl)) 式(7)式(7)中,p(xik|xjl)表示特征Xj取第l个值xjl时,特征Xi取第k个值xik的概率;
步骤六、计算第i个特征的局部密度;第i个特征的局部密度ρi的表达式如式(8)所示;i=1,2,…,16;
式(8)中,1/SUij是特征Xi和特征Xj的称为距离,即对称不确定性的倒数,dc是截断距离;
χ(x)是逻辑判断函数,其表达式如式(9)所示;
步骤七、分别计算各个特征对应的高密度特征距离
对16个特征按照局部密度的大小以升序重新排序;除局部密度最大的特征外,任意一个特征Xi的高密度特征距离(δi)1≤i≤15表示特征Xi与局部密度高于特征Xi的各个特征中局部密度最小的特征Xj之间的距离,其表达式如式(10)所示;i=1,2,…,15;
局部密度最大的特征Xi的高密度特征距离(δi)i=16表示该特征Xi与其他各特征的距离的最大值,其表达式如式(11)所示;
步骤八、计算各特征的加权后的局部密度ρi与加权后的高密度特征距离δi的乘积,作为该特征的中心指标γi,具体表达式如式(12)所示;
γi=ρiω·(δi)(1-ω) 式(12)式(12)中,ω为局部密度对应的权重;
步骤九、将各个特征按照中心指标γi的大小进行降序排列;选择前a个特征为聚类中心;a为识别特征数;
步骤十、使用者进行三维手写字符采集,得到三维点集;对所得的三维点集进行特征提取,提取出与步骤九所得a个聚类中心相对应的特征值;根据该a个特征值,通过决策树模型识别出被测三维手写字符。
2.根据权利要求1所述的一种基于密度峰值聚类特征选择的三维手写字符识别方法,其特征在于:步骤一的具体过程如下:使用者利用手指指尖在LeapMotion体感控制器上方进行字符的绘制,LeapMotion体感控制器以超过每秒200帧的速度追踪手指的移动,采集手指指尖运动的三维坐标并得到手写字符的三维离散点集;三维离散点集中包含n个点的三维坐标,n个点的坐标表示为(xi,yi,zi),i=1,2,...,n。
3.根据权利要求1所述的一种基于密度峰值聚类特征选择的三维手写字符识别方法,其特征在于:步骤三中预处理的步骤分成四步,分别是线性回归,倾斜校正,轨迹归一化,重采样,具体如下:
3.1、对步骤二中得到的三维离散点集进行线性回归,得到回归线;回归线的方向为(vx,vy,vz);
3.2、对三维离散点集进行旋转;旋转后的三维离散点集内第i个点的向量 的表达式如式(1)所示;
式(1)中, 是旋转前的三维离散点集内第i个点的向量,是单位向量,θ为回归线的旋转角度,θ的表达式如式(2)所示:式(2)中, 为回归线旋转前方向; 为回归线旋转后方向;
3.3、将旋转后的三维离散点集进行归一化;
3.4、对归一化后的三维离散点集进行重采样。
4.根据权利要求1所述的一种基于密度峰值聚类特征选择的三维手写字符识别方法,其特征在于:步骤八中,局部密度对应的权重ω利用粒子群算法确定。
5.根据权利要求1所述的一种基于密度峰值聚类特征选择的三维手写字符识别方法,其特征在于:步骤九中,识别特征数a的用粒子群算法确定。