1.一种用于音频事件分类的半监督学习高置信度样本挖掘方法,其特征是:包括以下步骤:步骤(1):输入已标注音频事件样本集L、未标注音频事件样本集U和支持向量机分类器;
步骤(2):用已标注音频事件样本集L中标注为正类的样本组成样本集L+,用未标注音频事件样本集U和样本集L+组成包含未标注音频事件样本和已标注的正类样本的数据集D1,用D1内的样本估计未标注音频事件样本的正类置信度;
-
步骤(3):用已标注音频事件样本集L中标注为负类的样本组成样本集L ,用未标注音频事件样本集U和样本集L-组成包含未标注音频事件样本和已标注的负类样本的数据集D2,用D2内的样本估计未标注音频事件样本的负类置信度;
步骤(4):对未标注音频事件样本,计算正类估计置信度和负类估计置信度的差值g1,用支持向量机分类器对未标注音频事件样本分类,然后选出那些落在支持向量机分类器分类边界内且其g1值为正值的未标注音频事件样本,并按其g1值进行降序排列,最后创建正类样本集P;
步骤(5):对未标注音频事件样本,计算负类估计置信度和正类估计置信度的差值g2,用支持向量机分类器对未标注音频事件样本分类,然后选出那些落在支持向量机分类器分类边界内且其g2值为正值的未标注音频事件样本,并按其g2值进行降序排列,最后创建负类样本集N;
步骤(6):将正类样本集P中的样本自动标注为正类,然后加入到已标注音频事件样本集L中,并将其从未标注音频事件样本集U中移除;将负类样本集N中的样本自动标注为负类,然后加入到已标注音频事件样本集L中,并将其从未标注音频事件样本集U中移除,利用处理后的音频事件样本集进行音频事件分类。
2.如权利要求1所述的一种用于音频事件分类的半监督学习高置信度样本挖掘方法,其特征是:所述步骤(2)的方法为:用已标注音频事件样本集中标注为正类的样本组成样本集L+,用未标注音频事件样本集U和样本集L+组成包含未标注音频事件样本和已标注的正类样本的数据集D1,g+表示D1中样本的正类估计置信度组成的列向量,r+表示D1中样本的正类先验置信度组成的列向量,设置r+中各个样本的正类先验置信度,用D1中的样本估计未标注音频事件样本的正类置信度。
3.如权利要求1所述的一种用于音频事件分类的半监督学习高置信度样本挖掘方法,其特征是:所述步骤(2)的具体方法为:步骤(2-1):用已标注音频事件样本集L中标注为正类的样本组成样本集L+,用U和L+组成包含未标注音频事件样本和已标注的正类样本的数据集D1,D1={U,L+}={x1,x2,…,n nx|U|,x|U|+1,…,x|D1|},xi∈R(i=1,2,…,|D1)表示D1中的第i个样本,下标i表示第i个,R 表示n维实数向量,|U|表示未标注音频事件样本集U中样本的数量,|D1|表示数据集D1中样本的数量;
步骤(2-2):令g+∈R|D1|表示由数据集D1中样本的正类估计置信度组成的列向量,g+是+ + D1一个待求的量,其各元素的值未知,g 中各元素在[0,1]区间取值,令r∈R 表示由数据集D1中样本的正类先验置信度组成的列向量,r+中各元素在[0,1]区间取值,RD1表示|D1|维的实数向量;
步骤(2-3):对于D1中的每个样本xi(i=1,2,…,|D1|),通过K近邻的方法为其创建一个单元格,记为Ci,Ci={xi(0),xi(1),…,xi(K)},xi表示D1中的第i个样本,下标i表示第i个,xi(0)表示样本xi在数据集D1中的第0近邻样本,即样本xi本身,xi(1),xi(K)分别表示样本xi在数据集D1中的第1近邻样本和第K近邻样本;
步骤(2-4):令Xi=[xi(0),xi(1),…,xi(K)]表示由单元格Ci中的样本组成的样本矩阵,令(k=0,1,…,K)表示Ci中样本xi(k)的正类估计置信度,令 表示Ci中样本xi(k)的正类先验置信度,xi(k)表示样本xi在数据集D1中的第k近邻样本;
步骤(2-5):令Wi+表示对角矩阵,其对角向量为 上标T表示
转置,ω是一个正常数;
步骤(2-6):令 I表示(K+1)×(K+1)维的单位矩阵,lK+1表示元素全为1的(K+1)维列向量,K表示K近邻算法中的K值,上标T表示转置,R(K+1)×(K+1)表示(K+1)×(K+1)维的实数矩阵;
步骤(2-7):令 Xi表示由单元格Ci中的样本组成的样
本矩阵,上标T表示转置,λ表示正则化系数,In表示n×n维的单位矩阵;
步骤(2-8):令 其中 表示|D1|
维的实数向量,其只有第p(xi(k))个元素值为1,其它元素值都为0,p(xi(k))表示样本xi(k)在数据集D1中的位置,xi(k)表示数据集D1中第i个样本xi的第k近邻样本;
步骤(2-9):求
步骤(2-10):求
步骤(2-11):求g+=(V++W+)-1W+r+;
步骤(2-12):向量g+中前|U|个值是未标注音频事件样本的正类估计置信度,将前|U|个值取出,用向量 表示,则 即为未标注音频事件样本的正类估计置信度。
4.如权利要求1所述的一种用于音频事件分类的半监督学习高置信度样本挖掘方法,其特征是:所述步骤(3)的步骤为:用已标注音频事件样本集L中标注为负类的样本组成样本集L-,用U和L-组成包含未标注音频事件样本和已标注的负类样本的数据集D2,g-表示数据集D2中样本的负类估计置信度组成的列向量,r-表示数据集D2中样本的负类先验置信度组成的列向量,设置r-中各个样本的负类先验置信度,用D2内的样本估计未标注音频事件样本的负类置信度。
5.如权利要求1所述的一种用于音频事件分类的半监督学习高置信度样本挖掘方法,其特征是:所述步骤(3)的具体步骤为:步骤(3-1):用已标注音频事件样本集L中标注为负类的样本组成样本集L-,用U和L-组成包含未标注音频事件样本和已标注的负类样本的数据集D2,D2={U,L-}={y1,y2,…,y|U|,y|U+1|,…,y|D2|},yi∈Rn(i=1,2,…,|D2|)表示D2中的第i个样本,下标i表示第i个,Rn表示n维实数向量,|U|表示未标注音频事件样本集U中样本的数量,|D2|表示数据集D2中样本的数量;
步骤(3-2):令g-∈RD2表示由数据集D2中样本的负类估计置信度组成的列向量,g-是一个待求的量,其各元素的值未知,g-中各元素在[0,1]区间取值,令r-∈RD2表示由数据集D2中样本的负类先验置信度组成的列向量,r-中各元素在[0,1]区间取值,R|D2|表示|D2|维的实数向量;
步骤(3-3):对于D2中的每个样本yi(i=1,2,…,|D2|),通过K近邻的方法为其创建一个单元格,单元格内样本记为{yi(0),yi(1),…,yi(K)},yi表示D2中的第i个样本,下标i表示第i个,yi(0)表示样本yi在数据集D2中的第0近邻样本,即样本yi本身,yi(1),yi(K)分别表示样本yi在数据集D2中的第1近邻样本和第K近邻样本;
步骤(3-4):令Yi=[yi(0),yi(1),…,yi(K)]表示由D2中第i个样本对应的单元格中的样本组成的样本矩阵,令 表示样本yi(k)的负类估计置信度,令表示样本yi(k)的负类先验置信度,yi(k)表示样本yi在数据集D2中的第k近邻样本;
步骤(3-5):令Wi-表示对角矩阵,其对角向量为 上标T表示转
置,ω是一个正常数;
步骤(3-6):令 I表示(K+1)×(K+1)维的单位矩阵,lK+1表示元素全为1的(K+1)维列向量,K表示K近邻算法中的K值,上标T表示转置,R(K+1)×(K+1)表示(K+1)×(K+1)维的实数矩阵;
步骤(3-7):令Vi-=H-HYiT(YiHYiT+λIn)-1YiH,Yi表示由D2中第i个样本对应的单元格中的样本组成的样本矩阵,上标T表示转置,λ表示正则化系数,In表示n×n维的单位矩阵;
步骤(3-8):令 其中 表示|D2|
维的实数向量,其只有第p(yi(k))个元素值为1,其它元素值都为0,p(yi(k))表示样本yi(k)在数据集D2中的位置,yi(k)表示数据集D2中第i个样本yi的第k近邻样本;
步骤(3-9):求
步骤(3-10):求
步骤(3-11):求g-=(V-+W-)-1W-r-;
步骤(3-12):向量g-中前|U|个值是未标注音频事件样本的负类估计置信度,将前|U|个值取出,用向量 表示,则 即为未标注音频事件样本的负类估计置信度。
6.如权利要求1所述的一种用于音频事件分类的半监督学习高置信度样本挖掘方法,其特征是:所述步骤(4)的具体步骤包括:步骤(4-1):对未标注音频事件样本,计算正类估计置信度和负类估计置信度的差值g1;
步骤(4-2):在半监督学习的每轮迭代中,用支持向量机分类器对未标注音频事件样本分类,然后选出那些落在支持向量机分类器分类边界内且其g1值为正值的未标注音频事件样本;
步骤(4-3):将步骤(4-2)中挑选出来的未标注音频事件样本按照其g1值降序排序;
步骤(4-4):设定一个百分比值ε%,取步骤(4-3)中排序的未标注音频事件样本的前ε%作为挖掘的正类样本。
7.如权利要求6所述的一种用于音频事件分类的半监督学习高置信度样本挖掘方法,其特征是:所述步骤(4-1)的具体步骤为:其中, 表示未标注音频事件样本集U中的第j个样本,下标j表示第j
个, 表示未标注音频事件样本 的g1值,即正类估计置信度和负类估
计置信度的差值,|U|表示未标注音频事件样本集中样本的数量。
8.如权利要求6所述的一种用于音频事件分类的半监督学习高置信度样本挖掘方法,其特征是:所述步骤(4-4)的具体方法用公式表达为:P表示挖掘的正类样本集,f(·)表示支持向量机分类器的决策函数, 表示样本的决策值,根据支持向量机原理,f(x)=±1表示的是支持向量机分类器的分类边界,而|f(x)|<1则表示分类边界内部区域,其中x表示任一样本,所以 表示样本 落在分类边界内,TOPε%/g1{·}表示将集合{·}内的样本根据其g1值降序排序后,取其前ε%的样本组成新的样本集合。
9.如权利要求1所述的一种用于音频事件分类的半监督学习高置信度样本挖掘方法,其特征是:所述步骤(5)的具体步骤为:步骤(5-1):对未标注音频事件样本,计算负类估计置信度和正类估计置信度的差值g2;
步骤(5-2):在半监督学习的每轮迭代中,用支持向量机分类器对未标注音频事件样本分类,然后选出那些落在支持向量机分类器分类边界内且其g2值为正值的未标注音频事件样本;
步骤(5-3):将步骤(5-2)中挑选出来的未标注音频事件样本按照其g2值降序排序;
步骤(5-4):设定一个百分比值ε%,取步骤(5-3)中排序的未标注音频事件样本的前ε%作为挖掘的负类样本。
10.如权利要求9所述的一种用于音频事件分类的半监督学习高置信度样本挖掘方法,其特征是:所述步骤(5-1)的具体方法为:其中, 表示未标注音频事件样本集U中的第j个样本,下标j表示第j
个, 表示未标注音频事件样本 的g2值,即负类估计置信度和正类估
计置信度的差值,|U|表示未标注音频事件样本集中样本的数量;
所述步骤(5-4)的具体方法用公式表达为:
N表示挖掘的负类样本集,TOPε%/g2{·}表示将集合{·}内的样本根据其g2值降序排序后,取其前ε%的样本组成新的样本集合。