1.一种试题自动分类系统,其特征在于:包括待分类试题数据库、自动分类模块、标签库、待审核试题数据库、人工审核模块、人工分类模块、自动分类纠正模块、已分类试题数据库以及同类题目查找模块;
所述自动分类模块,用于将待分类试题数据库中的试题与标签库的标签进行匹配,并将匹配后的试题传送至待审核试题数据库;
所述人工审核模块,用于审核试题自动分类的正确性,若自动分类正确将试题传送至已分类试题数据库,若自动分类错误则将试题传送至人工分类模块;
所述人工分类模块,用于将自动分类错误的试题与标签库的标签进行匹配,若标签库存在与试题匹配的标签,直接将试题与该标签进行匹配,若标签库不存在与试题匹配的标签,则创造新的标签与试题匹配,并将新的标签加入至标签库中,匹配后的试题传送至分类试题数据库;
所述自动分类纠正模块用于提高自动分类模块的正确性;
所述同类题目查找模块用于将分类试题数据库的试题进一步进行分类。
2.一种利用权利要求1所述的试题自动分类系统的分类方法,其特征在于:包括以下步骤:步骤A:自动分类模块将待分类试题数据库中的试题与标签库的标签进行匹配,并将匹配后的试题传送至待审核试题数据库;
步骤B:人工审核模块对待审核试题数据库的自动分类试题进行审核,若自动分类正确将试题传送至已分类试题数据库,若自动分类错误则将试题传送至人工分类模块;
步骤C:人工分类模块将自动分类错误的试题与标签库的标签进行匹配,若标签库存在与试题匹配的标签,直接将试题与该标签进行匹配,若标签库不存在与试题匹配的标签,则创造新的标签与试题匹配,并将新的标签加入至标签库中,匹配后的试题传送至分类试题数据库;
步骤D:自动分类纠正模块根据自动分类的准确性以及人工分类的准确性从而反馈至自动分类模块中提高自动分类模块的准确性;。
步骤E:同类题目查找模块将分类试题数据库的试题进一步进行分类。
3.根据权利要求2所述的一种分类方法,其特征在于:所述步骤A包括以下步骤:A1:从待分类试题数据库的待分类试题中提取试题特征词;
A2:将试题特征词储存至试题特征词集合中;
A3:从标签库的已有标签中提取标签特征词;
A4:将标签特征词储存至标签特征词集合中;
A5:将试题特征词集合与标签特征词集合经过K近邻算法模型;
A6:给待分类试题匹配最相近的标签。
4.根据权利要求3所述的一种分类方法,其特征在于:所述步骤A1中的提取试题特征词包括以下步骤:a1:将待分类试题数据库的待分类试题进行预处理;
a2:从预处理后的试题中提出其中一条试题;
a3:对该试题进行分词;
a4:通过分词后得到若干个候选词;
a5:计算各个候选词的权重;
a6:得到待分类试题的试题特征词。
5.根据权利要求3所述的一种分类方法,其特征在于:所述步骤D包括以下步骤:B1:经过人工分类模块得到新的标签库,在新的标签库中人工提取新的标签特征词集合;
B1:统计试题特征词集合与自动提取的标签特征词集合正确匹配的次数x;
B2:统计试题特征词集合与人工提取的标签特征词集合正确匹配的次数y;
B3:若y大于x,则在下一次自动分类模块自动分类时,将人工提取的标签特征词集合取代自动提取的标签特征词集合;若y小于x,则在下一次自动分类模块自动分类时,继续使用上一次的自动提取的标签特征词集合。
6.根据权利要求2所述的一种分类方法,其特征在于:所述步骤E包括以下步骤:C1:提取每个试题的试题特征词集合;
C2:排序出试题特征词集合的相似度;
C3:查找出同类题目。
7.根据权利要求2所述的一种分类方法,其特征在于:一个试题可匹配多个标签。
8.根据权利要求4所述的一种分类方法,其特征在于:所述候选词包括名词、公式、符号以及图形。