1.一种近似词条结构推荐方法,其特征在于,包括:步骤一:接收用户新建的根词条的结构,实时将结构格式转化为文本格式并存储;
步骤二:将转化为文本格式的新建的根词条与其他转化为文本格式的已有根词条进行两两余弦相似度对比;
步骤三:将余弦相似度超过预设阈值的已有根词条的文本格式转化为结构格式后呈现给用户,否则不呈现给用户。
2.根据权利要求1所述的近似词条结构推荐方法,其特征在于,词条结构格式转化为文本格式的过程中,词条结构中的词条属性按照键值对以哈希存储方式进行存储,其中词条属性包括词条标识、词条名称、词条文本、父级词条、子级词条,在将词条结构格式转化为文本格式的过程中,将词条结构中的根词条的词条属性以及根词条下所有子词条的词条属性读取出来以形成文本格式。
3.根据权利要求1所述的近似词条结构推荐方法,其特征在于,步骤二进一步包括:步骤1:导入gensim数据库;
步骤2;将现有的所有词条导入documents列表中,词条与词条用逗号间隔;
步骤3:将现有的所有词条向量化;
步骤4:通过步骤3中的向量值构建相应的TD_IDF模型;
步骤5:通过TD_IDF模型计算每个词条的TD_IDF值;
步骤6:通过每个词条的TD_IDF值构建相应的LSI模型;
步骤7:导入用户新建的根词条,将其向量化;
步骤8:将步骤7中的新建的根词条的向量值导入步骤6构建的LSI模型中;
步骤9:将步骤3中的词条的向量值导入步骤6构建的LSI模型中,并构建余弦相似度计算模型;
步骤10:将步骤8得到的值导入到余弦相似度计算模型中,输出新建的根词条与现有的所有词条的余弦相似度。
4.根据权利要求1所述的近似词条结构推荐方法,其特征在于,在步骤三的在将文本格式转化为词条结构格式的过程中,将文本格式涉及的词条属性按照键值对以哈希存储方式存储成词条结构,其中词条属性包括词条标识、词条名称、词条文本、父级词条、子级词条。
5.根据权利要求4所述的近似词条结构推荐方法,其特征在于,在步骤三进一步包括:步骤1:使用redis hash的基本命令hgetall将根词条的属性以及根词条所有子词条的属性取出给到某一对象;
步骤2:web前端加载D3.js开源库;
步骤3:使用d3.layout.tree命令定义一个tree对象,并确定图像区域大小;
步骤4:web前端向服务器请求数据,服务器将步骤1的对象按照JSON格式传到web前端中;
步骤5:根据步骤4的JSON数据生成节点集合nodes;
步骤6:根据nodes集合生成节点;
步骤7:使用tree.links(nodes)命令获取节点关系集合;
步骤8:为关系集合设置贝塞尔曲线连接;
步骤9:为节点添加圆形标记,如果有子节点为黑色,否则白色;
步骤10:根据JSON数据的document属性为节点添加说明文字;
步骤11:完成文本格式到结构格式的转化。
6.一种近似词条结构推荐系统,其特征在于,包括:文本格式转化模块,将根词条的结构格式转化为文本格式;
存储模块,存储所有词条的结构格式及其对应的文本格式;
余弦相似度对比模块,将转化为文本格式的新建的根词条与其他转化为文本格式的已有根词条进行两两余弦相似度对比,筛选出余弦相似度高于预设阈值的已有根词条的文本格式并输出为词条结构格式;
结构格式转化模块,将根词条的文本格式转化为词条的结构格式。
7.根据权利要求6所述的近似词条结构推荐系统,其特征在于,在文本格式转化模块中,词条结构中的词条属性按照键值对以哈希存储方式进行存储,其中词条属性包括词条标识、词条名称、词条文本、父级词条、子级词条,在将词条结构格式转化为文本格式的过程中,将词条结构中的根词条的词条属性以及根词条下所有子词条的词条属性读取出来以形成文本格式。
8.根据权利要求6所述的近似词条结构推荐系统,其特征在于,结构格式转化模块中,将文本格式涉及的词条属性按照键值对以哈希存储方式存储成词条结构,其中词条属性包括词条标识、词条名称、词条文本、父级词条、子级词条。