欢迎来到知嘟嘟! 联系电话:13336804447 卖家免费入驻,海量在线求购! 卖家免费入驻,海量在线求购!
知嘟嘟
我要发布
联系电话:13336804447
知嘟嘟经纪人
收藏
专利号: 2020112477360
申请人: 上海七猫文化传媒有限公司
专利类型:发明专利
专利状态:已下证
专利领域: 计算;推算;计数
更新日期:2024-03-13
缴费截止日期: 暂无
价格&联系人
年费信息
委托购买

摘要:

权利要求书:

1.一种文本的审核方法,其特征在于,包括:获取待审核文本,并检测所述待审核文本所属的类别;

从文本数据库中获取对应所述类别的多个预存文本,以及所述预存文本对应的满意度;

基于专业词库以及特殊字符标识库对所述预存文本进行数据预处理,从而得到各所述预存文本对应的暂时文本;

通过文本分类器对每个所述暂时文本进行分词;

根据所述暂时文本各自对应的所述满意度计算每个词语的权重,得到词语权重数据库;

根据所述词语权重数据库中每个词语对应的所述权重,计算所述待审核文本的预测满意度;

根据所述预测满意度判断所述待审核文本是否满足推送要求;

所述根据所述词语权重数据库中每个词语对应的所述权重,计算所述待审核文本的预测满意度的步骤,包括:通过所述文本分类器对所述待审核文本进行分词,得到各初始词语;

删除所述初始词语中所述词语权重数据库不存在的词语,得到各目标词语,获取分词后各所述目标词语对应的个数;

根据所述目标词语的个数,以及各目标词语对应的数量、权重,通过预设的预测满意度计算公式计算所述预测满意度;

其中,所述预设的预测满意度计算公式为

,其中 表示所述初始词语的个数,表示所述目标词语的个数, 表示第i个目标词语的数量, 表示第i个目标词语的权重, 为设定的标准个数,,,均为设定的参数。

2.如权利要求1所述的文本的审核方法,其特征在于,所述根据所述暂时文本各自对应的所述满意度计算每个词语的权重,得到词语权重数据库的步骤,包括:获取各个词语的文本分值;

根据各个词语的所述文本分值,以及各个所述暂时文本的满意度;通过预设的匹配值计算公式计算各个词语在各所述暂时文本中的匹配值;

统计各所述暂时文本中各个词语的个数,并根据各个词语在各所述暂时文本中的匹配值,通过预设的权重计算公式计算各个词语的权重;

根据各个词语的所述权重构建所述词语权重数据库;

其中,所述匹配值的计算公式为 ,其中, 表示第 个文本中第 个词语对应的匹配值, 表示第 个文本的所述满意度, 表示第 个词语对应的文本分值;

所述权重计算公式为 计算各个词语的权重,根据各个词语的权重构建词语权重数据库。

3.如权利要求1所述的文本的审核方法,其特征在于,所述检测所述待审核文本所属的类别的步骤,包括:获取所述待审核文本的文本信息,并将所述文本信息进行向量化,得到对应所述待审核文本的第一向量;

根据预设的相似度计算公式计算所述第一向量与各类别对应的第二向量的相似度;

根据所述相似度判断所述待审核文本所属的类别;

其中,所述预设的相似度计算公式为 ,

其中,所述 表示第一向量,所述 表示第二向量; 表示第一向量和第二向量的相似度。

4.如权利要求1所述的文本的审核方法,其特征在于,所述从文本数据库中获取对应所述类别的多个预存文本,以及所述预存文本对应的满意度的步骤,包括:从所述文本数据库中获取多个所述预存文本,并获取所述预存文本的业务转化率和文本信息;

根据所述业务转化率和文本信息率计算所述预存文本的所述满意度。

5.如权利要求1所述的文本的审核方法,其特征在于,所述根据所述预测满意度判断所述待审核文本是否满足推送要求的步骤之后,还包括:若满足推送要求,则将所述待审核文本输入至n‑gram模型中进行计算,得到所述待审核文本的合法值;

判断所述合法值是否达到了预设合法值;

若到了预设合法值,则推送所述待审核文本。

6.一种文本的审核装置,其特征在于,包括:待审核文本获取模块,用于获取待审核文本,并检测所述待审核文本所属的类别;

预存文本获取模块,用于从文本数据库中获取对应所述类别的多个预存文本,以及所述预存文本对应的满意度;

预处理模块,用于基于专业词库以及特殊字符标识库对所述预存文本进行数据预处理,从而得到各所述预存文本对应的暂时文本;

分词模块,用于通过文本分类器对每个所述暂时文本进行分词;

权重计算模块,用于根据所述暂时文本各自对应的所述满意度计算每个词语的权重,得到词语权重数据库;

预测满意度计算模块,用于根据所述词语权重数据库中每个词语对应的所述权重,计算所述待审核文本的预测满意度;

审核模块,用于根据所述预测满意度判断所述待审核文本是否满足推送要求;

所述预测满意度计算模块,包括:

分词子模块,用于通过所述文本分类器对所述待审核文本进行分词,得到各初始词语;

删除子模块,用于删除所述初始词语中所述词语权重数据库不存在的词语,得到各目标词语,获取分词后各所述目标词语对应的个数;

预测满意度计算子模块,用于根据所述目标词语的个数,以及各目标词语对应的数量、权重,通过预设的预测满意度计算公式计算所述预测满意度;

其中,所述预设的预测满意度计算公式为

,其中 表示所述初始词语的个数,表示所述目标词语的个数, 表示第i个目标词语的数量, 表示第i个目标词语的权重, 为设定的标准个数,,,均为设定的参数。

7.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至5中任一项所述方法的步骤。

8.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至5中任一项所述的方法的步骤。