欢迎来到知嘟嘟! 联系电话:13095918853 卖家免费入驻,海量在线求购! 卖家免费入驻,海量在线求购!
知嘟嘟
我要发布
联系电话:13095918853
知嘟嘟经纪人
收藏
专利号: 2014102288206
申请人: 百度在线网络技术(北京)有限公司
专利类型:发明专利
专利状态:已下证
专利领域: 计算;推算;计数
更新日期:2024-02-23
缴费截止日期: 暂无
价格&联系人
年费信息
委托购买

摘要:

权利要求书:

1.一种交互式搜索方法,其特征在于,包括:

接收用户输入的第一查询信息;

根据所述第一查询信息获取意图澄清引导语句,其中,所述意图澄清引导语句为通过查询语句库获取的;

接收所述用户输入的针对所述意图澄清引导语句的反馈信息,并根据所述第一查询信息、所述意图澄清引导语句和所述反馈信息生成第二查询信息;

根据所述第二查询信息提供搜索结果;

其中,所述根据所述第一查询信息、所述意图澄清引导语句和所述反馈信息生成第二查询信息,包括:获取所述意图澄清引导语句的类型;

如果所述意图澄清引导语句为一般疑问句或特殊疑问句,则根据所述第一查询信息、所述意图澄清引导语句和所述反馈信息获取多个关键词集合;

如果所述意图澄清引导语句为选择疑问句,则根据所述第一查询信息和所述反馈信息获取多个关键词集合;

根据所述多个关键词集合生成第二查询信息;

所述根据所述第一查询信息、所述意图澄清引导语句和所述反馈信息获取多个关键词集合,包括:分别对所述第一查询信息、所述意图澄清引导语句和所述反馈信息进行分词,以分别获取所述第一查询信息对应的第一分词集合、所述意图澄清引导语句对应的第二分词集合和所述反馈信息对应的第三分词集合;

分别获取所述第一分词集合、所述第二分词集合和所述第三分词集合中每个分词的多个特征,并分别获取所述每个分词对应的多个特征的特征值;每个分词的多个特征包括:词性、句法成分、在大量句子语料中的词频、出现次数、是否为实体、在句子中的位置、其上下位词的特征;

根据所述每个分词对应的多个特征的特征值获取每个分词的得分;

根据所述每个分词的得分从所述第一分词集合中筛选出第一关键词集合,从所述第二分词集合中筛选出第二关键词集合,从所述第三分词集合中筛选出第三关键词集合。

2.如权利要求1所述的方法,其特征在于,在所述根据所述第一查询信息获取意图澄清引导语句之后,还包括:获取针对所述意图澄清引导语句的至少一个候选结果;

接收所述用户对所述至少一个候选结果的触发操作,并将被触发的候选结果作为所述针对所述意图澄清引导语句的反馈信息。

3.如权利要求1所述的方法,其特征在于,所述根据所述第一查询信息和所述反馈信息获取多个关键词集合,包括:分别对所述第一查询信息和所述反馈信息进行分词,以分别获取所述第一查询信息对应的第四分词集合和所述反馈信息对应的第五分词集合;

分别获取所述第四分词集合和所述第五分词集合中每个分词的多个特征,并分别获取所述每个分词对应的多个特征的特征值;

根据所述每个分词对应的多个特征的特征值获取每个分词的得分;

根据所述每个分词的得分从所述第四分词集合中筛选出第四关键词集合,从所述第五分词集合中筛选出第五关键词集合。

4.如权利要求1所述的方法,其特征在于,所述根据所述多个关键词集合生成第二查询信息,包括:对所述多个关键词集合进行同义词处理以获取多个关键词序列;

将所述多个关键词序列中的关键词进行排序组合以获取多个候选序列;

分别根据所述多个候选序列中关键词的排序获取所述多个候选序列的得分;

根据所述得分在所述多个候选序列中筛选出所述第二查询信息。

5.一种交互式搜索装置,其特征在于,包括:

第一接收模块,用于接收用户输入的第一查询信息;

第一获取模块,用于根据所述第一查询信息获取意图澄清引导语句,其中,所述意图澄清引导语句为通过查询语句库获取的;

第二接收模块,用于接收所述用户输入的针对所述意图澄清引导语句的反馈信息;

生成模块,用于根据所述第一查询信息、所述意图澄清引导语句和所述反馈信息生成第二查询信息;

提供模块,用于根据所述第二查询信息提供搜索结果;

其中,所述生成模块包括:

第一获取子模块,用于获取所述意图澄清引导语句的类型;

第二获取子模块,用于在所述意图澄清引导语句为一般疑问句或特殊疑问句时,根据所述第一查询信息、所述意图澄清引导语句和所述反馈信息获取多个关键词集合;

第三获取子模块,用于在所述意图澄清引导语句为选择疑问句时,根据所述第一查询信息和所述反馈信息获取多个关键词集合;

生成子模块,用于根据所述多个关键词集合生成第二查询信息;

所述第二获取子模块包括:

第一分词单元,用于分别对所述第一查询信息、所述意图澄清引导语句和所述反馈信息进行分词,以分别获取所述第一查询信息对应的第一分词集合、所述意图澄清引导语句对应的第二分词集合和所述反馈信息对应的第三分词集合;

第一获取单元,用于分别获取所述第一分词集合、所述第二分词集合和所述第三分词集合中每个分词的多个特征,并分别获取所述每个分词对应的多个特征的特征值;每个分词的多个特征包括:词性、句法成分、在大量句子语料中的词频、出现次数、是否为实体、在句子中的位置、其上下位词的特征;

第二获取单元,用于根据所述每个分词对应的多个特征的特征值获取每个分词的得分;

第一筛选单元,用于根据所述每个分词的得分从所述第一分词集合中筛选出第一关键词集合,从所述第二分词集合中筛选出第二关键词集合,从所述第三分词集合中筛选出第三关键词集合。

6.如权利要求5所述的装置,其特征在于,还包括:第二获取模块,用于获取针对所述意图澄清引导语句的至少一个候选结果;

其中,所述第二接收模块用于接收所述用户对所述至少一个候选结果的触发操作,并将被触发的候选结果作为所述针对所述意图澄清引导语句的反馈信息。

7.如权利要求5所述的装置,其特征在于,所述第二获取子模块包括:第二分词单元,用于分别对所述第一查询信息和所述反馈信息进行分词,以分别获取所述第一查询信息对应的第四分词集合和所述反馈信息对应的第五分词集合;

第三获取单元,用于分别获取所述第四分词集合和所述第五分词集合中每个分词的多个特征,并分别获取所述每个分词对应的多个特征的特征值;

第四获取单元,用于根据所述每个分词对应的多个特征的特征值获取每个分词的得分;

第二筛选单元,用于根据所述每个分词的得分从所述第四分词集合中筛选出第四关键词集合,从所述第五分词集合中筛选出第五关键词集合。

8.如权利要求5所述的装置,其特征在于,所述生成子模块包括:同义词处理单元,用于对所述多个关键词集合进行同义词处理以获取多个关键词序列;

第五获取单元,用于将所述多个关键词序列中的关键词进行排序组合以获取多个候选序列;

第六获取单元,用于分别根据所述多个候选序列中关键词的排序获取所述多个候选序列的得分;

第三筛选单元,用于根据所述得分在所述多个候选序列中筛选出所述第二查询信息。