欢迎来到知嘟嘟! 联系电话:13336804447 卖家免费入驻,海量在线求购! 卖家免费入驻,海量在线求购!
知嘟嘟
我要发布
联系电话:13336804447
知嘟嘟经纪人
收藏
专利号: 2019112832266
申请人: 陕西师范大学
专利类型:发明专利
专利状态:已下证
专利领域: 计算;推算;计数
更新日期:2024-01-05
缴费截止日期: 暂无
价格&联系人
年费信息
委托购买

摘要:

权利要求书:

1.一种基于众包的中文旅游领域知识服务平台知识库更新方法,其特征在于,包括步骤:通过旅游实体名称构建出旅游实体库;

通过与结构化中文百科类数据集进行实体匹配抽取出旅游知识,构建出旅游知识库;

在旅游知识库的基础上搭建中文旅游领域知识服务平台;所述中文旅游领域知识服务平台的搭建方法包括旅游实体知识图谱的可视化方法以及旅游实体知识卡片展示中的实体链接方法;所述的旅游实体知识卡片包括Infobox属性和实体百科标签;

通过众包的方法统计出不同用户在中文旅游领域知识服务平台上的旅游实体搜索记录定时获取新的旅游实体;再通过抽取出的新的旅游知识来更新旅游知识库。

2.根据权利要求1所述基于众包的中文旅游领域知识服务平台知识库更新方法,其特征在于:采用网页爬取方法从现有的旅游网站上爬取旅游实体名称来构建出旅游实体库;

所述的旅游实体名称包括全国34个省、直辖市、自治区、特别行政区的旅游景点。

3.根据权利要求1或2所述基于众包的中文旅游领域知识服务平台知识库更新方法,其特征在于,旅游实体库的具体构建方法为:使用Python编程语言编写网页爬虫程序,通过程序模拟浏览器请求站点的行为,把站点返回的HTML代码爬到本地,进而提取所需要的旅游实体名称数据,将旅游实体名称数据存储到本地设备中来构建出旅游实体库。

4.根据权利要求1所述基于众包的中文旅游领域知识服务平台知识库更新方法,其特征在于:所述的结构化中文百科类数据集从互联网中获取三元组Dump数据组成,Dump数据包括CN-DBpedia、Zhishi.me提供的数据,将获取得到的数据集存储到本地设备;当进行实体匹配时编写Python脚本将旅游实体库与三元组Dump数据进行匹配抽取出旅游知识。

5.根据权利要求4所述基于众包的中文旅游领域知识服务平台知识库更新方法,其特征在于:所述的三元组Dump数据包含实体名称、属性名称、属性值,中间用tab分隔;

旅游知识库中的旅游知识数据对语料以标签进行标注。

6.根据权利要求1所述基于众包的中文旅游领域知识服务平台知识库更新方法,其特征在于,所述的旅游实体知识图谱的可视化方法如下:使用Ajax交互技术,通过XmlHttpRequest对象向服务器发出获取本实体相关知识的异步请求,服务器按照请求从本地设备存储的旅游知识库中获得相关知识数据并以JSON格式返回给前台,利用JavaScript脚本将JSON数据部署到Echarts.js配置项的各个节点上,从而最终实现将旅游实体知识图谱在前台JSP页面中展示在用户面前。

7.根据权利要求1所述基于众包的中文旅游领域知识服务平台知识库更新方法,其特征在于,所述旅游实体知识卡片展示中的实体链接方法如下:获取JSON格式的相关知识数据并返回给前台,利用JavaScript脚本,通过对数据中实体不同属性的判断,将数据在前台JSP页面中分别展示到知识卡片区域中的简介、Infobox、百科标签位置,并将有标注的JSON数据对应的实体实现识别和链接。

8.根据权利要求1所述基于众包的中文旅游领域知识服务平台知识库更新方法,其特征在于,通过众包的方法获取新的旅游实体具体步骤如下:

1)获取不同用户在中文旅游领域知识服务平台上的旅游实体搜索记录;

2)将用户旅游实体搜索记录与旅游实体库进行比较;

3)判断旅游实体库中是否存在用户搜索实体;

4)如果旅游实体库中没有用户搜索实体,则将该实体加入旅游实体库。