欢迎来到知嘟嘟! 联系电话:13336804447 卖家免费入驻,海量在线求购! 卖家免费入驻,海量在线求购!
知嘟嘟
我要发布
联系电话:13336804447
知嘟嘟经纪人
收藏
专利号: 2022100979878
申请人: 南京邮电大学
专利类型:发明专利
专利状态:已下证
专利领域: 计算;推算;计数
更新日期:2026-04-06
缴费截止日期: 暂无
价格&联系人
年费信息
委托购买

摘要:

权利要求书:

1.一种基于知识图谱的信息补充语义通信系统的实现方法,其特征在于,所述实现方法主要包括:步骤1,获取数据集以及准备相关知识图谱;

步骤2,编码信息、解码信息以及传输信息;

步骤3,基于初始解码信息的命名实体识别;

步骤4,基于知识图谱数据库的相似度对比实体纠错;利用余弦相似度计算公式,计算知识图谱数据库实体与识别实体的相似度得分,将知识库中得分最高的对应实体作为识别实体的正确结果,以进行纠错;记纠错后的实体集为E'(i);

步骤5,基于知识图谱的关联信息补充;调用neo4j知识图谱数据库,对经过纠错的命名实体进行知识库关联实体查询检索,获取对话场景下输入实体的关联实体及关系,形成格式规整的SPO三元组数据集T(i)输出给文本生成模型;

步骤6,生成知识图谱文本;用预训练的T

步骤7,进行模型整体测试;将要发送的语句与接收端最终恢复的语句进行包括BLEU评分以及基于BERT模型的句子相似度评分等多个指标的对比分析,并与传统通信模型的相关得分进行比较分析。

2.根据权利要求1所述的基于知识图谱的信息补充语义通信系统的实现方法,其特征在于:在步骤1中,基于相关标识符利用代码提取其中的三元组数据,并对错误及重复数据进行清洗,形成可用的格式规整三元组数据集,数据集中的文本经过处理,以作为通信过程发送语句来源,三元组数据利用neo4j形成知识图谱供模型使用。

3.根据权利要求2所述的基于知识图谱的信息补充语义通信系统的实现方法,其特征在于:在步骤2中,所述编码信息包括信源编码和信道编码;所述解码信息包括信源解码和信道解码。

4.根据权利要求3所述的基于知识图谱的信息补充语义通信系统的实现方法,其特征在于:所述信源编码为霍夫曼编码,所述信道编码为卷积码方式;所述信源解码为霍夫曼解码,所述信道解码为卷积码对应解码方式。

5.根据权利要求1所述的基于知识图谱的信息补充语义通信系统的实现方法,其特征在于:在步骤3中,采用基于掩码语言模型和下一句预测模型的BERT预训练语言模型作为命名实体识别的编码器,对训练语料进行词向量的嵌入编码,然后利用条件随机场(CRF)作为命名实体识别模型的解码模块,获取最优的标注序列,经过信道解码信源解码的恢复序列为

6.根据权利要求5所述的基于知识图谱的信息补充语义通信系统的实现方法,其特征在于:所述命名实体识别的处理过程的抽象表达式为:

7.根据权利要求1所述的基于知识图谱的信息补充语义通信系统的实现方法,其特征在于,在步骤4中,纠错步骤主要包括:步骤4.1,用数字0到25对26个字母进行编码;

步骤4.2,将命名实体识别出的实体及知识库中的实体每个字母按顺序编码;

步骤4.3,对A

步骤4.4,获得两个实体的独热编码向量之后,利用余弦相似度公式计算两个向量之间夹角的余弦值,值越大相似度越高;

步骤4.5,遍历知识库中的实体B

8.根据权利要求7所述的基于知识图谱的信息补充语义通信系统的实现方法,其特征在于,所述余弦相似度的计算公式为:

9.根据权利要求1所述的基于知识图谱的信息补充语义通信系统的实现方法,其特征在于,在步骤5中,信息补充步骤主要包括:步骤5.1,从纠错模块获取实体集E'(i);

步骤5.2,将实体E'(i)作为头实体在知识图谱可视化软件neo4j中检索对应的关系及尾实体;

步骤5.3,在与头实体相关全部关系及为实体之前添加标识符“”、“”、“”,形成形如“AthenscountryGreece”的三元组传输给文本生成器。

10.根据权利要求1所述的基于知识图谱的信息补充语义通信系统的实现方法,其特征在于:在步骤5中,所述T