1.一种基于知识图谱的信息补充语义通信系统的实现方法,其特征在于,所述实现方法主要包括:步骤1,获取数据集以及准备相关知识图谱;
步骤2,编码信息、解码信息以及传输信息;
步骤3,基于初始解码信息的命名实体识别;
步骤4,基于知识图谱数据库的相似度对比实体纠错;利用余弦相似度计算公式,计算知识图谱数据库实体与识别实体的相似度得分,将知识库中得分最高的对应实体作为识别实体的正确结果,以进行纠错;记纠错后的实体集为E'(i);
步骤5,基于知识图谱的关联信息补充;调用neo4j知识图谱数据库,对经过纠错的命名实体进行知识库关联实体查询检索,获取对话场景下输入实体的关联实体及关系,形成格式规整的SPO三元组数据集T(i)输出给文本生成模型;
步骤6,生成知识图谱文本;用预训练的T
步骤7,进行模型整体测试;将要发送的语句与接收端最终恢复的语句进行包括BLEU评分以及基于BERT模型的句子相似度评分等多个指标的对比分析,并与传统通信模型的相关得分进行比较分析。
2.根据权利要求1所述的基于知识图谱的信息补充语义通信系统的实现方法,其特征在于:在步骤1中,基于相关标识符利用代码提取其中的三元组数据,并对错误及重复数据进行清洗,形成可用的格式规整三元组数据集,数据集中的文本经过处理,以作为通信过程发送语句来源,三元组数据利用neo4j形成知识图谱供模型使用。
3.根据权利要求2所述的基于知识图谱的信息补充语义通信系统的实现方法,其特征在于:在步骤2中,所述编码信息包括信源编码和信道编码;所述解码信息包括信源解码和信道解码。
4.根据权利要求3所述的基于知识图谱的信息补充语义通信系统的实现方法,其特征在于:所述信源编码为霍夫曼编码,所述信道编码为卷积码方式;所述信源解码为霍夫曼解码,所述信道解码为卷积码对应解码方式。
5.根据权利要求1所述的基于知识图谱的信息补充语义通信系统的实现方法,其特征在于:在步骤3中,采用基于掩码语言模型和下一句预测模型的BERT预训练语言模型作为命名实体识别的编码器,对训练语料进行词向量的嵌入编码,然后利用条件随机场(CRF)作为命名实体识别模型的解码模块,获取最优的标注序列,经过信道解码信源解码的恢复序列为
6.根据权利要求5所述的基于知识图谱的信息补充语义通信系统的实现方法,其特征在于:所述命名实体识别的处理过程的抽象表达式为:
7.根据权利要求1所述的基于知识图谱的信息补充语义通信系统的实现方法,其特征在于,在步骤4中,纠错步骤主要包括:步骤4.1,用数字0到25对26个字母进行编码;
步骤4.2,将命名实体识别出的实体及知识库中的实体每个字母按顺序编码;
步骤4.3,对A
步骤4.4,获得两个实体的独热编码向量之后,利用余弦相似度公式计算两个向量之间夹角的余弦值,值越大相似度越高;
步骤4.5,遍历知识库中的实体B
8.根据权利要求7所述的基于知识图谱的信息补充语义通信系统的实现方法,其特征在于,所述余弦相似度的计算公式为:
9.根据权利要求1所述的基于知识图谱的信息补充语义通信系统的实现方法,其特征在于,在步骤5中,信息补充步骤主要包括:步骤5.1,从纠错模块获取实体集E'(i);
步骤5.2,将实体E'(i)作为头实体在知识图谱可视化软件neo4j中检索对应的关系及尾实体;
步骤5.3,在与头实体相关全部关系及为实体之前添加标识符“
10.根据权利要求1所述的基于知识图谱的信息补充语义通信系统的实现方法,其特征在于:在步骤5中,所述T