1.一种研发项目智能管理系统,其特征在于,包括:
全文语义编码单元,用于将待管理的研发项目的文本部分通过包含嵌入层的语义编码器以生成全文特征向量;
关键数据提取单元,用于从所述研发项目的文本部分提取研发项目的类型标签、离研发项目结题的时间和预报研发成果数据;
关键词语义编码单元,用于将所述研发项目的类型标签、所述离研发项目结题的时间和所述预报研发成果数据分别通过所述包含嵌入层的语义编码器以获得第一特征向量、第二特征向量和第三特征向量;
特征向量级联单元,用于将所述第一特征向量、所述第二特征向量和所述第三特征向量进行级联以生成关键特征向量;
语义蒸馏单元,用于将所述全文特征向量通过包含非重叠一维卷积核和全连接层的语义蒸馏器以获得与所述关键特征向量具有相同长度的语义蒸馏向量;
尺度迁移单元,用于计算所述关键词特征向量相对于所述语义蒸馏向量的基于尺度迁移的关联特征矩阵,其中,所述基于尺度迁移的关联特征矩阵基于所述关键词特征向量乘以所述语义蒸馏向量的转置向量所获得的特征矩阵除以所述关键词特征向量乘以所述语义蒸馏向量的转置向量所获得的特征矩阵的Frobenius范数所获得的特征矩阵来构建;以及管理结果生成单元,用于将所述关联特征矩阵通过分类器以获得分类结果,所述分类结果用于表示是否产生项目时间预警提示。
2.根据权利要求1所述的研发项目智能管理系统,其中,所述全文语义编码单元,包括:分词处理子单元,用于对所述待管理的研发项目的文本部分进行分词以获得词序列;
词清洗子单元,用于对所述词序列进行清洗以获得清洗后词序列,其中,对所述词序列进行清洗包括如下操作至少之一:删除重复词、去掉标点符号和删除特殊符号;
词嵌入子单元,用于使用所述语义编码器的嵌入层将所述清洗后词序列中各个词映射为词向量以获得词向量序列;
语义编码子单元,用于使用所述语义编码器的Bert模型对所述词向量序列进行语义编码以生成所述全文特征向量。
3.根据权利要求2所述的研发项目智能管理系统,其中,所述关键词语义编码单元,用于:使用所述包含嵌入层的语义编码器的嵌入层将所述研发项目的类型标签转化为标签输入向量;
使用所述包含嵌入层的语义编码器的转换器对所述标签输入向量进行基于全局的上下文语义编码以获得所述第一特征向量;
使用所述包含嵌入层的语义编码器的嵌入层将所述离研发项目结题的时间转化为时间输入向量;
使用所述包含嵌入层的语义编码器的转换器对所述时间输入向量进行基于全局的上下文语义编码以获得所述第二特征向量;
对所述预报研发成果数据进行分词处理以将所述预报研发成果数据转化为由多个词组成的词序列;
使用所述包含嵌入层的语义编码器的嵌入层将所述词序列中各个词映射到词向量以获得词向量的序列;以及使用所述包含嵌入层的语义编码器的转化器对所述词向量的序列进行基于全局的上下文语义编码以获得所述第三特征向量。
4.根据权利要求3所述的研发项目智能管理系统,其中,所述语义蒸馏单元,进一步用于使用所述语义蒸馏器的各层在层的正向传递中用于对输入数据分别进行:使用所述非重叠一维卷积核以如下公式对所述输入数据进行一维卷积编码以提取所述输入数据中各个位置的特征值间的关联的高维隐含关联特征,其中,所述公式为:其中,a为所述非重叠一维卷积核在x方向上的宽度、F为所述非重叠一维卷积核参数向量、G为与所述非重叠一维卷积核函数运算的局部向量矩阵,w为所述非重叠一维卷积核的尺寸,其中,所述非重叠一维卷积核在所述输入数据上的移动步长大于所述非重叠一维卷积核的尺寸;以及以如下公式对所述输入数据进行全连接编码以提取出所述输入数据中各个位置的特征值的高维隐含特征,其中,所述公式为: 其中X是所述输入数据,Y是输出向量,W是权重矩阵,B是偏置向量, 表示矩阵乘,其中,所述语义蒸馏器的最后一层的输出为所述语义蒸馏向量。
5.根据权利要求4所述的研发项目智能管理系统,其中,所述尺度迁移单元,进一步用于:以如下公式计算所述关键词特征向量相对于所述语义蒸馏向量的基于尺度迁移的所述关联特征矩阵;
其中,所述公式为:
其中,Vk表示所述关键特征向量,Vd表示所述语义蒸馏向量,所述关键特征向量Vk和所述语义蒸馏向量Vd均为列向量形式,||·||F表示矩阵的Frobenius范数。
6.根据权利要求5所述的研发项目智能管理系统,其中,所述管理结果生成单元,进一步用于:所述分类器以如下公式对所述关联特征矩阵进行处理以生成分类结果,其中,所述公式为:softmax{(Wn,Bn):...:(W1,B1)|Project(F)},其中Project(F)表示将所述关联特征矩阵投影为向量,W1至Wn为各层全连接层的权重矩阵,B1至Bn表示各层全连接层的偏置矩阵。
7.一种研发项目智能管理系统的管理方法,其特征在于,包括:
将待管理的研发项目的文本部分通过包含嵌入层的语义编码器以生成全文特征向量;
从所述研发项目的文本部分提取研发项目的类型标签、离研发项目结题的时间和预报研发成果数据;
将所述研发项目的类型标签、所述离研发项目结题的时间和所述预报研发成果数据分别通过所述包含嵌入层的语义编码器以获得第一特征向量、第二特征向量和第三特征向量;
将所述第一特征向量、所述第二特征向量和所述第三特征向量进行级联以生成关键特征向量;
将所述全文特征向量通过包含非重叠一维卷积核和全连接层的语义蒸馏器以获得与所述关键特征向量具有相同长度的语义蒸馏向量;
计算所述关键词特征向量相对于所述语义蒸馏向量的基于尺度迁移的关联特征矩阵,其中,所述基于尺度迁移的关联特征矩阵基于所述关键词特征向量乘以所述语义蒸馏向量的转置向量所获得的特征矩阵除以所述关键词特征向量乘以所述语义蒸馏向量的转置向量所获得的特征矩阵的Frobenius范数所获得的特征矩阵来构建;以及将所述关联特征矩阵通过分类器以获得分类结果,所述分类结果用于表示是否产生项目时间预警提示。
8.根据权利要求7所述的研发项目智能管理系统的管理方法,其中,将待管理的研发项目的文本部分通过包含嵌入层的语义编码器以生成全文特征向量,包括:对所述待管理的研发项目的文本部分进行分词以获得词序列;
对所述词序列进行清洗以获得清洗后词序列,其中,对所述词序列进行清洗包括如下操作至少之一:删除重复词、去掉标点符号和删除特殊符号;
使用所述语义编码器的嵌入层将所述清洗后词序列中各个词映射为词向量以获得词向量序列;
使用所述语义编码器的Bert模型对所述词向量序列进行语义编码以生成所述全文特征向量。
9.根据权利要求8所述的研发项目智能管理系统的管理方法,其中,将所述全文特征向量通过包含非重叠一维卷积核和全连接层的语义蒸馏器以获得与所述关键特征向量具有相同长度的语义蒸馏向量,包括:使用所述语义蒸馏器的各层在层的正向传递中用于对输入数据分别进行:使用所述非重叠一维卷积核以如下公式对所述输入数据进行一维卷积编码以提取所述输入数据中各个位置的特征值间的关联的高维隐含关联特征,其中,所述公式为:其中,a为所述非重叠一维卷积核在x方向上的宽度、F为所述非重叠一维卷积核参数向量、G为与所述非重叠一维卷积核函数运算的局部向量矩阵,w为所述非重叠一维卷积核的尺寸,其中,所述非重叠一维卷积核在所述输入数据上的移动步长大于所述非重叠一维卷积核的尺寸;以及以如下公式对所述输入数据进行全连接编码以提取出所述输入数据中各个位置的特征值的高维隐含特征,其中,所述公式为: 其中X是所述输入数据,Y是输出向量,W是权重矩阵,B是偏置向量, 表示矩阵乘,其中,所述语义蒸馏器的最后一层的输出为所述语义蒸馏向量。
10.根据权利要求9所述的研发项目智能管理系统的管理方法,其中,计算所述关键词特征向量相对于所述语义蒸馏向量的基于尺度迁移的关联特征矩阵,包括:以如下公式计算所述关键词特征向量相对于所述语义蒸馏向量的基于尺度迁移的所述关联特征矩阵;
其中,所述公式为:
其中,Vk表示所述关键特征向量,Vd表示所述语义蒸馏向量,所述关键特征向量Vk和所述语义蒸馏向量Vd均为列向量形式,||·||F表示矩阵的Frobenius范数。