1.一种社交媒体数据聚合分析系统,其特征在于,包括:云服务器和社交媒体平台;
所述云服务器被配置为:
获取多个社交媒体平台的历史数据,并以所述社交媒体平台的唯一标识符和时间关系对所述历史数据进行标记以建立内部的关联关系;
从所述历史数据中提取所述社交媒体平台的历史特征数据和历史事件数据;
根据所述历史特征数据生成多个社交媒体平台画像数据;
根据所述历史事件数据生成多个事件画像数据;
根据所述社交媒体平台画像数据建立各个所述社交媒体平台的第一数据获取模型;
根据所述事件画像数据进行聚类分析得到多个事件画像数据组;
对于每个所述事件画像数据组生成对应的数据聚类分析模型,得到多个事件数据分析模型;
根据所述第一数据获取模型从所述社交媒体平台上获取第一社交媒体数据;
从所述第一社交媒体数据中识别出第一事件数据;
根据所述第一事件数据中的属性数据从多个所述事件数据分析模型确定对应的第一事件数据分析模型;
根据所述第一事件数据分析模型对所述第一事件数据进行分析得到第一分析结果。
2.一种社交媒体数据聚合分析方法,其特征在于,包括:获取多个社交媒体平台的历史数据,并以所述社交媒体平台的唯一标识符和时间关系对所述历史数据进行标记以建立内部的关联关系;
从所述历史数据中提取所述社交媒体平台的历史特征数据和历史事件数据;
根据所述历史特征数据生成多个社交媒体平台画像数据;
根据所述历史事件数据生成多个事件画像数据;
根据所述社交媒体平台画像数据建立各个所述社交媒体平台的第一数据获取模型;
根据所述事件画像数据进行聚类分析得到多个事件画像数据组;
对于每个所述事件画像数据组生成对应的数据聚类分析模型,得到多个事件数据分析模型;
根据所述第一数据获取模型从所述社交媒体平台上获取第一社交媒体数据;
从所述第一社交媒体数据中识别出第一事件数据;
根据所述第一事件数据的属性数据从多个所述事件数据分析模型确定对应的第一事件数据分析模型;
根据所述第一事件数据分析模型对所述第一事件数据进行分析得到第一分析结果。
3.根据权利要求2所述的社交媒体数据聚合分析方法,其特征在于,所述获取多个社交媒体平台的历史数据,并以所述社交媒体平台的唯一标识符和时间关系对所述历史数据进行标记以建立内部的关联关系的步骤,包括:获取所述社交媒体平台的开发者文档,从中提取所述社交媒体平台提供的API接口和访问权限;
根据所述社交媒体平台的API接口和访问权限进行数据获取得到所述历史数据;
在获取所述历史数据时,使用所述社交媒体平台的唯一标识符和时间关系对所述历史数据进行标记;
将所述历史数据存储到数据库中,并根据所述社交媒体平台的唯一标识符和时间关系,对所述历史数据进行关联建模得到所述关联关系。
4.根据权利要求3所述的社交媒体数据聚合分析方法,其特征在于,所述根据所述历史特征数据生成多个社交媒体平台画像数据的步骤,包括:确定在所述社交媒体平台画像数据中包含的特征类型;
根据根据所述特征类型,对所述历史特征数据进行特征工程,得到第一特征数据;
根据所述第一特征数据,生成多个所述社交媒体平台画像数据。
5.根据权利要求4所述的社交媒体数据聚合分析方法,其特征在于,所述根据所述历史事件数据生成多个事件画像数据的步骤,包括:使用自然语言处理技术对所述历史事件数据进行事件要素抽取,获取包括事件主体、时间、地点、起因、发展过程、传播路径在内的事件信息;
应用知识图谱技术对所述事件信息进行处理,构建事件关系图;
使用情感分析技术和意图识别技术分析所述历史事件数据,确定参与者及公众的情绪倾向数据;
采用社交网络分析算法从所述历史事件数据中识别事件的传播范围和传播模型;
运用多模态分析技术关联所述历史事件数据中的文本数据和多媒体数据,构建事件知识库;
根据所述事件关系图、所述情绪倾向数据、所述传播范围、所述传播模型、所述事件知识库生成结构化事件画像,得到所述事件画像数据。
6.根据权利要求5所述的社交媒体数据聚合分析方法,其特征在于,所述根据所述社交媒体平台画像数据建立各个所述社交媒体平台的第一数据获取模型的步骤,包括:根据所述社交媒体平台画像数据确定所述社交媒体平台的用户画像、内容画像、互动画像、平台定位和场景、安全策略和限制;
根据所述用户画像、所述内容画像、所述互动画像、所述平台定位和场景、所述安全策略和限制确定所述第一数据获取模型。
7.根据权利要求6所述的社交媒体数据聚合分析方法,其特征在于,所述根据所述用户画像、所述内容画像、所述互动画像、所述平台定位和场景、所述安全策略和限制确定所述第一数据获取模型的步骤,包括:根据所述用户画像,确定针对不同用户特征采取的数据采集粒度;
根据所述内容画像,确定采集的数据类型/种类;
根据所述互动画像,确定采集的核心节点用户的数据;
根据所述平台定位和场景,定制数据采集的策略,确定采集的媒体类型、时间范围、采集频率;
根据所述安全策略和限制,确定数据访问权限、授权机制;
根据所述社交媒体平台的技术属性确定数据获取方式。
8.根据权利要求7所述的社交媒体数据聚合分析方法,其特征在于,所述根据所述第一数据获取模型从所述社交媒体平台上获取第一社交媒体数据的步骤,包括:从所述第一数据获取模型中解析出所述社交媒体平台的采集需求、用户群体、采集关键词、采集方式、采集频率;
根据所述采集需求、所述用户群体、所述采集关键词、所述采集方式、所述采集频率获取所述获取第一社交媒体数据。
9.根据权利要求8所述的社交媒体数据聚合分析方法,其特征在于,所述从所述第一社交媒体数据中识别出第一事件数据的步骤,包括:将所述第一社交媒体数据输入预设的第一事件识别模型;
所述第一事件识别模型应用文本相似度算法,比较从所述第一社交媒体数据中提取的短文本与历史事件简介的相似度,得到候选事件集;
使用命名实体识别和实体链接技术,从所述第一社交媒体数据识别事件主体和事件主体间的关系;
借助知识图谱,对事件主体间的关系进行分析,判断所述候选事件集中的各个候选事件的有效性值;
对各个所述候选事件进行聚类,利用集群的统计特征过滤噪声数据;
结合从所述第一社交媒体数据中识别的时间和地点信息,确定事件发生的时间范围和地理范围;
对根据所述有效性值对各个所述候选事件进行排序,根据各维特征计算事件的置信度得分;
选择置信度最高的第一候选事件,输出为所述第一事件数据。
10.根据权利要求9所述的社交媒体数据聚合分析方法,其特征在于,所述第一事件识别模型的构建方法包括:构建用于第一事件识别的训练数据集,并进行事件要素标注;
使用序列标注模型训练出事件要素抽取模型;
收集与所述第一事件相关的词典和规则库,进行关键词匹配和规则匹配,并结合所述事件要素抽取模型,得到所述第一事件识别模型。