1.一种基于大数据分析的公共卫生疫情防控系统,其特征在于:包括数据采集与预处理模块、数据融合与特征提取模块、疫情传播预测模块、风险评估与热点地区识别模块、决策支持与应急响应模块和动态反馈与优化模块;
所述数据采集与预处理模块负责从医院、社交媒体和气象部门收集原始数据,并进行预处理,获取防疫数据组FYW;
所述特征提取模块对防疫数据组FYW进行特征提取,包括社交媒体中有关疫情的情绪波动特征和空气污染与呼吸道疾病的关联特征,组成健康特征集F;
所述疫情传播预测模块通过防疫数据组FYW和健康特征集F,使用易感-感染-恢复模型预测疫情传播的趋势,分析人口流动数据Rk、空气质量数据AQ和情感分析数据SQ对疫情扩散的影响,获取预测结果;
所述疫情传播预测模块包括SIR模型构建与参数估计单元和影响因素分析与传播趋势调整单元;
所述SIR模型构建与参数估计单元根据防疫数据组FYW和健康特征集F,基于易感-感染-恢复模型构建疫情传播数学模型,分析易感人群的数量S、感染人群的数量I和恢复人群的数量R的变化趋势,对未来疫情传播的趋势进行预测,获取未来时间点t的易感人群数量S(t)、感染人群数量I(t)和恢复人群数量R(t);
通过分析人口流动数据Rk、空气质量数据AQ和情感分析数据SQ,估算疫情传播数学模型的参数,包括传染率β和恢复率γ;
所述时间点t的易感人群数量S(t)通过以下公式获取:;
式中,表示温度数据TE和湿度数据HU对疫情传播的影响系数,表示健康特征集F中第j个特征对疫情传播的影响系数,Fj表示健康特征集F中第j个特征,m表示健康特征集F的特征总数;
所述时间点t的感染人群数量I(t)通过以下公式获取:;
所述时间点t的恢复人群数量R(t)通过以下公式获取:;
所述影响因素分析与传播趋势调整单元分析人口流动数据Rk、空气质量数据AQ和情感分析数据SQ对疫情扩散的影响,并带入疫情传播数学模型中,对疫情传播趋势进行调整,获取调整后的传染率βadj和调整后的恢复率γadj,带入疫情传播数学模型中,重新对获取未来时间点t的易感人群数量S(t)、感染人群数量I(t)和恢复人群数量R(t)进行预测;
所述调整后的传染率βadj通过以下公式获取;
;
式中,分别表示人口流动数据Rk、空气质量数据AQ和情感分析数据SQ对传染率β的影响系数;
所述调整后的恢复率γadj通过以下公式获取;
;
式中,分别表示人口流动数据Rk、空气质量数据AQ和情感分析数据SQ对恢复率γ的影响系数;
所述风险评估与热点地区识别模块基于预测结果,结合疫情密度Iden、人口流动数据Rk和环境污染指数EPI,识别当前疫情的风险区域,进行评估,获取综合风险指数RI;
所述决策支持与应急响应模块根据综合风险指数RI,为公共卫生机构提供决策支持,并拟定防控措施;
所述动态反馈与优化模块在疫情防控过程中,实时监控防控措施效果,并通过数据反馈调整策略。
2.根据权利要求1所述的一种基于大数据分析的公共卫生疫情防控系统,其特征在于:所述数据采集与预处理模块包括数据采集单元和数据清洗与标准化单元;
所述采集单元从医院、社交媒体和气象部门多个数据源中采集原始数据,包括电子健康记录EHR、人口流动数据Rk、情感分析数据SQ、温度数据TE、湿度数据HU和空气质量数据AQ;
其中,电子健康记录EHR通过医院信息管理系统获取,包括呼吸道疾病发病率DiseaseRate;人口流动数据Rk通过区域内人口流动的数量与区域的总面积的比值获取;
情感分析数据SQ包括从社交媒体平台抓取有关疫情帖子,进行情感分析,并通过NLP技术将每个帖子划分为正面情绪、负面情绪和中立情绪,并为正面情绪、负面情绪和中立情绪分配数值,具体为:正面情绪为+1,负面情绪为-1,中立情绪为0;
情感分析数据SQ通过以下公式获取:
;
式中,Si表示第i条社交媒体帖子,n表示总共分析的帖子数量;
温度数据TE和湿度数据HU分别通过温度传感器和湿度传感器获取;
空气质量数据AQ通过以下公式获取:
;
式中,cPM2.5、cCO和cNO2分别表示空气颗粒物浓度PM2.5、一氧化碳CO和二氧化氮NO2,IPM2.5、ICO和INO2分别表示空气颗粒物浓度PM2.5、一氧化碳CO和二氧化氮NO2的污染物标准化指数,max表示取数值中的峰值;
所述数据清洗与标准化单元对数据采集单元采集的原始数据进行清洗和标准化处理,获取防疫数据组FYW;
清洗包括通过使用滤波器去除原始数据中的噪声和无效信息,包括缺失值和异常值;
标准化处理通过使用标准化法对原始数据进行统一量纲尺度。
3.根据权利要求2所述的一种基于大数据分析的公共卫生疫情防控系统,其特征在于:所述特征提取模块包括社交媒体情绪波动特征提取单元和空气污染与呼吸道疾病关联特征提取单元;
所述社交媒体情绪波动特征提取单元根据情感分析数据SQ提取情绪波动特征,分析疫情相关舆情的变化趋势;计算获取情绪波动指数EVI和情绪变化趋势ET;
所述情绪波动指数EVI通过以下公式获取:
;
式中,N表示总时间段,SQti表示时间点ti的情感分析数据的值,PSQ表示情感分析数据的平均值;
所述情绪变化趋势ET通过以下公式获取:
;
式中,SQ(qi)表示时间qi时刻的情感分析数据的值,SQ(pi)表示时间pi时刻的情感分析数据的值。
4.根据权利要求3所述的一种基于大数据分析的公共卫生疫情防控系统,其特征在于:所述呼吸道疾病关联特征提取单元根据空气质量数据AQ和电子健康记录EHR之间的关联,具体通过结合空气质量数据AQ和呼吸道疾病发病率DiseaseRate,计算获取污染与健康关联指数PHI;
所述污染与健康关联指数PHI通过以下公式获取:;
式中,ln表示自然对数函数;
对获取的情绪波动指数EVI、情绪变化趋势ET和污染与健康关联指数PHI进行组合,获取健康特征集F。
5.根据权利要求4所述的一种基于大数据分析的公共卫生疫情防控系统,其特征在于:所述风险评估与热点地区识别模块包括风险评估单元和热点地区识别与动态更新单元;
所述风险评估单元根据疫情传播预测模块提供的未来时间点t的感染人群数量I(t)结合疫情密度Iden、人口流动数据Rk和环境污染指数EPI,计算获取综合风险指数RI,并与预设的风险阈值TRI进行对比,评估区域的疫情风险;
通过计算感染人群的疫情密度Iden来估算区域的疫情严重程度;
所述疫情密度Iden通过以下公式获取:
;
式中,mA表示区域的面积;
通过空气质量数据AQ计算环境污染指数EPI;
所述环境污染指数EPI通过以下公式获取:
;
式中,M表示污染物的总数量,表示第ia种污染物的权重系数,AQia表示第ia种污染物的空气质量数据;
所述综合风险指数RI通过以下公式获取:
;
式中,分别表示疫情密度Iden、人口流动数据Rk和环境污染指数EPI的预设权重值,且;
所述区域的疫情风险通过以下方式匹配获取:
当综合风险指数RI≤风险阈值TRI时,则表示区域内疫情风险正常;
当综合风险指数RI>风险阈值TRI时,则表示区域内疫情风险异常。
6.根据权利要求5所述的一种基于大数据分析的公共卫生疫情防控系统,其特征在于:所述热点地区识别与动态更新单元根据区域的综合风险指数RI,识别疫情热点地区,并实时更新各区域的综合风险指数RI,动态调整疫情热点的识别;
对获取的各区域的综合风险指数RI进行排序,将综合风险指数RI>风险阈值TRI的区域标记为热点地区K,表示该区域的风险异常;
对所有热点地区K进行拟合,组成热点集HArea={Area(K)|RI(K)>TRI};
式中,RI(K)表示第K热点地区的综合风险指数,Area(K)表示第K热点地区,具体表示存在风险异常的区域;
固定周期对热点地区K的综合风险指数RI进行更新,跟踪疫情变化趋势。
7.根据权利要求6所述的一种基于大数据分析的公共卫生疫情防控系统,其特征在于:所述决策支持与应急响应模块包括决策支持单元和应急响应单元;
所述决策支持单元根据预设的风险阈值TRI,将区域的疫情风险分第一等级和第二等级,为每个热点地区K提供防控措施;
当综合风险指数RI≤风险阈值TRI时,标记为第一等级,则表示地区不属于热点地区K,且区域内疫情风险正常,保持常态防控措施,进行常规监测和报告;
当综合风险指数RI>风险阈值TRI时,标记为第二等级,则表示热点地区K内疫情风险异常,提供防控措施,包括实施封锁措施、隔离感染者和调整医疗资源配置;
所述应急响应单元根据决策支持单元提供的防控措施,制定应急响应计划,包括资源调配、人员调度和紧急措施;
其中,资源调配包括医院床位调配、救护车调配、检测设备调配和个人防护装备调配;
人员调度包括指派相关人员前往疫情风险异常的区域进行疫情监测和防控;
紧急措施包括临时设立疫情防控点、加强疫情信息的传播和居民健康教育。
8.根据权利要求5所述的一种基于大数据分析的公共卫生疫情防控系统,其特征在于:所述动态反馈与优化模块包括防控效果监控单元和策略调整单元;
所述防控效果监控单元获取实时疫情数据和防控措施执行情况,包括感染人群数量I、恢复人群数量R、死亡人群数量和防控措施的执行强度,并通过传染率β和恢复率γ来衡量防控效果,判断防控措施是否有效;
所述策略调整单元基于防控效果监控单元提供的反馈,计算并识别当前防控措施是否达到预期效果,获取疫情控制指数YZ,并与预设的疫情控制阈值TYZ进行比对,判断防控措施的效果;
所述疫情控制指数YZ通过对传染率β和恢复率γ使用加权算法获取;
所述防控措施的效果通过以下方式匹配获取:
当疫情控制指数YZ≥疫情控制阈值TYZ时,则表示防控措施有效;
当疫情控制指数YZ<疫情控制阈值TYZ时,则表示防控措施无效,重新调整防控措施,并制定新的应急响应计划。