1.一种基于强化学习的污水处理控制系统,包括依次通信连接的信号接收端、现场控制器、指令发送端,其特征在于:所述现场控制器与信号接收端之间接有信号分路模块,现场控制器与指令发送端之间接有信号合并模块,在信号分路模块和信号合并模块之间有强化控制模块并联于现场控制器;有时序协调模块分别连接强化控制模块、信号分路模块和信号合并模块,并根据强化控制模块的信号对信号分路模块和信号合并模块进行控制;所述时序协调模块控制信号合并模块完成从完全传递现场控制器的指令、到传递现场控制器和强化控制模块的叠加指令、最后到完全传递强化控制模块的指令的过程,为如下两种方式之一:
a.分为三个阶段,第一阶段完全传递现场控制器的指令,第二阶段传递现场控制器和强化控制模块的叠加指令,且强化控制模块指令信号量小于传递现场控制器指令信号量的
30%,第三阶段完全传递强化控制模块的指令;
b.传递现场控制器和强化控制模块的叠加指令,其中强化控制模块指令信号量在最终指令信号量中的占比从0%至100%线性增加。
2.如权利要求1所述的基于强化学习的污水处理控制系统,其特征在于:所述时序协调模块对信号合并模块的控制在于,根据强化控制模块中控制模型的训练程度的提高,控制信号合并模块完成从完全传递现场控制器的指令、到传递现场控制器和强化控制模块的叠加指令、最后到完全传递强化控制模块的指令的过程。
3.如权利要求1所述的基于强化学习的污水处理控制系统,其特征在于:所述时序协调模块对信号分路模块的控制在于,在强化控制模块发出训练完成度100%的信号之前,信号分路模块将信号接收端的信号同时完整发送至强化控制模块和现场控制器,在强化控制模块发出训练完成度100%的信号之后,信号分路模块将信号接收端的信号仅发送至强化控制模块。
4.如权利要求1所述的基于强化学习的污水处理控制系统,其特征在于:所述强化控制模块核心采用ARMv8架构的处理器。
5.如权利要求1所述的基于强化学习的污水处理控制系统,其特征在于:所述时序协调模块核心采用STM32F1系列芯片。
6.如权利要求1所述的基于强化学习的污水处理控制系统,其特征在于:所述信号分路模块采用8位单片机为核心的光耦电路。
7.如权利要求1所述的基于强化学习的污水处理控制系统,其特征在于:所述信号合并模块核心为DSP芯片。