知嘟嘟-专利交易平台_专利购买_专利出售-买专利,上嘟嘟

欢迎来到知嘟嘟！联系电话：13336804447 卖家免费入驻，海量在线求购！卖家免费入驻，海量在线求购！

嘟嘟会员

帮助中心网站地图

查出售查高校查求购查年费

我要发布

首页转移热力图Hot 专利交易委托购买高校专区科技服务专利求购年费查询行业资讯

联系电话：13336804447

知嘟嘟经纪人

一种污水处理的强化学习控制方法

面议

专利号： 2018110278647

申请人：南宁学院

专利类型：发明专利

专利状态：已下证

专利领域：控制；调节

更新日期：2024-02-23

缴费截止日期：暂无

价格&联系人

年费信息

委托购买

专利简介

专利详情

委托购买说明

需准备材料

常见问题

摘要:

权利要求书:

1.一种污水处理的强化学习控制方法，其特征在于：在现场控制器控制的过程中，获取现场控制器的输入信号，并将现场控制器的输出指令和强化学习模型的输出指令合并为最终输出指令输出控制，其中强化学习模型的输出指令中数值在最终输出指令总数值的占比为N，N从0逐渐增大至100％；当强化学习模型的输出指令中数值在最终输出指令总数值的占比为100％时，切断现场控制器控制的输入和输出。

2.如权利要求1所述的污水处理的强化学习控制方法，其特征在于：所述将现场控制器的输出指令和强化学习模型的输出指令合并为最终输出指令输出，采用如下步骤：a.获取现场控制器的输出指令和强化学习模型的输出指令；

b.将现场控制器的输出指令和强化学习模型的输出指令中的数值取出为现场控制器输出指令数值和强化学习模型输出指令数值；

c.将强化学习模型输出指令数值乘以系数N后更新为新的强化学习模型输出指令数值；

d.将现场控制器输出指令数值乘以系数(1-N)后更新为新的现场控制器输出指令数值；

e.将新的现场控制器输出指令数值和新的强化学习模型输出指令数值叠加得到输出指令叠加值；

f.将输出指令叠加值封装为输出指令发送指令。。

3.如权利要求1所述的污水处理的强化学习控制方法，其特征在于：所述N初始为0，每经过M次将现场控制器的输出指令和强化学习模型的输出指令合并为最终输出指令输出控制的步骤后，N自加0.5％。

4.如权利要求3所述的污水处理的强化学习控制方法，其特征在于：所述M取值由用户设定，但限定为5～20。

5.如权利要求1所述的污水处理的强化学习控制方法，其特征在于：所述强化学习模型采用带值函数逼近的TD学习算法。

6.如权利要求1所述的污水处理的强化学习控制方法，其特征在于：所述强化学习模型的值函数为高斯核函数。

7.如权利要求1所述的污水处理的强化学习控制方法，其特征在于：所述强化学习模型采用如下方式更新：a.获取现场控制器的输入作为当前现场控制器输入，将当前现场控制器输入作为值函数的输出反向计算值函数的输入，计算结果作为当前模拟输入；

b.根据当前模拟输入和前一现场控制器输入的误差值更新值函数，如无前一现场控制器输入，则将当前模拟输入直接作为误差值；