基于深度强化学习的配电网多时间尺度在线无功优化
Multi-time-scale Online Optimization for Reactive Power of Distribution Network Based on Deep Reinforcement Learning作者机构:上海电力大学自动化工程学院上海市200090 上海市智能电网需求响应重点实验室上海市200063 上海电力大学电气工程学院上海市200090
出 版 物:《电力系统自动化》 (Automation of Electric Power Systems)
年 卷 期:2021年第45卷第10期
页 面:77-85页
核心收录:
学科分类:12[管理学] 1201[管理学-管理科学与工程(可授管理学、工学学位)] 0808[工学-电气工程] 080802[工学-电力系统及其自动化] 08[工学] 081104[工学-模式识别与智能系统] 0807[工学-动力工程及工程热物理] 0835[工学-软件工程] 0811[工学-控制科学与工程] 0812[工学-计算机科学与技术(可授工学、理学学位)]
基 金:国家自然科学基金青年科学基金项目(51607111) 上海市科技创新行动计划资助项目(18DZ1203502、19DZ1205700) 上海市人民保险局优秀人才基金项目“自动需求响应接口设计与开发”(2017116)的资助
主 题:配电网 深度强化学习 马尔可夫决策过程 网络损耗 多时间尺度无功优化
摘 要:含分布式电源的配电网存在潮流建模不精确、通信条件差、各无功补偿设备难以协调等问题,给配电网在线无功优化带来了挑战。文中采用深度强化学习方法,提出了一种多时间尺度配电网在线无功优化运行方案。该方案将配电网在线无功优化问题转化为马尔可夫决策过程。鉴于不同无功补偿设备的调节速度不同,设计2个时间尺度分别对离散调节设备和连续调节设备进行优化配置。该方案能够实时追踪配电网状态,在线决策无功调节设备的优化方案,且不依赖精确的潮流模型,适用于复杂多变、通信条件差的部分可观测配电网。最后,通过算例验证了所提方法的有效性和鲁棒性。