基于多智能体迁移强化学习算法的电力系统最优碳–能复合流求解
Optimal Carbon-energy Combined Flow in Power System Based on Multi-agent Transfer Reinforcement Learning作者机构:华南理工大学电力学院广州510640 深圳供电局有限公司深圳518020
出 版 物:《高电压技术》 (High Voltage Engineering)
年 卷 期:2019年第45卷第3期
页 面:863-872页
核心收录:
学科分类:080802[工学-电力系统及其自动化] 0808[工学-电气工程] 08[工学]
基 金:国家重点基础研究发展计划(973计划)(2013CB228205) 国家自然科学基金(51777078)
主 题:多智能体迁移强化学习算法 碳-能复合流 碳排放责任分摊 迁移学习 强化学习
摘 要:为避免碳排放责任的重复计算,首次在电力系统最优碳–能复合流模型中提出发电侧、电网侧、用户侧之间的碳排放责任分摊机制。并进一步提出一种全新的多智能体迁移强化学习算法,以实现电力系统最优碳–能复合流模型的快速、高质量求解。此算法同时组织多个智能体执行优化任务,并将知识学习机制、多智能体交互机制和知识迁移机制相结合,不仅使每个智能体都具有较强的自主学习能力,还通过多个智能体之间的协调实现了问题的合作求解;知识迁移可以复用历史任务学习经验,使新任务学习效率大幅提升。IEEE 57节点系统、IEEE 300节点系统及深圳电网模型仿真结果均表明,此算法在保证最优解质量和寻优稳定性的同时,收敛速度可达其他算法的4.7~50.5倍,具有明显的优势和实用价值。