基于安全深度强化学习的电网有功频率协同优化控制
周毅, 周良才, 史迪, 赵小英, 闪鑫

Coordinated Active Power-Frequency Control Based on Safe Deep Reinforcement Learning
ZHOU Yi, ZHOU Liangcai, SHI Di, ZHAO Xiaoying, SHAN Xin
表1 智能体测试结果小结
Tab.1 Summary of agent testing results
编号 总样
本数
频率未恢复
的样本个数
断面潮流越限
的样本个数
成功
率/%
平均决策
时间/ms
1 20 000 0 0 100 15.178
2 20 000 0 0 100 16.290
3 20 000 0 68 99.66 19.703
4 20 000 0 86 99.57 16.842
5 20 000 0 16 99.92 17.633