基于安全深度强化学习的电网有功频率协同优化控制

周毅, 周良才, 史迪, 赵小英, 闪鑫

Coordinated Active Power-Frequency Control Based on Safe Deep Reinforcement Learning

ZHOU Yi, ZHOU Liangcai, SHI Di, ZHAO Xiaoying, SHAN Xin

表1 智能体测试结果小结

Tab.1 Summary of agent testing results

编号	总样本数	断面潮流越限的样本个数	成功率/%	平均决策时间/ms
1	20 000	0	100	15.178
2	20 000	0	100	16.290
3	20 000	68	99.66	19.703
4	20 000	86	99.57	16.842
5	20 000	16	99.92	17.633