基于强化学习的产消用户端对端电能交易决策
强化学习是一种促进智能体在与环境交互过程中通过学习策略达成回报最大化的人工智能方法.在不进行优化计算和不充分了解市场机制的情况下,该方法非常适合处理小规模用户电能交易行为.文中首先建立了包含交易主体、交易电价和交易物理约束的产消用户端对端电能交易模型.其次,将电能交易问题等效为一个马尔可夫决策过程并对各学习要素进行建模.然后,基于Q-Learning强化学习算法,对马尔可夫决策过程中储能动作和交易策略选择问题进行均匀离散处理,并进行分析求解.最后,采用含多类型产消用户和消费用户的电能交易案例进行分析,验证强化学习方法在解决小规模产消用户端对端电能交易问题上的合理性和可行性.
强化学习、产消用户、端对端电能交易、马尔可夫决策过程
45
国家重点研发计划资助项目;国家自然科学基金资助项目;国家电网公司总部科技项目
2021-03-02(万方平台首次上网日期,不代表论文的发表时间)
共9页
139-147