学术报告
刘斌博士:Markov decision process and reinforcement learning for intelligent operation and maintenance

 

Academy of Mathematics and Systems Science, CAS
Colloquia & Seminars

Speaker:

刘斌博士,思克莱德大学管理科学系

Inviter: 胡庆培
Title:
Markov decision process and reinforcement learning for intelligent
operation and maintenance
Language: Chinese
Time & Venue:
2022.12.09 10:00-11:00 腾讯会议:951-760-750
Abstract:

本次讲座主要针对智能运维中的建模优化问题。首先基于前期研究,我将讨论基于马尔可夫决策过程的有限周期的视情维护策略。考虑二元件系统以及系统元件
的退化过程具有随机相关性,用二元伽马过程来描述系统退化过程。系统元件服从周期性检测,当元件的退化程度超过预防性维护阈值时,其会被替换。该维护问题可以表示
成马尔可夫决策过程并可用动态规划来求解。不同于无限周期的维护策略,有限周期的最优策略是动态的,其在每次检测都会变化。我们从理论上得出最优策略的性质并给出
各种维护方式的界限。之后,我将简单讨论下在线强化学习及深度强化学习在智能运维中的运用,最终期望实现运维的自动化。