Safe Reinforcement Learning for Single Train Trajectory Optimization via Shield SARSA

Safe Reinforcement Learning for Single Train Trajectory Optimization via Shield SARSA | IEEE Journals & Magazine | IEEE Xplore