Policy Gradient Based Entropic-VaR Optimization in Risk-Sensitive Reinforcement Learning

Policy Gradient Based Entropic-VaR Optimization in Risk-Sensitive Reinforcement Learning | IEEE Conference Publication | IEEE Xplore