Learning Optimal Controllers by Policy Gradient: Global Optimality via Convex Parameterization

Learning Optimal Controllers by Policy Gradient: Global Optimality via Convex Parameterization | IEEE Conference Publication | IEEE Xplore