Actor-Critic Learning Control Based on <inline-formula> <tex-math notation="LaTeX">$\ell_{2}$ </tex-math></inline-formula>-Regularized Temporal-Difference Prediction With Gradient Correction

Actor-Critic Learning Control Based on --Regularized Temporal-Difference Prediction With Gradient Correction | IEEE Journals & Magazine | IEEE Xplore