Abstract
In algorithm 21 Spremann and Gessner [1] present a new algorithm for an ergodic Markov decision process. This note shows that this algorithm not necessarily converges and suggest a modified algorithm.
Zusammenfassung
In Algorithmus 21 presentieren Spremann und Gessner [1] einen neuen Algorithmus für einen ergodischen Markov-Entscheidungsprozeß. Diese Notiz zeigt, daß der Algorithmus nicht notwendigerweise konvergiert und schlägt einen modifizierten Algorithmus vor.
Explore related subjects
Discover the latest articles, news and stories from top researchers in related subjects.References
Spremann, K., Gessner, P.: Algorithmus 21: Bewertete Markovprozesse im stationären Zustand—Ein neuer Algorithmus mit Beispiel. Computing13, 173–181 (1974).
Van der Wal, J.: A successive approximation algorithm for an undiscounted Markov decision process. Computing17, 157–162 (1976).
Author information
Authors and Affiliations
Rights and permissions
About this article
Cite this article
van der Wal, J. Note on algorithm 21. Computing 17, 261–264 (1976). https://doi.org/10.1007/BF02259650
Received:
Issue Date:
DOI: https://doi.org/10.1007/BF02259650