Algorithmus 21 Bewertete Markovprozesse im stationären Zustand —Ein neuer Algorithmus mit Beispiel

Gessner, P.

doi:10.1007/BF02246616

Algorithmus 21 Bewertete Markovprozesse im stationären Zustand —Ein neuer Algorithmus mit Beispiel

Ergodic marcovprocesses with Rewards — A new algorithm

Algorithmen
Published: June 1974

Volume 13, pages 173–181, (1974)
Cite this article

Computing Aims and scope Submit manuscript

P. Gessner¹

32 Accesses
2 Citations
Explore all metrics

Zusammenfassung

Ausgehend von einem Modell zur Erfassung von allgemeinen Steuerungsproblemen verschiedenster Art [8], kann ein funktionalanalytisches Maximumprinzip bewiesen werden, das den Wertzuwachs durch eine verallgemeinerte Hamiltonfunktion charakterisiert [5, 6, 7, 8]. Dieses Modell und die entwickelte Methode (auf die in dieser Arbeit nur verwiesen wird) sind allgemein genug, um sie (ohne Grenzübergänget→∞ betrachten zu müssen) auf Markovprozesse im stationären Zustand anwenden zu können. Man wird dann auf die Politikiteration von Howard geführt, weiters aber auf einen neuen Algorithmus, der umso effektiver ist, je mehr Entscheidungen pro Zustand zur Wahl stehen.

Hier werden die Rechenschritte genau beschrieben (unsere numerischen Erfahrungen und Testergebnisse gehen darin ein) und zur Verdeutlichung an einem Beispiel nachvollzogen.

Abstract

Starting with a model for general problems of optimal control, a maximumprinciple can be derived by partial deviation of objective functional and process in direction of state variables. Application of model and method (presented in 5, 6, 7, 8) to ergodic Marcovprocesses with rewards results in Howard's method of policy iteration and a new algorithm, which is more effective, specially when the number of possible decision is great.

This is a preview of subscription content, log in via an institution to check access.

Access this article

Log in via an institution

Price excludes VAT (USA)
Tax calculation will be finalised during checkout.

Instant access to the full article PDF.

Literatur

Gessner, P., und K. Spremann: Optimierung in Funktionenräumen. Lecture Notes in Econ. a. Math. Syst.64, Springer 1972.
Howard, R. A.: Dynamic Programming and Markov Processes, 2. Aufl., S. 32–43. Cambridge: MIT Press. 1962.
Google Scholar
Kushner, H.: Introduction to stochastic Control. New York: Holt, Rinehart and Watson. 1971. (Umfassendes Standardwerk.)
Google Scholar
Spremann, K.: Ein funktionalanalytischer Beweis des Maximumprinzips von Pontrjagin und dessen Verwendung zur Herleitung der Politikiteration von Howard. Computing9, 343–353 (1972).
Google Scholar
Spremann, K.: Beweisprinzipien für Optimalitätsbedingungen bei zeitabhängigen Prozessen. Diss. TU München, 1972.
Spremann, K.: Optimierung verschiedener Steuerungsprobleme mit einem funktionalanalytischen Maximumprinzip. Vortrag auf der Diskussionstagung des ADOW (Arbeitskreis für Dynamische Optimierung in den Wirtschaftswissenschaften) in Rheda/Schloss bei Bielefeld am 31. 5. 1973 (ersch. in ZAMM).
Spremann, K.: Eine konstruktive Methode zur Lösung von Kontrollproblemen. Discussion Paper Nr. 4 des Instituts für Wirtschaftstheorie und Operations Research der Universität Karlsruhe. Mai 1973.
Spremann, K., und P. Gessner: Konstruktive Optimierung dynamischer und stochastischer Prozesse. Mathematical Systems in Economics. Meisenheim am Glan: Verl. A. Hain. 1973.
Google Scholar

Download references

Author information

Authors and Affiliations

Lehrstuhl für Anwendungen des Operations Research, Universität Karlsruhe (TH) Kollegium am Schloß, Bau III, Kaiserstraße 12, D-7500, Karlsruhe 1, Bundesrepublik Deutschland
P. Gessner

Authors

P. Gessner
View author publications
You can also search for this author in PubMed Google Scholar

Rights and permissions

Reprints and permissions

About this article

Cite this article

Gessner, P. Algorithmus 21 Bewertete Markovprozesse im stationären Zustand —Ein neuer Algorithmus mit Beispiel. Computing 13, 173–181 (1974). https://doi.org/10.1007/BF02246616

Download citation

Received: 01 August 1973
Issue Date: June 1974
DOI: https://doi.org/10.1007/BF02246616

Access this article

Log in via an institution

Price excludes VAT (USA)
Tax calculation will be finalised during checkout.

Instant access to the full article PDF.

Algorithmus 21 Bewertete Markovprozesse im stationären Zustand —Ein neuer Algorithmus mit Beispiel

Zusammenfassung

Abstract

Access this article

Literatur

Author information

Authors and Affiliations

Rights and permissions

About this article

Cite this article

Share this article

Search

Navigation