A Counterexample on Sample-Path Optimality in Stable Markov Decision Chains with the Average Reward Criterion

Cavazos-Cadena, Rolando; Montes-de-Oca, Raúl; Sladký, Karel

doi:10.1007/s10957-013-0474-6

A Counterexample on Sample-Path Optimality in Stable Markov Decision Chains with the Average Reward Criterion

Published: 23 November 2013

Volume 163, pages 674–684, (2014)
Cite this article

Journal of Optimization Theory and Applications Aims and scope Submit manuscript

Rolando Cavazos-Cadena¹,
Raúl Montes-de-Oca² &
Karel Sladký³

232 Accesses
5 Citations
Explore all metrics

Abstract

This note deals with Markov decision chains evolving on a denumerable state space. Under standard continuity-compactness requirements, an explicit example is provided to show that, with respect to a strong sample-path average reward criterion, the Lyapunov function condition does not ensure the existence of an optimal stationary policy.

This is a preview of subscription content, log in via an institution to check access.

Access this article

Log in via an institution

Price excludes VAT (USA)
Tax calculation will be finalised during checkout.

Instant access to the full article PDF.

Institutional subscriptions

Sample-Path Optimality in Average Markov Decision Chains Under a Double Lyapunov Function Condition

Average criteria in denumerable semi-Markov decision chains under risk-aversion

Article 21 August 2023

Rolando Cavazos-Cadena, Hugo Cruz-Suárez & Raúl Montes-De-Oca

Constrained Optimality for First Passage Criteria in Semi-Markov Decision Processes

References

Hordijk, A.: Dynamic Programming and Potential Theory. Mathematical Centre Tract, vol. 51. Mathematisch Centrum, Amsterdam (1974)
MATH Google Scholar
Cavazos-Cadena, R., Montes-de-Oca, R.: Sample-path optimality in average Markov decision chains under a double Lyapunov function condition. In: Hernández-Hernández, D., Minjárez-Sosa, A. (eds.) Optimization, Control, and Applications of Stochastic Systems, In Honor of Onésimo Hernández-Lerma, pp. 31–57. Springer, New York (2012)
Chapter Google Scholar
Puterman, M.L.: Markov Decision Processes: Discrete Stochastic Dynamic Programming. Wiley, New York (1994)
Book MATH Google Scholar
Thomas, L.C.: Connectedness conditions for denumerable state Markov decision processes. In: Hartley, R., Thomas, L.C., White, D.J. (eds.) Recent Developments in Markov Decision Processes, pp. 181–204. Academic Press, London (1980)
Google Scholar
Cavazos-Cadena, R., Fernández-Gaucherand, E.: Denumerable controlled Markov chains with average reward criterion: sample path optimality. Math. Methods Oper. Res. 41, 89–108 (1995)
Article MATH Google Scholar
Lasserre, J.B.: Sample-path average optimality for Markov control processes. IEEE Trans. Autom. Control 44, 1966–1971 (1999)
Article MathSciNet MATH Google Scholar
Hunt, F.Y.: Sample path optimality for a Markov optimization problems. Stoch. Process. Appl. 115, 769–779 (2005)
Article MATH Google Scholar
Ross, S.M.: Applied Probability Models with Optimization Applications. Holden-Day, Oakland (1970)
MATH Google Scholar

Download references

Acknowledgements

This work was supported in part by the PSF Organization under Grant No. 012/300/02, and by CONACYT (México) and ASCR (Czech Republic) under Grant No. 171396.

The authors are grateful to the editor for helpful suggestions.

Author information

Authors and Affiliations

Departamento de Estadística y Cálculo, Universidad Autónoma Agraria Antonio Narro, Buenavista, Saltillo Coah, 25315, Mexico
Rolando Cavazos-Cadena
Departamento de Matemáticas, Universidad Autónoma Metropolitana, Campus Iztapalapa, Avenida San Rafael Atlixco 186, Colonia Vicentina, México, 09340, Mexico
Raúl Montes-de-Oca
Institute of Information Theory and Automation, Pod Vodárenskou věží 4, 182 08, Praha 8, Czech Republic
Karel Sladký

Authors

Rolando Cavazos-Cadena
View author publications
You can also search for this author in PubMed Google Scholar
Raúl Montes-de-Oca
View author publications
You can also search for this author in PubMed Google Scholar
Karel Sladký
View author publications
You can also search for this author in PubMed Google Scholar

Corresponding author

Correspondence to Rolando Cavazos-Cadena.

Rights and permissions

Reprints and permissions

About this article

Cite this article

Cavazos-Cadena, R., Montes-de-Oca, R. & Sladký, K. A Counterexample on Sample-Path Optimality in Stable Markov Decision Chains with the Average Reward Criterion. J Optim Theory Appl 163, 674–684 (2014). https://doi.org/10.1007/s10957-013-0474-6

Download citation

Received: 22 September 2012
Accepted: 30 October 2013
Published: 23 November 2013
Issue Date: November 2014
DOI: https://doi.org/10.1007/s10957-013-0474-6

Keywords

Access this article

Log in via an institution

Price excludes VAT (USA)
Tax calculation will be finalised during checkout.

Instant access to the full article PDF.

Institutional subscriptions

A Counterexample on Sample-Path Optimality in Stable Markov Decision Chains with the Average Reward Criterion

Abstract

Access this article

Similar content being viewed by others

Sample-Path Optimality in Average Markov Decision Chains Under a Double Lyapunov Function Condition

Average criteria in denumerable semi-Markov decision chains under risk-aversion

Constrained Optimality for First Passage Criteria in Semi-Markov Decision Processes

References

Acknowledgements

Author information

Authors and Affiliations

Corresponding author

Rights and permissions

About this article

Cite this article

Keywords

Navigation

A Counterexample on Sample-Path Optimality in Stable Markov Decision Chains with the Average Reward Criterion

Abstract

Access this article

Similar content being viewed by others

Sample-Path Optimality in Average Markov Decision Chains Under a Double Lyapunov Function Condition

Average criteria in denumerable semi-Markov decision chains under risk-aversion

Constrained Optimality for First Passage Criteria in Semi-Markov Decision Processes

References

Acknowledgements

Author information

Authors and Affiliations

Corresponding author

Rights and permissions

About this article

Cite this article

Share this article

Keywords

Search

Navigation