Value iteration and approximately optimal stationary policies in finite-state average Markov decision chains

Cavazos-Cadena, Rolando; Cavazos-Cadena, Rolando

doi:10.1007/s001860200205

Value iteration and approximately optimal stationary policies in finite-state average Markov decision chains

Published: November 2002

Volume 56, pages 181–196, (2002)
Cite this article

Mathematical Methods of Operations Research Aims and scope Submit manuscript

Rolando Cavazos-Cadena¹ &
Rolando Cavazos-Cadena²

74 Accesses
6 Citations
Explore all metrics

Abstract.

This work concerns finte-state Markov decision chains endowed with the long-run average reward criterion. Assuming that the optimality equation has a solution, it is shown that a nearly optimal stationary policy, as well as an approximation to the optimal average reward within a specified error, can be obtained in a finite number of steps of the value iteration method. These results extend others already available in the literature, which were established under more stringent restrictions on the ergodic structure of the decision process.

This is a preview of subscription content, log in via an institution to check access.

Access this article

Log in via an institution

Price excludes VAT (USA)
Tax calculation will be finalised during checkout.

Instant access to the full article PDF.

Institutional subscriptions

Sample-Path Optimality in Average Markov Decision Chains Under a Double Lyapunov Function Condition

Semi-Markov decision processes with variance minimization criterion

Article 09 August 2014

Qingda Wei & Xianping Guo

Constrained Optimality for First Passage Criteria in Semi-Markov Decision Processes

Author information

Authors and Affiliations

Departamento de Estadı´stica y Cálculo, Universidad Autónoma Agraria Antonio Narro, Buenavista, Saltillo COAH 25315, México, , , , , , MX
Rolando Cavazos-Cadena
Centro de Investigaciones Socioeconómicas, Universidad Autónoma de Coahuila, Edificio S, Unidad Campo Redondo, Saltillo COAH 25479, México, , , , , , MX
Rolando Cavazos-Cadena

Authors

Rolando Cavazos-Cadena
View author publications
You can also search for this author in PubMed Google Scholar
Rolando Cavazos-Cadena
View author publications
You can also search for this author in PubMed Google Scholar

Additional information

Manuscript received: October 2001/Final version received: February 2002

RID="*"

ID="*" The support of the PSF Organization under Grant No. 010/300/01-1 is deeply acknowledged.

Rights and permissions

Reprints and permissions

About this article

Cite this article

Cavazos-Cadena, R., Cavazos-Cadena, R. Value iteration and approximately optimal stationary policies in finite-state average Markov decision chains. Mathematical Methods of OR 56, 181–196 (2002). https://doi.org/10.1007/s001860200205

Download citation

Issue Date: November 2002
DOI: https://doi.org/10.1007/s001860200205

AMS Subject Classifications. Primary, 90C40, 93E20; Secondary, 60J05

Key words: Successive approximations, Markov decision processes, Schweitzer's Transformation, Optimality Equation, Convergence of the value iteration approximations

Access this article

Log in via an institution

Price excludes VAT (USA)
Tax calculation will be finalised during checkout.

Instant access to the full article PDF.

Institutional subscriptions

Value iteration and approximately optimal stationary policies in finite-state average Markov decision chains

Abstract.

Access this article

Similar content being viewed by others

Sample-Path Optimality in Average Markov Decision Chains Under a Double Lyapunov Function Condition

Semi-Markov decision processes with variance minimization criterion

Constrained Optimality for First Passage Criteria in Semi-Markov Decision Processes

Author information

Authors and Affiliations

Additional information

Rights and permissions

About this article

Cite this article

Navigation

Value iteration and approximately optimal stationary policies in finite-state average Markov decision chains

Abstract.

Access this article

Similar content being viewed by others

Sample-Path Optimality in Average Markov Decision Chains Under a Double Lyapunov Function Condition

Semi-Markov decision processes with variance minimization criterion

Constrained Optimality for First Passage Criteria in Semi-Markov Decision Processes

Author information

Authors and Affiliations

Additional information

Rights and permissions

About this article

Cite this article

Share this article

Search

Navigation