Nuevo método de aceleración de los procesos de decisión de Markov
PDF

Palabras clave

Markov decision processes
topological ordering
shortest path. Procesos de decisión de Markov
ordenamiento topológico
ruta más corta.

Cómo citar

García-Hernández, M. de G., Ruiz-Pinales, J., Ledesma-Orozco, S., Aviña-Cervantes, J. G., & Alvarado-Méndez, E. (2011). Nuevo método de aceleración de los procesos de decisión de Markov. Acta Universitaria, 21(2), 50–57. https://doi.org/10.15174/au.2011.38

Resumen

En este artículo se presenta un nuevo método de aceleración para resolver a los procesos de decisión de Markov. El clásico algoritmo de iteración de valor ha resuelto satisfactoria­mente a estos procesos estocásticos, pero este algoritmo y sus variantes aceleradas han sido lentos con factores de descuento cercanos a la unidad y sus propiedades de conver­gencia han dependido, en gran medida, de un buen ordenamiento en la actualización de estados. Recientemente se mostró que la iteración de valor presenta buena velocidad de convergencia gracias al uso de un algoritmo de ordenamiento topológico mejorado. Sin embargo, la desventaja de este algoritmo es debida a sus requerimientos de memoria. Aquí se presenta un método diferente para obtener un buen ordenamiento de estados actuali­zados con menor requerimiento de memoria. De igual manera se presentan los resultados experimentales obtenidos sobre un problema de ruta estocástica más corta
https://doi.org/10.15174/au.2011.38
PDF