Una Cadena de Markov en tiempo discreto consiste en una clase particular de un proceso estocástico donde se verifica el cumplimiento de la propiedad markoviana (en términos simples establece que el futuro es independiente del pasado dado el presente) y la propiedad estacionaria (la probabilidad de transición de un estado i a un estado j al cabo de una etapa no depende de la etapa n). En este contexto a continuación presentamos 3 preguntas de selección múltiple que permite reforzar algunos conceptos básicos sobre las Cadenas de Markov.
Pregunta N°1: En la matriz de probabilidades de transición:
a) La suma de cada columna debe ser igual a 1
b) La suma de cada columna y cada fila debe ser igual a 1
c) Por lo menos debe haber un 0 en cada fila d) La suma de cada fila debe ser igual a 1
e) Por lo menos debe haber un 0 en cada columna
Respuesta:Alternativa d). La matriz de probabilidades de transición o matriz P resume las probabilidad de transición en una etapa de un estado i a un estado j. La matriz P tiene la misma cantidad de filas y columnas. Por ejemplo a continuación de presenta la matriz de transición que corresponde a uno de los casos discutidos en el artículo Cadenas de Markov (Ejercicios Resueltos) donde se corrobora que la sumatoria de los valores de cada fila corresponde a un 100%.
Pregunta N°2: Si la distribución de probabilidad de la variable no cambia de una etapa a otra:
a) Cada probabilidad debe ser igual a 1
b) Debe haber al menos una probabilidad igual a 0
c) La probabilidad debe ser la misma para cada estado d) Dicha distribución coincide con la distribución estacionaria
e) Debe haber al menos una probabilidad igual a 1
Respuesta:Alternativa d). En este caso estamos frente a la distribución estacionaria o de largo plazo la cual como hemos discutido previamente es independiente de la distribución inicial para la variable aleatoria. Antecedentes adicionales y un ejemplo con el detalle del cálculo se puede consultar en Distribución Límite de una Cadena de Markov en Tiempo Discreto.
Pregunta N°3: Cuál de las siguientes alternativas no es un supuesto de las cadenas de Markov:
a) Existe un número finito de estados
b) Existe un número finito de etapas
c) Las probabilidades de la variable de estado se pueden calcular usando únicamente la matriz de probabilidades de transición
d) La distribución de probabilidades de una etapa no cambia de una etapa a la otra e) Todas la anteriores no son supuestos del análisis
Respuesta:Alternativa e). Se descarta a) y b) debido a que puede existir un número infinito de estados y etapas. En cuanto a las probabilidades de la variable de estado , se requiere conocer una distribución de estado actual o inicial para que luego, haciendo uso de las ecuaciones matriciales se pueda estimar las probabilidades de estado.
Un proceso estocástico en tiempo discreto se denomina una Cadena de Markov en tiempo discreto si y solo sí se satisface la Propiedad Markoviana (esto es básicamente que el futuro t=n+1 es independiente del pasado dado el presente t=n) y Propiedad Estacionaria (la probabilidad de pasar de un estado i a un estado j al cabo de una etapa no depende de la etapa n). A continuación presentamos un conjunto de problemas resueltos de Cadenas de Markov que sirvan de complemento para los estudios de nuestros usuarios.
Ejercicios Resueltos de Cadenas de Markov
Ejercicio N°1: Una empresa esta considerando utilizar Cadenas de Markov para analizar los cambios en las preferencias de los usuarios por tres marcas distintas de un determinado producto. El estudio ha arrojado la siguiente estimación de la matriz de probabilidades de cambiarse de una marca a otra cada mes:
Si en la actualidad la participación de mercado es de 45%, 25% y 30%, respectivamente. ¿Cuales serán las participaciones de mercado de cada marca en dos meses más?.
En primer lugar definimos la variable aleatoria que representa la marca que adquiere un cliente cualquiera en el mes n. Dicha variable aleatoria puede adoptar los valores 1,2,3 en el mes n=0,1,2,3,..
Adicionalmente conocemos cuál es la distribución inicial y la matriz de probabilidades de transición en una etapa tal como se observa a continuación:
Luego para conocer la distribución de las participaciones de mercado al cabo de 2 meses (2 etapas) podemos utilizar la fórmula :
Se concluye que las cuotas de mercado (participaciones de mercado) en dos meses a cambiado de un 45% a un 40.59%; de un 25% a un 33.91% y de un 30% a un 25.50%, para las marcas 1,2 y 3 respectivamente.
Ejercicio N°2: ¿Cuál es la cuota de mercado en el largo plazo para cada una de las marcas descritas en el Ejercicio N°1?.
La solución del sistema corresponde a: , y , que representan las cuotas de mercado en el largo plazo para las marcas 1,2 y 3, respectivamente. Notar que las actuales participaciones de mercado difieren significativamente de las cuotas obtenidas en el largo plazo lo cual sugiere que de alguna manera deban ser corregidas las probabilidades de transición.
Ejercicio N°3: En una Unidad de Cuidados Intensivos en un determinado hospital, cada paciente es clasificado de acuerdo a un estado crítico, serio o estable. Estas clasificaciones son actualizadas cada mañana por un médico internista, de acuerdo a la evaluación experimentada por el paciente. Las probabilidades con las cuales cada paciente se mueve de un estado a otro se resumen en la tabla que sigue:
¿Cuál es la probabilidad que un paciente en estado crítico un día Jueves esté estable el día Sábado?.
Sea la variable aleatoria que indica el estado que se encuentra un paciente cualquiera en el hospital en el día n. Los valores posibles para dicha variable son C, S y E, representando los estados crítico, serio y estable, respectivamente. Un grafo que representa dicho proceso estocástico dada la tabla anterior es:
La probabilidad de que un paciente esté en estado crítico el día Jueves y que el día Sábado esté estable, esta dado por: , es decir, la probabilidad de pasar del estado crítico al estado estable al cabo de 2 etapas (días).
Notar que de forma equivalente se pueden utilizar las ecuaciones matriciales :
Se comprueba que la probabilidad de pasar del estado crítico al estado estable al cabo de 2 etapas es de un 17%.
¿Cuál es la probabilidad que un paciente que está en estado estable el Lunes experimente alguna complicación y no esté estable nuevamente el Miércoles?.
En este caso cambia la distribución inicial respecto al escenario anterior (ahora el paciente está en estado estable), no obstante, también resulta de nuestro interés analizar qué sucede al cabo de 2 etapas.
Con color verde se marca la probabilidad de que comenzando en un estado estable al cabo de 2 días un paciente se encuentre en estado crítico o serio. La suma de dichas probabilidades es un 66% que da respuesta a la interrogante anterior.
¿Qué porcentaje de la Unidad de Cuidados Intensivos usted diseñaría y equiparía para pacientes en estado crítico?.
Naturalmente se desea estimar la probabilidades de estado en el largo plazo independiente de la distribución inicial. La cadena es irreducible con estados recurrentes positivos aperiódicos. Utilizando las ecuaciones de estado estable presentadas en el Ejercicio N°2 se obtiene que , y , que representan la probabilidad de que un individuo se encuentre en estado crítico, serio y estable, respectivamente.
La gestión de inventarios hace uso de distintas herramientas metodológicas que abordan 2 preguntas básicas: ¿de qué tamaño debe ser un pedido? y ¿cada cuánto tiempo se debe realizar un pedido?. En el siguiente artículo se propone la utilización de una Cadena de Markov en tiempo discreto para determinar la política de reposición de inventarios de una empresa: Una tienda que mantiene un inventario de un producto dado para satisfacer una demanda (aleatoria). La demanda diaria D, tiene la siguiente distribución de probabilidades:
Consideremos una política de inventarios denominada (q,Q), que indica que si el nivel de inventarios al final de cada día es menor a q=2 se ordenan Q=1 unidades adicionales (las cuales se asumen disponibles al inicio del día siguiente), en caso contrario no se hace ninguna orden. La demanda no satisfecha es venta perdida y hay 2 unidades al final en n=0 (distribución inicial). Sea Xn el nivel de inventario al final del día n (esto corresponde a la definición de la variable aleatoria), interesa modelar el problema mediante una Cadena de Markov.
Un primer desafío consiste en determinar los posibles estados que puede adoptar la variable aleatoria en una etapa n cualquiera. Notar que es posible finalizar un día sin unidades en inventario, dado que si bien esta situación genera una reposición de 1 unidad, ésta se asume disponible al inicio del día siguiente. Adicionalmente también es posible terminar un día con 1 o 2 unidades en inventario (en estos casos no se genera reposición). Sin embargo, no es posible terminar un día con 3 unidades en inventario (recordar que en n=0 se dispone de 2 unidades en inventario y dada la política de reposición, ésta se genera cuando se dispone de menos de 2 unidades en inventario). En resumen, los estados posibles para la variable aleatoria son Xn℮{0,1,2}.
A continuación estimamos las probabilidades de transición en una etapa las cuales se resumen en la siguiente matriz de probabilidades de transición (matriz P):
Por ejemplo, si en un día n en particular se finaliza con 0 unidades en inventarios se genera un pedido que al inicio del día siguiente permitirá disponer de 1 unidad; para que dicho día (n+1) se termine con 0 unidades en inventario se requiere que la demanda sea mayor o igual a 1 unidad (este es el caso de P00).
Adicionalmente se pueden estimar las probabilidades estacionarias, es decir, que en el largo plazo (independiente de la distribución inicial) se disponga al final de un día de 0, 1 o 2 unidades en inventario. Para ello se debe clasificar los estados de la cadena donde en particular se corrobora que ésta es irreducible con estados recurrentes positivos aperiódicos.
En consecuencia la probabilidad de que en el largo plazo se disponga de 0 unidades al final de un día es de un 50% (1/2), tener una unidad es un 37,5% (3/8) y 2 unidades un 12,5% (1/8). Alternativamente podemos hacer uso de las ecuaciones matriciales para que partiendo de la distribución inicial (dato) se estime la probabilidad de encontrarse en cualquiera de los estados al cabo de 1, 2, …, n etapas (con n que tiende a infinito). Dicho resultado corrobora los resultados anteriores:
Se propone al lector comprobar que independiente de la selección de la distribución inicial las probabilidades de largo plazo son las expuestas.
Una Distribución Límite (estacionaria) de una Cadena de Markov en tiempo discreto consiste en una distribución de estado estable para los estados de una cadena que es independiente de la distribución inicial.
En distintas aplicaciones de esta categoría de procesos estocásticos resulta de interés identificar la probabilidad de que la variable aleatoria «Xn» adopte un valor «j» (entre M estados posibles) al cabo de un número de etapas o transiciones «n» que tiende a infinito. Lo anterior equivale a:
En este contexto existen ecuaciones que permiten encontrar estas probabilidades de largo plazo en la medida que el proceso markoviano en tiempo discreto sea una cadena irreducible con estados recurrentes positivos aperiódicos.
En forma compacta las ecuaciones que permiten encontrar las probabilidades estacionarias son:
Consideremos el siguiente ejemplo que satisface las condiciones enunciadas previamente. ¿Cuál es la probabilidad de que en el largo plazo el proceso se encuentre en el estado 0, 1 o 2?.
La matriz de probabilidades de transición en una etapa (y su respectiva matriz transpuesta) son las siguientes:
El sistema de ecuaciones que permite encontrar las probabilidades de estado estable queda especificado por:
La resolución del sistema anterior permite obtener:
Es decir, la probabilidad de que en el largo plazo el proceso se encuentre en el estado 0, 1 y 2 es de un 28,57%, 35,71% y 35,71%, respectivamente (las probabilidades han sido aproximadas a dos decimales). Esto es independiente de la distribución inicial, es decir, en qué estado actualmente se encuentre la variable aleatoria.
Conclusión: Se puede corroborar los resultados anteriores utilizando las fórmulas matriciales para encontrar la distribución de estado para una etapa «n». Para ello seleccionamos un valor de «n» relativamente «grande» y una distribución inicial cualquiera (se deben seleccionar valores de a, b y c mayores o iguales a cero tal que a+b+c=1). Con esto se puede verificar que independiente de la distribución inicial las probabilidades de largo plazo convergerán asintóticamente a los valores obtenidos anteriormente.
Por ejemplo, estableciendo (arbitrariamente) a=1, b=0, c=0 se logran las siguientes probabilidades de estado al cabo de 10 transiciones (con color verde se muestra las probabilidades estacionarias).
En el siguiente artículo abordaremos la formulación de una Cadena de Markov en tiempo discreto, para la cual identificaremos la variable aleatoria que resulta de interés su análisis, los posibles estados que puede adoptar dicha variable en un periodo cualquiera y las probabilidades de transición en una etapa que se puede resumir en una matriz de transición de probabilidades conocida como matriz P. En dicho contexto consideremos el siguiente ejemplo:
Un individuo posee 2 paraguas los cuales emplea para ir de su casa al trabajo y viceversa (llevando uno a la vez). Si está en casa (oficina) al comienzo (final) del día y está lloviendo toma un paraguas, si lo hay para ir de su casa a la oficina y viceversa. Asuma que independiente del pasado llueve al comienzo (final) del día con probabilidad p (0<p<1). Se desea modelar el número de paraguas en su casa al inicio del día n, suponiendo que inicialmente ambos paraguas están en su casa.
El problema sugiere como variable aleatoria el modelamiento del número de paraguas que tiene el individuo en su casa al inicio del día n:
Los posibles estados o valores que puede adoptar la variable aleatoria en una etapa n cualquiera son 0, 1 o 2. Es decir, el individuo podrá tener en su casa al inicio de un día en particular 0, 1 o 2 paraguas.
A continuación corresponde identificar las probabilidades de transición en una etapa, lo cual depende de la dinámica de la situación planteada:
Por ejemplo P(0,0) representa la probabilidad de que un día el individuo no tenga paraguas en su casa (por tanto los 2 paraguas están en la oficina) y que al inicio del día siguiente siga en la misma situación (es decir, sin paraguas en la casa). Los escenarios que permiten esta situación son que llueva en la mañana (con probabilidad p) y que no llueva en la tarde (con probabilidad 1-p). Adicionalmente si no llueve en la mañana (con probabilidad 1-p) y no llueve en la tarde (con probabilidad 1-p) el individuo al inicio del día siguiente no tendrá paraguas en la casa. En consecuencia se puede notar que para este caso lo relevante es que no llueva en la tarde (sin importar si llueve o no en la mañana) para que de esta forma el individuo no se lleve un paragua desde la oficina a la casa.
Otra combinación interesante es P(2,2) que considera la probabilidad de tener los 2 paraguas en la casa al inicio de un día (y por tanto ninguno en la oficina) y al inicio del día siguiente también tener 2 paraguas en la casa. Para ello se debe cumplir alguno de los siguientes escenarios: que llueva en la mañana y en la tarde, que no llueva ni en la mañana ni en la tarde o que no llueva en la mañana pero si llueva en la tarde.
Una vez identificadas todas las probabilidades de transición en una etapa entre estados, éstas se pueden resumen en la matriz de probabilidades de transición (conocida también como matriz P). Notar que la suma de las probabilidades de cada una de las filas de la matriz es (y debe ser) un 100%.
Alternativamente la información anterior se puede representar a través de un grafo donde cada nodo representa un estado y las flechas muestran si es posible pasar de un estado a otro al cabo de una etapa (y cuál es la probabilidad asociada en dicho caso):
Adicionalmente se puede identificar (si se cuenta con dicha información) la distribución inicial de estados que permite identificar cuál es la probabilidad que al inicio de la planificación el proceso se encuentre en alguno de los n estados posibles. En este ejemplo sabemos que se comienza con 2 paraguas en la casa:
Con la información recabada en este problema estamos en condiciones de poder estimar cuál es la probabilidad que comenzando en un estado i pasemos a un estado j al cabo de n etapas (pasos). Este tipo de análisis y otros complementarios los abordaremos en un próximo artículo.
Actualización: Se recomienda consultar el artículo Cadenas de Markov (Ejercicios Resueltos) para encontrar material de estudio complementario al presentado en esta publicación.