Árbol de Decisión (Qué es y para qué sirve)

Un Árbol de Decisión (o Árboles de Decisiones) es un método analítico que a través de una representación esquemática de las alternativas disponible facilita la toma de mejores decisiones, especialmente cuando existen riesgos, costos, beneficios y múltiples opciones. El nombre se deriva de la apariencia del modelo parecido a un árbol y su uso es amplio en el ámbito de la toma de decisiones bajo incertidumbre (Teoría de Decisiones) junto a otras herramientas como el Análisis del Punto de Equilibrio.

Los árboles de decisión son especialmente útiles cuando:

  1. Las alternativas o cursos de acción están bien definidas (por ejemplo: aceptar o rechazar una propuesta, aumentar o no la capacidad de producción, construir o no una nueva bodega, etc.)
  2. Las incertidumbres pueden ser cuantificadas (por ejemplo: probabilidad de éxito de una campaña publicitaria, probable efecto en ventas, probabilidad de pasar de etapas, etc.)
  3. Los objetivos están claros (por ejemplo: aumentar las ventas, maximizar utilidades, minimizar costos, etc.)

Árbol de Decisión (Ejercicio Resuelto)

La gerencia de una tienda debe decidir si debe construir una instalación pequeña o grande en otra ciudad. La demanda ahí puede ser baja o alta, con probabilidades estimadas de un 40% y 60%, respectivamente. Si se construye la instalación pequeña y la demanda resulta ser alta, el gerente puede decidir no expandirse (ganancia $223) o expandirse (ganancia $270). Si se construye una instalación pequeña y la demanda es baja, no hay razón para expandirse y la ganancia estimada en este caso es de $200. Por otro lado si se construye una instalación grande y la demanda resulta ser baja , la opción es no hacer nada (ganancia $40) o estimular la demanda con publicidad local. La respuesta a la publicidad puede ser modesta o considerable, con probabilidades estimadas de un 30% y 70%, respectivamente. Si es modesta, la ganancia estimada será sólo de $20; si la respuesta es considerable, la ganancia aumenta a $220; y por último, si construye una instalación grande y la demanda resulta ser alta, la ganancia estimada es de $800.

Dibuje un árbol de decisiones. Después analícelo para determinar el pago esperado de cada decisión y nodo de evento. ¿Qué alternativa tiene la ganancia esperada más alta?.

Para estos efectos es importante comprender la nomenclatura comúnmente utilizada para representar un árbol de decisión.

  1. Los nodos de decisión se anotan como cuadrados.
  2. Los nodos de incertidumbre se anotan como círculos.
  3. Los nodos de resultados finales se anotan como triángulos.
  4. Los eventos se unen con líneas o ramas del árbol.
  5. Los costos o beneficios asociados a una decisión o evento se anotan en la rama (para efectos de recordar aplicarlos al final de esa rama).
  6. Las probabilidades de un evento se anotan entre paréntesis en la rama correspondiente a ese evento.
  7. Los valores asociados a cada pago final se anotan junto al triangulo correspondiente, e incluyen costos asociados a la rama.
  8. Se diseñan comenzando por la decisión inicial, y una rama a la vez. Es importante tener claro el orden temporal de los eventos.
  9. Es importante distinguir entre eventos sobre los cuales se tiene poder de decisión, y aquellos que no.
  10. Se debe estimar el valor o resultado final de cada extremo del árbol.
  11. Se deben estimar o calcular las probabilidades de ocurrencia de los eventos inciertos.
  12. Se deben estimar los correspondientes valores esperados para cada rama del árbol. La resolución es hacia atrás.

A continuación se muestra un ejemplo de dicha notación aplicada a un problema descrito en el libro Administración de Operaciones, Producción y Cadena de Suministros, Duodécima Edición, Página 131, de los autores Chase, Jacobs y Aquilano. En dicha representación gráfica se puede apreciar la utilización de los elementos descritos en la nomenclatura anteriormente.

ejemplo árbol de decisión

En relación a nuestro ejemplo utilizaremos el software POM for Windows el cual se encuentra disponible junto al libro Administración de Operaciones, Procesos y Cadena de Suministro, Décima Edición, de los autores Krajewski, Ritzman y Malhotra. Notar que la versión del software utilizado no dispone de la opción de resultado final (triángulo) por tanto se ha dado término a cada ramificación utilizando un nodo (círculo) de incertidumbre.

árbol de decisiones

De esta forma la primera decisión consiste en construir una instalación pequeña o grande. Si la instalación es pequeña y la demanda es baja (con probabilidad de un 40%) no se hace nada y se obtiene $200 de ganancia, sin embargo, si la instalación es pequeña y la demanda es alta (con probabilidad de un 60%), nos enfrentamos a una segunda decisión: expandirse (con ganancia estimada de $270) o no expandirse (con ganancia estimada de $223).

Por otro lado si se decide por una instalación grande la demanda puede ser alta (con probabilidad de un 60%) en cuyo caso la ganancia es de $800 (y no se hace nada más) o la demanda puede ser baja (con probabilidad de un 40%), enfrentándose en este último caso a una nueva decisión: estimular o no la demanda. Si no se hace nada (es decir, si no se estimula la demanda) la ganancia será de $40 y si se estimula (realizar publicidad) la respuesta puede ser moderada (con probabilidad de un 30%) y ganancia estimada de $20 o considerable (con probabilidad estimada de un 70%) y ganancia de $220.

Luego de hacer la representación en POM for Windows del problema seleccionamos Solve para encontrar la solución que representa la mayor ganancia esperada. El resultado que ofrece el software se muestra a continuación:

ejercicio resuelto árbol de decisión

La gerencia por tanto debe construir la instalación grande con una ganancia esperada de $544 ($544=$160*0,4+$800*0,6 y además $160=$20*0,3+$220*0,7. La ganancia esperada asociada a la instalación pequeña es de $242). Notar que esta decisión (el tamaño de la instalación) es la única que se toma ahora. Las decisiones siguientes se toman después de ver si la demanda es baja o alta.

Para los usuarios que dispongan del software POM for Windows dejamos a continuación el archivo utilizado en este ejemplo para que pueda ser descargado. Alternativamente existen otros software que permiten la confección de árboles de decisión como PrecisionTree y TreePlan, ambos con opción de descarga gratuita durante un período de prueba.

[sociallocker]Ejemplo KPag 40[/sociallocker]

Cómo calcular la Probabilidad de producir un Producto Defectuoso (Control Estadístico de Procesos)

El siguiente artículo aborda a través de un sencillo ejemplo la estimación de la probabilidad de producir un producto defectuoso en el contexto del Control Estadístico de Procesos (CEP). Consideremos una empresa de manufactura que desea determinar si una máquina que tiene es capaz de fresar la pieza de un motor que tiene una especificación clave de  4 ± 0.003 pulgadas. Después de probar esta máquina, la empresa determinó que tiene una media muestral de 4.001 pulgadas con una desviación estándar de 0.002 pulgadas. Asumiendo que el proceso en cuestión se encuentra bajo control estadístico, calcule Cpk para esta máquina:

ejemplo-calculo-cpk

¿Cuál es la probabilidad de producir un defecto?. Un producto defectuoso será aquel que se encuentre en una dimensión bajo el LEI (3,997) o sobre el LES (4,003).

calculo-zlei-y-zles

Probabilidad de Defectuoso = P(X<LEI) + P(X>LES) = (1 – 0,9773) + (1 – 0,8413) = 18,14%.

Una forma alternativa de abordar el procedimiento anterior es haciendo uso de la interfaz de cálculos de probabilidad disponible en el software Geogebra. En la siguiente imagen el área achurada en color azul representa la probabilidad de que un producto no sea defectuoso (81,86%), por tanto por diferencia se obtiene la probabilidad de defectuoso (100% – 81,86% = 18,14%) que corrobora el resultado obtenido anteriormente.

probabilidad-defectuoso-geo

¿Recomendaría a la empresa utilizar esta máquina para producir esta pieza?. No. Cpk indica que el promedio muestral está descentrado, en particular, más cerca del LES. Si bien es difícil encontrar un proceso perfectamente centrado en el valor nominal de la especificación, en este caso esta situación no se compensa con una baja variabilidad del proceso (se propone al lector corroborar que Cp=0,5 lo cual confirma el análisis anterior). Adicionalmente la probabilidad de producir un defecto (18,14%) es inadmisible es un contexto competitivo.

Distribución Límite de una Cadena de Markov en Tiempo Discreto

Una Distribución Límite (estacionaria) de una Cadena de Markov en tiempo discreto consiste en una distribución de estado estable para los estados de una cadena que es independiente de la distribución inicial.

En distintas aplicaciones de esta categoría de procesos estocásticos resulta de interés identificar la probabilidad de que la variable aleatoria «Xn» adopte un valor «j» (entre M estados posibles) al cabo de un número de etapas o transiciones «n» que tiende a infinito. Lo anterior equivale a:

limite-cadena-de-markov

En este contexto existen ecuaciones que permiten encontrar estas probabilidades de largo plazo en la medida que el proceso markoviano en tiempo discreto sea una cadena irreducible con estados recurrentes positivos aperiódicos.

Para ello se requiere en primera instancia Clasificar los Estados de la Cadena de Markov de modo de corroborar las condiciones anteriores.

En forma compacta las ecuaciones que permiten encontrar las probabilidades estacionarias son:

ecuaciones-largo-plazo-mark

Consideremos el siguiente ejemplo que satisface las condiciones enunciadas previamente. ¿Cuál es la probabilidad de que en el largo plazo el proceso se encuentre en el estado 0, 1 o 2?.

grafo-markov-clasificacion-

La matriz de probabilidades de transición en una etapa (y su respectiva matriz transpuesta) son las siguientes:

matriz-markov-transpuesta

El sistema de ecuaciones que permite encontrar las probabilidades de estado estable queda especificado por:

ecuaciones-estacionarias-ma

La resolución del sistema anterior permite obtener:

probabilidades-largo-plazo

Es decir, la probabilidad de que en el largo plazo el proceso se encuentre en el estado 0, 1 y 2 es de un 28,57%, 35,71% y 35,71%, respectivamente (las probabilidades han sido aproximadas a dos decimales). Esto es independiente de la distribución inicial, es decir, en qué estado actualmente se encuentre la variable aleatoria.

Conclusión: Se puede corroborar los resultados anteriores utilizando las fórmulas matriciales para encontrar la distribución de estado para una etapa «n». Para ello seleccionamos un valor de «n» relativamente «grande» y una distribución inicial cualquiera (se deben seleccionar valores de a, b y c mayores o iguales a cero tal que a+b+c=1). Con esto se puede verificar que independiente de la distribución inicial las probabilidades de largo plazo convergerán asintóticamente a los valores obtenidos anteriormente.

formulas-matriciales-largo-

Por ejemplo, estableciendo (arbitrariamente) a=1, b=0, c=0 se logran las siguientes probabilidades de estado al cabo de 10 transiciones (con color verde se muestra las probabilidades estacionarias).

probabilidades largo plazo cdm

Cómo hacer un Histograma con Excel y EasyFit

En el siguiente artículo mostraremos cómo hacer un histograma aplicado a una serie de datos a granel. Para ello utilizaremos 2 programas computacionales frecuentemente utilizados para estos propósitos: Excel y EasyFit.

Recordemos que un histograma consiste en una representación gráfica  a través de un diagrama de barras, donde cada barra es proporcional a la frecuencia de los valores representados. El histograma como herramienta de análisis gráfica que resume información nos ayuda para tener una primera visión de si, por ejemplo, la distribución de los datos se asemeja al comportamiento de una función de probabilidad conocida.

Consideremos los siguientes 40 datos a granel que consideran la medición de un cierto fenómeno de interés:

datos-a-granel-para-histrog

A continuación generaremos una tabulación de la información utilizando algunos conceptos estadísticos básicos. Primero determinaremos la cantidad de clases «k» para lo cual se pueden utilizar múltiples criterios y donde se selecciona aquel que otorga una cantidad de clases «razonable». En nuestro ejemplo consideraremos k=6 clases.

cantidad-de-clases-histogra

Luego determinamos el Rango «R» que consiste en la diferencia entre la mayor y menor observación de los datos a granel. R=Máximo(Xi)-Mínimo(Xi)=2,8-0,5=2,3.

Ahora determinamos la amplitud de cada clase «a». Notar que el concepto de «Unidad» esta relacionado con los datos que se disponen que en nuestro ejemplo consideran un decimal, en consecuencia se define como unidad a 0,1.

amplitud-histograma

Finalmente calculamos el Límite Inferior (LI) y Límite Superior (LS) utilizando las siguientes fórmulas:

  • Límite Inferior (LI) = Mínimo Dato (Xi) – 0,5 «Unidad»
  • Límite Superior (LS) = Limite Inferior de la clase + amplitud

De acuerdo a lo anterior estamos en condiciones de construir una tabla que resume la información de los datos proporcionados a granel:

datos-tabulados-histograma

Notar, por ejemplo, que para la primera clase el Límite Inferior (LI=0,45) se obtiene restando al Mínimo Dato (en el ejemplo el dato 9 con valor 0,5) menos 0,5*(0,1).

El Límite Superior de la primera clase (LS=0,85) se obtiene sumando al Límite Inferior (LI=0,45) la amplitud obtenida previamente (a=0,4).

Adicionalmente los valores en la columna etiquetada con «Mi» representa la marca de la clase (por ejemplo en M1 es igual a (0,45+0,85)/2=0,65).

En la columna n se contabilizan las observaciones que corresponden a la clase lo que se denomina como frecuencia absoluta (por ejemplo en la clase 1 se observan 3 datos que están en el intervalo entre 0,45 y 0,85).

En f se considera la frecuencia relativa, es decir, la proporción de datos sobre el total de la muestra que pertenecen a la clase (por ejemplo, para la clase 1 es f=3/40).

Finalmente en N y F se representa la frecuencia absoluta acumulada y frecuencia relativa acumulada, respectivamente.

Si generamos un gráfico de columna en Excel con los valores de la frecuencia relativa de cada clase y como etiqueta de datos (línea horizontal) la marca de clase, se obtiene lo siguiente:

grafico-histograma-excel-2

Cabe destacar que existe una serie de software estadístico que permite procesar este tipo de análisis de forma rápida e intuitiva. A continuación mostraremos cómo generar un histograma utilizando EasyFit el cual esta disponible en una versión de evaluación de 30 días y en una licencia académica de 69 Euros. Para ello copiamos y pegamos los 40 datos en una columna de la interfaz del programa y luego seleccionamos el icono con forma de rayo.

easyfit-datos-a-granel

A continuación se desplegara el menú a continuación donde sólo será necesario seleccionar OK.

easyfit-analisis-distribuci

El programa ejecutará una rápida rutina donde ajustará un importante número de distintas funciones de probabilidad teóricas a los datos proporcionados. Por ejemplo, en el siguiente gráfico mostramos el histograma de los datos (que por cierto es consistente con lo que hemos obtenido previamente en Excel) y donde se ha ajustado una distribución normal a los datos (línea color rojo).

Claramente la función de densidad de probabilidad ajustada es una aproximación a la distribución de los datos y resulta de interés decidir si una distribución particular es representativa de la naturaleza de los datos. Para esto es necesario realizar un Test de Bondad de ajuste sobre lo cual nos referiremos en un próximo artículo.

distribucion-normal-histogr