Cálculo de la Probabilidad de un Número de Llegadas en un Tiempo Determinado utilizando la Distribución de Poisson

Cuando los clientes llegan a un servicio de forma totalmente aleatoria (es decir, no hay forma de pronosticar cuándo va a llegar alguien) la función de densidad de probabilidad para describir la cantidad de llegadas durante un tiempo determinado se representa por la Distribución de Poisson y automáticamente la distribución del tiempo entre llegadas sigue una Distribución Exponencial según lo expuesto en el artículo Propiedad de Falta de Memoria o Amnesia de la Distribución Exponencial.

En este contexto la fórmula que permite calcular la probabilidad exacta de n llegadas dentro de un período T es la siguiente:

probabilidad-poisson

Consideremos por ejemplo un taller que se dedica a labores de reparación y que la llegada de éstos diariamente se comporta de forma aleatoria con una tasa de 10 trabajos diarios. ¿Cuál es la probabilidad de que no lleguen trabajos durante una hora cualquiera bajo el supuesto que el taller opera 8 horas al día?.

probabilida-cero-llegadas-p

Notar que \lambda =\frac{10}{8}=1,25[\frac{trabajos}{hora}]. Es decir, la probabilidad de no recibir trabajos durante una hora cualquiera es aproximadamente a un 28,65%.

Asumamos ahora una nueva situación. Un proceso que tiene una tasa promedio de llegada de 6 clientes por hora (\lambda =6[clientes/hora]) y se desea evaluar cuál es la probabilidad de que lleguen exactamente 0, 1, 2,…,n clientes en un intervalo de tiempo de 0,5 horas (30 minutos). El siguiente vídeo proporciona una simulación de dicho escenario:

En el gráfico, el área amarilla, por ejemplo, significa exactamente la probabilidad que 3 personas lleguen en las 0,5 horas. El área amarilla más el área roja, por ejemplo, significa la probabilidad de que lleguen 2 o 3 personas en los 30 minutos.

Adicionalmente haciendo uso del software Geogebra y su herramienta cálculos de probabilidad, se puede representar la Distribución de Poisson para los parámetros descritos anteriormente de forma de obtener rápidamente los resultados para distintos números de llegadas (notar que la Distribución de Poisson es discreta).

distribucion-poisson-geogeb

Ejemplo de una Regresión Lineal Múltiple para un Pronóstico con Excel y Minitab

Los métodos de pronósticos de relaciones causales establecen que el comportamiento o variación de una variable de interés se puede explicar a través de una o más variables que se presume tienen un efecto significativo sobre ella. Tal sería el caso de si por ejemplo se intenta explicar las ventas de casas en un país a través de variables como la tasa de interés promedio para créditos hipotecarios, PIB per cápita, subsidios del estado para adquisición de nuevas viviendas, crecimiento demográfico, entre otras.

Ejemplo de una Regresión Lineal Múltiple

En el siguiente artículo desarrollaremos un pronóstico a través de una regresión lineal múltiple que en términos generales se puede representar por Y=\beta_{0}+\beta_{1}X_{1}+\beta_{2}X_{2}+\cdots +\beta_{k}X_{k} donde Y es la variable dependiente, X_{1},X_{2},\cdots ,X_{k} las variables independientes y \beta _{0},\beta _{1},\beta _{2},\cdots,\beta _{k} los coeficientes de la regresión. En particular consideraremos en el siguiente ejemplo una variable dependiente (Ganancias en Millones de $) y 2 variables explicativas o independientes (Número de Vendedores y Precio del Producto $), es decir, Y=\beta _{0}+\beta _{1}X_{1}+\beta _{2}X_{2}, donde X_{1} es el N° de Vendedores y X_{2} el Precio del Producto ($). La información se resume en la tabla a continuación:

datos-regresion-lineal-mult

En el artículo Cómo utilizar una Regresión Lineal para realizar un Pronóstico de Demanda se detalla el procedimiento para obtener una regresión lineal simple con una variable explicativa, lo cual se favorece con la utilización de las herramientas que provee Excel como se muestra en los siguientes gráficos:

graficos-regresion-lineal-s

¿Qué sucede si ahora buscamos explicar las Ganancias en Millones de $ a través del Número de Vendedores y Precio del Producto $? (ambas variables independientes o explicativas en forma simultanea). Existen varias alternativas para lograr lo anterior. Un procedimiento sencillo es utilizar la herramienta de Análisis de Datos de Excel cuya implementación se muestra a continuación:

estadisticas-regresion-mult

Otra alternativa es hacer uso del software estadístico Minitab 17. El siguiente tutorial muestra la implementación computacional:

salida-regresion-multiple-m

La diferencia en los coeficientes de la regresión de ambos procedimientos obedece sólo a aspectos de visualización de los resultados. Luego, la interpretación es la siguiente: las variables independientes Número de Vendedores y Precio del Producto $ explican el 97,23% de la variación de las Ganancias en Millones de $. Notar que al considerar 2 variables independientes el coeficiente de determinación r cuadrado aumenta en comparación a las alternativas que consideran sólo una variable independiente o explicativa.

¿Quieres tener el archivo Excel con la Regresión Lineal Múltiple desarrollada en este ejemplo?

[sociallocker]

MUCHAS GRACIAS!. DESCARGA AQUÍ EL ARCHIVO

[/sociallocker]

Propiedad de Falta de Memoria o Amnesia de la Distribución Exponencial

En el análisis del comportamiento de las Líneas de Espera, se reconoce que el proceso de llegada de los clientes al sistema ocurre de forma totalmente aleatoria. Se entiende por aleatorio que la ocurrencia de un evento no se ve afectado por el tiempo transcurrido desde la ocurrencia de un evento anterior. Por ejemplo, si en estos momentos son las 10:30 y la última llegada de un cliente fue a las 10:15, la probabilidad de que la siguiente llegada sea a las 10:35 es función sólo de las 10:30 a las 10:35 y en consecuencia es totalmente independiente del tiempo transcurrido desde la ocurrencia del último evento, es decir, de las 10:15 a las 10:30. Este resultado se conoce como falta de memoria o amnesia de la Distribución Exponencial.

linea-de-espera-llegada

Consideremos el siguiente ejemplo que permite ilustrar esta situación: Una máquina en operación tiene una unidad de reserva para sustituirla de inmediato cuando falla. El tiempo medio entre fallas (conocido también como MTBF o Mean Time Between Failures) se distribuye exponencial y sucede cada 50 minutos (en promedio). El operario de la máquina comenta que ésta suele descomponerse cada tarde a eso de las 17:00. Se requiere analizar la validez de lo que señala el operario.

El tasa promedio de fallas de la máquina es \lambda =60/50=1,2[fallas/hora]. Luego la distribución exponencial del tiempo entre fallas se representa por f(t)=1,2e^{-1,2t}, t>0.

Se concluye que lo que señala el operario no es correcto dado que contradice a que el tiempo entre fallas se distribuye exponencial y que por consiguiente es totalmente aleatorio. Dicho de otro modo la probabilidad de que la máquina falle a las 17:00 dependerá de la hora del día (en relación a las 17:00) con la que se calcule. Por ejemplo, si ahora son las 16:30, la probabilidad de que lo que afirma el operador sea cierto es:

probabilidad-tiempo-entre-f

El resultado anterior se puede corroborar haciendo uso de la herramienta de cálculos de probabilidad del software Geogebra:

geogebra-probabilidad-tiemp

A continuación presentamos un breve tutorial de nuestro canal de Youtube con la implementación en Geogebra del ejemplo anterior:

Gráfico de Promedios y Gráfico de Rangos en el Control Estadístico de Procesos con Minitab 17

En el siguiente tutorial mostraremos cómo hacer un gráfico de promedios y un gráfico de rangos en el contexto del Control Estadístico de Procesos (CEP) utilizando el software estadístico Minitab 17. Para tal propósito utilizaremos los mismos datos del Ejemplo de Gráfica de Promedios y Gráfica de Rangos en el Control Estadístico de Procesos que desarrollamos en un artículo previo. Cabe destacar que cualquier diferencia entre el artículo de referencia y los resultados que se observan en el vídeo a continuación obedecen sólo a criterios de aproximación de decimales.

Vídeo disponible en nuestro Canal de Youtube en https://youtu.be/ghNlFTjrjBo

Minitab 17 genera las gráficas de control de forma automática, las cuales podemos comparar con las que se pueden obtener haciendo uso de Excel.

promedios-y-rangos-minitab-

grafica-promedios-control-e

grafica-rangos-control-esta

El proceso del ejemplo se encuentra bajo control estadístico. Notar que los resultados de cada muestra tanto del gráfico de promedio como rangos se encuentran dentro de los límites de control. No obstante llama la atención el aumento de la variabilidad (rangos) de las últimas muestras lo que sugiere mantener un estrecho control sobre el proceso productivo para evitar que éste salga de los límites.

Problema de Explotación de Minas y Transporte de Carbón a Puertos

Es frecuente reconocer en los problemas de optimización que representan una estructura productiva, un componente de costo fijo asociado a la utilización de un recurso (dentro de un intervalo de producción relevante) y un costo variable que que asume proporcional al nivel de actividad que represente la unidad productiva (por ejemplo, lo que se refiere a costos de producción, costos de transporte en una red logística, entre otros). Por ejemplo, el Problema de Inclusión de Costos Fijos en Programación Entera representa una situación muy sencilla de lo anteriormente descrito.

En este contexto a continuación se presenta un problema de operación de minas de carbón que su simple utilización tiene asociado un costo fijo, además de incurrir en costos variables por concepto de producción y transporte a distintos puertos demandantes, que adicionalmente tienen requerimientos particulares sobre la calidad del producto recepcionado.

Problema de Explotación de Minas y Transporte

La compañía ABC puede explotar hasta tres minas de carbón y debe realizar envíos a tres puertos. El costo por tonelada de producción (en dólares), el costo fijo de operación en dólares (en caso de ser utilizada), los contenidos de una cierta clase de ceniza y de sulfuro por tonelada y las capacidades de producción (en toneladas de carbón) se resumen en la siguiente tabla:

antecedentes-productivos-mi

Por su parte, las toneladas demandadas que deben ser enviadas a cada puerto, conjuntamente con los costos de transporte (en dólares por tonelada) se dan en la siguiente tabla:

demanda-puertos

Formule y resuelva un modelo de optimización que permita determinar la eventual operación de cada mina y sus niveles de producción, de modo de satisfacer los requerimientos de demanda y que las cantidades enviadas a cada puerto contenga a los más un 4,5% de ceniza y a lo más un 3% de sulfuro.

Variables de Decisión:

variables-minas-y-puertos

Parámetros:

parametros-minas-y-puertos

Función Objetivo: Se desea minimizar los costos asociados a la explotación de las minas, el costo de producción del carbón y los costos de transporte del carbón enviado desde las minas a los puertos.

funcion-objetivo-minas-y-pu

Restricciones:

Capacidad de Producción de las Minas: cada mina puede operar a su capacidad máxima de producción para abastecer los requerimientos de los distintos puertos en caso en que se decida realizar funciones de explotación en la misma.

capacidad-minas

Demanda de Carbón los Puertos: cada puerto debe recibir la cantidad de toneladas de carbón que demanda.

demanda-carbon-puertos

Máximo Porcentaje de Ceniza admitido por cada Puerto: cada puerto esta dispuesto a recibir como máximo un 4,5% de ceniza en los envíos de carbón que recibe desde las minas. En este caso se expresa dicha condición de forma general a través de parámetros.

maximo-ceniza-puertos

Máximo Porcentaje de Sulfuro admitido por cada Puerto: similar al caso anterior pero estableciendo un límite máximo al porcentaje de sulfuro que admite cada puerto (en el ejemplo un 3%).

maximo-sulfuro-puertos

No Negatividad: las toneladas producidas en las minas y transportadas a los puertos naturalmente deben satisfacer las condiciones de no negatividad.

no-neg-minas-y-puertos

A continuación de presenta un extracto de la implementación computacional del modelo anterior haciendo uso de Solver de Excel junto a un tutorial de nuestro canal de Youtube con los detalles de la resolución:

solucion-minas-y-puertos-so

Se puede observar que sólo se utilizan las minas 1 y 3. La mina 1 envía 35, 45 y 30 toneladas al Puerto 1, 2 y 3, respectivamente. En el caso de la mina 3, ésta envía 35, 35 y 30 toneladas a los Puertos 1, 2 y 3, respectivamente. La demanda en toneladas de carbón es satisfecha en los puertos y se respeta adicionalmente la capacidad máxima de producción de las minas. Adicionalmente se puede observar en color verde el porcentaje de ceniza o sulfuro (según sea el caso) que recibe cada puerto lo cual satisface las condiciones expuestas. Finalmente el valor óptimo, es decir, el costo mínimo asociado al plan de producción y transporte descrito es de 14.550 dólares.

¿Quieres tener el archivo Excel con la implementación computacional de este problema?

[sociallocker]

MUCHAS GRACIAS!. DESCARGA AQUÍ EL ARCHIVO

[/sociallocker]