Cómo ajustar una Función de Probabilidad Teórica a una serie de datos Empíricos

En el análisis del comportamiento de una línea de espera se suele considerar  la premisa de que el tiempo entre llegada de los clientes se distribuye exponencial con parámetro lambda (λ). Si bien esta presunción es válida en muchas situaciones es conveniente realizar un diagnóstico de dicha situación a través de test estadísticos ad hoc. En este contexto el siguiente artículo aborda el problema de ajuste de una función de probabilidad teórica a una serie de datos empíricos que como se menciono anteriormente es un asunto de interés en el análisis de los sistemas de espera como así también en un sin número de aplicaciones estadísticas clásicas.

La data que utilizaremos en este tutorial fue obtenida del Libro Matching Supply with Demand: An Introduction to Operations Management. Esta corresponde a las 686 llamadas que ha recibido un Call Center en un período de 4 horas según se muestra a continuación:

tabla-data-call-center

La pregunta que queremos responder es: ¿El tiempo entre llamada de los clientes se distribuye exponencial?. Análogamente ¿Qué función de probabilidad teórica ajusta de mejor forma los datos empíricos?. Para enfrentar dichas interrogantes utilizaremos el software Easyfit que hemos abordado en artículos anteriores para la confección de histogramas y análisis de estadísticas descriptivas.

Preliminarmente ordenaremos los datos recolectados en una columna y procedemos a calcular el tiempo transcurrido entre cada llamada (Iai), por ejemplo, entre la primera y segunda llamada pasan 23 segundos, entre la segunda y tercera llamada pasan 1 minuto y 24 segundos (equivalente a 84 segundos) y así sucesivamente. A continuación se muestra un extracto de dicho procedimiento:

calculo-del-tiempo-entre-ll

Con los tiempos entre llamadas en segundos (o su equivalencia en minutos si así se desea) se hace uso de Easyfit. Copiamos dichos tiempos en la columna A tal se muestra en la siguiente imagen y luego la opción «Ajustar distribuciones»:

ajustar-distribuciones-easy

Luego seleccionamos «OK»:

datos-de-entrada-easyfit

El programa se ejecuta y proporciona los resultados de los ajustes de los datos empíricos a un importante número de distribuciones teóricas, proporcionando una estimación de los parámetros respectivos.

ajuste-easyfit-datos-empiri

La distribución Wakeby es la que muestra el mejor ajuste, considerando los siguientes parámetros:

parametros-wakeby

Adicionalmente podemos obtener los test de bondad de ajuste (en la pestaña «Bondad de ajuste»). Probablemente el más conocido de ellos es el test Chi-cuadrado (notar que las distribuciones han sido ordenadas en base a este criterio). También se puede obtener el detalle de las pruebas de hipótesis para distintos niveles de significancia estadística (valores de alfa).

bondad-de-ajuste-easyfit
valores-p-easyfit

Una interpretación exhaustiva de los test de bondad de ajuste requiere de una discusión más detallada que escapa a los propósitos de este artículo. No obstante queda de manifiesto que existen herramientas computacionales que permite simplificar este tipo de análisis que es recurrente en el ámbito de la estadística y por cierto en el de la gestión de operaciones.

Cómo calcular la Utilización de un servidor, Tiempo de Espera y Tiempo de Flujo de una Línea de Espera

El siguiente artículo aborda de forma práctica cómo calcular algunos indicadores de desempeño básico de un sistema de espera con un único servidor. Entre ellos, la tasa promedio de flujo (λ), la capacidad promedio del servidor (μ), la utilización promedio del servidor (ρ=λ/μ), el tiempo promedio que un cliente esta en la fila esperando ser atendido (Wq) y el tiempo promedio que un cliente esta en el sistema (Ws), esto incluyendo tanto los tiempos de espera como los tiempos de atención.

Considere un proceso de línea de espera que tiene un servidor y una única fila (caja de atención) como el que se describe a continuación. Se opera bajo una regla de prioridad FIFO, es decir, se atienden los clientes por orden de llegada. Los registros tomados para la primera hora de trabajo de un día en particular son los siguientes:

linea-de-espera-1-servidor
tabla-llegada-de-clientes-l

Por ejemplo el Cliente 3 llega exactamente 9 minutos después de iniciada las actividades y una vez que comienza su atención (por el servidor) el tiempo requerido para completar ésta es de 7 minutos. Es decir, el tiempo de flujo de este cliente es de 11 minutos, donde 7 minutos corresponde a la atención en sí y los 4 minutos restantes son los minutos que debe esperar que se desocupe el servidor (que esta atendiendo al Cliente 2). Con este ejemplo queda en evidencia que contar con la información de las primeras 3 columnas se puede completar la información de las columnas restantes.

Ahora desarrollaremos algunos cálculos básicos que permite tener una noción del desempeño de esta línea de espera.

Calcular la tasa de flujo promedio (λ) y la capacidad promedio del servidor (μ): Pasaron 12 clientes por el servicio en 60 minutos, luego la tasa de flujo promedio es λ=0,2[clientes/minuto]=12[clientes/hora]. El tiempo de servicio promedio es 4[min] (corresponde al promedio de los valores de la columna Ws), luego la capacidad promedio es μ=1[clientes]/4[min]=0,25[clientes/min]=15[clientes/hora].

La utilización promedio del servidor (ρ): Esto permite estimar que porcentaje del tiempo en promedio el servidor esta ocupado (atendiendo clientes). En nuestro ejemplo ρ=λ/μ=12[clientes/hora]/15[clientes/hora]=80%. Notar que de este ejemplo sencillo se obtiene una importante conclusión que se puede extrapolar a otros sistemas de espera más complejos:

Si existe variabilidad en las llegadas y/o atenciones, entonces hay colas (aunque de largo finito). A pesar de que λ<μ, es decir, de que ρ<1. Si λ>μ el sistema es inestable (colas infinitas). Es decir, las colas se deben a la variabilidad y no al hecho de que λ>μ (ρ>1).

El tiempo promedio que un cliente pasa en el sector de caja (espera + atención) (Ws): El tiempo promedio que un cliente pasa en el sector de caja corresponde al promedio de los valores de la columna “Tiempo Sistema”: Ws=8[min].

Evalúe si el proceso de llegada es estacionario: Un proceso de llegada es estacionario si el número esperado de clientes que llegan al sistema sólo depende de la longitud del intervalo de tiempo y no del tiempo de inicio del intervalo. Lo anterior por simple inspección no se cumple para el ejemplo. En este sentido se puede apreciar que en la primera media hora de observación han llegado 8 clientes (de un total de 12 clientes en la hora completa). Por tanto el sistema tiene un requerimiento mayor en el primer período de observación.

clientes-acumulados

El gráfico anterior corrobora esta conclusión. Se muestra la cantidad de clientes (acumulados) que han llegado al sistema al cabo de un determinado tiempo. La línea roja mostraría teóricamente el comportamiento de un proceso estacionario, donde un cliente llega exactamente cada 5[min]. La línea azul muestra el comportamiento real del proceso en estudio.

Análisis Cuantitativo de un Proceso Productivo y su relación con la Ley de Little

Existe una estrecha relación teórica y práctica entre el análisis cuantitativo de un Proceso Productivo (donde se calculan frecuentemente indicadores de gestión como capacidad, tiempo de ciclo, tiempo de flujo, utilización, entre otros) y las Líneas de Espera.

Lo anterior generalmente suele ser materia de estudios de cursos de Gestión de Operaciones e Investigación Operativa. En el siguiente artículo ilustraremos dicha relación a través de un ejemplo sencillo que fue compartido por uno de nuestros lectores.

En el taller ABC se dedican a la reparar carrocerías de autos, en particular desabollan y pintan. En la entrada del taller atienden las recepcionistas Mónica y Silvana quienes reciben a los clientes y revisan si viene con los papeles apropiados (documentos del auto, ven si el trabajo se puede hacer en el taller, presupuesto valido, etc).  Si todo se encuentra en orden se genera una ficha para el automóvil y es ingresado al taller. Si no Mónica o Silvana, según corresponda, le informan al dueño del vehículo qué debe hacer, ya sea ir a otro taller o volver otro día.

En la entrada del taller esperando para ser atendidos hay, en promedio, 1 automóvil esperando además de los que están revisando Mónica y Silvana.

(a) Si los autos llegan al taller a una tasa promedio de 2 autos por hora, ¿cuánto tiempo en promedio espera un cliente para saber si su auto será ingresado al taller o no?

Para responder lo anterior aplicamos la ecuación de la Ley de Little donde nos interesa calcular el tiempo que en promedio permanece un cliente en el sistema (Ws), dado que recién luego de la entrevista con una recepcionista el cliente sabrá si su auto se ingresará al taller o no.

ws-ejemplo-proceso

Continuando con el análisis consideraremos la siguiente información adicional: En el interior del taller el trabajo en los automóviles se divide en 4 etapas:

  • Desabolladura, en esta etapa hay un sólo trabajador (A).
  • Pintado, en esta etapa de pintado hay 4 trabajadores (B1, B2, B3, B4).
  • Secado, no necesita trabajadores, puede asumir que hay tantos espacio como autos se necesiten secar (D).
  • Entrega, en esta etapa hay un sólo trabajador (E).

En la siguiente figura puede ver como se organiza el taller y el tiempo promedio que toma cada tarea:

proceso-con-actividades-en-

(b) Encuentre el cuello de botella del proceso, la capacidad de cada estación y la capacidad total.

La capacidad de cada estación de trabajo se detalla a continuación. Notar que los trabajadores de la etapa de pintado trabajan en paralelo, por tanto se suman sus respectivas capacidades. Adicionalmente como la etapa D (secado) no tiene restricciones en cuanto al número de vehículos que simultáneamente pueden pasar por dicha actividad, se considera en consecuencia que su capacidad es infinita.

capacidad-proceso-taller-pr

El cuello de botella son los trabajadores de las actividades de Pintado, siendo la capacidad del taller de 19/12[autos/hora].

(c) Suponga que, de los 2 autos por hora que en promedio llegan al taller, entran a desabollarse efectivamente el 70%. ¿Cuál  es la utilización de las etapas A y E?

La tasa de entrada (λ) efectiva de autos al taller es λ=0,7*2[autos/hora]=1,4[autos/hora] y representa la demanda del sistema. Por tanto la utilización de los trabajadores de las etapas A y E son:

calculo-utilizacion-trabaja

Claramente la tasa de llegada tiene un impacto directo en la utilización de los trabajadores, más aun en un contexto de una empresa de servicios como el descrito en el ejemplo que hemos propuesto en este artículo, donde el taller responde a la demanda de los clientes y por supuesto no puede anticiparse a la demanda (como el enfoque de los procesos productivos de fabricación contra stock conocidos comúnmente como «make to stock»).

Qué es la Ley de Little y su aplicación en Líneas de Espera

La Teoría de Colas o Líneas de Espera hace uso de modelos matemáticos para encontrar un balance adecuado entre el nivel de servicio ofrecido a los clientes y los costos asociados a su prestación. El objetivo es reducir el impacto desfavorable de la espera de los clientes o usuarios de un sistema a niveles tolerables.

Notar que la tolerancia de un cliente a la espera depende de muchos factores que resulta imposible enumerar de forma exhaustiva, incluso en un análisis introspectivo se puede apreciar que nuestra propia tolerancia no es rígida y se ve afectada por condiciones del ambiente, congestión del sistema, temperatura, urgencia, etc.

Una descripción general de la estructura de los modelos que representan lo que sucede en un proceso o línea de espera es la siguiente:

  1. Clientes con una fuente de entrada (población finita o infinita). Una población finita se refiere a un conjunto limitado de clientes que usarán el servicio y en ocasiones formarán una línea. Por el contrario una población infinita es lo bastante grande en relación con el sistema de servicio.

  2. Clientes entran al sistema y se unen a una cola (tiempo entre llegada de clientes). Por lo general se supone que el tiempo entre llegada de clientes se distribuye de forma exponencial. No obstante se puede corroborar lo anterior a través de un ajuste de curva para lo cual se puede utilizar software estadístico como Easyfit.

  3. Se proporciona el servicio (tiempos de servicio) por un servidor (uno y/o múltiples servidores) a un miembro de la cola, según una disciplina de servicio (disciplina de la cola). La disciplina de la cola más común es FIFO, es decir, se atiende por orden de llegada.

  4. El cliente sale del sistema.

En este contexto uno de los escenarios más sencillo para el análisis es aquel donde existe una fase de servicio, un único servidor, con una fuente de entrada infinita y una longitud permisible de la fila ilimitada.

linea-de-espera-un-servidor

Ley de Little

Un importante resultado matemático es el demostrado por John Little en 1961, el cual relaciona las siguientes variables:

L : Número promedio de clientes en un sistema
W : Tiempo promedio de espera en un sistema
λ : Número promedio de clientes que llegan al sistema por unidad de tiempo

Luego la Ley de Little establece que el número promedio de clientes en un sistema (L) es igual a la tasa promedio de llegada de los clientes al sistema (λ) por el tiempo promedio que un cliente esta en el sistema (W).

formula-ley-de-little

La fórmula es válida para sistemas y para subsistemas, es decir:

formula-ley-de-little-esper

Donde Lq es el número promedio de clientes que esperan en la fila y Wq el tiempo promedio que un cliente espera en la fila. Adicionalmente µ representa el ritmo del servicio o capacidad del sistema.

Ejemplo Ley de Little

Un pequeño banco está considerando abrir un servicio para que los clientes paguen desde su automóvil. Se estima que los clientes llegarán a una tasa promedio de 15 por hora. El cajero que trabajará en la ventanilla puede atender a los clientes a un ritmo promedio de uno cada tres minutos. Suponiendo que el patrón de llegadas es Poisson y el patrón de servicios es Exponencial, encuentre:

La utilización promedio del cajero:

utilizacion-cajero

El número promedio de clientes en la línea de espera es:

Lq-ley-de-little

El número promedio de clientes en el sistema:

Ls-ley-de-little

El tiempo promedio de la espera en la fila:

Wq-ley-de-little

El tiempo promedio de espera en el sistema:

Ws-ley-de-little

En el libro de Investigación de Operaciones de Hamdy Taha se puede encontrar un archivo en formato Excel que permite automatizar este tipo de cálculos y que facilita el análisis de las líneas de espera. El archivo lo puedes descargar aquí: Formulas Sistemas de Espera.

Para la utilización de la planilla se deben completar los datos de entrada (Input Data) y se obtienen automáticamente los resultados que son consistentes con lo detallado anteriormente.

salida-planilla-linea-de-es

El ejemplo que hemos presentado ha sido obtenido del Libro de Administración de Operaciones duodécima edición de los autores Chase, Jacobs y Aquilano el cual puede ser adquirido a través del siguiente enlace: