Cómo hacer un Diagrama de Pareto con Excel 2010

El Diagrama de Pareto consiste en una representación gráfica de los datos obtenidos de un problema que resulta de utilidad para identificar cuáles son los aspectos prioritarios que se deben enfrentar. En este contexto se espera el cumplimiento de la Regla de Pareto que empíricamente indica que aproximadamente el 80% de los problemas se explica por aproximadamente el 20% de las causas (notar que la Regla de Pareto se aplica adicionalmente en otros ámbitos y que por cierto los porcentajes anteriores son aproximaciones).

En el siguiente artículo desarrollamos a través de un ejemplo la confección de un Diagrama de Pareto haciendo uso de Excel en su versión de Office 2010, no obstante, resulta ser bastante genérico como instructivo en caso que estemos utilizando otra versión de Office.

Para ello consideremos la observación de un proceso de manufactura de computadores donde se lleva registro de todas las causas (se han identificado 10) que generan un rechazo en el control de calidad durante el horizonte de evaluación.

tabla-diagrama-de-pareto

Por ejemplo la Causa 1 ha representado un total de 182 defectos (de un total de 355 defectos detectados) lo que corresponde a un 51,27% del total (182/355=0,5127). Notar que en conjunto la Causa 1 y Causa 2 representan un 80,28% del total (285/355=0,8028) lo cual aproxima de forma cercana el cumplimiento de la regla empírica de Pareto. A continuación una descripción detallada del procedimiento en Excel para la confección del Diagrama de Pareto.

Paso 1: Seleccionamos los datos de las columnas «Causas», «N° Defectos» y «% Total Acum.». A continuación en el Menú «Insertar» seleccionamos gráfico de «Columna», luego en las opciones disponibles en «Columna en 2-D» la alternativa «Columna agrupada».

paso-1-diagrama-pareto

Paso 2: Al completar el Paso 1 se generará un diagrama de barra como el que se muestra en la imagen a continuación. Luego debemos seleccionar cuidadosamente el eje horizontal (que representan el % Total Acum.) y posteriormente procedemos a «Cambiar tipo de gráfico».

paso-2-diagrama-pareto

Paso 3: Se desplegará una ventana que permite cambiar el tipo de gráfico donde debemos seleccionar «Línea» y «Aceptar».

paso-3-diagrama-pareto

Paso 4: Una vez concluido el Pase 3 obtendremos un gráfico como el que se muestra en la siguiente imagen. Seleccionamos con doble clic cualquiera de los datos que representa la serie de línea «% Total Acum.» (en el ejemplo el dato correspondiente a la Causa 9).

paso-4-diagrama-de-pareto

Paso 5: En la ventana «Formato de serie de datos» en «Opciones de serie» seleccionamos «Eje secundario» y luego «Cerrar». Se debería obtener un gráfico como el que se muestra a continuación.

paso-5-diagrama-pareto

Paso 6: Nuestro Diagrama de Pareto ha sido confeccionado y debería ser de la siguiente forma:

paso-6-diagrama-de-pareto

Opcionalmente se pueden hacer algunos cambios adicionales como, por ejemplo, dejar la etiqueta de datos al pie del gráfico y ajustar la escala del eje vertical de porcentajes de modo que el máximo valor sea un 100%.

diagrama-de-pareto

Una vez concluida la construcción del Diagrama de Pareto la interpretación de los datos se facilita, donde se observa tanto la frecuencia absoluta asociada a cada causa (que gatilla en un defecto) como también la contribución relativa acumulada que generan determinadas causas en el total de los defectos.

Notar adicionalmente que es imprescindible realizar un diagrama de causas (por ejemplo, el Diagrama de Espina de PescadoDiagrama de Ishikawa) si se quieren realizar mejoras. De esta forma se puede intervenir el Proceso Productivo en aquellos aspectos que están causando un desempeño deficiente y que se ve traducido en la calidad desmejorada del producto.

A continuación el enlace de descarga del archivo Excel utilizado en este artículo: Excel Diagrama de Pareto y un vídeo de nuestro canal de Youtube con el detalle de la implementación computacional:

Adicionalmente dejamos a disposición de nuestros usuarios la siguiente plantilla Excel la cual puede ser editada y ver los cambios asociados en la forma del Diagrama de Pareto:

¿Quieres tener el archivo Excel con el Diagrama de Pareto de este Ejemplo?

[sociallocker]

MUCHAS GRACIAS!. DESCARGA AQUÍ EL ARCHIVO

[/sociallocker]

Cálculo de la Probabilidad de un Número de Llegadas en un Tiempo Determinado utilizando la Distribución de Poisson

Cuando los clientes llegan a un servicio de forma totalmente aleatoria (es decir, no hay forma de pronosticar cuándo va a llegar alguien) la función de densidad de probabilidad para describir la cantidad de llegadas durante un tiempo determinado se representa por la Distribución de Poisson y automáticamente la distribución del tiempo entre llegadas sigue una Distribución Exponencial según lo expuesto en el artículo Propiedad de Falta de Memoria o Amnesia de la Distribución Exponencial.

En este contexto la fórmula que permite calcular la probabilidad exacta de n llegadas dentro de un período T es la siguiente:

probabilidad-poisson

Consideremos por ejemplo un taller que se dedica a labores de reparación y que la llegada de éstos diariamente se comporta de forma aleatoria con una tasa de 10 trabajos diarios. ¿Cuál es la probabilidad de que no lleguen trabajos durante una hora cualquiera bajo el supuesto que el taller opera 8 horas al día?.

probabilida-cero-llegadas-p

Notar que \lambda =\frac{10}{8}=1,25[\frac{trabajos}{hora}]. Es decir, la probabilidad de no recibir trabajos durante una hora cualquiera es aproximadamente a un 28,65%.

Asumamos ahora una nueva situación. Un proceso que tiene una tasa promedio de llegada de 6 clientes por hora (\lambda =6[clientes/hora]) y se desea evaluar cuál es la probabilidad de que lleguen exactamente 0, 1, 2,…,n clientes en un intervalo de tiempo de 0,5 horas (30 minutos). El siguiente vídeo proporciona una simulación de dicho escenario:

En el gráfico, el área amarilla, por ejemplo, significa exactamente la probabilidad que 3 personas lleguen en las 0,5 horas. El área amarilla más el área roja, por ejemplo, significa la probabilidad de que lleguen 2 o 3 personas en los 30 minutos.

Adicionalmente haciendo uso del software Geogebra y su herramienta cálculos de probabilidad, se puede representar la Distribución de Poisson para los parámetros descritos anteriormente de forma de obtener rápidamente los resultados para distintos números de llegadas (notar que la Distribución de Poisson es discreta).

distribucion-poisson-geogeb

Ejemplo de una Regresión Lineal Múltiple para un Pronóstico con Excel y Minitab

Los métodos de pronósticos de relaciones causales establecen que el comportamiento o variación de una variable de interés se puede explicar a través de una o más variables que se presume tienen un efecto significativo sobre ella. Tal sería el caso de si por ejemplo se intenta explicar las ventas de casas en un país a través de variables como la tasa de interés promedio para créditos hipotecarios, PIB per cápita, subsidios del estado para adquisición de nuevas viviendas, crecimiento demográfico, entre otras.

Ejemplo de una Regresión Lineal Múltiple

En el siguiente artículo desarrollaremos un pronóstico a través de una regresión lineal múltiple que en términos generales se puede representar por Y=\beta_{0}+\beta_{1}X_{1}+\beta_{2}X_{2}+\cdots +\beta_{k}X_{k} donde Y es la variable dependiente, X_{1},X_{2},\cdots ,X_{k} las variables independientes y \beta _{0},\beta _{1},\beta _{2},\cdots,\beta _{k} los coeficientes de la regresión. En particular consideraremos en el siguiente ejemplo una variable dependiente (Ganancias en Millones de $) y 2 variables explicativas o independientes (Número de Vendedores y Precio del Producto $), es decir, Y=\beta _{0}+\beta _{1}X_{1}+\beta _{2}X_{2}, donde X_{1} es el N° de Vendedores y X_{2} el Precio del Producto ($). La información se resume en la tabla a continuación:

datos-regresion-lineal-mult

En el artículo Cómo utilizar una Regresión Lineal para realizar un Pronóstico de Demanda se detalla el procedimiento para obtener una regresión lineal simple con una variable explicativa, lo cual se favorece con la utilización de las herramientas que provee Excel como se muestra en los siguientes gráficos:

graficos-regresion-lineal-s

¿Qué sucede si ahora buscamos explicar las Ganancias en Millones de $ a través del Número de Vendedores y Precio del Producto $? (ambas variables independientes o explicativas en forma simultanea). Existen varias alternativas para lograr lo anterior. Un procedimiento sencillo es utilizar la herramienta de Análisis de Datos de Excel cuya implementación se muestra a continuación:

estadisticas-regresion-mult

Otra alternativa es hacer uso del software estadístico Minitab 17. El siguiente tutorial muestra la implementación computacional:

salida-regresion-multiple-m

La diferencia en los coeficientes de la regresión de ambos procedimientos obedece sólo a aspectos de visualización de los resultados. Luego, la interpretación es la siguiente: las variables independientes Número de Vendedores y Precio del Producto $ explican el 97,23% de la variación de las Ganancias en Millones de $. Notar que al considerar 2 variables independientes el coeficiente de determinación r cuadrado aumenta en comparación a las alternativas que consideran sólo una variable independiente o explicativa.

¿Quieres tener el archivo Excel con la Regresión Lineal Múltiple desarrollada en este ejemplo?

[sociallocker]

MUCHAS GRACIAS!. DESCARGA AQUÍ EL ARCHIVO

[/sociallocker]

Propiedad de Falta de Memoria o Amnesia de la Distribución Exponencial

En el análisis del comportamiento de las Líneas de Espera, se reconoce que el proceso de llegada de los clientes al sistema ocurre de forma totalmente aleatoria. Se entiende por aleatorio que la ocurrencia de un evento no se ve afectado por el tiempo transcurrido desde la ocurrencia de un evento anterior. Por ejemplo, si en estos momentos son las 10:30 y la última llegada de un cliente fue a las 10:15, la probabilidad de que la siguiente llegada sea a las 10:35 es función sólo de las 10:30 a las 10:35 y en consecuencia es totalmente independiente del tiempo transcurrido desde la ocurrencia del último evento, es decir, de las 10:15 a las 10:30. Este resultado se conoce como falta de memoria o amnesia de la Distribución Exponencial.

linea-de-espera-llegada

Consideremos el siguiente ejemplo que permite ilustrar esta situación: Una máquina en operación tiene una unidad de reserva para sustituirla de inmediato cuando falla. El tiempo medio entre fallas (conocido también como MTBF o Mean Time Between Failures) se distribuye exponencial y sucede cada 50 minutos (en promedio). El operario de la máquina comenta que ésta suele descomponerse cada tarde a eso de las 17:00. Se requiere analizar la validez de lo que señala el operario.

El tasa promedio de fallas de la máquina es \lambda =60/50=1,2[fallas/hora]. Luego la distribución exponencial del tiempo entre fallas se representa por f(t)=1,2e^{-1,2t}, t>0.

Se concluye que lo que señala el operario no es correcto dado que contradice a que el tiempo entre fallas se distribuye exponencial y que por consiguiente es totalmente aleatorio. Dicho de otro modo la probabilidad de que la máquina falle a las 17:00 dependerá de la hora del día (en relación a las 17:00) con la que se calcule. Por ejemplo, si ahora son las 16:30, la probabilidad de que lo que afirma el operador sea cierto es:

probabilidad-tiempo-entre-f

El resultado anterior se puede corroborar haciendo uso de la herramienta de cálculos de probabilidad del software Geogebra:

geogebra-probabilidad-tiemp

A continuación presentamos un breve tutorial de nuestro canal de Youtube con la implementación en Geogebra del ejemplo anterior:

Gráfico de Promedios y Gráfico de Rangos en el Control Estadístico de Procesos con Minitab 17

En el siguiente tutorial mostraremos cómo hacer un gráfico de promedios y un gráfico de rangos en el contexto del Control Estadístico de Procesos (CEP) utilizando el software estadístico Minitab 17. Para tal propósito utilizaremos los mismos datos del Ejemplo de Gráfica de Promedios y Gráfica de Rangos en el Control Estadístico de Procesos que desarrollamos en un artículo previo. Cabe destacar que cualquier diferencia entre el artículo de referencia y los resultados que se observan en el vídeo a continuación obedecen sólo a criterios de aproximación de decimales.

Vídeo disponible en nuestro Canal de Youtube en https://youtu.be/ghNlFTjrjBo

Minitab 17 genera las gráficas de control de forma automática, las cuales podemos comparar con las que se pueden obtener haciendo uso de Excel.

promedios-y-rangos-minitab-

grafica-promedios-control-e

grafica-rangos-control-esta

El proceso del ejemplo se encuentra bajo control estadístico. Notar que los resultados de cada muestra tanto del gráfico de promedio como rangos se encuentran dentro de los límites de control. No obstante llama la atención el aumento de la variabilidad (rangos) de las últimas muestras lo que sugiere mantener un estrecho control sobre el proceso productivo para evitar que éste salga de los límites.