Definición: Una distribución de probabilidad indica toda la gama de valores que pueden representarse como resultado de un experimento si éste se llevase a cabo.
Es decir, describe la probabilidad de que un evento se realice en el futuro, constituye una herramienta fundamental para la prospectiva, puesto que se puede diseñar un escenario de acontecimientos futuros considerando las tendencias actuales de diversos fenómenos naturales.
Toda distribución de probabilidad es generada por una variable (porque puede tomar diferentes valores) aleatoria x (porque el valor tomado es totalmente al azar), y puede ser de dos tipos:
- Variable aleatoria discreta (x). Porque solo puede tomar valores enteros y un número finito de ellos. Por ejemplo:
- x ® Variable que define el número de alumnos aprobados en la materia de probabilidad en un grupo de 40 alumnos (1, 2 ,3…ó los 40).
PROPIEDADES DE UNA VARIABLE ALEATORIA DISCRETA (X)
- 0≤p(xi)£1 Las probabilidades asociadas a cada uno de los valores que toma x deben ser mayores o iguales a cero y menores o iguales a 1.
- Sp(xi) = 1 La sumatoria de las probabilidades asociadas a cada uno de los valores que toma x debe ser igual a 1.
Ejemplo para variable aleatoria discreta
Se tiene una moneda que al lanzarla puede dar sólo dos resultados: o cara (50%), o cruz (50%).
La siguiente tabla muestra los posibles resultados de lanzar dos veces una moneda:
PRIMER LANZAMIENTO | SEGUNDO LANZAMIENTO | NUMERO DE CARAS EN 2 LANZAMIENTOS | PROBABILIDAD DE LOS 4 RESULTADOS POSIBLES |
CARA | CARA | 2 | 0.5 X 0.5 = 0.25 |
CARA | CRUZ | 1 | 0.5 X 0.5 = 0.25 |
CRUZ | CARA | 1 | 0.5 X 0.5 = 0.25 |
CRUZ | CRUZ | 0 | 0.5 X 0.5 = 0.25 |
Al realizar la tabla de distribución del número posible de caras que resulta de lanzar una moneda dos veces, se obtiene:
NÚMERO DE CARAS | LANZAMIENTOS | PROBABILIDAD DE ESTE RESULTADO
P(CARA) |
0 | (CRUZ, CRUZ) | 0.25 |
1 | (CARA, CRUZ)
+ (CRUZ, CARA) |
0.50 |
2 | (CARA, CARA) | 0.25 |
NOTA: Esta tabla no representa el resultado real de lanzar una moneda dos veces sino la del resultado teórico es decir representa la forma en que se espera se comporte el experimento de lanzar dos veces una moneda.
- Variable aleatoria continua (x). Porque puede tomar tanto valores enteros como fraccionarios y un número infinito de ellos dentro de un mismo intervalo.
Por ejemplo:
- x ® Variable que define la concentración en gramos de plata de algunas muestras de mineral (14.8 gr., 12.1, 42.3, 15.0, 18.4, 19.0, 21.0, 20.8, …, ¥)
PROPIEDADES DE UNA VARIABLE ALEATORIA DISCRETA (X)
- p(x)³0 Las probabilidades asociadas a cada uno de los valores que toma x deben ser mayores o iguales a cero. Dicho de otra forma, la función de densidad de probabilidad deberá tomar solo valores mayores o iguales a cero.
- El área definida bajo la función de densidad de probabilidad deberá ser de 1.
DISTRIBUCIONES DE PROBABILIDAD DE LAS VARIABLES ALEATORIAS
(LAS MAS UTILIZADAS)
- Distribución Binomial
- Distribución de Poisson
- Distribución Normal
DISTRIBUCION BINOMIAL
La distribución Binomial es un caso particular de probabilidad de variable aleatoria discreta, y por sus aplicaciones, es posiblemente la más importante.
Esta distribución corresponde a la realización de un experimento aleatorio que cumple con las siguientes condiciones:
- Al realizar el experimento sólo son posible dos resultados: el suceso A, llamado éxito, o su contrario A’, llamado fracaso.
- Al repetir el experimento, el resultado obtenido es independiente de los resultados obtenidos anteriormente.
- La probabilidad del suceso A es constante, es decir, no varía de una prueba del experimento a otra. Si llamamos p a la probabilidad de A, p(A) = P, entonces p(A’) = 1 – p = q
* En cada experimento se realizan n pruebas idénticas.
Todo experimento que tenga estas características se dice que sigue el modelo de la distribución Binomial o distribución de Bernoulli.
En general, si se tienen n ensayos Bernoulli con probabilidad de éxito p y de fracaso q, entonces la distribución de probabilidad que la modela es la distribución de probabilidad binomial y su regla de correspondencia es:
Como el cálculo de estas probabilidades puede resultar algo tedioso se han construido tablas para algunos valores de n y p que facilitan el trabajo.
Calculo de la distribución de probabilidad binomial por tres métodos:
- a) Utilización del Minitab 15.
- b) Utilización de la fórmula
- c) Utilización de las tablas binomiales
Por ejemplo:
¿Cuál es la probabilidad de obtener exactamente 2 caras al lanzar una misma moneda 6 veces ?
Donde:
- P(X) es la probabilidad de ocurrencia del evento
- p es la probabilidad de éxito del evento (en un intento) (0.5)
- q es la probabilidad de fracaso del evento (en un intento) y se define como
q = 1 – p (0.50)
- X = ocurrencia del evento o éxitos deseados = 2 (para efectos de la tabla binomial tómese como r)
- n = número de intentos = 6
- a) Cálculo de la distribución de probabilidad binomial utilizando el Minitab 15.
Titular la columna C1 como X y en el renglón 1 columna 1 se coloca el número 2 (el cual representa el número de ocurrencia del evento, ya que se desea saber la probabilidad de que caigan exactamente dos caras). (Referirse a la figura 1)
Seleccionar: Calc / Probability Distributions / Binomial
En seguida aparecerá la ventana “Binomial Distribution” (“Distribucion Binomial”).
- Seleccionar Probability
- En el campo de “Number of trials” (Número de intentos) colocar 6 (n)
- En el campo de “Event probability” colocar 0.50 (probabilidad de éxito
- En el campo de “Input column” colocar el puntero del mouse y automáticamente aparecerá en el recuadro de la izquierda C1 X el cual se selecciona con el puntero del mouse y luego presionar “Select”
- Una vez alimentado los datos presionar “OK” .
- Para obtener así el resultado.
La probabilidad de que caigan 2 caras en el lanzamiento de una moneda 6 veces es 0.234375.
Por lo tanto:
- b) Cálculo de la distribución de probabilidad binomial utilizando la fórmula
Al sustituir los valores en la fórmula se obtiene:
- c) Cálculo de la distribución de probabilidad binomial utilizando las tablas binomiales.
- Para una combinación de n y p, la entrada indica una probabilidad de obtener un valor específico de r (ocurrencia del evento).
- Para localizar la entrada, cuando p≤0.50, localizar el valor de p a lo largo del encabezado de la tabla, y en la columna correspondiente localizar n y r en el margen izquierdo.
- Para localizar la entrada, cuando p≥0.50, localizar el valor de p en la parte inferior de la tabla, y n y r arriba, en el margen derecho.
Resolviendo el mismo ejemplo pero utilizando las tablas binomiales se tiene que:
p = 0.50, n = 6 y r = 2
Obteniendo resultado directo de tablas.
NOTA: Para este caso en particular donde p = 0.50 se puede obtener el resultado de las tablas trabajando como si p≤0.50 (encerrado en azul) o como si p≥0.50 (encerrado en rojo).
DISTRIBUCION DE POISSON
La distribución de POISSON es también un caso particular de probabilidad de variable aleatoria discreta, el cual debe su nombre a Siméon Denis Poisson (1781-1840), un francés que la desarrolló a partir de los estudios que realizó durante la última etapa de su vida.
Esta distribución se utiliza para describir ciertos procesos.
Características:
En este tipo de experimentos los éxitos buscados son expresados por unidad de área, tiempo, pieza, etc:
- # de defectos de una tela por m2
- # de aviones que aterrizan en un aeropuerto por día, hora, minuto, etc.
- # de bacterias por c m2 de cultivo
- # de llamadas telefónicas a un conmutador por hora, minuto, etc, etc.
- # de llegadas de embarcaciones a un puerto por día, mes, etc, etc.
Para determinar la probabilidad de que ocurran x éxitos por unidad de tiempo, área, o producto, la fórmula a utilizar es:
donde:
p(X) = probabilidad de que ocurran x éxitos, cuando el número promedio de ocurrencia de ellos es l.
l = media o promedio de éxitos por unidad de tiempo, área o producto
e = 2.718 (base de logaritmo neperiano o natural)
X = variable que nos denota el número de éxitos que se desea que ocurra
Hay que hacer notar que en esta distribución el número de éxitos que ocurren por unidad de tiempo, área o producto es totalmente al azar y que cada intervalo de tiempo es independiente de otro intervalo dado, así como cada área es independiente de otra área dada y cada producto es independiente de otro producto dado.
Calculo de la distribución de probabilidad de Poisson por tres métodos:
- Utilización del Minitab 15.
- Utilización de la fórmula
- Utilización de las tablas de Poisson
Por ejemplo:
Si un banco recibe en promedio (l=) 6 cheques sin fondo por día, ¿cuáles son las probabilidades de que reciba:
- a) cuatro cheques sin fondo en un día dado (x),
- b) 10 cheques sin fondos en cualquiera de dos días consecutivos?
(e= 2.718281828)
a) Cálculo de la distribución de probabilidad de Poisson utilizando el Minitab 15.
Resolviendo para:
- a) x = 4; l = 6 cheques sin fondo por día
Titular la columna C1 como X y en el renglón 1 columna 1 se coloca el número 4 (el cual representa el número de ocurrencia del evento, ya que se desea saber la probabilidad de que el banco reciba 4 cheques sin fondos en un día dado). (Referirse a la figura 2)
Seleccionar: Calc / Probability Distributions / Poisson
En seguida aparecerá una ventana “Poisson Distribution” (“Distribución de Poisson”).
- Seleccionar Probability
- En el campo de “Mean” (media = l ) colocar 6 (promedio de cheques diarios recibidos sin fondos)
- En el campo de “Input column” colocar el puntero del mouse y automáticamente aparecerá en el recuadro de la izquierda C1 Seleccionarlo con el puntero del mouse y presionar “Select”
- Una vez alimentado los datos presionar “OK” .
- Para obtener así el resultado.
- Por lo tanto la probabilidad de que el banco reciba cuatro cheques sin fondo en un día dado es:
Resolviendo de igual manera para:
- X=10; l= 6 x 2 = 12 cheques sin fondo en promedio que llegan al banco en dos días consecutivos.
- Para obtener así el resultado.
- Por lo tanto la probabilidad de que el banco reciba diez cheques sin fondo en dos días consecutivos es:
b) Cálculo de la distribución de probabilidad de Poisson utilizando la fórmula
Resolviendo para:
- a) x = 4; l = 6 cheques sin fondo por día y sustituyendo en la fórmula
Resolviendo de igual manera para:
- b) X=10; l= 6 x 2 = 12 cheques sin fondo en promedio que llegan al banco en dos días consecutivos.
- c) Cálculo de la distribución de probabilidad de Poisson utilizando las tablas de Poisson
- Valores directos para determinar probabilidades de Poisson.
- Para un valor dado de λ, la entrada indica la probabilidad de obtener un valor específico de X
Para el mismo ejemplo, resolviendo para:
- a) ¿Cuál es la probabilidad de que el banco reciba cuatro cheques sin fondo en un día dado?
Se tiene x = 4; l = 6 cheques sin fondo por día; obteniendo resultado directo de tablas :
Para el mismo ejemplo, resolviendo para:
- b) ¿Cuál es la probabilidad de que el banco reciba diez cheques sin fondo en dos días consecutivos?
Se tiene X=10; l= 6 x 2 = 12 cheques sin fondo en promedio que llegan al banco en dos días consecutivos, obteniendo resultado directo de tablas :
DISTRIBUCIÓN NORMAL
La distribución normal es también un caso particular de probabilidad de variable aleatoria contínua, fue reconocida por primera vez por el francés Abraham de Moivre (1667-1754). Posteriormente, Carl Friedrich Gauss (1777-1855) elaboró desarrollos más profundos y formuló la ecuación de la curva; de ahí que también se le conozca, más comúnmente, como la «campana de Gauss». La distribución de una variable normal está completamente determinada por dos parámetros, su media (µ) y su desviación estándar (σ). Con esta notación, la densidad de la normal viene dada por la ecuación:
Existen dos razones básicas por las cuales la distribución normal ocupa un lugar tan prominente en la estadística:
- Tiene algunas propiedades que la hacen aplicable a un gran número de situaciones en la que es necesario hacer inferencias mediante la toma de muestras.
- La distribución normal casi se ajusta a las distribuciones de frecuencias reales observadas en muchos fenómenos, incluyendo características humanas, resultados de procesos físicos y muchas otras medidas de interés para los administradores, tanto en el sector público como en el privado.
Propiedad:
No importa cuáles sean los valores de µ y σ para una distribución de probabilidad normal, el área total bajo la curva siempre es 1, de manera que podemos pensar en áreas bajo la curva como si fueran probabilidades. Matemáticamente es verdad que:
- Aproximadamente el 68% de todos los valores de una población normalmente distribuida se encuentra dentro de ± 1 desviación estándar de la media.
- Aproximadamente el 95.5% de todos los valores de una población normalmente distribuida se encuentra dentro de ± 2 desviaciones estándar de la media.
- Aproximadamente el 99.7% de todos los valores de una población normalmente distribuida se encuentra dentro de ± 3 desviaciones estándar de la media.
Relación entre el área bajo la curva de distribución normal de probabilidad y la distancia a la media medida en desviaciones estándar.
Estas gráficas muestran tres formas diferentes de medir el área bajo la curva normal. Sin embargo, muy pocas de las aplicaciones de la distribución normal de probabilidad implican intervalos de exactamente (más o menos) 1, 2 ó 3 desviaciones estándar a partir de la media. Para estos casos existen tablas estadísticas que indican porciones del área bajo la curva normal que están contenidas dentro de cualquier número de desviaciones estándar (más o menos) a partir de la media.
Afortunadamente también se puede utilizar una distribución de probabilidad normal estándar para encontrar áreas bajo cualquier curva normal. Con esta tabla se determina el área o la probabilidad de que la variable aleatoria distribuida normalmente esté dentro de ciertas distancias a partir de la media. Estas distancias están definidas en términos de desviaciones estándar.
Para cualquier distribución normal de probabilidad, todos los intervalos que contienen el mismo número de desviaciones estándar a partir de la media contendrán la misma fracción del área total bajo la curva para cualquier distribución de probabilidad normal. Esto hace que sea posible usar solamente una tabla de la distribución de probabilidad normal estándar
El valor de z está derivado de la fórmula:
En la que:
- x = valor de la variable aleatoria de interés.
- µ = media de la distribución de la variable aleatoria.
- σ = desviación estándar de la distribución.
- z = número de desviaciones estándar que hay desde x a la media de la distribución. (El uso de z es solamente un cambio de escala de medición del eje horizontal)
Calculo de la distribución de probabilidad Normal por los métodos:
- a) Utilización de las tablas de la distribución Normal.
- b) Utilización del Minitab 15.
- a) Cálculo de la distribución de probabilidad Normal utilizando las tablas de distribución de probabilidad normal estándar
Ejemplo:
Hay un programa de entrenamiento diseñado para mejorar la calidad de las habilidades de supervisión de los supervisores de la línea de producción. Debido a que el programa es autoadministrado, los supervisores requieren un número diferente de horas para terminarlo. Un estudio de los participantes anteriores indica que el tiempo medio que se lleva completar el programa es de 500 horas, y que esta variable aleatoria normalmente distribuida tiene una desviación estándar de 100 horas.
- a) ¿Cuál es la probabilidad de que un candidato elegido al azar requiera más de 500 horas para completar el programa de entrenamiento?
- b) ¿Cuál es la probabilidad de que un candidato elegido al azar se tome entre 500 y 650 horas en completar el programa de entrenamiento?
Resolviendo para:
- a) Dibujando una gráfica de distribución Normal (campana de Gauss) se puede observar que la mitad del área bajo la curva está localizada a ambos lados de la media de 500 horas. Por tanto, se deduce que la probabilidad de que la variable aleatoria tome un valor mayor a 500 es el área sombreada, es decir, 0.5
Resolviendo ahora para:
- b) Se tiene que: µ = 500 y σ = 100 y sustituyendo valores para la obtención de Z
Buscar Z = 1.50 en la tabla distribución de probabilidad normal estándar.
Encontrando una probabilidad de 0.4332.
Por lo tanto, la probabilidad de que un candidato escogido al azar requiera entre 500 y 650 horas para terminar el programa de entrenamiento es de 0.4332 es decir un 43.32%.
- b) Cálculo de la distribución de probabilidad Normal utilizando Minitab 15.
Resolviendo para:
- a) ¿Cuál es la probabilidad de que un candidato elegido al azar requiera más de 500 horas para completar el programa de entrenamiento?
Para obtener la gráfica de la distribución de probabilidad Normal en minitab 15 se selecciona:
Graph / Probability Distribution Plot…
En seguida aparecerá una ventana “Probability Distribution Plot” (“Gráfica de Distribución de Probabilidad”) con el puntero seleccionar “View Probability” (Vista de Probabilidad) y una vez seleccionado presionar OK.
En seguida aparecerá otra una ventana “Probability Distribution Plot – View Probability” (“Gráfica de Distribución de Probabilidad – Vista de Probabilidad”).
- En la pestaña de Distribution:
- En el campo de “Distribution:” seleccionar “Normal”
- En el campo de “Mean” (media = l ) colocar 500 (promedio de horas que se lleva completar el programa)
- En el campo de “Standar deviation” colocar 100 (desviación estándar de la variable)
- En la pestaña de Shaded Area:
- Con el puntero seleccionar “Probability”
- Con el punetro seleccionar el “Right Tail”
- En el campo de Probability: colocar 0.5 (ya que para este caso la media ocupa exactamente el punto más alto de la curva por tanto la probabilidad es de 0.5)
- Una vez alimentado los datos presionar “OK” .
El programa MIinitab arrojará la gráfica mostrada
Estos pasos descritos fue simplemente para mostrar la manera de graficarlo.
Resolviendo para:
- b) ¿Cuál es la probabilidad de que un candidato elegido al azar se tome entre 500 y 650 horas en completar el programa de entrenamiento?
Para obtener la gráfica en minitab seleccionar:
Graph / Probability Distribution Plot…
En seguida aparecerá una ventana “Probability Distribution Plot” (“Gráfica de Distribución de Probabilidad”) con el puntero seleccionar “View Probability” (Vista de Probabilidad) y una vez seleccionado presionar OK.
En seguida aparecerá otra una ventana “Probability Distribution Plot – View Probability” (“Gráfica de Distribución de Probabilidad – Vista de Probabilidad”).
- En la pestaña de Distribution:
- En el campo de “Distribution:” seleccionar “Normal
- En el campo de “Mean” (media = l ) colocar 500 (promedio de horas que se lleva completar el programa)
- En el campo de “Standar deviation” colocamos 100 (desviación estándar de la variable)
- En la pestaña de Shaded Area:
- Con el puntero seleccionar “X Value”
- Con el puntero seleccionar el “Middle”
- En el campo de X value 1: colocar 500 (valor medio)
- En el campo de X value 2: colocar 650 (valor de la probabilidad que toma la vareable en ese punto)
- Una vez alimentado los datos presionar “OK” .
- El programa MIinitab arrojará la gráfica mostrada y el valor obtenido
Es decir, la probabilidad de que un candidato escogido al azar requiera entre 500 y 650 horas para terminar el programa de entrenamiento es de 0.433. (43.30%)
CONCLUSIONES
El reto de la materia Estadística Aplicada a los Negocios, impartida por el Ing. Juan Alejandro Garza Rodríguez, nos comprometió a aprender y a utilizar el Minitab como una herramienta más.
Con los grandes avances tecnológicos hemos ahorrado tiempo para el análisis estadístico, sin embargo la comprensión de la lógica que se utiliza para llegar a la resolución del mismo es algo que nos ha llevado a este estudio, el cual ha sido muy bien conducido por el Ing. Garza, quien nos imparte la asignatura.
Con el desarrollo de este proyecto y gracias a la comprensión de conceptos y el manejo del programa Minitab entendimos que es una poderosa herramienta estadística que bien aplicada nos podrá ayudar a facilitar los cálculos para la solución de problemas. Lo cual continúa con el propósito esencial: Ahorro de costos y mejora continúa en cualquier ámbito en que nos desarrollemos. Aprendimos que no es limitativa el área en que nos desempeñemos en nuestro trabajo ya que tanto en Ingeniería como Materiales, en Recursos Humanos como en un Negocio Propio, en Comercio o en Industria, o bien por puro pasatiempo en el panorama de la probabilidad estadística, estas herramientas serán siempre de gran utilidad.
Para esta presentación aprendimos la aplicación y manejo de las Distribuciones de Probabilidades más comunes, la Binomial, la de Poisson y finalmente la distribución Normal.
Se investigó además de la utilización y funcionamiento del Minitab 15 el razonamiento, cálculo manual y por tablas como el método original como se realizaba, antes de que el Minitab existiera como tal.
Deseamos compartir esta compilación de información con alguien más que al igual que nosotros tuvimos la necesidad de investigar y realizar un trabajo de este tipo. Análisis y estudios que nos han abierto la mente así como nuestras habilidades para desempeñarnos con mayor eficiencia en nuestras funciones laborales y personales.
Gracias por tomarse el tiempo de revisar nuestras aportaciones.
BIBLIOGRAFIA
- Estadística para Administradores. Sexta Edición. Richard I. Levin & David S. Rubin. Editorial Prentice Hall. Capítulo 5 Probabilidad II: Distribuciones, pp.232 – 264
- GE Lighting – AEA. Curso para Green Belts, Iniciativa Sies Sigma Semana #1. Abril 1997.
- Minitab 15 (versión de prueba obtenida de www.minitab.com).
- MeetMinitabEs.pdf (obtenido de www.minitab.com)
- Distribución de Probabilidades (información tomada de www.monografias.com, http://www.monografias.com/trabajos29/distribucion-probabilidades/distribucion-probabilidades.shtml)
- Distribución Binomial (información tomada de www.wikipedia.com, http://es.wikipedia.org/wiki/Distribuci%C3%B3n_binomial)
- Distribución Normal (información tomada de www.wikipedia.com, http://es.wikipedia.org/wiki/Distribuci%C3%B3n_normal
- Distribución de Poisson (http://www.itchihuahua.edu.mx/academic/industrial/sabaticorita/_private/05Distr%20Poisson.htm)