El tema a desarrollar es intervalo de Confianza y haciendo referencia a Richard I. Levin & David S. Rubin, en su libro de “Estadística para Administradores”, establecen el concepto de Intervalo de Confianza de la siguiente forma:
Intervalo de valores que tiene designada una probabilidad que incluya el valor real del parámetro de población.
Para entender mas claramente este concepto, es necesario comentar de inicio otros que al estar relacionados con el, facilitan su comprensión.
Algunos de estos conceptos a revisar son:
- Estimación.
- Estimación Puntual.
- Estimación de intervalo.
- Nivel de confianza.
- Limites de confianza
Estimación
(Del lat. aestimatĭo, -ōnis). f. Aprecio y valor que se da y en que se tasa y considera algo. || 2. Der. La que se realiza en ciertos tributos para determinar el valor de la base imponible.
Este es el concepto que podemos encontrar en un diccionario. Pero es además un concepto que en nuestra vida diaria aplicamos de forma recurrente.
Todo el mundo hace estimaciones. Para cruzar una calle, y vemos venir un auto, estimamos la velocidad de este y la distancia que hay entre nosotros y el automóvil a fin de decidir si esperamos a cruzar o echaremos a correr para cruzar la calle.
Implicito esta en este ejemplo una de la razones para hacer estimaciones como administradores, jefes o lideres de equipo: Tomar decisiones en base a un calculo, una estimación.
Los administradores deben hacer estimaciones rápidas, el resultado de estas incide en la organización por medio de la decisión tomada a partir de la estimación. Se hacen estimaciones en:
- Una universidad para determinar el nivel de inscripciones año con año.
- En un buró de crédito, a fin de determinar si un cliente puede terminar de pagar su deuda en un determinado tiempo, a partir de sus hábitos de crédito previos, lo que vendría a ser el historial.
- Para fijar presupuestos, con base a información del pasado.
En cada uno de estos casos se esta tratando de inferir, saber algo de una población a partir de una muestra, como tomadores de decisiones, nos veremos muchas veces forzados a tomar decisiones confiando en nuestro instinto en nuestros presentimientos, pero lo ideal cada uno en su posición, seria que estas decisiones estuvieran tomadas a partir de la disposición de información y aplicar conocimientos de estadística para desempeñarnos mejor.
Concluimos de inicio para el Concepto de Estimación que las razones para su aplicación son las siguientes:
- Con el fin de tomar decisiones racionales, para el beneficio de la organización.
- Inferir algo, acerca a partir de la información de la muestra., a partir de métodos con precisión razonable, todo este proceso debe ser capaz de proveer de información para desempeñarnos de la mejor manera en la toma de decisiones.
Existen dos tipos de estimación, en lo que se refiere a una población.
- Estimación. Puntual.
- Estimación de Intervalo.
Este último concepto nos ayudara a entender el concepto objetivo de nuestra exposición que es Intervalo de Confianza.
Estimación Puntual
Una estimación puntual es un solo número que se utiliza para estimar un parámetro (dato) de población desconocido.
Ejemplo: El jefe de una Universidad estaría haciendo una estimación puntual al afirmar: “Para el siguiente año escolar por nuestros datos actuales se indica que en la materia de Filosofía y letras tendremos 350 estudiantes”.
La afirmación es similar a lanzar una moneda al aire: o es cierta o es falsa, solo tiene dos opciones. Por lo tanto una estimación puntual resulta a menudo insuficiente, debido a que solo tiene dos opciones: es correcta o esta equivocada. Además si se nos dice que el jefe de departamento esta equivocado en su estimación, se generarla la siguiente pregunta. ¿Que tan distante esta la estimación de la real? Es decir que estimación de error posee. No es lo mismo decir que la estimación esta errada por 10 estudiantes que por 90, la diferencia lo establece un concepto: CONFIABILIDAD.
Ejemplo de Estimación Puntual: La media de la muestra es un estimador de la media de la población confiable, sobre todo cuando la muestra es lo suficientemente grande. Pero es una estimación puntual pues solo arroja un resultado.
Para explicarlo, aun cuando ya es un tema visto, haremos revisión de la formula:
Donde: ∑x, es la sumatoria de todos los elementos de la muestra.
Y n, es el numero de elementos.
Observemos el ejemplo de una compañía de suministros clínicos que produce jeringas hipodérmicas desechables. Cada jeringa viene en una envoltura estéril que a su vez viene empacada en grandes cajas de cartón corrugado. Debido a la forma en que empacan las jeringas en las cajas de cartón, están manejan una cantidad de contenido diferente, debido a que las jeringas se venden por pieza, la compañía necesita una estimación del número de pieza que hay por caja, para propósitos de facturación.
Se tomo la muestra aleatoria de 35 cajas, y se registro el número de jeringas contenido en dicha muestra:
101 | 103 | 112 | 102 | 98 | 97 | 93 |
105 | 100 | 97 | 107 | 93 | 94 | 97 |
97 | 100 | 110 | 106 | 110 | 103 | 99 |
93 | 98 | 106 | 100 | 112 | 105 | 100 |
114 | 97 | 110 | 102 | 98 | 112 | 99 |
Utilizando la formula, tendremos lo siguiente.
|
Así pues al usar la media de la muestra, como nuestro estimador, la estimación puntual de la media es de 102 jeringas.
La conclusión a la que llegaríamos con el anterior ejemplo seria:
Así al usar la media de la muestra como un estimador, la estimación puntual de la jeringa hipodérmica desechable es de 102 jeringas por caja. El precio de fabricación es bastante bajo (alrededor de 25 centavos), de modo que tanto el comprador como el vendedor aceptarían esta estimación puntual como la base para hacer la facturación, y el fabricante puede ahorrarse tiempo y el gasto de contar cada una de las jeringas contenidas en las cajas.
El propósito de tomar muestras es para conocer mas acerca de una población, ya sea, los estudiantes de ingreso al próximo ciclo escolar, o el total de un embarque de jeringas hipodérmicas, como en el ejemplo anterior, cuyo análisis partió de una muestra de 35 cajas.
Para hacerlo, podemos basarnos en estimaciones puntuales, como lo es la media de la muestra, o con Estimaciones de intervalo, nuestro siguiente tema.
Estimación de Intervalo
Una estimación de Intervalo, describe un intervalo de valores dentro del cual es posible que este un parámetro de población.
Dentro de sus características encontramos:
- Dentro de las estimaciones de Intervalo, se maneja un concepto adicional, que implica la incertidumbre que acompañara dicha estimación.
- Una afirmación acerca del intervalo dentro del cual es probable que este la media de población desconocida.
- Para proporcionar dicha afirmación, se necesita encontrar el error estándar de la media.
Para explicarlo mejor nos apoyaremos en el siguiente ejemplo:
Suponga que el director de investigaciones de mercado de una fábrica de refacciones automotrices necesita hacer una estimación de la vida promedio de las baterías para automóvil que su compañía produce. Se selecciona una muestra aleatoria de 200 baterías, se registro en nombre de los propietarios de los automóviles y su dirección, de la misma manera se entrevisto a estas personas con respecto a la duración de la batería de su automóvil. Después de realizar la aplicación de la formula de la media de la muestra, tenemos como resultado: 36 meses de vida promedio.
Si se utiliza la estimación puntual de la media de la muestra como el mejor estimador de la media de la población µ se informaría que la vida media de las baterías de la empresa es de 36 meses.
Pero supongamos que el director también conocer acerca de la incertidumbre que probablemente acompañara a la estimación, es decir una afirmación acerca del intervalo dentro de lo cual es posible que este la media de la población desconocida. Eso se determina calculando el error estándar de la media.
Para esto se utiliza la formula de cálculo de error estándar de la media:
Supongamos que previamente se hizo el cálculo de la desviación estándar de las 200 baterías, y se ha determinado que es de 10 meses. Utilizando dicho dato y la formula que indicamos en el recuadro anterior. Resultaría así.
Ahora se puede concluir que la estimación de la vida útil de un las baterías de la compañía es de 36 meses, y el error estándar que acompaña a dicha estimación es .707. En otras palabras, la vida útil real para todas las baterías puede estar en alguna parte de esta estimación de intervalo comprendida entre 35.293 y 36.707 meses.
Nos hemos acercado ya entonces al concepto inicial de la exposición, Intervalo de confianza, a fin de entender Estimación de Intervalo, marcando su diferencia con Estimación Puntual.
Recordemos el concepto de Richard I. Levin & David S. Rubin, en su libro de “Estadística para Administradores”, establecen el concepto de Intervalo de Confianza de la siguiente forma:
Intervalo de valores que tiene designada una probabilidad que incluya el valor real del parámetro de población
Porque hacemos esto, para entender el concepto de Nivel de confianza de un Intervalo, esto es la probabilidad de que el verdadero parámetro de la estimación este dentro de la estimación de intervalo.
Es decir apoyándonos en el ejemplo de las 200 baterías, cuantas de estas caerían dentro del intervalo en donde se encuentra la media de la muestra., con los limites que hemos establecidos con la formula de Error estándar de la media.
Nivel de confianza
En la estadística la probabilidad que asociamos o relacionamos con una estimación de intervalo es conocida como Nivel de Confianza.
Que tanta confianza tenemos que la estimación que hicimos de un intervalo, incluya la mayor parte de la muestra, es decir los casos analizados.
Analicemos un caso práctico:
Considere por ejemplo el caso de un cliente de una tienda de electrodomésticos que pregunta sobre el tiempo de espera para la entrega de una lavadora de ropa nueva. En la tabla se aprecia las preguntas que el cliente puede hacer y las probables respuestas. Si se observa se puede ver que existe una relación directa entre el nivel de confianza y el intervalo de confianza de cualquier estimación.
Pregunta del Cliente | Respuesta del Empleado. | Nivel de Confianza | Intervalo de Confianza Implicado |
¿Llegara la lavadora en un año? | Tengo la certeza de ello. | Mayor a 99% | Un año. |
¿Me entregaran la lavadora dentro de un mes? | Estoy casi seguro de que llegara en un mes. | Al menos 95% | Un mes |
¿Me entregaran la lavadora en una semana? | Estoy bastante seguro. | Alrededor de 80% | Una semana |
¿Me entregaran la lavadora mañana? | No tengo la certeza de poder hacerlo. | Cerca de 40% | Un día |
¿Llegara la lavadora antes de que llegue a casa? | Hay una mínima posibilidad de poder lograrlo. | Cerca de 1% | Una hora. |
- Se nota que cuando el intervalo de confianza es más amplio o extenso, como en el caso de la entrega que tarda un año, la estimación toma un valor muy poco real, a pesar de que el administrador le da un nivel de confianza de 99% a dicha estimación.
- A medida que el cliente estable un intervalo mas estrecho (el tiempo de entrega), el administrador de la tienda consiente un nivel de confianza mas bajo, ¿llegara la lavadora antes que llegue yo a casa?, la estimación de confianza tiene un nivel muy bajo (1%).
Encontramos de esta forma el intervalo de confianza del anterior ejemplo:
N.C. | Intervalo |
Mayor a 99% | Un año. |
Al menos 95% | Un mes |
Limites de Confianza
A menudo el intervalo de confianza se expresa en términos de errores estándar, más que con valores numéricos. De la siguiente forma.
x ± 1.64 σ x en la que:
x + 1.64 σ x = limite superior del intervalo.
x – 1.64 σ x = limite inferior del intervalo.
A estos límites se les conoce como limites de Confianza del intervalo de Confianza. (LIC)
¿Qué ES EL MINITAB?
Minitab es un programa de computadora diseñado para ejecutar funciones estadísticas básicas y avanzadas. Combina lo amigable del uso de Microsoft Excel con la capacidad de ejecución análisis estadísticos. En 1972, instructores del programa de análisis estadísticos de la Universidad Estatal de Pennsylvania (Pennsylvania State University) desarrollaron MINITAB como una versión ligera de OMNITAB, un programa de análisis estadístico del Instituto Nacional de Estándares y Tecnología (NIST) de los Estados Unidos. Como versión completa en el 2006 cuesta $1195 USD, pero una versión para estudiantes y académicos se ofrece como complemento de algunos libros de texto.
El entorno de trabajo con Minitab se divide en:
- Barra de Menús.
- Barra de Herramientas.
- Área “Session”.
- Área “Work Sheet”.
Entorno minitab
Intervalos de confianza
Ejemplo peso de una bolsa de frituras
Problema
Suponga que desea calcular, el Intervalo de confianza de 100 bolsas de frituras, con peso establecido de 40 gramos y necesitas asegurarte que el proceso de la media esté dentro de 2.5 gramos que es el objetivo.
Una forma de dar entrada a los datos seria capturar, utilizando una columna, el total de las cien bolsitas de frituras, a esto se le conoce como recolección de datos.
A fin de manejar otra opción dentro de Minitab, generaremos la serie de datos en forma aleatoria de la siguiente forma:
1.-Menú Calc>Random Data> Normal
Se abre un cuadro de dialogo, que pregunta aspectos, como numero de Filas, media, y desviación estandar.
Como estamos trabajando con un peso especifico de embalaje, se indica tecleando en los cuadros: 40 de media, y una desviación de 2.5 gramos, el numero de filas: 100, la columna se ubica en Store in column(s) dando doble clic, en el listado del recuadro izquierdo.
Clic, en OK
Se generaran de forma aleatoria, una serie de 100 números, como la siguiente.
Una vez creada nuestra relación de 100 bolsas de frituras (serie de números), se procede a trabajar en establecer el intervalo de confianza.
Pero antes de seguir.
¿Que es un intervalo de confianza?
Un intervalo de confianza es un rango de posibles valores para un perímetro de una población (tal como µ) que esta basada en un dato de muestra. Por ejemplo, muy seguido usaras una muestra para calcular µ. Un intervalo confidencial te dirá que tan lejos esperes ese cálculo. ¿Cuándo usar el intervalo de confianza?
Usa un intervalo de confianza para hacer inferencias de una o más poblaciones de muestra de datos.
- – Menu Stat > Basic Statistics > 1-Sample t.
(Observe la figura siguiente para apreciar secuencia de clics)
A continuación aparecerá un cuadro de dialogo, donde se indicara el nivel de confianza en el intervalo buscado y la variable a trabajar (esto en el caso de haber mas columnas, se da doble clic sobre la columna a trabajar, para que se desplace al apartado de variables).
Clic, en Graphs
Seleccionar Boxplot of data.
Clic OK
Interpretando resultados
Intervalo de confianza
El intervalo de confianza es un rango de posibles valores para µ. Esta mostrado gráficamente como una línea roja y dos escuadras cuadradas debajo del boxplot.
Es un intervalo de confianza de 95% por que tomamos 100 muestras de la misma población, los intervalos de 95 de las muestras incluirá a µ. Por lo tanto para cualquier ejemplo que pueda ser 95% seguro que la µ está dentro del intervalo de confianza.
En la siguiente hoja, la figura graficada, se maximiza, para fácil apreciación.
El área de Session, además le arroja información, procesada de los datos iniciales:
Interpretar:
N (Numero de datos).
M (Media).
St Dev (Desviación estandar)
95% CI (95% de Intervalo de Confianza).
(39,426 40,428) (Intervalo de Confianza.
Si se desea conservar el proyecto generado:
Clic Menu File >Save Project As.
Dar nombre y guardar en la ubicación deseada.
Síntesis del Manual.
- Se ha generado una serie de datos aleatorios. (En lugar de esta opción se da la Recolección de Datos desde cuadricula, o desde archivos Data.).
- Dotándole de características especificas. (Media y Desviación estandar).
- Se ha hecho un análisis y proceso de dichos datos. (Intervalo de Confianza)
- Se ha obtenido del anterior proceso Información.
- Conocemos el intervalo de confianza, con nivel de 95% de confiabilidad.
Bibliografía
“Estadística para Administradores”,Richard I. Levin & David S. Rubin. Editorial Prentice Hall.