Teoría de las muestras estadísticas de trabajo

Una parte fundamental para realizar un estudio estadístico de cualquier tipo es obtener unos resultados confiables y que puedan ser aplicables.

Como ya se comentó anteriormente, resulta casi imposible o impráctico llevar a cabo algunos estudios sobre toda una población, por lo que la solución es llevar a cabo el estudio basándose en un subconjunto de ésta denominada muestra.

teoria-de-las-muestras-de-trabajo

Sin embargo, para que los estudios tengan la validez y confiabilidad buscada es necesario que tal subconjunto de datos, o muestra, posea algunas características específicas que permitan, al final, generalizar los resultados hacia la población en total. Esas características tienen que ver principalmente con el tamaño de la muestra y con la manera de obtenerla.

En las siguientes secciones de esta unidad lo comentaremos.

La Alumna

UNIDAD 1. TEORÍA DE MUESTRAS

En este capítulo se resume la Teoría de Muestras estadística, la cual trata el concepto de estudiar una población desconocida tomándole muestras, y a través del estudio de las mismas poder hacer inferencias acerca de toda la población. Primero se analiza el caso del muestreo aleatorio simple y estratificado, mostrando el manejo de una tabla de números aleatorios. Luego se ven los tipos no-aleatorios en el muestreo y se discute acerca de las ventajas y desventajas de cada uno de los métodos. Se explican los métodos usados en Bioquímica para lograr que las muestras extraídas a los pacientes cumplan los requisitos de aleatoriedad, aunque sea aproximadamente. Lo mismo para el caso de la industria Farmacéutica y para las simulaciones en los muestreos de mercadeo, usadas en el comercio en general. De manera tal de poder aplicar luego los modelos estadísticos que exigen tal requisito. En la Tabla 3, del fascículo de las tablas, se presenta la Tabla Aleatoria, más conocida como: “Random Numbers”.

2. IMPORTANCIA DEL MUESTREO

A lo largo del curso se hacen uso de dos tipos de razonamiento: el deductivo y el inductivo. El primero está relacionado directamente con la teoría de probabilidad, que se aborda en la unidad 4, y que a partir de las características de la población se obtienen las posibles características de una muestra. El segundo tipo de razonamiento se relaciona con la denominada inferencia estadística: utilizar las características de un subconjunto de la población (la muestra) para hacer afirmaciones (inferir) sobre la población en general. Éste será el caso de esta unidad.

El muestro, como ya se mencionó, implica algo de incertidumbre que debe ser aceptada para poder realizar el trabajo, pues aparte de que estudiar una población resulta ser un trabajo en ocasiones demasiado grande, Wonnacott y Wonnacott ofrecen las siguientes razones extras:

Recursos limitados. Es decir, no existen los recursos humanos, materiales o económicos para realizar el estudio sobre el total de la población. Es como cuando se compra un aparato, un automóvil usado (por ejemplo), que se prueba unos minutos (el encendido, una carrerita, etc.) para ver si funciona correctamente y luego se adquiere, pero no se espera a probarlo toda la vida (encendiéndolo y apagándolo o, simplemente, dejándolo encendida) antes de realizar la adquisición.
Escasez. Es el caso en que se dispone de una sola muestra. Por ejemplo, para el estudio paleontológico de los dinosaurios (el T. Rex por ejemplo) sería muy bueno contar con, al menos, muchos restos fósiles y así realizar tales investigaciones; sin embargo, se cuenta sólo con una docena de esqueletos fosilizados (casi todos incompletos) de esas criaturas en todo el mundo.
Pruebas destructivas. Es el caso en el que realizar el estudio sobre toda la población llevaría a la destrucción misma de la población. Por ejemplo, si se quisiese saber el conteo exacto de hemoglobina de una persona habría que extraerle toda la sangre.
El muestreo puede ser más exacto. Esto es en el caso en el que el estudio sobre la población total puede causar errores por su tamaño o, en el caso de los censos, que sea necesario utilizar personal no lo suficientemente capacitado; mientras que, por otro lado, el estudio sobre una muestra podría ser realizada con menos personal pero más capacitado.

Ya que hemos mencionado la necesidad de realizar muestras, continuaremos con algunas características que deben tener éstas para que, realmente, se puedan realizar inferencias (inducciones) sobre ellas hacia la población total.

3. TAMAÑO DE LAS MUESTRAS

Para calcular el tamaño de una muestra hay que tomar en cuenta tres factores:

El porcentaje de confianza con el cual se quiere generalizar los datos desde la muestra hacia la población total.
El porcentaje de error que se pretende aceptar al momento de hacer la generalización.
El nivel de variabilidad que se calcula para comprobar la hipótesis.
- La confianza o el porcentaje de confianza es el porcentaje de seguridad que existe para generalizar los resultados obtenidos. Esto quiere decir que un porcentaje del 100% equivale a decir que no existe ninguna duda para generalizar tales resultados, pero también implica estudiar a la totalidad de los casos de la población.

Para evitar un costo muy alto para el estudio o debido a que en ocasiones llega a ser prácticamente imposible el estudio de todos los casos, entonces se busca un porcentaje de confianza menor. Comúnmente en las investigaciones sociales se busca un 95%.

El error o porcentaje de error equivale a elegir una probabilidad de aceptar una hipótesis que sea falsa como si fuera verdadera, o la inversa: rechazar a hipótesis verdadera por considerarla falsa. Al igual que en el caso de la confianza, si se quiere eliminar el riesgo del error y considerarlo como 0%, entonces la muestra es del mismo tamaño que la población, por lo que conviene correr un cierto riesgo de equivocarse.

Comúnmente se aceptan entre el 4% y el 6% como error, tomando en cuenta de que no son complementarios la confianza y el error.

La variabilidad es la probabilidad (o porcentaje) con el que se aceptó y se rechazó la hipótesis que se quiere investigar en alguna investigación anterior o en un ensayo previo a la investigación actual. El porcentaje con que se aceptó tal hipótesis se denomina variabilidad positiva y se denota por p, y el porcentaje con el que se rechazó se la hipótesis es la variabilidad negativa, denotada por q.

Hay que considerar que p y q son complementarios, es decir, que su suma es igual a la unidad: p+q=1. Además, cuando se habla de la máxima variabilidad, en el caso de no existir antecedentes sobre la investigación (no hay otras o no se pudo aplicar una prueba previa), entonces los valores de variabilidad es p=q=0.5.

Una vez que se han determinado estos tres factores, entonces se puede calcular el tamaño de la muestra como a continuación se expone.

Hablando de una población de alrededor de 10,000 casos, o mínimamente esa cantidad, podemos pensar en la manera de calcular el tamaño de la muestra a través de las siguientes fórmulas. Hay que mencionar que estas fórmulas se pueden aplicar de manera aceptable pensando en instrumentos que no incluyan preguntas abiertas y que sean un total de alrededor de 30.

Vamos a presentar dos fórmulas, siendo la primera la que se aplica en el caso de que no se conozca con precisión el tamaño de la población, y es:

Donde:

n   es el tamaño de la muestra;
Z   es el nivel de confianza;
p   es la variabilidad positiva;
q   es la variabilidad negativa;
E   es la precisión o error.

Hay que tomar nota de que debido a que la variabilidad y el error se pueden expresar por medio de porcentajes, hay que convertir todos esos valores a proporciones en el caso necesario.

También hay que tomar en cuenta que el nivel de confianza no es ni un porcentaje, ni la proporción que le correspondería, a pesar de que se expresa en términos de porcentajes. El nivel de confianza se obtiene a partir de la distribución normal estándar, pues la proporción correspondiente al porcentaje de confianza es el área simétrica bajo la curva normal que se toma como la confianza, y la intención es buscar el valor Z de la variable aleatoria que corresponda a tal área.

Por ejemplo: Si se quiere un porcentaje de confianza del 95%, entonces hay que considerar la proporción correspondiente, que es 0.95. Lo que se buscaría en seguida es el valor Z para la variable aleatoria z tal que el área simétrica bajo la curva normal desde –Z hasta Z sea igual a 0.95, es decir, P(-Z<z<Z)=0.95.

Utilizando las tablas, o la función DISTR.NORM.ESTAND.INV() del Excel, se puede calcular el valor de Z, que sería 1.96 (con una aproximación a dos decimales).

Esto quiere decir que P(-1.96<z<1.96)=0.95.

En el caso de que sí se conozca el tamaño de la población entonces se aplica la siguiente fórmula:

Donde

n   es el tamaño de la muestra;
Z   es el nivel de confianza;
p   es la variabilidad positiva;
q   es la variabilidad negativa;
N   es el tamaño de la población;
E   es la precisión o el error.

La ventaja sobre la primera fórmula es que al conocer exactamente el tamaño de la población, el tamaño de la muestra resulta con mayor precisión y se pueden incluso ahorrarse recursos y tiempo para la aplicación y desarrollo de una investigación.

Por ejemplo: En el Colegio de Bachilleres, una institución de nivel medio superior, se desea realizar una investigación sobre los alumnos inscritos en primer y segundo años, para lo cual se aplicará un cuestionario de manera aleatoria a una muestra, pues los recursos económicos y el tiempo para procesar la información resultaría insuficiente en el caso de aplicársele a la población estudiantil completa.

En primera instancia, suponiendo que no se conoce el tamaño exacto de la población, pero con la seguridad de que ésta se encuentra cerca a los diez millares, se aplicará la primera fórmula.

Se considerará una confianza del 95%, un porcentaje de error del 5% y la máxima variabilidad por no existir antecedentes en la institución sobre la investigación y porque no se puede aplicar una prueba previa.

Primero habrá que obtener el valor de Z de tal forma que la confianza sea del 95%, es decir, buscar un valor de Z tal que P(-Z<z<Z)=0.95. Utilizando las tablas o las funciones de Excel se pueden obtener, o viendo (en este caso) el ejemplo anterior, resulta que Z=1.96.

De esta manera se realiza la sustitución y se obtiene:

Esto quiere decir que el tamaño de la muestra es de 385 alumnos.

Supongamos ahora que sí se conoce el tamaño de la población estudiantil y es de 9,408, entonces se aplicará la segunda fórmula. Utilizando los mismos parámetros la sustitución queda como:

4. MUESTRAS PROBABILÍSTICAS

Las técnicas de muestreo probabilística son aquellas en las que se determina al azar los individuos que constituirán la muestra. Estas técnicas nos sirven cuando se desean generalizar los resultados que se obtienen a partir de la muestra hacia toda la población. Lo anterior se dice dado que se supone que el proceso aleatorio permitirá la obtención de una muestra representativa de la población.

Los muestreos probabilísticas pueden ser con o sin reemplazo.

Los muestreos con reemplazo son aquellos en los que una vez que ha sido seleccionado un individuo (y estudiado) se le toma en cuenta nuevamente al elegir el siguiente individuo a ser estudiado. En este caso cada una de las observaciones permanece independiente de las demás, pero con poblaciones pequeñas (un grupo de escuela de 30 alumnos, por ejemplo) tal procedimiento debe ser considerado ante la posibilidad de repetir observaciones. En el caso de poblaciones grandes no importa tal proceder, pues no afecta sustancialmente una repetición a las frecuencias relativas.

Los muestreos sin reemplazo son los que una vez que se ha tomado en cuenta un individuo para formar parte de la muestra, no se le vuelve a tomar en cuenta nuevamente. En este caso, y hablando específicamente para el caso de poblaciones pequeñas, las observaciones son dependientes entre sí, pues al no tomar en cuenta nuevamente el individuo se altera la probabilidad para la selección de otro individuo de la población. Para el caso de las poblaciones grandes (por ejemplo la población de un país) dicha probabilidad para la selección de un individuo se mantiene prácticamente igual, por lo que se puede decir que existe independencia en las observaciones.

Las técnicas de muestreo probabilística que mencionaremos serán básicamente tres: el aleatorio simple, el aleatorio estratificado y el sistemático.

4.2 Muestreo aleatorio simple

Podemos aquí mencionar que para el caso de que se estuviese estudiando un propoción dentro de la población (una elección de candidato, la aceptación o rechazo de una propuesta en una comunidad, la presencia o ausencia de una característica hereditaria), y el en caso de un muestreo aleatorio simple, la estimación que se puede hacer de la proporción buscada a partir de la proporción hallada en la muestra se obtiene mediante la construcción de un intervalo de confianza:

p = P ± tolerancia de la muestra

Donde p es la proporción buscada en la población y P es la proporción presente en la muestra.

Por otro lado, la tolerancia de la muestra está relacionada directamente con el nivel de confianza y se obtiene a partir de la distribución normal al igual que como se obtuvo para el cálculo del tamaño de las muestras. La representaremos con Z para obtener la fórmula:

Muestras aletorias

Para que las conclusiones de la teoría del muestreo y de la inferencia estadística sean validas, las muestras deben escogerse representativas de la población. El análisis de los métodos de muestreo y problemas relacionados se llaman el diseño del experimento.

4.2 Muestras no aleatorias

Cuando el método de extracción de las muestras no asegure a cada individuo de la población o del estrato, igual probabilidad de ser elegido, entonces la muestra obtenida no es aleatoria.

A veces, esto se hace por razones de practicidad en el sentido del costo o del tiempo. Si se desea tomar una muestra probabilística de la población argentina no parece razonable usar a cada individuo como unidad de muestreo. Lo mismo cuando se desea hacer un muestreo a los escolares de una provincia, es muy difícil empadronar a todos primero para luego sortear, y se tardaría demasiado para ubicarlos uno por uno hasta terminar el trabajo.

En el muestreo de etapas múltiples se utiliza para el caso de grandes poblaciones humanas.

Acá, la unidad de muestreo en la primera etapa son los departamentos de cada provincia. Se los lista y se hace un primer sorteo para la selección. En una segunda etapa se distingue la población rural de la urbana, subdividiendo en fracciones (diferentes superficies con densidad de población semejante). Otra vez se sortea para elegir, y se continúa con otra división en radios dentro de las fracciones, segmentos dentro de radios, y así sucesivamente. La razón es repartir equitativamente el trabajo del encuestador.

En el muestreo por conglomerados se eligen conjuntos donde naturalmente se agrupan los individuos. Es, por ejemplo, el caso de las escuelas para hacer un muestreo alumnos en el sistema educativo, o las facultades para los universitarios. Si se trata de estudiar las condiciones laborales de los empleados de comercio que trabajan en supermercados, primero se empadronan a los lugares naturales de trabajo (supermercados), y luego se sortea entre estos conglomerados para elegir a uno. Luego se entrevista a todos los empleados del supermercado elegido, y se acepta esto como una muestra representativa del sector.
El muestreo sistemático se usa para el caso de sucesiones de elementos. Por ejemplo, el caso de las historias clínicas de pacientes, certificados de nacimiento, tarjetas de catálogo en una biblioteca, etc. Son los casos donde la información está en archivos y hay que trabajar con estos para obtenerlas. Se elige una cifra entera, razonable, tomando en cuenta el tamaño de la muestra y el de la población. Por ejemplo, hay que tomar una muestra de tamaño 25 de un archivo que contiene 488 fichas; luego, el cociente entre población y muestra es 488 /25, aproximadamente 19. Notar que si se elige 20 el tamaño muestral no llega a 25. Entonces, se cuentan las fichas y a llegar a la décimo novena se la extrae, se sigue hasta la número 38 que será la segunda escogida, y así sucesivamente hasta tener las 25 fichas necesarias. Es también el caso de los soldados que se numeran de 1 en adelante y cada 5 (u otro número cualquiera) dan un paso al frente. Es un método sencillo y rápido de selección.

Hay otros casos de muestreo no aleatorios de uso común. Como el de tomar una lista de nombres, cerrar los ojos y con la punta de un lápiz marcar a uno de ellos, para escogerlo. Son los casos de los programas de TV donde se toma la guía telefónica, se la abre en una página cualquiera

y se escoge a uno de los números que figuran, para luego hacer un llamado con premio. En los juegos infantiles se hace una ronda con los participantes, se vendan los ojos del que va a elegir, se le hace dar varias vueltas con los ojos vendados para que marque a alguno. Todos los casos vistos tienen una característica común: los individuos de la población no son equiprobables.

Números Aletoricos

Una forma para obtener una muestra representativa es mediante el muestreo aleatorio, de acuerdo con el cual, cada miembro de la población tiene la misma probabilidad de ser incluido en la muestra. Un método para lograrlo es asignarle a cada uno un número, escribir cada número en una papeleta, y realizar en una urna un soporte justo en ella. Un método alternativo consiste en recurrir una tabla de números aleatorios.

4.5 Sistemático

Es análogo al anterior, aunque resulta más cómoda la elección de los elementos. Si hemos de elegir 40 elementos de un grupo de 600, se comienza por calcular el cociente 600/40 que nos dice que existen 40 grupos de 15 elementos entre los 600. Se elige un elemento de salida entre los 15 primeros, y suponiendo que sea el k-simo, el resto de los elementos serán los k-simos de cada grupo. En concreto, si el elemento de partida es el número 6, los restantes serán los que tengan los números: 15+6 ,2×15+6,……,39×15+6

Este procedimiento simplifica enormemente la elección de elementos, pero puede dar al traste con la representatividad de la muestra, cuando los elementos se hayan numerados por algún criterio concreto, y los k-simos tienen todos una determinada característica, que haga conformarse una muestra no representativa.

4.6 Estratificado

A veces nos interesa, cuando las poblaciones son muy grandes, dividir éstas en sub-poblaciones o estratos, sin elementos comunes, y que cubran toda la población.

Una vez hecho esto podemos elegir, por muestreo aleatorio simple, de cada estrato, un número de elementos igual o proporcional al tamaño del estrato.

Este procedimiento tiene la gran ventaja de que se puede obtener una mayor precisión en poblaciones no homogéneas (aunque en este curso no estudiaremos los métodos necesarios)

Si decidiéramos hacer una encuesta sobre la incidencia del tabaco en nuestro centro, podríamos razonar de la siguiente forma:

Nuestro centro tiene 2000 alumnos, 720 en 3º de ESO, 700 en 4º de ESO, 340 en 1º de Bachillerato, y 240 en 2º de Bachillerato.

Si deseamos tomar una muestra de 100 alumnos, para analizar la incidencia del tabaco en la adolescencia, bastaría tomar un número igual de alumnos de cada estrato, es decir 25.

Si embargo, si lo que se quiere es hacer una encuesta para conocer la opinión que tiene el alumnado sobre una medida que ha tomado el Consejo Escolar, es más representativo elegir de cada estrato, y en número proporcional a su tamaño, los elementos que compondrán la muestra. Si 3º de ESO representa al 36% del alumnado, el 36% de la muestra (es decir 36 alumnos) se elegirán de este estrato por muestreo aleatorio simple, 35 para 4º de ESO, y así hasta completar los 100 elementos de la muestra.

MUESTRA CON Y SIN REPOSICION

Si sacamos el número de una urna, podemos volverlos en ella o no, antes de la siguiente extracción. En el primer caso, ese número puede salir de nuevo mas veces, mientras que en el segundo pueda salir cada numero una vez. Estos dos tipos de muestras se llaman, respectivamente, Muestras con reposición y muestra sin reposición

Las poblaciones son finitas o infinitas. Si por ejemplo, sacamos 10 bolas sucesivamente, sin reposición, de una urna que contiene 100 bolas, estamos tomando muestra de población finita; mientras que si lanzamos 50 veces una moneda contamos el numero de caras, estamos ante una muestra población infinita.

Una población finita en la que se efectúa muestra con reposición, puede considerarse infinita teóricamente, ya que puede tomar cualquier numero de muestras sin agotarla. Para muchos efectos prácticos, una población muy grande se puede considerar como si fuera infinita.

DISTRIBUCIONES DE PROBABILIDAD EN EL MUESTREO

También llamadas distribuciones muestrales de un estadígrafo cualquiera obtenido a través de la muestra. La idea es la siguiente: si se toman k muestras, todas las posibles de tamaño n (con o sin reemplazamiento) de una población de tamaño NP, y a cada muestra se le calcula un estadígrafo e (media, mediana, varianza, etc.), se obtienen una serie de k valores: e1, e2, e3 , …, ek

Estos valores pueden agruparse mediante un histograma de frecuencias para poder apreciar la forma de la distribución de los mismos. En la Figura 10.1 se esquematiza esta situación:

Figura 6.1 Distribuciones muestrales.

Población

De una población cualquiera se extraen k muestras; cada una permite calcular k estadígrafos con los cuales se puede hacer un histograma como el de la derecha de la Figura 10.1. Se aprecia que este histograma adquiere forma de campana si se suavizan los escalones, al achicar los intervalos.

Esta curva obtenida a partir de datos muestrales, observados a través del muestreo, tiende asintóticamente a otra curva teórica a medida que k aumenta, y los intervalos se hacen infinitesimales.

Dicha curva teórica es la función de Gauss de acuerdo con el Teorema Central del Límite, el principal de la Estadística.

El Teorema Central del Límite permite establecer que, en condiciones muy generales, si la muestra es lo suficientemente grande, la distribución teórica de los k valores obtenidos es aproximadamente la función de Gauss. Esta es la base de la Teoría de las Grandes Muestras. Las principales Distribuciones Muestrales son funciones de Gauss identificadas en forma unívoca con sus dos parámetros μ y SE. En la Tabla 10.1 se presentan estos dos valores para cada uno de los estadígrafos más usuales. En la primer columna de la tabla se muestra cada estadígrafo, en la segunda columna se da la fórmula para el cálculo del error típico de estimación SE. Finalmente en la tercera columna se muestra la estimación puntual para obtener el valor esperado del estadígrafo μe, con las aclaraciones respecto al tamaño muestral requerido para que tal estimación sea considerada aceptable.

DISTRIBUCIÓN MUESTRAL DE LA MEDIA

Si el estadígrafo elegido es la media, se tendrán .X1 ,.X2 ,.X 3 ,…,.Xk medias muestrales; estas se distribuyen normalmente si k es muy grande. En la práctica, 30 o más valores son suficientes.

En la teoría, cuando k → ∞ entonces la distribución muestral de la media es asintóticamente normal y coincidirá con la función de Gauss. Esta distribución tendrá un valor esperado y una varianza que permitirán estimar los respectivos valores poblacionales. O sea,

μ x = μ σ2 x = σ 2 / n = SE2( x ) = VAR( x )

Tabla 7.1. Errores típicos para algunas distribuciones muestrales

Esto es: la media aritmética de las k medias muestrales obtenidas es aproximadamente igual a la media poblacional (o valor verdadero). Sin embargo, esta aproximación tiene un error de estimación denominado error típico o error estándar de estimación que en el caso de la media

es: σ x . En la bibliografía clínica la nomenclatura más empleada es SE( x ). En la Tabla 10.1 se muestran los valores anteriores para el caso de la media aritmética.

Las relaciones anteriores son válidas solo si la población es infinita, o si es finita, pero el muestreo es con reemplazamiento. Caso contrario, cuando la población es finita y se realizan muestreos sin reposición, entonces se deben ajustar dichas relaciones con:

μ x = μ σ2 x = (σ 2 / n) [( NP – n) / (NP – 1)] = SE2( x ) = VAR( x )

En el Cuadro 10.1 siguiente se presenta un problema de aplicación para un caso donde se conoce a toda la población, los parámetros poblacionales se calculan directamente aplicando las fórmulas vistas en el Tema 4 resultando: μ = 4,5 y σ 2 = 1,25. Se pueden verificar las relaciones anteriores de dos maneras. En la primera se toman las seis muestras posibles de tamaño 2, para un muestreo sin reemplazamiento. A cada muestra se le calcula su media respectiva, luego con estos 6 promedios se pueden calcular: el promedio y la varianza de esas seis muestras. Ahora, el promedio de todas las medias muestrales da exactamente igual al valor medio poblacional y la varianza de las medias muestrales verifica la relación anterior, si se aplica el factor de corrección para muestras de tamaño finito. La segunda manera (Bootstrap procedure) es tomando muestras con reposición, primero se toman todas las 16 muestras posibles con reemplazamiento de tamaño 2. Luego, con las dieciséis muestras se calculan las 16 medias respectivas. Por último, se calcula el promedio y la varianza de estos 16 valores, verificando de nuevo las relaciones vistas más arriba, para el caso de muestras con reposición. Para el otro problema, se suponen conocidos los valores poblacionales, y tomando 50 muestras de tamaño 3 hay que determinar la cantidad de casos donde el resultado esté comprendido en un intervalo (6 ; 7,796). La forma de proceder es calculando primero las probabilidades de obtener esos resultados límites, luego por diferencia calcular

la probabilidad gaussiana asociada al intervalo y entonces, multiplicando dicha probabilidad por el tamaño muestral, se puede contestar la pregunta efectuada.

CUADRO 7.2: Distribución Muestral de Medias.

Ejemplo: Suponiendo que las proteínas totales se distribuyen normalmente entre los 2.500 varones sanos de una cierta población, con edades de 14 a 50 años, con un valor promedio de 7 g/dl y un desvío de 0,9 g/dl. Un investigador decide tomar 50 muestras aleatorias de tamaño 3, con reemplazamiento. Desea saber en cuántas muestras cabe esperar una media entre 6 y 7,796 g/dl.

El primer paso para resolver este problema es encontrar los parámetros de la distribución muestral de medias, usando los valores poblacionales conocidos. Entonces:

μ x . 7 g/dl = μ ; σ2 x . σ 2 / n = ( 0,9 )2 / 3 = 0,27 ; σ x = SE( x ) = 0,52

Cabe esperar que la distribución muestral de medias sea una curva de Gauss con tales parámetros.

Para calcular la probabilidad de que una muestra tenga una media entre 6 y 7,796 g/dl, se tipifican estos valores con:

z6 = ( x – μ x ) / σ x = ( 6 – 7) / 0,52 = – 1,92

z7,6 = ( x – μ x ) / σ x = ( 7,796 – 7) / 0,52 = 1,53

La probabilidad bajo la curva de Gauss tipificada dentro del intervalo – 1,92 ; + 1,53 se obtiene calculando las probabilidades:

P (-1,92 ; 0 ) = 0,4726

P ( 0 ; 1,53 ) = 0,4370

P (-1,92 ; 1,53) = 0,9096

Entonces, el número esperado de muestras buscado será la proporción anterior, multiplicada por el número total de muestras extraídas. Esto es, (0,9096) 50 = 45,48 muestras.

Es de esperar encontrar 45 muestras con valores de proteínas totales entre 6 y 7,6 g/dl.

DISTRIBUCIÓN MUESTRAL DE PROPORCIONES

Cuando el estadígrafo obtenido de cada muestra de una población sea la proporción de ocurrencia de un suceso dado, un “éxito”, se trata de una distribución muestral de proporciones.

Por ejemplo, el caso del lanzamiento de una moneda es uno de población infinita porque se puede realizar la prueba cuantas veces se desee. La probabilidad de sacar un éxito, una cara es p =

0,5, la misma para todos los casos posibles, mientras que la probabilidad de “fracaso” al lanzar la moneda y salir seca es q = 1 – p = 0,5. Si el experimento consiste en realizar n lanzamientos de la moneda, una cantidad lo suficientemente grande, luego la frecuencia relativa del suceso cara, tendrá una distribución aproximadamente normal de parámetros:

μ p = π y σ2

π = [π .(1- π)] / n = SE2(π)

O bien

μ r = r = n . π y σ2

r = n . [π .(1- π)] = SE2 (r)

CUADRO 8.1: Distribución muestral de proporciones.

Las que se obtienen de la relación vista más arriba con reemplazamiento de π = r / n. Por muestra lo suficientemente grande, se entiende en la práctica n > 25. Por otra parte, cuando la población es finita y el muestreo se realiza sin reposición, entonces las ecuaciones anteriores se modifican con:

μ p = π y σ2 π = [π .(1- π) / n] [(NP – n ) / (NP – 1)] = SE2 (π)

O bien

μ r = r = n . π y σ2

r = n [π .(1- π)] [(NP – n ) / (NP – 1)] = SE2 (r)

Usando la distribución de Gauss, se pueden calcular las probabilidades asociadas

Tanto la distribución de medias como la de proporciones se usan muy frecuentemente en la práctica. El problema básico es conocer los valores poblacionales porque es muy raro saberlos de antemano, salvo el caso de la moneda y otros juegos de azar; lo común es ignorar estos parámetros. Entonces, usando los valores obtenidos del muestreo aleatorio se pueden aproximar los valores desconocidos poblacionales, como se verá en el tema inferencia estadística.

DIFERENCIAS DE MEDIAS Y DE PROPORCIONES

Muchas veces es necesario comparar dos poblaciones, como cuando se testea un tratamiento en pacientes contra un control o blanco; o bien, cuando se comparan dos sistemas de medición entre sí (estos sistemas pueden ser: técnicas de laboratorio, marcas comerciales, instrumentos de diferente marca, etc.). El problema es ver si hay diferencias entre ambos casos. El método es encontrar un estadístico para la diferencia (o suma) de ambos estadísticos muestrales. Se tienen dos poblaciones, se efectúa un muestreo aleatorio de tamaño n1 en la primera de ellas, y se obtienen los valores de un estadígrafo cualquiera: e1. La población gaussiana de la distribución muestral tendrá los parámetros μe1 y σe1. Análogamente, se procede con la segunda población y

se obtienen los parámetros μe2 y σe2. Se pueden combinar ambas poblaciones a través de un estadígrafo que sea la diferencia de ambos: e = e1 – e2. Este nuevo índice también tendrá una distribución gaussiana, pues la diferencia de dos funciones de Gauss es otra función gaussiana, siempre y cuando las muestras no dependan unas de otras; esto es, sean independientes. Sus parámetros son:

Si el estadígrafo es la media muestral e = .x entonces, la distribución muestral de la diferencia de medias para poblaciones infinitas, de parámetros ( μ1 ; σ1 ) y ( μ2 ; σ2 ). Entonces:

Es el valor esperado de la diferencia de medias y su error de estimación es:

Si el estadígrafo es una proporción e = π entonces, la distribución muestral de la diferencia de proporciones para poblaciones infinitas,de parámetros ( μ1 ; σ1 ) y ( μ2 ; σ2 ). Luego:

μP1 – P2 = μ1 – μ2 = π1 . π2

es el valor esperado de la diferencia de proporciones poblacionales.

μe1-e2 = μe1 – μe2 y σ2 e1-e2 = σ2 e1 + σ2e2 = SE2 (e1 – e2)

Es el error estándar al cuadrado de tal estimación para la diferencia de proporciones.

En el Cuadro 10.3 se presentan dos ejemplos de aplicación de lo visto. En el primer caso se trata de una diferencia de medias usando la vida útil de dos medicamentos, mientras que en el segundo caso se trata de una diferencia de Sensibilidades de dos métodos clínicos (tomando como proporciones a las Sensibilidades) para poder compararlos. En ambos casos las probabilidades encontradas son muy chicas lo que indica diferencias entre las medias muestrales. Para poder decidir si tales diferencias son válidas se emplea la Teoría de la decisión estadística

CUADRO 9.1 Diferencia de 2 muestras. μ

UNIDAD 2 TEORÍA DE PEQUEÑAS MUESTRAS

En este capítulo se presentan tres nuevos modelos estadísticos: el llamado t de Student, el modelo de la Chi-cuadrado ( χ2 ) y el modelo F de Fisher. Los tres no requieren ya más del supuesto de un tamaño muestral grande. Ahora con dos o más mediciones se puede trabajar; por eso se usa la expresión Teoría de pequeñas muestras para este tema. El empleo de cualquiera de ellos es enteramente similar al visto en el capítulo anterior. Cambia la manera de calcular el estadígrafo de comparación y su respectiva tabla de valores críticos de la distribución muestral.

Mientras que el modelo de la t se aplica a medias y proporciones, los dos últimos se usan para el estudio de las desviaciones o dispersiones. También se la llama Teoría Exacta del Muestreo, pues ahora no hay que efectuar la aproximación DS2 . σ² ya que el valor muestral viene en la fórmula de cálculo del estadígrafo de comparación, en lugar del poblacional. Eso hace que no sea necesario efectuar una estimación y se tiene una mayor exactitud que con la gaussiana. Es importante destacar que los tres modelos son válidos tanto para pequeñas como para grandes muestras. Esto amplía el campo de aplicación del modelo de Gauss. Además, al no tener que hacer tantas pruebas disminuye el costo y se gana en tiempo. Todas estas ventajas tienen una contrapartida: se pierde un poco de precisión pues, como se verá, el intervalo de confianza se hace más grande para un mismo caso. Estos modelos se prefieren al de Gauss porque sus ventajas valen la pena, al precio de perder un poco de precisión. Se mostrará su empleo tanto para el caso de una sola muestra de mediciones como para la comparación de dos muestras o grupos de mediciones.

EL MODELO DE STUDENT

Sea un estadígrafo t calculado para la media con la relación

Figura 2.1: La distribución de Student

Si de una población normal, o aproximadamente normal, se extraen muestras aleatorias e independientes y a cada una se le calcula dicho estadígrafo usando los valores muestrales de la media

y el desvío estándar, entonces se obtiene una distribución muestral t que viene dada por la fórmula de Student. En realidad, fue obtenida por R. A. Fisher y la bautizó Student en honor a W. S. Gosset, quien usaba ese seudónimo para poder publicar sus trabajos en la revista Biometrika. Esta función matemática tiene un parámetro que la define en forma unívoca: el número de grados de libertad υ= n-1 (donde n es el tamaño muestral). El concepto matemático de υ está relacionado con la cantidad de observaciones independientes que se hagan y se calcula con el tamaño muestral n, menos la cantidad k de parámetros poblacionales que deban ser estimados a través de ellas. O sea: υ = n.k. Si se observa la ecuación superior, se ve que el único parámetro poblacional

que figura es μ, por lo tanto k = 1 y así resulta υ = n.1. Cuando el tamaño muestral es mayor que 30 la distribución de Student se aproxima mucho a la de Gauss, en el límite ambas son iguales.

Es decir que la función Student tiende asintóticamente a la función de Gauss.

Para cada grado de libertad hay una tabla de valores que pueden obtenerse variando el nivel de significación, parecida a la de Gauss. Sería muy engorroso tener una hoja con la tabla para cada grado de libertad. Esto se soluciona de dos formas: una es usando computadoras para resolver los cálculos (programas estadísticos como Mini-Tab, SPSS, Statistica, Excel, etc.). La otra y más común, es preparar una tabla donde en cada fila se coloquen encolumnados los valores críticos más usuales para cada valor de grados de libertad. Como interesan únicamente los valores pequeños, se listan correlativamente de 1 a 30 y luego algunos como 40, 60, 120 e ∞. Este último tendrá los valores vistos para la normal. Así, en una sola hoja se presentan los valores útiles para el empleo de este modelo, como se muestran en el Tabla 5 del Anexo con las tablas estadísticas.

La distribución de Student, al igual que la de Gauss, es simétrica respecto al origen de coordenadas y se extiende desde – ∞ hasta + ∞. Pero a diferencia de la normal, puede adoptar diferentes formas dependiendo del número de grados de libertad. Por ejemplo, la que tiene un solo grado de libertad (n = 2 y υ = 1), se desvía marcadamente de la normal, como se puede ver en la Figura 13.1 anterior. Luego, a medida que los grados van aumentando, se acerca cada vez más, hasta igualarla en el infinito. Se puede ver esto en las tablas y en la Figura 2. Los valores críticos de la Tabla Student, para una confianza del 95 % y dos colas, para 1, 5, 10, 30 y ∞ grados de libertad son 12,71; 2,57; 2,23; 2,04 y 1,96 respectivamente. Estos valores críticos se denotan con sus dos parámetros así: tα ; υ = t0,05 ; ∞ = 1,96 = zα.

Los intervalos de confianza para esta distribución se arman en forma análoga a la vista para el caso de Gauss. Con la única diferencia en cómo se calcula el valor crítico tα;υ en lugar de zα.

De nuevo, el par de valores ( μ e ; σe ) se saca de la Tabla 4, con la salvedad que ahora no se usa más la aproximación DS . σ; pues en el cálculo de t se emplea DS directamente. Esto hace que el modelo sea más exacto que el de Gauss. Generalmente, este modelo se aplica al caso de la media, proporciones y sus diferencias o sumas. Para una estimación con 30 o más grados de libertad, se pueden usar tanto el modelo de Gauss, como el de Student. El intervalo es casi igual, salvo que en este último el valor crítico es mayor. En efecto, si se tienen 31 muestras, t = 2,09, mientras que z = 1,96. Esto hace mayores a los intervalos obtenidos con Student que sus equivalentes

gaussianos. Por eso, se dice que el modelo Student tiene menor precisión que el de Gauss.

La teoría de decisiones se usa en forma análoga, empleando los intervalos de confianza visto más arriba. Pero para poder aplicar este modelo se deben tener en cuenta los requisitos siguientes:

1) Las muestras fueron extraídas de una población normal o aproximadamente normal.

2) La selección de las muestras se hizo en forma aleatoria.

3) Las muestras son independientes entre sí.

Si alguno de ellos no se cumple, las conclusiones que se obtengan no son válidas. Los supuestos se pueden resumir así: para poder usar Student, se deben tener muestras normales, aleatorias e independientes. Notar que el error estándar de estimación es SE (e)= σe.

Los casos más frecuentes en la práctica son:

Student para medias muestrales

En este caso e =.x luego: μe = μ y SE (e) = σe = DS / n . Por lo tanto el valor de comparación se calcula con:

Ejemplo 1) Se desea saber si un instrumento de medición cualquiera está calibrado, desde el punto de vista de la exactitud. Para ello se consigue un valor patrón y se lo mide 10 veces (por ejemplo: una pesa patrón para una balanza, un suero control para un método clínico, etc.). Suponiendo que el resultado de estas mediciones arroja una media de 52,9 y un desvío de 3, usando un patrón de valor 50, se debe determinar si el instrumento está calibrado y la estimación de su error sistemático, si es que se prueba su existencia (no se usan unidades para generalizar este ejemplo).

Ho : = 50 el instrumento está calibrado en exactitud

H1 : ≠50 no está calibrado. Hay un error sistemático

Se trata de un ensayo de dos colas donde hay = 10 – 1 = 9 grados de libertad. De la Tabla 4 se obtienen los valores críticos para el 95% de t 0,059 2,262, para el 99% de t 0,019 3,25 y para un nivel del 99,9% es t 0,0019 4,781. Lo que permite establecer las zonas de aceptación y rechazo:

Dibujando las zonas con los valores críticos, el valor de t cae en la de rechazo para el 95% y no alcanza para las otras. La conclusión es que se ha probado la existencia de un error sistemático con una confianza del 95%. Y se estima con:

Ejemplo 2) Se midió colesterol total a 11 pacientes varones adultos escogidos al azar los resultados obtenidos arrojan una media de 235 mg/dl y un desvío estándar de 35 mg/dl. Ensayar la hipótesis de que se mantienen por debajo del valor límite de referencia ( 220mg/dl ).

Para el caso de una cola, el valor de tablas para el 95% debe ser el que está en la Tabla 4 para el 90% en dos colas. La idea es que el 10% en dos colas significa el 5% en cada una, por la simetría de la curva de Student. Luego, para = 10, el límite para el 95% será t = 1,812 en una cola y t = 2,228 para dos colas. En la figura de más arriba se han marcado los límites del 99% y del 99,9% para una sola cola, a los efectos didácticos. La conclusión es que no puede rechazar la hipótesis nula, por lo que debe considerarse un colesterol total admisible desde el punto de vista clínico, por estar por debajo del límite de referencia.

Student para proporciones

En este caso e = P y μp = μ = π luego con se puede obtener el valor del estadígrafo de comparación con la relación:

Ejemplo1) Un analgésico de plaza, afirma en su propaganda que alivia el dolor en el 90% de los casos antes de la primer hora luego de su ingesta. Para validar esa información, se hace un experimento en 20 individuos con cefalea. Se observa que fue efectivo en 15 de ellos.

El resultado obtenido es significativo (t = – 2,24 *). Pero la evidencia no alcanza para rechazar la hipótesis a los niveles del 99% y 99,9%. Se la rechaza al nivel de 95% únicamente. Si bien no es tan terminante, se puede afirmar que la aseveración es falsa con un 95% de confianza.

Student para dos muestras independientes

El modelo de Student también se puede usar cuando se desean comparar dos muestras entre sí, para detectar si hay diferencia significativa entre ellas, debido a algún factor analizado. En primer lugar se analizará el caso de dos muestras independientes como: aplicar dos tipos de remedios a dos grupos de pacientes escogidos al azar, o las mediciones repetidas de una misma magnitud, etc. El otro caso, cuando las muestras no son independientes sino apareadas, se verá en el próximo tema. Una vez más, los supuestos para poder aplicar este modelo se resumen en: para poder comparar con Student, las dos muestras deben ser normales, aleatorias e independientes.

Se sacan muestras aleatorias e independientes, de dos poblaciones normales. La idea es averiguar si ambas muestras provienen de la misma población o de poblaciones diferentes. Con eso se puede ver si el efecto de los “tratamientos” aplicados a las muestras es apreciable, en cuyo caso las muestras parecerán provenir de diferentes poblaciones. Se usa en los casos donde se compara el efecto de una droga aplicada a un grupo de pacientes, contra otro grupo al cual se le suministra un placebo. También para comparar dos técnicas clínicas y detectar si hay diferencias, por ejemplo: dos marcas comerciales de plaza, dos instrumentos de medición, dos individuos, dos técnicas diferentes (la nueva contra la vieja), dos protocolos, etc. Con estas comparaciones se pueden realizar muchos controles internos en el laboratorio para hacer calibraciones, medir eficacia, etc. Hay una limitación: solo se pueden comparar dos muestras entre sí a la vez y no más. Para el caso de tener más de dos muestras, se recurre a los modelos de ANOVA.

Comparación de medias

Para estos casos, el valor de Student para validaciones de medias se calcula con:

El cual se contrasta con tα; υ donde υ = n1 + n2 – 2 grados de libertad. Hay casos particulares como (a) las muestras son de igual tamaño y (b) son homocedásticas (tienen igual varianza). En ambos casos se simplifican las fórmulas de cálculo.

Ejemplo 1) Se aplica un medicamento a 15 pacientes que padecen cierta enfermedad, escogidos al azar, y un placebo a 20 pacientes. En el primer grupo, la desaparición del estado febril se observa a las 19 horas de tratamiento en promedio (con un desvío de 2 hs.). En el grupo control, la mejoría se observa en promedio las 25 horas con un desvío de 3 horas. Decidir si el medicamento modifica el tiempo de curación.

Como el valor hallado de t es mucho más grande que el valor crítico de tablas para 33 grados de libertad: tα ; υ = t 0,999; 33 = 3,44 (ensayo de dos colas y un 99,9% de confianza), la conclusión es: se obtuvieron resultados altamente significativos ( t = 7,06 *** ) como para rechazar la hipótesis nula. Se tiene una prueba científica del efecto del medicamento.

Ejemplo 2) Se desea verificar si hay diferencia en las mediciones a través de dos métodos clínicos diferentes. Se toma una muestra de suero lo suficientemente grande como para obtener 10 alícuotas. Se distribuyen al azar 5 alícuotas para cada método. Efectuadas las mediciones, con el primero se tuvo una media de 85 mg/dl con un desvío de 8 mg/dl. Mientras que con el segundo se tuvo una media de 83 mg/dl con un desvío de 6 mg/dl.

Comparación de proporciones

Para estos casos, el valor de Student para validaciones de proporciones se calcula la misma fórmula, pero reemplazando los valores esperados con

Contrastando con el valor de tablas dado por tα;υ; con υ= n1 + n2 -2 grados de libertad.

Ejemplo) Se escogen al azar dos grupos formados por 20 individuos cada uno, entre los que padecen cierta alergia. Se administra una droga curativa al primer grupo y se observa una mejoría en 15 de los casos. Al segundo grupo se le administra un placebo y mejoran 13 de ellos. Ensayar la hipótesis que la droga sirve para curar ese tipo de alergia. Se emplean las hipótesis siguientes:

H0 : μ1-2 = 0 las diferencias observadas se deben al azar. H1 : μ1-2 ≠ 0 la droga produce efecto. Si se supone que ambas muestras fueron extraídas de la misma población, y por lo tanto no hay diferencias entre las muestras observadas (H0) μ1-2 = 0, eso significa que el porcentaje de curados en dicha población será π = π1 = π2 y habrá que estimarlo con los datos muestrales, calculando la proporción ponderada con: p = ( total de curados en las muestras / total muestral ) = (15+13) / 40 = 0,7. Entonces, sacando factor común en la fórmula de la varianza, esta resulta: SE2(π) = π (1.π).[ ) / 1 ( ) / 1 ( 2 1 n n + ] = π (1.π) [2 / n] =(0,7 . 0,3) (2/20) = 0,021

Y es SE(π) = 0,145; de los datos del problema surgen P1 =15/20 = 0,75 y P2 = 13/20 = 0, 65 t = ( 0,75 – 0,65 ) / (0,021)1/2= 0,69 < t0,95 ; 38=2,02. μ1-2 = 0 cae dentro de 95% CI(-0,19 ; +0,39) Un resultado no significativo. Las diferencias observadas no se deben a la droga sino al azar.

Test de equivalencia biológica

Hay ocasiones donde la Ho no busca establecer si hay o no diferencia entre dos muestras, como las del ejemplo anterior, sino que se trata de establecer si un método clínico o tratamiento nuevo es lo suficientemente bueno como para reemplaza al que se venía usando hasta entonces, el método viejo. Las ventajas de este nuevo método pueden ser: un costo menor, más rápido, menos dañino o peligroso para el paciente, etc. La cuestión básica aquí es ver si, en promedio, la diferencia entre ambos es menor que un cierto valor límite para la magnitud estudiada. Es decir que tal diferencia no implique una inferioridad del nuevo método, desde un punto de vista clínico. Para estos casos la Ho : La diferencia entre ambos promedios es mayor o igual al valor aceptable y la alternativa es H1 : Esta diferencia de medias es menor al valor crítico; en cuyo caso ambos métodos pueden ser considerados clínicamente equivalentes. La idea es que, si se rechaza la Ho se puede usar el método nuevo en lugar del viejo y aprovechar las ventajas que este posee. Pero la decisión se basa más en consideraciones médicas que estadísticas. Entonces, si se trata de magnitudes continuas, se puede usar el test de Student para comparar la diferencia de las dos medias contra el valor crítico δ o máximo aceptable desde el punto de vista clínico. El planteo se hace así: Ho : μV – μN = . > δ. Donde μV es el valor poblacional que se obtiene con el método viejo y μN con el método nuevo, . es la diferencia real entre ambos métodos y δ es la diferencia máxima admisible entre ambos métodos. De esta manera, cuando Ho pueda rechazarse se tendrá evidencia suficiente como para efectuar el reemplazo, esto es cuando H1 : μV – μN = . < δ.

Se trata de un ensayo de una sola cola. Pero cuando se trate de ver si en valor absoluto la diferencia entre ambos métodos no supere a un cierto valor δ, porque aquí no interesa tanto que sea menor, sino que también interesa que no sea mayor (dependiendo de la magnitud clínica analizada); entonces la Ho será : μV – μN = . = δ y el ensayo será de dos colas. Análogo al visto en el punto anterior. Para ilustrar este procedimiento se usará un ejemplo tomado de la obra de Armitage

Ejemplo) Sea el índice cardíaco CI (respuesta cardiaca normalizada para la superficie del cuerpo) el cual se mide con un procedimiento invasivo como es el colocar un catéter en el corazón del paciente llamado Termo-dilución (el método viejo) y la unidad de medición son litros por minuto tomado por m2 de superficie del cuerpo humano. Se ha propuesto una nueva manera de medir esa magnitud con una técnica no invasiva, llamada el método de la Bioimpedancia, en la cual se le adosa un instrumento al cuerpo de paciente en forma externa, y mide en forma eléctrica el valor del CI usando una escala adecuada (el método nuevo). El criterio clínico de aceptación es: el nuevo método se considerará equivalente al viejo cuando, en promedio, el valor obtenido difiera en un 20% respecto al promedio aceptado de 2,75 l / min. / m2 para el método del catéter. Esto significa que el 20% de tal valor es δ = 0,55. Luego el planteo se hace así:

Ho : .μV – μN . = … > δ = 0,55 o lo que es lo mismo (μV – μN ) = δ = 0,55

H1 : .μV – μN . = … < δ = 0,55 cuyo equivalente es (μV – μN ) = δ ≠ 0,55

Se toma una muestra de N = 96 individuos a los cuales se le aplica el método nuevo, los valores encontrados fueron un promedio de 2,68 l / min. / m2, y un desvío estándar de 0,26 l / min. / m2 luego será:

La conclusión final es que se puede usar el método nuevo en lugar del viejo, con una gran ventaja para el paciente, pues ahora ya no tendrá que ser cateterizado para efectuarle su medición del índice cardíaco. A este procedimiento estadístico aparecido en los últimos años en Medicina se lo conoce también con el nombre de test de equivalencias médicas o biológicas.

Student para dos muestras apareadas

El modelo de Student se puede usar para el caso especial de muestras apareadas, esto es, cuando se le efectúan dos tratamientos a la misma muestra; por ejemplo, del tipo antes–después donde al mismo individuo se lo mide dos veces para ver el efecto del tratamiento realizado, o el caso de método nuevo contra el método viejo, donde al mismo grupo de pacientes se le hacen dos mediciones a cada uno, la del método de rutina habitual y una extra con el nuevo método a probar para decidirse entre ambos. La idea básica es como sigue: se sacan n muestras aleatorias e independientes de una población normal. A cada muestra se le aplican dos “tratamientos” A y B diferentes y lo que interesa detectar es si producen algún efecto apreciable. Este caso es muy diferente al anterior si bien las muestras son independientes entre sí, los tratamientos no lo son, porque a un mismo individuo se le aplican ambos tratamientos. Entonces, la misma persona aparecerá dos veces en los resultados: uno en el grupo A y el otro en el grupo B. El truco para resolver este problema de la independencia es trabajar con la diferencia de los resultados de cada par de mediciones efectuadas: d = xA – xB. Luego se tendrán n diferencias d1; d2; d3…dn, que son independientes entre sí, puesto que cada valor di corresponde a un solo individuo. Luego, se le aplica el modelo Student para una sola muestra, ensayando la hipótesis de que no hay diferencias entre ambos grupos. O sea, efectuando la hipótesis: H0 : d 0 resultará:

La hipótesis alternativa implica un efecto diferente para cada grupo H1 : μd ≠ 0. Si se prueba que el valor esperado del promedio de las diferencias es diferente de cero, entonces el tratamiento aplicado produce un efecto demostrable. Para aclarar estas ideas se presenta el siguiente caso:

Ejemplo) Se escogen 5 pacientes al azar, del grupo que concurre diariamente al Laboratorio de Análisis Clínicos a efectuarse una determinación de Uremia. Las muestras extraídas se miden con el procedimiento habitual y además con una nueva técnica clínica que se desea probar. Ver si hay diferencia entre ambas técnicas. Los resultados expresados en g/l fueron:

EL MODELO DE CHI-CUADRADO

La función Chi-cuadrado es igual a la función normal elevada al cuadrado. Esto es, el producto de dos distribuciones de Gauss es una distribución de Chi-cuadrado. Si de una población normal, o aproximadamente normal, se extraen muestras aleatorias e independientes, y se le calcula el estadígrafo χ2 usando el valor muestral de la varianza y el poblacional con:

La distribución muestral de χ2 viene dada por la fórmula de K.R. Pearson. Esta función matemática está caracterizada por el valor del número de grados de libertad υ = n – 1 (donde n es el tamaño muestral). Al igual que la Student, el valor total del área bajo la curva es igual a la unidad, pero la diferencia principal es que esta no es simétrica respecto al origen, sino que se extiende desde 0 hasta + ∞ porque no puede ser negativa. A medida que los grados de libertad aumentan, la curva cambia de forma y sus valores se han tabulado en el anexo de tablas estadísticas (Tabla 6), donde se muestran los valores del área bajo la curva, para los principales valores de χ2 , a la derecha de éste. O sea, se muestra la zona de rechazo para diferentes niveles de significación y de grados de libertad, lo cuales varían entre 1 y 100. Más allá, conviene usar directamente la función de Gauss.

Figura 3.1: La distribución de Chi-cuadrado

Para cada grado de libertad hay una tabla de valores que pueden obtenerse variando el nivel de significación, parecida a la de Gauss. El problema de calcular los valores críticos, para un nivel de confianza dado, se resuelve de dos maneras: usando computadoras para resolver los cálculos, y la otra más común, usando tablas resumidas en una sola hoja como la que se muestra en la Tabla 6, en forma análoga a la vista para el modelo de Student. La distribución de χ2 se usa principalmente para analizar dispersiones. Se compara la dispersión muestral expresada a través de sus cuadrados medios (MS) contra la dispersión poblacional cuantificada a través de la varianza (σ2). El valor MS = ( n – 1 ) DS2 = ν DS2 es otra forma de mostrar la precisión del sistema de medición. El uso más difundido en Bioquímica es para controlar la dispersión de la técnica de Análisis Clínicos empleada en el Laboratorio; se compara la obtenida en forma experimental, contra un valor considerado como aceptable en los libros de texto denominado la dispersión máxima admisible (σmáx). Usualmente, se toma el CV%, como se

Mostró en el ejemplo de varianzas visto en el capítulo anterior. Existen otros criterios, como el de Thonks, que usa un error relativo admisible máximo, y se calcula como un cuarto del rango de los valores normales de referencia, dividido por el valor medio de dicho intervalo (referido a la magnitud clínica en cuestión y expresado en porcentajes). Todo esto se puede ver con mayor detalle en la Tabla 24.1 del Capítulo 24. También se emplea a este modelo para realizar la llamada prueba de chi-cuadrado en las comparaciones de frecuencias observadas contra las frecuencias esperadas, con datos de recuento. Más adelante se desarrolla mejor este tema, lo mismo que su so para testear la independencia de dos o más factores en una Tabla de Contingencia.

En la industria farmacéutica se la usa para analizar la dispersión de los componentes de los productos terminados. Todo remedio fabricado debe cumplir estrictas normas de calidad, generalmente referidas al contenido en peso de sus principales componentes. Se usan dos límites: el superior e inferior, dentro de los cuales se los debe mantener controlados. Este rango de valores define la dispersión máxima admisible y lo ideal es que la dispersión de los productos terminados sea bastante inferior a dicho rango. Ese control de la dispersión es muy similar al explicado más arriba, para los bioquímicos. Para ilustrar estas ideas se presenta un ejemplo en Control de Calidad de equipos de Laboratorio. Pero antes se debe remarcar que para poder aplicar este modelo, se deben tener en cuenta los requisitos siguientes:

Las muestras fueron extraídas de una población normal o aproximadamente normal.
La selección de las muestras se hizo en forma aleatoria.
Las muestras son independientes entre sí.

Ejemplo 1) Un bioquímico sospecha que su micro-centrífuga no mantiene constante su velocidad mientras trabaja, lo cual le da una variabilidad indeseada en sus determinaciones. Para controlarla, consigue un tacómetro regulado y mide cada minuto la velocidad durante 10 minutos. Los resultados fueron: una velocidad promedio en las 10 mediciones de 3098 rpm con un desvío de

100,4 rpm. Testear para un error relativo máximo del 2% o menos, si la centrífuga es estable.

De la Tabla de valores críticos surge: χ2 0,99 ; 9 = 21,666 y χ2 0,991 ; 9 = 27,877. Por lo tanto, el bioquímico ha encontrado una muy fuerte evidencia que la velocidad del equipo oscila en forma indeseada, tal como sospechaba. Y deberá ajustarlo si desea disminuir la variabilidad de sus mediciones. Los resultados fueron muy significativos χ2 = 23,6**.

Ejemplo 2) Un farmacéutico Jefe del Dpto. Control de Calidad en una industria alimenticia, descubre que en su proceso de producción el contenido de ciclamato en su línea de mermeladas dietéticas varía en forma indeseada. Sospechando que se trata de una falla en el dosificador, decide tomar 10 muestras seguidas del mismo. Encuentra un promedio de 20 gramos con un desvío de 8 gramos. Si en su protocolo de fabricación la variación máxima permitida es del 3%, determinar si el dosificador debe ser corregido.

El desvío estándar aceptable es: máx = 3% de 20 g = 6 g. Luego: H0 : máx ≤6 g.: el dosificador funciona correctamente H1 : máx > 6 g.: el dosificador debe ser cambiado

2 = ( n – 1 ) DS2 / 2 = (10 – 1) . (8)2 / 2 = 16 (no significativo) De la Tabla de valores críticos surge: 2 0,95 ; 9 = 16,9. Por lo tanto, el farmacéutico no ha encontrado evidencia que respalde sus sospechas. Sin embargo, el valor hallado es muy cercano al crítico, por lo que le convendría hacer más pruebas.

EL MODELO DE FISHER

Si de dos poblaciones normales, o aproximadamente normales, se extraen dos muestras aleatorias e independientes, y a cada una se le calcula su respectiva varianza, el cociente de ambos valores F = DS2 1 / DS2 2 (con F > 1, esto es, siempre se coloca el más grande como numerador) tendrá una distribución de Fisher, cuyos valores críticos fueron obtenidos por W. Snedecor y se muestran en la Tabla 7 del anexo. Esta tabla se caracteriza por tener dos grados de libertad: el correspondiente al numerador υ1 = n1 – 1 y el del denominador υ2 = n2 – 1. Programas de computación permiten calcular los valores críticos respectivos. En otra forma se puede usar una tabla de doble entrada como la Tabla 7; su forma se puede ver a continuación:

Figura 4.1: La distribución de Fisher.

En las Tabla 7 se presenta una hoja para cada nivel de confianza, se eligen los más apropiados como: 95% ; 97,5% ; 99% ; 99,5% y 99,9%. Como siempre, el área total bajo la curva es la unidad y se extiende desde 0 a + ∞. La forma es muy parecida a la Chi-cuadrado. se muestran tres casos, con diferentes grados de libertad, y se marca el valor de F = 2,5 con una ,línea punteada vertical.

El principal uso de esta función es el Análisis de Varianza, que se verá más adelante, y es para cuando se necesita comparar más de dos medias muestrales a la vez. En estos casos la idea es detectar si el efecto de uno o más tratamientos afecta a las muestras testeadas. En cambio, cuando se tiene el caso de dos muestras, la idea es testear si hay homoscedasticidad en las dos poblaciones en estudio. Una vez verificado este supuesto, se puede avanzar más verificando si hay diferencia entre las medias muestrales, y así verificar si ambas muestras tienen igual media y varianza, porque eso significa que en realidad provienen de la misma población normal. Eso probaría que no hay efecto de un tratamiento si se lo compara con un placebo, o que dos técnicas de laboratorio son equivalentes. Si el experimento no verifica esto, entonces se deberá elegir el caso que presente menor varianza, para tener menor variabilidad en las mediciones. En Genética se puede verificar si una generación de crías es más variable en un carácter que la de sus padres. En Sistemática se puede testear si dos poblaciones locales tienen la misma variabilidad. En Bioquímica y Farmacia el uso más frecuente es comparar el error casual de mediciones de laboratorio, al introducir algún efecto o cambiar el método de medición. En el caso de testear si dos técnicas de laboratorio tienen igual dispersión, o bien, para elegir aquella con mayor precisión, conviene pensar el problema como la incidencia de un factor en estudio en lugar de dos técnicas totalmente diferentes entre sí. Por ejemplo, se trata de una misma práctica, pero se usan dos espectrofotómetros diferentes, y se trata de determinar si la modificación de la varianza se debe al uso de un aparato diferente. El factor acá sería: tipo de espectros.

También se puede estudiar la incidencia del factor humano, realizando las mismas mediciones a dos personas diferentes. De esa forma se puede imaginar que las dos muestras provienen de diferentes poblaciones, o que el efecto del factor analizado no es despreciable cuando se rechaza la hipótesis nula. En la Figura 13.4 se muestra el caso de dos poblaciones. En el caso (a) ambas poblaciones tienen la misma media, pero por efecto del error casual sus varianzas son diferentes. Si esta diferencia es significativa, resulta evidenciada por el Modelo de Fisher que permite la comparación de ambas.

Figura 4.2: Dos poblaciones con

En el caso (b) hay un error sistemático que desplaza la media, pero sus varianzas permanecen iguales. Es lo mismo que sumar una constante a todos los valores; ocurre un desplazamiento hacia la derecha. Student se usa para detectar esto cuando se hace el test de comparación de dos medias independientes. Como se verá más adelante, se puede construir todo un bagaje de métodos para efectuar un Control de Calidad interno en un laboratorio de medición clínica. Por ahora, basta decir que se puede controlar la exactitud con los modelos de Student y la precisión con los de Chi-cuadrado y Fisher.

Con esto se pueden comenzar a controlar y calibrar los sistemas de medición. Las limitaciones de todo esto son dos: la primera es que se puede estudiar el efecto del factor analizado en solo dos muestras y no en más de dos. La segunda es que si la calidad se entiende como exactitud y precisión, solo se pueden emplear estos modelos para magnitudes de tipo cuantitativas como las de la Química Clínica, pero no en magnitudes cualitativas como las usuales en Microbiología, Bacteriología, Micología, etc. En magnitudes cuantitativas, por “calidad “se entiende precisión y exactitud, en lugar de la capacidad de una prueba clínica para diagnosticar. Sin embargo, a pesar de estas limitaciones sigue siendo una herramienta sencilla y poderosa de control.

Para poder aplicar este modelo se deben tener en cuenta los requisitos siguientes:

Las muestras fueron extraídas de una población normal o aproximadamente normal.
La selección de las muestras se hizo en forma aleatoria.
Las muestras son independientes entre sí.

Ejemplo) El jefe de un laboratorio se encuentra con una técnica de medición fuera del control estadístico.

Para investigar las causas decide investigar si el factor humano tiene incidencia, y toma una muestra de suero cualquiera la divide en 20 alícuotas. Luego elige 10 de ellas al azar y se las entrega al laboratorista 1 para que haga las determinaciones; las restantes las encomienda al laboratorista 2 para que las mida. Los resultados obtenidos son: DS2 1 = 2,4 es la varianza obtenida

por el laborista, 1 y DS2 2 = 0,8 para el otro. Decidir si hay diferencia en dispersión entre ambos.

Como se trata de un ensayo de dos colas, para un nivel del 95% de confianza, se busca en las tablas para: υ1 = υ2 = n1 – 1 = 9 grados de libertad, mientras que α = 0,025 para el límite inferior

y α = 0,975 para el superior. Estos valores son:

F0,975; (9,9) = 4,03.

Luego, para calcular el valor no tabulado α = 0,025 se aprovecha una propiedad que tiene la función F usando la inversa como sigue:

F0,025; (9,9) = 1 / F0,975; (9,9) = 1/ 4,03 = 0,248 Como el valor hallado F = 3 cae dentro de la zona de aceptación, no hay evidencia significativa como para decir que el factor humano tiene incidencia en la dispersión de las mediciones.

Cuadro resumen
Test de hipótesis para las medias muestrales.

Se puede siempre usar el modelo Student. El de Gauss cuando la muestra sea grande (n > 30)

CONCLUSION

Las razones para efectuar un muestreo a una población, en lugar de estudiarla directamente, pueden ser varias como se puntualiza a continuación:

El tamaño de la población es infinito.
El muestreo es de tipo destructivo.
La población es finita, pero demasiado grande.
Sería muy caro estudiar a toda la población y basta con deducciones aproximadas.
Tomaría demasiado tiempo analizar la población total.

Cuando las muestras son lo suficientemente grandes, se pueden hacer inferencias analíticas bastante extensas, con pocos y simples recursos, en comparación con técnicas más refinadas de la Estadística. Esto es conveniente desde un punto de vista didáctico. La Teoría del muestreo es el estudio de las relaciones entre una población y las muestras que se extraen de ella. Del análisis de las muestras se pueden estimar o inferir datos de la población como su media ( μ ), varianza ( σ2 ), etc., llamados parámetros poblacionales, denotados usualmente con letras griegas, a partir de los valores obtenidos de la muestra, tales como la media muestral x , la varianza muestral

DS2, etc. Por ejemplo, en Bioquímica el verdadero valor de glucosa de un paciente μ es siempre desconocido y además variable con el tiempo, por ello se le extrae una muestra de sangre para poder estimarlo a través de mediciones. Así, el valor x obtenido (ya sea con una o más mediciones) es el que se pone en el informe de la determinación clínica. El problema consiste en extraer muestras lo más representativas posibles, de la población desconocida, para que tengan sentido las estimaciones realizadas a través de ellas. Cuando en Farmacia las mediciones se hacen a través de encuestas; se miden los porcentajes de las respuestas obtenidas. Esto se emplea usualmente en investigaciones de mercado, técnicas de propaganda, estudios poblacionales, etc. Por ejemplo, en una encuesta sobre el uso de determinado producto cada respuesta favorable se puede considerar un éxito, y la proporción de éxitos p en el total de las encuestas realizadas se puede usar para estimar la verdadera proporción en la población tomada como marco de referencia del estudio.

Cuando la población sea finita y de un tamaño manejable en tiempo y costo, los valores poblacionales se calculan directamente, sin necesidad del muestreo. Por ejemplo, si se trata de revisar diamantes, a nadie se le ocurriría tomar muestras sino que se controlarían uno por uno. Ahora bien, cuando se efectúan mediciones de magnitudes clínicas de tipo cuantitativo, la idea teórica es que se pueden efectuar infinitas mediciones y, en tal caso, el tamaño de la población será infinito. Es el caso de mediciones repetidas de un mismo objeto como pesar un cuerpo, o medirle su longitud, etc., se puede efectuar todas las mediciones que se deseen. Esto no ocurre cuando el ensayo es destructivo para la muestra. Por ejemplo, en mediciones clínicas de calcio, colesterol, hierro, etc., porque al suero se le adicionan los reactivos químicos y sirve para una sola vez. O bien, cuando se controla la cantidad de los componentes activos en un remedio, no hay otra forma que destruirlo para poder revisarlo. Entonces, el número total de determinaciones posibles dependerá de la cantidad de material disponible, que es finito. En resumen, en estos casos se acostumbra a considerar al valor verdadero de la magnitud medida como desconocido. El único medio para estimarlo es la toma de muestras.

La Alumna

BIBLIOGRAFIA

A. (1.998) 1Var 25. Oviedo
reskog, K. G. y S.rbom, D. (1.993). PRELIS 2 User«s reference guide. Chicago
iz, J. (1997) Introducci.n a la Teor.a de Respuesta a los .tems. Ediciones Pir.mide.Madrid
Samejima, F. (1.969) Estimation of latent ability using a response pattern of graded scores. Psychometric Monographs, num 17
Van der Linden, W.J. y Hambleton, R.K. (eds.)(1.997) Handbook of modern item response theory, Springer-Velac, Nueva York
Spigel, Munrray. «Estadisticas Administrativas». Editorial McGraw Hill. Décima edición. 1.998.

ANEXOS

Teoría de las Muestras de Trabajo

Descarga el archivo original