Teoría básica de la Estadística. Presentación

Tema 1
(DEI 031)
1.1. DEFINICIONES DE ESTADÍSTICA
¿Qué es la estadística?
Estadística es la ciencia de:
·Recolectar
·Describir
·Organizar
·Interpretar
Datos, para transformarlos en información,
para la toma mas eficiente de decisiones.
¿Quienes usan la estadística?
Todos…
Organismos oficiales.
Diarios y revistas.
Políticos.
Deportes.
Marketing.
Control de calidad.
Administradores.
Investigadores científicos.
Médicos
etc.
Tipos de Estadística
LA, DESCRIPTIVA E INFERENCIAL
Estadística Descriptiva: Método de
recolectar, organizar, resumir y presentar
los datos en forma informativa.
Ejemplo 1: Los datos del Censo de población de 2001.
Ejemplo 2: La cantidad de robos ocurridos el último mes en el
municipio.
Ejemplo 3: La cantidad de pacientes atendidos en el Hospital
municipal el último año, etc.
Estadística inferencial: Métodos usados
para determinar algo acerca de la
población, basado en una muestra.
Población(1) es la colección, o conjunto, de
individuos, objetos, características o
eventos cuyas propiedades serán
analizadas.
Muestra es un subconjunto de la población
de interés.
(1) Algunos autores utilizan Universo como sinónimo
Población y Muestra
Población
Muestra
Variable: Característica de interés sobre cada
elemento individual de una población o
muestra.
Dato: Valor de la variable asociada a un
elemento de la población o muestra. Este valor
puede ser un número, una palabra o un
símbolo.
1.1.2. VARIABLE Y TÍPOS DE VARIABLES
Variable
Cualitativa o de Atributos Clasifica o describe
un elemento de la población. Los valores que
puede asumir no constituyen un espacio
métrico, por lo tanto las operaciones
aritméticas, como sumar y obtener promedios,
no son significativas.
Tipos de Variables
Tipos de Variables(cont.)
Cuantitativa o Numérica Cuantifica un
elemento de la población. Los valores que
puede asumir constituyen un espacio métrico,
por lo tanto las operaciones aritméticas, como
sumar y obtener promedios, son significativas.
Ejemplos: Cantidad de Habitaciones, Número de hijos,
Kilómetros recorridos, Tiempo de reacción, Ingreso, etc..
Las variables cuantitativas se pueden
clasificar a su vez en discretas o continuas.
Cuantitativas Discretas: solo pueden asumir
ciertos valores y normalmente hay huecos
entre ellos. Normalmente solo son conteos .
Ejemplo1: cantidad de materias aprobadas.(1, 2,3 ......)
Ejemplo2: cantidad de productos (1, 2, 3,4...)
Cuantitativas Continuas: Pueden asumir
valores continuos, que se obtienen o
determinan en un experimento.
Ejemplo1: La cantidad (kg) de un cierto producto
embasado para la venta. (5,01 - 5,10 - 5,12 - 4,99....)
Ejemplo2: La densidad de una muestra de un producto
terminado (kg/m3) (0,86 0,88 0,85 0,87...)
Las variables cualitativas se miden en escala
nominal o ordinal.
Nominal: los elementos solo pueden ser
clasificados en categorías pero no se da un
orden o jerarquía.
Ordinal: Bueno, regular, primero, segundo….
Ejemplo 1: Barrio de residencia de los alumnos .
Ejemplo 2: Color de ojos
Ejemplo 3: Aprovechamiento de los alumnos en un
curso.
El fin último de cualquier estudio es aprender sobre las
poblaciones. Pero es usualmente necesario, y más práctico,
estudiar solo una muestra de cada una de las poblaciones.
Definimos:
Usamos una muestra para conocer o estimar características de
la población, denominamos:
PARÁMETRO una medida resumen calculada sobre la
población
ESTADÍSTICO una medida resumen calculada sobre la
muestra
1.1.2.1. TIPOS DE DATOS
En esta parte presentaremos los distintos
tipos de datos o variables que podemos
encontrar en una investigación e
comentaremos algunas estrategias para el
manejo de datos con una computadora.
1.1.2.2. CARACTERÍSTICAS DE LOS CONJUNTOS DE DATOS.
Denominaremos:
- UNIDAD DE ANÁLISIS O DE OBSERVACIÓN al objeto bajo
estudio. El mismo puede ser una persona, una familia, un país,
una región, una institución o en general, cualquier objeto.
- VARIABLE a cualquier característica de la unidad de
observación que interese registrar, la que en el momento de
ser registrada puede ser transformada en un número.
- VALOR de una variable, OBSERVACIÓN o MEDICIÓN, al
número que describe a la característica de interés en una
unidad de observación particular.
- CASO o REGISTRO al conjunto de mediciones realizadas sobre
una unidad de observación.
Consideremos el siguiente ejemplo:
Cuando se diseña una investigación, se
intenta estudiar de qué modo una o más
variables (variables independientes) afectan
a una o más variables de interés (variables
dependientes).
Por ejemplo en un experimento, el
investigador impone a los sujetos
condiciones (variable independiente) y
estudia el efecto de la misma sobre una
característica del sujeto (aparición de una
cierta característica, modificación de una
condición, etc.).
Un paso importante al comenzar a
manejar un conjunto de datos es
identificar cuántas variables se han
registrado y cómo fueron registradas
esas variables, lo que permitirá definir
la estrategia de análisis.
1.2. DISTRIBUCIÓN Y FRECUENCIA
Las distribuciones de frecuencia es la organización de
datos crudos en forma de tablas, organizando dichos
datos en clases y frecuencias.
Las gráficas o diagramas proveen de inmediato un
sentido de proporción.
Se debe explicar por misma y cumplen con
especificaciones de presentación.
Un listado de todas las puntuaciones observadas (o de
las categorías) de una variable y de la frecuencia, f , de
cada puntuación o categoría
Presenta los valores de los datos y su frecuencia o las
veces que se repite la observación
La frecuencia de una puntuación o de una categoría no
ofrece mucha información por mismo así que
computamos proporciones y porcentajes
Frecuencia
Frecuencia absoluta: ( ) El número de
veces que se repite cada valor o dato de
la variable.
Frecuencia relativa: ( ) La frecuencia
absoluta dividida por el número de datos.
donde N es el número de datos.
i
n
i
f
N
n
fi
i
Frecuencia
Frecuencia absoluta acumuladas: ( ).
Es el número de datos que hay igual al
considerado o inferiores a él.
Frecuencia relativa acumuladas: ( ).
Es cada frecuencia acumulada dividida
por el número de datos.
i
N
i
F
Frecuencia
Frecuencia absoluta:
Frecuencia absoluta
acumulada:
Frecuencia relativa:
Frecuencia relativa
acumulada.
n
n
fi
i
1ii ffF
1
1
n
i
f
11
2 1 2
12
12
................
...
..................
... ...
kk
n k n
Nn
N n n
N n n n
N n n n n N

 
   
n
i
ini nnnnnn
1
21
1.2.1. HISTOGRAMAS POLÍGONOS Y OTROS GRÁFICOS
El modo más simple de presentar datos categóricos es
por medio de una tabla de frecuencias.
1.2.2 HISTOGRAMA
El histograma es el más conocido de los gráficos para
resumir un conjunto de datos numéricos y pretende
responder a las mismas preguntas que un gráfico de
barras.
Para construir un histograma es necesario
previamente construir una tabla de frecuencias.
Histograma
1.2.3. GRÁFICO DE BARRAS
Este gráfico es útil para representar datos categóricos
nominales u ordinales. A cada
categoría o clase de la variable se le asocia una barra
cuya altura representa la frecuencia o
la frecuencia relativa de esa clase. Las barras difieren
sólo en altura, no en ancho.
1.2.4. GRÁFICO DE TORTAS
En este gráfico, ampliamente utilizado, se representa la
frecuencia relativa de cada categoría como una porción
de un círculo, en la que el ángulo se corresponde con la
frecuencia relativa correspondiente. Como en todo
gráfico es importante indicar el número total de sujetos.
1.3. MEDIDAS RESÚMENES O DE TENDENCIA CENTRAL
En este punto, introduciremos distintas formas de
resumir la distribución muestral o poblacional de una
variable NUMÉRICA y finalmente presentaremos un
tipo de gráfico que se construye a partir de medidas
resúmenes.
Resumir un conjunto de datos es pasar de una visión
detallada a una generalización simple e informativa
tratando de preservar las características esenciales.
Las medidas resúmenes son útiles para comparar
conjuntos de datos cuantitativos y para presentar los
resultados de un estudio y se clasifican en dos grupos
principales:
Medidas de posición o localización describen un
valor alrededor del cual se encuentran las
observaciones.
Medidas de dispersión o escala pretenden
expresar cuan variable es un conjunto de datos.
1.3.1. MEDIDAS DE POSICIÓN O LOCALIZACIÓN
La medidas de centralización nos indican en torno a
qué valor (centro) se distribuyen los datos.
Un modo de resumir un único conjunto de datos
numéricos es a través de un número que debería ser
típico para el grupo. No debería ser ni demasiado
grande, ni demasiado pequeño y debería estar tan
cerca del centro de la distribución como sea posible.
Por lo tanto, una medida de posición es un número
que pretende indicar dónde se encuentra el centro de
la distribución de un conjunto de datos. Pero, ¿dónde
se encuentra el centro de una distribución?
El centro es fácil de identificar si la distribución es
simétrica, pero es difícil si la distribución es
asimétrica. Por esta razón, no hay una única medida
de posición para resumir una distribución.
a) PROMEDIO O LA MEDIA ARITMÉTICA
Es la medida de posición más frecuentemente usada. Para calcular la
media aritmética o promedio de un conjunto de observaciones se
suman todos los valores y se divide por el número total de
observaciones.
Definición
Si tenemos una muestra de n observaciones y denotadas por
X1, X2, ..., Xn, definimos la media muestral X del siguiente
modo:
Características y propiedades de la media.
a) Se usa para datos numéricos.
b) Representa el centro de gravedad o el punto de equilibrio de
los datos.
Podemos imaginar a los datos como un sistema físico, en el que
cada dato tiene una “masa” unitaria y lo ubicamos sobre una
barra en la posición correspondiente a su valor. La media
representa la posición en que deberíamos ubicar el punto de
apoyo para que el sistema esté en equilibrio.
c) La suma de las distancias de los datos a la media es
cero. Esta propiedad está relacionada con el hecho
que la media es el centro de gravedad de los datos.
d) Es muy sensible a la presencia de datos atípicos
b) LA MEDIANA MUESTRAL
La mediana es el dato que ocupa la posición central en la muestra
ordenada de menor a mayor.
¿Cómo calculamos la mediana de una muestra de n observaciones?
1. Ordenamos los datos de menor a mayor.
2. La mediana es el dato que ocupa la posición (n+1/2) en la lista
ordenada.
Si el número de datos es impar, la mediana X es el dato que ocupa la
posición central.
Si el número de datos es par, la mediana X es el promedio de los dos
datos centrales.
Propiedades de la mediana
a) La mediana puede ser usada no sólo para datos numéricos
sino además para datos ordinales, ya que para calcularla sólo es
necesario establecer un orden en los datos.
b) Si la distribución de los datos es aproximadamente simétrica la
media y la mediana serán aproximadamente iguales.
c) LA MODA
La moda es el dato que ocurre con mayor frecuencia
en el conjunto.
Es una medida de poca utilidad salvo para datos
categóricos en los que suele interesar identificar la
categoría con mayor cantidad de datos.
ES EL DATO DE MAYOR FRECUENCIA
Cuando se considera la distribución poblacional de una
variable continua, decimos que esta es UNIMODAL si
presenta un pico y BIMODAL si aparecen dos picos
claros.
Valor que ocurre más a menudo.
No es afectada por valores extremos.
Puede no existir una moda.
Pueden haber varias modas.
Miden qué tanto se dispersan las observaciones alrededor
de su media.
MEDIDAS DE DISPERSIÓN
Medidas de tendencia central y dispersión:
Existen diversas medidas estadísticas de
dispersión, pero las principales son:
Rango
Varianza
Desviación estándar
Coeficiente de variación
Alcance o Rango
Diferencia entre la mayor y la menor de las
observaciones
Alcance = xmayor xmenor
No toma en cuenta la forma en que están
distribuidos los datos.
7 8 9 10 11 12
Alcance: 12 - 7 = 5
7 8 9 10 11 12
Alcance de 12-7 = 5
Ejemplo 2.
Hay dos conjuntos sobre la cantidad de lluvia (mm) en Villa Montes y Yacuiba en un año.
Calcula el rango en cada una de las ciudades.
Solución.
Aplicando la fórmula correspondiente tenemos:
Villa Montes
Yacuiba
305 66 239Rango mm mm mm  
Ene Feb Mar Abr May Jun Jul Ago Sep Oct Nov Dic
Villa Montes 86 135 178 170 231 290 231 305 244 122 66 71
Yacuiba 40 77 83 89 147 168 184 252 209 101 32 13
252 13 239Rango mm mm mm  
En este caso se puede observar que
el rango es el mismo para ambos
casos aunque las cantidades sean
diferentes.
0
50
100
150
200
250
300
350
Cantidad de lluvia (mm)
Mes
Cantidad de lluvia en Villa Montes y
Yacuiba 2005
Mide la distancia existente entre los valores de la serie y la media. Se calcula
como sumatoria de las diferencias al cuadrado entre cada valor y la media,
multiplicadas por el número de veces que se ha repetido cada valor. La
sumatoria obtenida se divide por el tamaño de la muestra.
VARIANZA (Datos no agrupados)
FÓRMULA
2
21
()
1
n
i
i
xx
sn
Muestral
Poblacional
2
21
()
N
ix
i
x
N
La varianza siempre será mayor que cero. Mientras más se aproxima a
cero, s concentrados están los valores de la serie alrededor de la
media. Por el contrario, mientras mayor sea la varianza, más dispersos
están.
Ejemplo 1.
Calcula la varianza para los siguientes datos
2 1 2 4 1 3 2 3 2 0 5 1
Solución.
Primero es necesario obtener la media. En este caso
Ahora aplicamos la fórmula correspondiente
2.16x
2 2 2 2 2 2 2 2 2 2 2 2
2(2 2.16) (1 2.16) (2 2.16) (4 2.16) (1 2.16) (3 2.16) (2 2.16) (3 2.16) (2 2.16) (0 2.16) (5 2.16) (1 2.16)
12 1
s                     
221.6672 1.9697
11
s
Ejemplo 2.
A continuación se muestran dos conjuntos de datos obtenidos a partir de un
experimento químico que realizaron dos estudiantes distintos. Calcular la
varianza.
Solución.
Primero es necesario obtener la media de cada conjunto de datos. En este
caso
Estudiante A
Estudiante B
Ahora aplicamos la fórmula correspondiente
Volumen de ácido medido (cm^3)
Estudiante A 812 7 9 3 10 12 11 12 14
Estudiante B 7 6 7 15 12 11 9 9 13 11
8.9
10
1412111210397128
x
10
10
111399111215767
x
Solución (Continuación).
Estudiante A
Estudiante B
2 2 2 2 2 2 2 2 2 2
2(8 9.8) (12 9.8) (7 9.8) (9 9.8) (3 9.8) (10 9.8) (12 9.8) (11 9.8) (12 9.8) (14 9.8)
10 1
s                 
2 2 2 2 2 2 2 2 2 2
2(7 10) (6 10) (7 10) (15 10) (12 10) (11 10) (9 10) (9 10) (13 10) (11 10)
10 1
s                 
291.6 9.16
10
s
276 7.6
10
s
También llamada desviación típica, es una medida de dispersión usada en
estadística que nos dice cuánto tienden a alejarse los valores puntuales del
promedio en una distribución.
Específicamente, la desviación estándar es "el promedio de la distancia de
cada punto respecto del promedio". Se suele representar por una S o con la
letra sigma,σ, según se calcule en una muestra o en la población.
Una desviación estándar grande indica que los puntos están lejos de la media,
y una desviación pequeña indica que los datos están agrupados cerca de la
media.
DESVIACIÓN ESTÁNDAR (Datos no agrupados)
2
1
()
1
n
i
i
xx
sn
N
x
N
i
xi
1
2
)(
Muestral
Poblacional
Ejemplo 1.
Si retomamos el ejemplo 1 que corresponde a la varianza:
Calcula la desviación estándar para los siguientes datos
2 1 2 4 1 3 2 3 2 0 5 1
Solución.
Una vez que hemos calculado la media y la varianza, sólo resta calcular la
raíz cuadrada de la varianza.
2.16x
221.6672 1.9697
11
s
Ejemplo 2.
Considerando nuevamente el segundo ejemplo que estudiaste para calcular la
varianza, tenemos:
A continuación se muestran dos conjuntos de datos obtenidos a partir de un
experimento químico que realizaron dos estudiantes distintos. Calcular la varianza.
Solución.
Una vez que has calculado la media y la varianza, es necesario calcular la desviación
estándar a partir de la obtención de la raíz cuadrada de la varianza.
Estudiante A
Estudiante B
Volumen de ácido medido (cm^3)
Estudiante A 812 7 9 3 10 12 11 12 14
Estudiante B 7 6 7 15 12 11 9 9 13 11
291.6 9.16
10
s
276 7.6
10
s
Es una medida de dispersión que se utiliza para poder
comparar las desviaciones estándar de poblaciones con
diferentes medias y se calcula como cociente entre la
desviación típica y la media.
COEFICIENTE DE VARIACIÓN
100%
S
CV x

Muestral
Poblacional
100%CV

Ejemplo 1.
En dos materias A y B los promedios que sacaron sus alumnos fueron 6.1 y 4.3 y las
desviaciones estándar respectivas fueron 0.6 y 0.45 respectivamente. ¿En qué curso
hay mayor dispersión?
Solución
Para responder esto, debemos obtener el coeficiente de variación aplicando la
fórmula
Claramente, la materia A tiene una dispersión menor que la B, pese a presentar una
mayor desviación estándar.
%8.9%)100(
1.6
6.0
A
CV
%4.10%)100(
3.4
45.0
B
CV
100%
S
CV x

Cuando los datos están agrupados en tablas de frecuencias, el
significado de las medidas de dispersión es el mismo, sin
embargo la manera de calcularlas es diferente.
Enseguida se muestra la fórmula para la varianza, pero
recuerda que la desviación estándar es igual a la raíz cuadrada
de la primera.
VARIANZA Y DESVIACIÓN ESTÁNDAR (Datos agrupados)
11
)(
1
2
1
2
1
2
2
n
n
fx
xf
n
xxf
s
k
i
k
i
ii
ii
k
i
ii
2
1
2
1
2
2
)(
N
xf
N
xf
k
i
ii
k
i
ii
Muestral
Poblacional
Ejemplo 1.
Se han registrado durante 20 días, el número de pasajes que hacen
reservaciones a una agencia de viajes pero que no las hacen efectivas:
Calcula las medidas de dispersión de la variable en estudio.
i Número de viajeros
(xi )
Frecuencia
(fi)
1 12 3
2 13 3
3 14 6
4 15 3
5 16 5
Total 70 20
Solución.
Tal como lo indica la fórmula, primero es necesario
multiplicar la variable (xi ) por la frecuencia (fi) y
añadirlo como una columna a la tabla.
i Número de viajeros
(xi )
Frecuencia
(fi)
xi fi
1 12 3 36
2 13 3 39
3 14 6 84
4 15 3 45
5 16 5 80
Total 70 20 284
...
...
...
1
2
1
2
k
i
k
i
ii fx
s
Solución (Continuación).
Después se obtiene el cuadrado de la variable x, o sea, (xi )2.
i Número de viajeros
(xi )
Frecuenc
ia
(fi)
xi fi xi2
1 12 3 36 144
2 13 3 39 169
3 14 6 84 196
4 15 3 45 225
5 16 5 80 256
Total 70 20 284 990
...
......
1
2
2
k
i
i
x
s
Solución (Continuación).
Ahora se multiplica el cuadrado de la variable por la frecuencia, es
decir, (fixi2).
i
Número de
viajeros
(xi )
Frecuencia
(fi)
xi fi xi2 fixi2
1 12 3 36 144 432
2 13 3 39 169 507
3 14 6 84 196 1176
4 15 3 45 225 675
5 16 5 80 256 1280
Total 70 20 284 990 4070
...
...
...
1
2
2
k
i
ii xf
s
Solución (Continuación).
Una vez obtenidos todos los datos anteriores, se procede a aplicar la fórmula
i Número de viajeros
(xi )
Frecuencia
(fi)
xi fi xi2 fixi2
1 12 3 36 144 432
2 13 3 39 169 507
3 14 6 84 196 1176
4 15 3 45 225 675
5 16 5 80 256 1280
Total 70 20 284 990 4070
1
1
2
1
2
2
n
n
fx
xf
s
k
i
k
i
ii
ii
Solución (Continuación).
i Número de viajeros
(xi )
Frecuencia
(fi)
xi fi xi2 fixi2
1 12 3 36 144 432
2 13 3 39 169 507
3 14 6 84 196 1176
4 15 3 45 225 675
5 16 5 80 256 1280
Total 70 20 284 990 4070
3992.19579.1
9579.1
19
20
284
4070
2
2
s
s
Ejemplo 2.
De acuerdo a la siguiente tabla, calcula la varianza y la desviación estándar:
NOTA
x
FREC. ABSOLUTA
f
FREC. ABSOLUTA ACUMULADA
FREC. RELATIVA %
FREC RELATIVA ACUMULADA %
1.2
1
1
0.1
0.1
1.4
2
3
0.2
0.3
1.6
3
6
0.3
0.6
1.8
8
14
0.8
1.4
2.0
14
28
1.4
2.8
2.2
18
46
1.8
4.6
2.4
19
65
1.9
6.5
2.6
22
87
2.2
8.7
2.8
25
112
2.5
11.2
3.0
26
138
2.6
13.8
3.2
27
165
2.7
16.5
3.4
31
196
3.1
19.6
3.6
35
231
3.5
23.1
3.8
38
269
3.8
26.9
4.0
45
314
4.5
31.4
4.2
46
360
4.6
36.0
4.4
48
408
4.8
40.8
4.6
52
460
5.2
46.0
4.8
58
518
5.8
51.8
5.0
60
578
6.0
57.8
5.2
56
634
5.6
63.4
5.4
54
688
5.4
68.8
5.6
51
739
5.1
73.9
5.8
50
789
5.0
78.9
6.0
46
835
4.6
83.5
6.2
44
879
4.4
87.9
6.4
40
919
4.0
91.9
6.6
32
951
3.2
95.1
6.8
31
982
3.1
98.2
7.0
18
1000
1.8
100
TOTAL
1000
4717
23970.12
Solución.
El primer paso es calcular xi fi:
NOTA
x
FREC. ABSOLUTA
f
FREC. ABSOLUTA ACUMULADA
FREC. RELATIVA %
FREC RELATIVA ACUMULADA %
xi fi
1.2
1
1
0.1
0.1
1.2
1.4
2
3
0.2
0.3
2.8
1.6
3
6
0.3
0.6
4.8
1.8
8
14
0.8
1.4
14.4
2.0
14
28
1.4
2.8
28
2.2
18
46
1.8
4.6
39.6
2.4
19
65
1.9
6.5
45.6
2.6
22
87
2.2
8.7
57.2
2.8
25
112
2.5
11.2
70
3.0
26
138
2.6
13.8
78
3.2
27
165
2.7
16.5
86.4
3.4
31
196
3.1
19.6
105.4
3.6
35
231
3.5
23.1
126
3.8
38
269
3.8
26.9
144.4
4.0
45
314
4.5
31.4
180
4.2
46
360
4.6
36.0
193.2
4.4
48
408
4.8
40.8
211.2
4.6
52
460
5.2
46.0
239.2
4.8
58
518
5.8
51.8
278.4
5.0
60
578
6.0
57.8
300
5.2
56
634
5.6
63.4
291.2
5.4
54
688
5.4
68.8
291.6
5.6
51
739
5.1
73.9
285.6
5.8
50
789
5.0
78.9
290
6.0
46
835
4.6
83.5
276
6.2
44
879
4.4
87.9
272.8
6.4
40
919
4.0
91.9
256
6.6
32
951
3.2
95.1
211.2
6.8
31
982
3.1
98.2
210.8
7.0
18
1000
1.8
100
126
TOTAL
1000
4717
23970.12
Solución (Continuación).
Después se obtiene el cuadrado de la variable x, o sea, (xi )2.
NOTA
x
FREC. ABSOLUTA
f
FREC. ABSOLUTA
ACUMULADA
FREC. RELATIVA %
FREC RELATIVA ACUMULADA
%
xi fi
xi2
1.2
1
1
0.1
0.1
1.2
1.44
1.4
2
3
0.2
0.3
2.8
1.96
1.6
3
6
0.3
0.6
4.8
2.56
1.8
8
14
0.8
1.4
14.4
3.24
2.0
14
28
1.4
2.8
28
4
2.2
18
46
1.8
4.6
39.6
4.84
2.4
19
65
1.9
6.5
45.6
5.76
2.6
22
87
2.2
8.7
57.2
6.76
2.8
25
112
2.5
11.2
70
7.84
3.0
26
138
2.6
13.8
78
9
3.2
27
165
2.7
16.5
86.4
10.24
3.4
31
196
3.1
19.6
105.4
11.56
3.6
35
231
3.5
23.1
126
12.96
3.8
38
269
3.8
26.9
144.4
14.44
4.0
45
314
4.5
31.4
180
16
4.2
46
360
4.6
36.0
193.2
17.64
4.4
48
408
4.8
40.8
211.2
19.36
4.6
52
460
5.2
46.0
239.2
21.16
4.8
58
518
5.8
51.8
278.4
23.04
5.0
60
578
6.0
57.8
300
25
5.2
56
634
5.6
63.4
291.2
27.04
5.4
54
688
5.4
68.8
291.6
29.16
5.6
51
739
5.1
73.9
285.6
31.36
5.8
50
789
5.0
78.9
290
33.64
6.0
46
835
4.6
83.5
276
36
6.2
44
879
4.4
87.9
272.8
38.44
6.4
40
919
4.0
91.9
256
40.96
6.6
32
951
3.2
95.1
211.2
43.56
6.8
31
982
3.1
98.2
210.8
46.24
7.0
18
1000
1.8
100
126
49
TOTAL
1000
4717
23970.12
Solución (Continuación).
Ahora se multiplica el cuadrado de la variable por la frecuencia, es decir, (fixi2).
NOTA
x
FREC. ABSOLUTA
f
FREC. ABSOLUTA
ACUMULADA
FREC. RELATIVA %
FREC RELATIVA ACUMULADA
%
xi fi
xi2
fixi2
1.2
1
1
0.1
0.1
1.2
1.44
1.44
1.4
2
3
0.2
0.3
2.8
1.96
3.92
1.6
3
6
0.3
0.6
4.8
2.56
7.68
1.8
8
14
0.8
1.4
14.4
3.24
25.92
2.0
14
28
1.4
2.8
28
4
56
2.2
18
46
1.8
4.6
39.6
4.84
87.12
2.4
19
65
1.9
6.5
45.6
5.76
109.44
2.6
22
87
2.2
8.7
57.2
6.76
148.72
2.8
25
112
2.5
11.2
70
7.84
196
3.0
26
138
2.6
13.8
78
9
234
3.2
27
165
2.7
16.5
86.4
10.24
276.48
3.4
31
196
3.1
19.6
105.4
11.56
358.36
3.6
35
231
3.5
23.1
126
12.96
453.6
3.8
38
269
3.8
26.9
144.4
14.44
548.72
4.0
45
314
4.5
31.4
180
16
720
4.2
46
360
4.6
36.0
193.2
17.64
811.44
4.4
48
408
4.8
40.8
211.2
19.36
929.28
4.6
52
460
5.2
46.0
239.2
21.16
1100.32
4.8
58
518
5.8
51.8
278.4
23.04
1336.32
5.0
60
578
6.0
57.8
300
25
1500
5.2
56
634
5.6
63.4
291.2
27.04
1514.24
5.4
54
688
5.4
68.8
291.6
29.16
1574.64
5.6
51
739
5.1
73.9
285.6
31.36
1599.36
5.8
50
789
5.0
78.9
290
33.64
1682
6.0
46
835
4.6
83.5
276
36
1656
6.2
44
879
4.4
87.9
272.8
38.44
1691.36
6.4
40
919
4.0
91.9
256
40.96
1638.4
6.6
32
951
3.2
95.1
211.2
43.56
1393.92
6.8
31
982
3.1
98.2
210.8
46.24
1433.44
7.0
18
1000
1.8
100
126
49
882
TOTAL
1000
4717
23970.12
4717
23970.12
Solución (Continuación).
Una vez obtenidos todos los datos anteriores, se procede a aplicar la fórmula
1
1
2
1
2
2
n
n
fx
xf
s
k
i
k
i
ii
ii
7217.1
11000
1000
4717
12.23970
2
2
s
3121.17217.1 s
Varianza
Desviación estándar
Cuartiles y Deciles
Estas medidas de dispersión se parecen mucho a la
mediana en cuanto a que dividen a la distribución en
partes iguales y se encuentra el valor que
corresponde, los cuartiles la dividen en cuatro y los
deciles en diez.
Cuartiles Al dividir a la distribución en cuatro partes
iguales, los cuartiles contendrán entre uno y otro al
25% del total de datos. Al primer cuartil se le denota
Q1 y separa al primer 25% del total de datos; el
segundo cuartil, Q2, separa al primer 50% de los
datos, (por lo que coincide con la mediana; el tercer
cuartil, Q3, separa al 75% de los datos.
Defensa la próxima clase

Hazle saber al autor que aprecias su trabajo

Estás en libertad de marcarlo con "Me gusta" o no

Tu opinión vale, comenta aquíOculta los comentarios

Comentarios

comentarios

Compártelo con tu mundo

Escrito por:

Cita esta página
V Juan Carlos. (2016, noviembre 8). Teoría básica de la Estadística. Presentación. Recuperado de http://www.gestiopolis.com/teoria-basica-la-estadistica-presentacion/
V, Juan Carlos. "Teoría básica de la Estadística. Presentación". GestioPolis. 8 noviembre 2016. Web. <http://www.gestiopolis.com/teoria-basica-la-estadistica-presentacion/>.
V, Juan Carlos. "Teoría básica de la Estadística. Presentación". GestioPolis. noviembre 8, 2016. Consultado el 9 de Diciembre de 2016. http://www.gestiopolis.com/teoria-basica-la-estadistica-presentacion/.
V, Juan Carlos. Teoría básica de la Estadística. Presentación [en línea]. <http://www.gestiopolis.com/teoria-basica-la-estadistica-presentacion/> [Citado el 9 de Diciembre de 2016].
Copiar
Imagen del encabezado cortesía de lumaxart en Flickr