Curso de estadística descriptiva y analítica

  • Otros
  • 6 horas de lectura
ESTADÍSTICAESTADÍSTICA
DescriptivaDescriptiva
yy
AnalíticaAnalítica
ESTADÍSTICAESTADÍSTICA
DescriptivaDescriptiva
yy
AnalíticaAnalítica
Enrique Alberto HurtadoEnrique Alberto Hurtado MinottaMinotta
2.13.1 ERROR ALEATORIO
2.13 ERRORES EN ENCUESTAS
2.12.3.4 MUESTRA ALEATORIA AGRUPADA
2.12.3.3 MUESTRA ALEATORIA ESTRATIFICADA
2.12.3.2 MUESTRA ALEATORIA SISTEMATICA
2.12.3.1 MUESTRA ALEATORIA SIMPLE
2.12.3 MUESTRAS ALEATORIAS
2.12.2 MUESTRAS DE JUICIOS
2.12.1 MUESTRAS DE CONVENIENCIAS
2.12 TIPOS DE MUESTRAS
2.11 RAZONES PARA HACER UN MUESTREO
2.10.2 ENCUESTA MUESTRAL
2.10.1 CENSO
2.10 ENCUESTA
2.9 EXPERIMENTO
2.8 DATO
2.7 UNIDAD ELEMENTAL
2.6.2.2 VARIABLE DISCRETA
2.6.2.1 VARIABLE CONTINUA
2.6.2 VARIABLE CUANTITATIVA
2.6.1 VARIABLE CUALITATIVA
2.6 VARIABLES
2.5 ESTADISTICO
2.4 MUESTRA
2.3 PARAMETRO
2.2 POBLACION
2.1.2 ESTADISTICA ANALÍTICA
2.1.1 ESTADISTICA DESCRIPTIVA
2.1 ESTADISTICA
DEFINICIONES Y CONCEPTOS BASICOS
1.1 IMPORTANCIA DE LA ESTADÍSTICA
1.2 HISTORIA DE LA ESTADÍSTICA
1.3 LA ESTADÍSTICA Y SUS METODOS
1.4 LA ESTADÍSTICA Y LA INFORMATICA
1.5 REFLEXION
BIBLIOGRAFIA
MODULO II
MODULO 1
INTRODUCCIÓN A LA ESTADÍSTICA
CONTENIDO
(VWDGtVWLFD
MODULO III
BIBLIOGRAFIA
2.15.6 PUBLICACION
2.15.5 PROCESAMIENTO DE LA INFORMACIÓN
2.15.4 RECOLECCION DE LA INFORMACIÓN
2.15.3 DETERMINACION DE LA POBLACIÓN Y DE LA MUESTRA
2.15.2 UNIDAD DE LA INVESTIGACIÓN
2.15.1 OBJETIVO DE LA INVESTIGACIÓN
2.15 ESTAPAS BASICAS DE LA INVESTIGACIÓN ESTADÍSTICA
2.14.4 DATOS DE PROPORCION
2.14.3 DATOS DE INTERVALOS
2.14.2 DATOS ORDINALES
2.14.1 DATOS NOMINALES
2.14 NIVELES DE MEDICION
2.13.2 ERROR SISTEMATICO
BIBLIOGRAFIA
TALLER MODULO III
3.18 PICTOGRAMAS
3.17 OJIVAS
3.16 POLIGONOS DE FRECUENCIAS
3.15 HISTOGRAMAS DE FRECUENCIAS ACUMULADAS
3.14 HISTOGRAMAS DE FRECUENCIAS
3.13 GRÁFICOS CIRCULARES
3.12 GRÁFICOS DE BARRAS
3.11 GRÁFICOS DE LÍNEA
3.1 GRÁFICOS
GRÁFICOS ESTADÍSTICOS
DISTRIBUCIÓN DE FRECUENCIA
MODULO IV
4.1 FILA DE DATOS
4.2 ORDENACIONES
4.3 TABLA DE FRECUENCIA
4.4 INTERVALOS DE CLASE Y LIMITES DE CLASE
4.5 FRONTERAS DE CLASE O LIMITES REALES
4.6 TAMAÑO O ANCHURA DEL INTERVALO DE CLASE
4.7 MARCA DE CLASE
4.8 FRECUENCIA RELATIVA
4.9 HISTOGRAMA
4.10 POLIGONO DE FRECUENCIA
4.11 OJIVAS
4.12 DISTRIBUCION DE FRECUENCIAS RELATIVAS
4.13 OJIVAS EN PORCENTAJES
4.14 REGALS PARA CONSTRUIR UNA DISTRIBUCION DE FRECUENCIA
4.15 DIAGRAMA DE PARETO
4.16 DIAGRAMA DE TALLO Y HOJA
TALLER DEL MODULO IV
BIBLIOGRAFIA
6.1 RANGO O RECORRIDO
MEDIDAS DE DISPERSIÓN
7.1.5 TASA DE SUBEMPLEO
7.1.4 TASA DE OCUPACIÓN
7.1.3 TASA DE DESEMPLEO
7.1.2 TASA BRUTA DE PARTICIPACIÓN
7.1.1 TASA GLOBAL DE PARTICIPACIÓN
7.1 TASAS
TASAS Y NUMEROS INDICES
BIBLIOGRAFIA
TALLER MODULO V
5.12 MEDIDAS DE POSICIONAMIENTO
5.11 MEDIA ARMONICA
5.10 MEDIA GEOMÉTRICA
5.9 COMPARACION ENTRE LA MEDIA, LA MEDIAN AY LA MODA
5.8 RELACIONES EMPÍRICAS ENTRE LA MEDIA LA MODA Y LA MEDIANA
5.7 MODA PARA DATOS AGRUPADOS
5.6 MODA
5.5 MEDIANA PARA DATOS AGRUPADOS
5.4 MEDIANA
5.3 MEDIA ARITMÉTICA PARA DATOS AGRUPADOS
5.2 MEDIA ARITMÉTICA PONDERADA
5.1 MEDIA ARITMÉTICA
MEDIDAS DE TENDENCIA CENTRAL
MODULO V
MODULO VI
6.2 RANGO INTERCUARTÍLICO
6.3 RANGO SEMICUARTIL
6.4 RANGO PERCENTIL 10-90
6.5 DESVIACIÓN MEDIA PARA DATOS SIN AGRUPAR
6.6 DESVIACIÓN MEDIA PARA DATOS AGRUPADOS
6.7 DESVIACIÓN TÍPICA
6.8 VARIANZA
6.9 PROPIEDADES DE LA DESVIACIÓN TÍPICA
6.9.1 TEOREMADE Chebyshev
6.9.2 PARA DISTRIBUCIONES NORMALES
6.9.3 SESGO ASIMETRÍA
6.9.4 PARA DISTRIBUCIONES POCOSESGADA
6.9.5 PARA LA DEFINICION
6.9.6 COEFICIENTE DE VARIACIÓN
6.10 DIAGRAM DE CAJA
TALLER MODULO VI
BIBLIOGRAFIA
MODULO VII
BIBLIOGRAFIA
TALLER MODULO VIII
8.11 COEFICIENTE DE CORRELACIÓN
8.10 COEFICIENTE DE DETERMINACIÓN
8.9 VARIACION EXPLICADA
8.8 VARIACION NO EXPLICADA
8.7 VARIACION TOTAL
8.6 ERROR TIPICO DE ESTIMACIÓN
8.5 APLICACIONES A SERIES DE TIEMPO
8.4 RECTA DE REGRESIÓN POR MINIMOS CUADRADOS
8.3 AJUSTE POR MINIMOS CUADRADOS
8.2 DIGRAMA DE DISPERSIÓN
8.1 REGRESION LINEAL
REGRESIÓN LINEAL Y CORRELACIÓN
7.1.6 TASA DE DESERCIÓN ESCOLAR
7.1.7 TASA DE MORTALIDAD
7.1.8 TASA DE NATALIDAD
7.2 NUMEROS INDICES
7.2.1 ÍNDICE SIMPLE
7.2.2 ÍNDICE DE PRECIOS AGREGADOS
7.2.3 ÍNDICE DE PRECIOS AGREGADOS PONDERADOS
7.2.3.1 ÍNDICE DE Laspeyres
7.2.3.2 ÍNDICE DE PAASCHE
7.2.3.3 ÍNDICE IDEAL DE FISHER
7.3 CAMBIO DE LA BASE DE UN NUMERO ÍNDICE
7.4 OTROS INDICES
7.4.1 ÍNDICE DEL PRECIO AL CONSUMIDOR
7.4.2 ÍNDICE DOW JONES
TALLER MODULO VII
BIBLIOGRAFIA
MODULO VIII
MODULO I
ANALISIS COMBINATORIO
1.1 FACTORIAL DE UN NUMERO
1.2 PRINCIPIO FUNDAMENTAL
1.3 DIAGRAMA DE ARBOL
1.4 PERMUTACIONES
1.5 COMBINACIONES
TALLER MODULO I
BIBLIOGRAFIA
MODULO II
PROBABILIDADES
2.1 GENERALIDADES
2.2 ESPACIO MUESTRAL
2.3 AXIOMAS DE LA PROBABILIDAD
2.4 CALCULO DE LA PROBABILIDAD DE UN EVENTO
2.4.1 ENFOQUE CLASICO
2.4.2 ENFOQUE DE FRECUENCIA RELATIVA
2.4.3 ENFOQUE SUBJETIVO
2.5 PROBABILIDAD DE APUESTAS CON VENTAJAS
2.6 LEYES DE LAS PROBABILIDADES
2.6.1 REGLA DE LA SUMA
2.6.2 REGLA DE LA MULTIPLICACION
2.7 PROBABILIDAD CONDICIONAL
2.8 ARBOL DE PROBABILIDADES
2.9 TEOREMA DE BAYES
2.10. PROCESOS ESTOCASTICOS
TALLER MODULO II
BIBLIOGRAFIA
(VWDGtVWLFD
MODULO III
DISTRIBUCIONES PROBABILISTICAS
3.1 INTRODUCCION
3.2 VARIABLES ALEATORIAS
3.3 ESPERANZA MATEMATICA
3.4 DISTRIBUCIONES PROBABILISTICAS
3.4.1 DISTRIBUCION BINOMIAL
3.4.1.1 TABLAS BINOMIALES
3.4.1.2 TABLAS BINOMIALES ACUMULADAS
3.4.2 DISTRIBUCION DE POISON
3.4.2.1 TABLAS DE POISSON
3.4.3 DISTRIBUCION HIPERGEOMETRICA
3.4.4 DISTRIBUCION MULTINOMIAL
3.4.5 DISTRIBUCION UNIFORME
3.4.6 DISTRIBUCION EXPONENCIAL
3.4.6.1 DETERMINACION DE PROBABILIDADES
TALLER DEL MODULO III
BIBLIOGRAFIA
ANEXOS
MODULO IV
DISTRIBUCION NORMAL
4.1 NATURALEZA DE LA DISTRIBUCION NORMAL
4.2 VARIABLE TIPIFICADA O ESTANDARIZADA
4.3 CALCULO DE UN VALOR DE X A PARTIR DE UNA PROBABILIDAD
CONOCIDA
4.4 APROXIMACION DE LA DISTRIBUCION NORMAL A LA DISTRIBUCION
BINOMIAL
TALLER MODULO V
BIBLIOGRAFIA
ANEXO
Copyright © Ing. Enrique A Hurtado Minotta, all rights reserved
8
MODULO I
INTRODUCCIÓN A LA ESTADÍSTICA
A medida que aumenta la complejidad de nuestro mundo y nos internamos por los
senderos reales y virtuales del nuevo milenio, se hace más difícil tomar decisiones
informada e inteligentes. Con frecuencia, estas decisiones han de tomarse con un
conocimiento imperfecto de la situación y un grado considerable de incertidumbre, sin
embargo, las soluciones pertinentes son esenciales para nuestro bienestar e incluso para
nuestra supervivencia. Estamos expuestos a la presión constante de problemas
económicos galopantes y angustiantes, como una inflación dinámicamente creciente en
casi todos los países subdesarrollados y tercermundistas, un sistema fiscal engorroso,
coercitivo e injusto y oscilaciones excesivas del ciclo económico.
Todo nuestro tejido socioeconómico esta amenazado por una contaminación ambiental
exponencialmente creciente, por una deuda pública opresiva y criminal, por un índice de
delincuencia que se incrementa sin cesar día a día como consecuencia de la perdida de
valores morales y por unos intereses impredecibles que coadyuvan a incrementar la ya
casi infinita brecha entre los países desarrollados y los países pobres de Asia,
Latinoamérica y África y sirven de caldo de cultivo para brotes de violencia cargadas de
racismo, xenofobia y lucha de clases.
Quienes crean que estas condiciones son características del estilo de vida actual, bien le
cabría recordar que problemas análogos contribuyeron a la caída del imperio romano
mas que la invasión de las hordas bárbaras del Norte. Nuestro periodo de éxito en este
planeta, relativamente, breve no es ninguna garantía de supervivencia futura. A menos
que se encuentren soluciones viables a estos apremiantes problemas, podríamos
acompañar en el olvido al dinosaurio, como ya lo hicieron los antiguos romanos.
En razón de lo anteriormente expuesto, es necesario contar con herramientas altamente
confiables que nos permitan tomar decisiones acertadas y eficaces para poder resolver
los problemas prioritarios que podrían enmarcarse de acuerdo al criterio 80/20 ( el 80%
de todos los problemas se deben al 20% de las causas.) .De ahí que sea fundamental que
todos los futuros profesionales que pretendan dirigir correctamente los destinos de la
humanidad, aprendan y se sirvan de los métodos estadísticos para minimizar la
probabilidad de error en la toma de decisiones en esta era llamada del conocimiento,
que actualmente cuentan con todas ayudas de última generación que a través de
excelentes software permiten agilizar todo el trabajo estadístico.
Es altamente recomendable que a la par con la formación humanística que se imparte en
nuestra universidad, se actualice las técnicas pedagógicas y se introduzcan en los
contenidos programáticos y curriculares de los diferentes programas, la obligación que
los docentes y estudiantes utilicen los diferentes software que se consiguen en el
mercado, que le permitan estar actualizados con las tecnologías de puntas.
1.1 IMPORTANCIA DE LA ESTADÍSTICA
(VWDGtVWLFD
9
Todos los campos de la investigación científica seria se pueden beneficiar del análisis
estadístico ya que las técnicas estadísticas se pueden utilizar en casi todos los aspectos
de la vida Se diseñan encuestas para recopilar información previa al día de elecciones y
así predecir el resultado de las mismas. Se seleccionan al azar consumidores para
obtener información con el fin de predecir la preferencia con respecto a ciertos productos
y/o servicios.
Los responsables de la toma de decisiones sobre la política económica, asesores
presidenciales, ministeriales y de otros altos cargos públicos, tienen en la estadística una
herramienta muy valiosa. Los economistas consideran varios índices de la situación
económica durante cierto periodo y utilizan la información para predecir la situación
económica futura. Únicamente con la ayuda del análisis estadístico pueden tomarse
decisiones inteligentes en relación con los tipos tributarios, programas sociales, gastos de
defensas, políticas laborales, inversiones prioritarias..
Es fundamental para los empresarios, en su búsqueda incansable del beneficio, donde las
actividades de control total de calidad, minimización de costos, combinación de productos
- existencias y multitud de aspectos empresariales se pueden gestionar con eficacia
mediante procedimientos estadísticos constratados. Los ingenieros muestrean las
características de calidad de un producto, juntos con otras variables controladas del
proceso para facilitar la identificación de las variables que están mas relacionadas con
dicha calidad.
En la investigación de mercados, la estadística representa una ayuda inestimable para
determinar si es probable que un nuevo producto y/o servicio tenga éxito. Su utilidad es
evidente también para los asesores financieros que han de evaluar las oportunidades de
inversión a través de las bolsas de valores. Contadores, directores de personal y
fabricantes se benefician igualmente del análisis estadístico.
Incluso los investigadores médicos, sicólogos, siquiatras y muchos profesionales del
sector de la salud y del comportamiento, que preocupados por la eficacia de nuevos
medicamentos, realizan experimentos para determinar su efecto bajo ciertas condiciones
ambientales controladas en los humanos y en los animales para la determinación del
método apropiado para curar ciertas enfermedades, encuentran en la estadística un
aliado imprescindible.
En termino generales la estadística se puede utilizar para mejorar el rendimiento en el
trabajo y en muchos aspectos de la vida diaria ya que es una guía universal para lo
desconocido
1.2 HISTORIA DE LA ESTADISTICA
Las ciencias al evolucionar pierden sus rasgos primitivos, se transforman, se dividen y
aún cambian de nombre. La estadística ha seguido igual proceso y para comprender su
estado actual necesitamos conocer algo de su historia. Formalmente se considera
fundador de la estadística a Godofredo Achenwall (1719 1772) profesor y economista
alemán quien siendo docente de la universidad de Leipzig, escribió el descubrimiento de
una nueva ciencia que llamo estadística ( palabra derivada de Staat que significa
gobierno) y que definió como el conocimiento profundo de la situación respectiva y
comparativa de cada estado. Achenwall y sus seguidores estructuraron los métodos
estadísticos que se orientaron a investigar, medir y comparar las riquezas de las
naciones.. No obstante lo anterior no significa que antes de los estudios de Achenwall,
los estados no hubiesen efectuados inventarios de sus riquezas; estos inventarios o
censos (palabra derivada del latín censere que significa valuar o tasar) se realizaron
desde la antigüedad. Se sabe que 2000 a 3500 años antes de Cristo, los chinos y los
egipcios efectuaron censos que eran simples inventarios elementales y que desde los
10
comienzos de la civilización han existido formas sencillas de estadística, pues ya se
utilizaban representaciones gráficas y otros símbolos en pieles, rocas, palos de madera y
paredes de cuevas para contar el número de personas, animales o cosas. Hacia el año
3000 AC. Los babilonios usaban pequeñas tablillas de arcilla para recopilar datos sobre la
producción agrícola y sobre los géneros vendidos o cambiados mediante trueque. En el
siglo XXXI a.C., mucho antes de construir las pirámides, los egipcios analizaban los datos
de la población y la renta del país. Los libros bíblicos de Números y Crónicas incluyen, en
algunas partes, trabajos de estadística. El primero contiene dos censos de la población de
Israel y el segundo describe el bienestar material de las diversas tribus judías. En China
existían registros numéricos similares con anterioridad al año 2000 a.C. Los griegos
clásicos realizaban censos cuya información se utilizaba hacia el 594 a.C. para cobrar
impuestos.
El Imperio romano fue el primer gobierno que recopiló una gran cantidad de datos sobre la
población, superficie y renta de todos los territorios bajo su control. Durante la edad media
sólo se realizaron algunos censos exhaustivos en Europa. Los reyes caloringios Pipino el
Breve y Carlomagno ordenaron hacer estudios minuciosos de las propiedades de la
Iglesia en los años 758 y 762 respectivamente. Después de la conquista normanda de
Inglaterra en 1066, el rey Guillermo I de Inglaterra encargó la realización de un censo. La
información obtenida con este censo, llevado a cabo en 1086, se recoge en el Domesday
Book. El registro de nacimientos y defunciones comenzó en Inglaterra a principios del
siglo XVI, y en 1662 apareció el primer estudio estadístico notable de población, titulado
Observations on the London Bills of Mortality (Comentarios sobre las partidas de
defunción en Londres. Un estudio similar sobre la tasa de mortalidad en la ciudad de
Breslau, en Alemania, realizado en 1691, fue utilizado por el astrónomo inglés Edmund
Halley como base para la primera tabla de mortalidad.11 En el siglo XIX, con la
generalización del método científico para estudiar todos los fenómenos de las ciencias
naturales y sociales, los investigadores aceptaron la necesidad de reducir la información a
valores numéricos para evitar la ambigüedad de las descripciones verbales
Desde su creación, la estadística se ha enriquecido continuamente con los aportes de
matemáticos, filósofos y científicos de todas las disciplinas.
En nuestros días, la estadística se ha convertido en un método efectivo para describir con
exactitud los valores de datos económicos, políticos, sociales, psicológicos, biológicos o
físicos, y sirve como herramienta para relacionar y analizar dichos datos. El trabajo del
experto estadístico no consiste ya sólo en reunir y tabular los datos, sino sobre todo en el
proceso de “interpretación” de esa información. El desarrollo de la teoría de la
probabilidad ha aumentado el alcance de las aplicaciones de la estadística. Muchos
conjuntos de datos se pueden aproximar, con gran exactitud, utilizando determinadas
distribuciones probabilísticas; los resultados de éstas se pueden utilizar para analizar
datos estadísticos. La probabilidad es útil para comprobar la fiabilidad de las inferencias
estadísticas y para predecir el tipo y la cantidad de datos necesarios en un determinado
estudio estadístico.
1.3 LA ESTADÍSTICA Y SUS METODOS
De acuerdo a un punto de vista aceptado ampliamente, la Estadística, se define mejor
como la rama de las matemáticas que se ocupa de facilitar la toma de decisiones
acertadas frente a una incertidumbre y por lo tanto, desarrolla y utiliza técnicas para la
1 Estadística," Enciclopedia Microsoft® Encarta® 2000. © 1993-1999 Microsoft
Corporation
11
recolección cuidadosa, presentación efectiva y el análisis correcto de la información
numérica.
Esta definición incorpora claramente a la estadística descriptiva y a la estadística inductiva
o inferencial. Conjuntamente, las ramas ayudan a quienes toman decisiones a extraer la
máxima utilidad a partir de información limitada; por una parte, las tablas, gráficos,
resúmenes resaltan los modelos que de otra forma quedarían ocultos en datos
desorganizados; a la vez que las deducciones correctas proporcionan estimaciones
razonables de cosas desconocidas, juntos con probabilidades indicadas claramente de
que sean correctas o falsas.
La materia prima de la estadística consiste en conjuntos de números obtenidos al contar o
medir elementos. Al recopilar datos estadísticos se ha de tener especial cuidado para
garantizar que la información sea completa y correcta.
El primer problema para los estadísticos reside en determinar qué información y en que
cantidad se ha de reunir. En realidad, la dificultad al compilar un censo está en obtener el
número de habitantes de forma completa y exacta; de la misma manera que un físico que
quiere contar el número de colisiones por segundo entre las moléculas de un gas debe
empezar determinando con precisión la naturaleza de los objetos a contar.
Los estadísticos se enfrentan a un complejo problema cuando, por ejemplo, toman una
muestra para un sondeo de opinión o una encuesta electoral. El seleccionar una muestra
capaz de representar con exactitud las preferencias del total de la población no es tarea
fácil.
Para establecer una ley física, biológica o social, el estadístico debe comenzar con un
conjunto de datos y modificarlo basándose en la experiencia. Por ejemplo, en los primeros
estudios sobre crecimiento de la población, los cambios en el número de habitantes se
predecían calculando la diferencia entre el número de nacimientos y el de fallecimientos
en un determinado lapso. Los expertos en estudios de población comprobaron que la tasa
de crecimiento depende sólo del número de nacimientos, sin que el número de
defunciones tenga importancia. Por tanto, el futuro crecimiento de la población se empezó
a calcular basándose en el número anual de nacimientos por cada 1.000 habitantes. Sin
embargo, pronto se dieron cuenta que las predicciones obtenidas utilizando este método
no daban resultados correctos. Los estadísticos comprobaron que hay otros factores que
limitan el crecimiento de la población. Dado que el número de posibles nacimientos
depende del número de mujeres, y no del total de la población, y dado que las mujeres
sólo tienen hijos durante parte de su vida, el dato más importante que se ha de utilizar
para predecir la población es el número de niños nacidos vivos por cada 1.000 mujeres en
edad de procrear. El valor obtenido utilizando este dato mejora al combinarlo con el dato
del porcentaje de mujeres sin descendencia. Por tanto, la diferencia entre nacimientos y
fallecimientos sólo es útil para indicar el crecimiento de población en un determinado
periodo de tiempo del pasado, el número de nacimientos por cada 1.000 habitantes sólo
expresa la tasa de crecimiento en el mismo periodo, y sólo el número de nacimientos por
cada 1.000 mujeres en edad de procrear sirve para predecir el número de habitantes en el
futuro.
La estadística descriptiva analiza, estudia y describe a la totalidad de individuos de una
población. Su finalidad es obtener información, analizarla, elaborarla y simplificarla lo
necesario para que pueda ser interpretada cómoda y rápidamente y, por tanto, pueda
utilizarse eficazmente para el fin que se desee.
La estadística descriptiva trabaja con todos los individuos de la población. La estadística
inferencial, sin embargo, trabaja con muestras, subconjuntos formados por algunos
individuos de la población. A partir del estudio de la muestra se pretende inferir aspectos
12
relevantes de toda la población. Cómo se selecciona la muestra, cómo se realiza la
inferencia, y qué grado de confianza se puede tener en ella son aspectos fundamentales
de la estadística inferencial, para cuyo estudio se requiere un alto nivel de conocimientos
de estadística, probabilidad y matemáticas.
Tiene especial importancia como herramienta la estadística aplicada a la economía que
formalmente llamamos econometría 2
1.4 LA ESTADÍSTICA Y LA INFORMATICA
Vivimos en la llamada era del conocimiento, de la globalización, del Internet, donde los
conocimientos se vuelven obsoleto en un abrir y cerrar de ojos. La diversidad y
abundancia de información que trae hoy cualquier periódico dominical es mucho más
grande que la podía obtener un ciudadano normal del de siglo XVII en toda su vida.
Tenemos derechos y necesidad de conocer toda esta información y de acceder a ella de
forma resumida y confiable y es aquí donde la estadística juega unos de sus roles
importantes.
La estadística en combinación con la Informática permite manejar de manera eficiente,
confiable y relativamente fácil grandes volúmenes de información y obtener resultados
que se han de someter al análisis e interpretación de los profesionales.
Actualmente existen muchos paquetes estadísticos que agilizan todo el trabajo y entre los
más importantes tenemos:
SPSS . : Gestión de datos, análisis estadístico, gráficos y presentación de resultados.
STAGRAPHICS : Paquete de análisis interactivo y sistema grafico
SAS : Planificación, análisis estadístico, gráficos y presentación de resultados.
Excel : análisis estadístico, gráficos y presentación de resultados.
STATISTICA : Planificación, análisis estadístico, gráficos y presentación de resultados
MINITAB : Planificación, análisis estadístico, gráficos y presentación de resultados
ARIMA : Diseño de experimentos
EViews : Análisis econométrico y estadístico, gráficos y presentación de resultados
1.5 REFLEXION
Our lives begín to end the day we become silent about things that
matter
Martin Luther King
“ La soñada igualdad se aleja y sistema neoliberal procura ahondar las
desigualdades. El darwinismo neoliberal globalizado permite que 225 ricos posean
tanto como 2500 millones de pobres, 3 billonarios, el PIB de los 48 países más
pobres del universo ” 3¿ Es justo? ¿ Usted que piensa?
2 Econometría, rama de la economía que utiliza métodos y modelos matemáticos. El
cálculo, la probabilidad, la estadística, la programación lineal y la teoría de juegos, así
cómo otras áreas de las matemáticas, se utilizan para analizar, interpretar y predecir
diversos sistemas y variables económicas, como el precio, las reacciones del mercado, el
coste de producción, la tendencia de los negocios y la política económica
3 Fernando Castello ,Utopía a la vista, www.arrakis.es/~trazeg/castello.html
13
La pobreza extrema, por debajo del limite de subsistencia, para millones de personas.
Pobreza en forma de hambre permanente que se transforma en azote bíblico en momento
como el presente; pobreza de capacidad y de gestión que afecta a la inmensa mayoría,
analfabeta en mas de dos tercios de las mujeres y más de la mitad de los hombres de los
países del tercer mundo en la llamada era del conocimiento. El narcotráfico enfermedad
social de los países ricos y desgracia de los países pobres, el hambre, la deuda externa,
la malaria de siempre, el SIDA de la última década, la escasez de agua potable y de
energía, el analfabetismo, la guerra y la destrucción se han convertido en imagen
habitual y nos hemos insensibilizados.
Parafraseando, como dijo el expresidente español Felipe González 4, a Joseph Ki-Zerbo ,
de Burkina Faso, afectado de malaria, venerable en su vejez de luchador por un futuro
mejor para su continente, decía en las palabras finales de una de sus intervenciones “ la
juventud africana se encuentra ante un pasado mudo, un presente ciego y un futuro sordo
“ así nos hemos quedados nosotros en todos los países subdesarrollados, masticando un
silencio cómplice y cobarde.
Ya se fue el milenio, considerado durante mucho tiempo sinónimo de futuro y desde ahora
en adelante, nuestro presente. La globalización vuela y llega a los rincones más
recónditos del planeta ignorando la independencia de los pueblos y la diversidad de sus
regímenes políticos, vivimos una nueva colonización donde los actores principales son las
empresas y conglomerados de grupos de industriales y financieros privados que
intentan dominar el mundo. Nunca antes los dueños del poder y de la tierra habían sido
tan poco numerosos y sin embargo tan poderosos. Estos grupos se sitúan en el triangulo
formado por los Estados Unidos, Europa y Japón, donde la mitad de ellos tienen su base
en los Estados Unidos.
La concentración del capital y el poder se ha acelerado enormemente bajo el influjo de las
revoluciones tecnológicas de la información. La globalización no intenta conquistar países
sino mercados. La preocupación de este moderno poder no es la conquistar territorios
como los fueron las grandes invasiones en la colonia, sino la toma de sus riquezas. ; lo
que lleva consigo destrucciones impresionantes, donde industrias enteras son
brutalmente desmanteladas en todas las regiones, paros masivos, contratos-basuras,
desempleo, sobreexplotación de hombres, mujeres y niños, miseria, etc.
La globalización es también pillaje planetario, los grandes grupos saquean el medio
ambiente, sacan provecho de las riquezas de la naturaleza que son patrimonio de
humanidad y lo hacen sin escrúpulos ni limitaciones, acompañado de una criminalidad
financiera y bancaria, por la que pasan sumas que superan el billón de dólar anuales, es
decir, mas que el PIB de la tercera parte de la humanidad.
La mercantilización generalizada de palabras y cosas, cuerpos y espíritus, de la
naturaleza y la cultura provoca mayor desigualdad mientras la producción mundial de
productos alimenticios básicos cubren mas del 110% de las necesidades, 30 millones de
personas continúan muriendo de hambre cada año y más de 800 millones están
famélicos.
A principios de la década del 60, el 20% de la población del mundo, los más ricos, tenían
unos ingresos 30 veces superiores que el 20 % de los más pobres. Hoy en día los
ingresos de los ricos son 82 veces superiores. De los 6.000 millones de habitantes del
planeta, solamente 500 millones viven con holgura, el resto, los 5,500 millones malviven
en la necesidad.55 ¿ Usted amigo lector cree que esto es justo?
4 Felipe Gonzalez Africa : El silencio de los tambores,
www.arrakis.es/~trazeg/gonzalez.html
5 El año 2000, WWW.arrakis.es/~ trazeg/anno2000.html
14
Se perdieron los valores, las estructuras sociales y políticas; se desarrollan zonas sin
derechos, entidades caóticas e ingobernables que escapan a todo tipo de legalidad,
sumergidas en un estado de barbarie donde los grupos de saqueadores son los únicos
capacitados para imponer la ley chantajeando a la población, carteles del narcotráfico y
redes mafiosas, especulación financiera, corrupción a todo nivel, contaminación
ambiental, fanáticos religiosos y étnicos, efecto invernadero, desertización y proliferación
nuclear entre otras.
¿ Serán consecuencia lógica o ilógica o realmente entrópica del neoliberalismo
implementados en el triangulo del poder arriba mencionado? ¿ Que piensa usted amigo
estudiante y futuro profesional?
Aunque alegremente se pregona el triunfo de la democracia y la libertad en un planeta
que casi se ha librado de regímenes autoritarios, la censura y la manipulación vuelven
paradójicamente con mas fuerza. Nuevos y seductores “ lideres “ proponen mundos
maravillosos, mágicos pero alejados de la realidad distrayendo a los viejos y
convenciendo a los jóvenes para que abandonen toda acción cívica y reivindicativa.
Amigos en esta nueva era de alienación, de la cultura global, de la informática, de los
mensajes planetarios. , La comunicación juega un papel ideológico importante que puede
amordazar y liberar el pensamiento.
Si Usted, amigo lector es capaz de resolver problemas y tomar decisiones acertadas,
tendrá una excelente posición en el campo empresarial, si a la vez que toma decisiones
inteligentes, resuelve problemas, alguien estará dispuesto a pagarle con generosidad. En
este mundo se suele pagar mas a quienes formulan preguntas adecuadas para lograr los
objetivos fundamentales que a quienes toman la responsabilidad para lograrlos. Las
respuestas suelen ser muy evidentes una vez que se han hecho las preguntas correctas.
El análisis estadístico demostrará ser de gran utilidad en la formación adecuada de esas
preguntas.
Los empresarios saben que los complejos problemas con que nos enfrentamos en el
mundo actual exigen soluciones cuantitativas. Si usted no estuviera en condiciones de
aplicar la estadística y otros métodos cuantitativos a los numerosos problemas corrientes
que si duda se le presentaran, se encontrara en fuerte desventaja en el mercado
empresarial.
Quienes aspiren a ocupar puestos de dirección, trabajar independientes o desempeñar
cualquier profesión del sector industrial advertirán que una comprensión básica de la
estadística no solo multiplica sus oportunidades de trabajo sino que renueva las
probabilidades de promoción debido a las mejoras del rendimiento en el trabajo.
Tenga presente que en el mercado actual los empresarios se resisten a contratar
analfabetas estadísticos por lo tanto si sus aspiraciones profesionales se encaminan a la
industria privada, al sector oficial o al desempeño de cualquier actividad lucrativa, se
encontrara mucho mejor respaldado por su experiencia académica si adquiere una base
sólida en los fundamentos del análisis estadístico “ Amigo lector no se olvide de la
primera parte de la reflexión y luchemos por la utopía de un mundo mejor.”
Cada vez que usted toma decisiones esta aplicando la estadística, ya que tomar
decisiones es inherente a todo ser viviente, por lo tanto es de aplicación universal.
Tomarla bien o mal depende no solamente de los soporte cuantitativos y
cualitativos sino también de la formación moral y ética, ya que con la estadística
también se puede engañar y manipular.
REVISTAS ELECTRONICAS
15
1. Journal of Statistics Education. Excelente revista (¡gratuita!) editada por la
American Statistical Association sobre educación estadística (a todos los niveles)
2. Homepage de la American Statistical Association. La mayor asociación de
estadísticos, editora de Journal of Agricultural, Biological, and Environmental
Statistics, Journal of the American Statistical Association, Journal of Statistics
Education y The American Statistician entre otras revistas.
3. Environmental and Ecological Statistics
4. Community Ecology
5. Journal of Agricultural, Biological, and Environmental Statistics
6. Bulletin of the Ecological Society of America (gratuita; contiene artículos de
ecología estadística)
7. Journal of Statistical Software (gratuita)
8. InterStat (Statistics on the Internet) (gratuita)
9. Probability and Statistics Journals on the Web
ESTADISTICA ON LINE
1. Aula Virtual de Bioestadística, Universidad Complutense
2. Curso de bioestadística de la Universidad de Málaga
3. Apuntes de Bioestadística. Unidad de Bioestadística Clínica del Hospital Ramón y
Cajal
4. Lecciones de Estadística, 5campus.org (análisis multivariante...)
5. Curso de Bioestadística de la Universidad Nacional de Misiones (Argentina)
6. Curso de estadística (para ingenieros) de una universidad mexicana
7. Cursos de estadística de la Universidad de California, Los Angeles
8. Cursos de estadística de la Universidad de Michigan
9. Electronic Statistics Textbook
10. A New View of Statistics
11. HyperStat Statistics Textbook
12. Statistics at Square One
13. Statistics Every Writer Should Know
14. Introductory Statistics: Concepts, Models, and Applications
15. Multivariate Statistics: Concepts, Models, and Applications
16. A complete guide to nonlinear regression
17. Ordination Methods for Ecologists
18. Annotated Bibliography of Canonical Correspondence Analysis and related
constrained ordination methods 1986-1993
19. Multivariate Statistics: an Introduction
16
20. A glossary of ordination-related terms
21. Glossary of Statistical Terms and Medical Citations for Statistical Issues
22. Glossary of over 30 statistical terms
23. EVSC 503 Applied Statistics for the Environmental Sciences
24. http://s9000.furman.edu/mellonj/spss1.htm
25. http://www.indiana.edu/~statmath/stat/spss/win/index.html
26. http://www.utexas.edu/cc/stat/tutorials/spss/SPSS1/Outline1.html
27. http://web.uccs.edu/lbecker/SPSS/content.htm
28. http://core.ecu.edu/psyc/wuenschk/SPSS/SPSS-Data.htm
29. http://www.tulane.edu/~ panda2/Analysis2/ahome.html
30. http://www.shef.ac.uk/~ scharr/spss/index2.htm
31. http://calcnet.mth.cmich.edu/org/spss/index.html
32. http://calcnet.mth.cmich.edu/org/spss/toc.htm
33. http://www.public.asu.edu/~pythagor/spssworkbook.htm
34. http://lib.stat.cmu.edu/
35. http://www.stat.ufl.edu/vlib/statistics.html
36. http://www.statserv.com/softwares.html
37. http://www.maths.uq.edu.au/~gks/webguide/
38. http://www.statistics.com/
39. http://www.helsinki.fi/~jpuranen/links.html#stc
40. http://www.maths.uq.edu.au/~gks/webguide/free.html
41. http://nhsbig.inhs.uiuc.edu/
42. http://www.okstate.edu/artsci/botany/ordinate/software.htm
43. http://life.bio.sunysb.edu/ee/biometry/
44. http://life.bio.sunysb.edu/morph/software.html.
45. http://pbil.univ-lyon1.fr/ADE-4/ADE-4.html
46. http://ourworld.compuserve.com/homepages/Rainer_Wuerlaender/statsoft.htm
47. http://www.stat.auckland.ac.nz/~mja/Programs.htm
48. http://it.stlawu.edu/~rlock/maa99/
49. http://it.stlawu.edu/~rlock/tise98/java.html
50. http://www.stat.vt.edu/~sundar/java/applets/
51. http://www.kuleuven.ac.be/ucs/java/index.htm
52. http://noppa5.pc.helsinki.fi/koe/
17
53. http://www2.kenyon.edu/people/hartlaub/MellonProject/mellon.html
Demostraciones Java para el aprendizaje de la estadística
54. Electronic Textbook (UCLA), programa on-line de representación y cálculo de
funciones de densidad y de distribución (normal, F, ji-cuadrado, números
aleatorios...). Equivalente a un libro de tablas
BIBLIOGRAFÍA
1. Montgomery Douglas y Runger George.( 1996), Probabilidad y Estadística
aplicada a la Ingeniería., Mcgraw-Hill, Mexico
2. Montgomery Douglas y Hines William.( 1995), Probabilidad y Estadística aplicada
a la Ingeniería. y Administración, segunda edición ,CECSA, México
3. Mendenhall William, Wackerly Dennis y Scheaffer Richard (1994), Estadística
Matemáticas con Aplicaciones , segunda edición, Grupo Editorial Iberoamerica. M,
México
4. Govinden Portus Lincoyan.( 1998), Introducción a la Estadística,. Mcgraw-Hill,
Santafé de Bogotá
5. Webster Allen L.( 1998), Estadística aplicada a la Empresa y a la Economía,
segunda edición, Mcgraw-Hill, Madrid
6. Kohler Heinz.( 1996), Estadística para Negocios y Economía, primera edición
,CECSA, México
7. Martinez Bencardino Ciro ( 1995), Estadística , sexta edición ,ECOE EDICIONES
Santafé de Bogotá.
8. Alvarez C Ricardo ( 1994), Estadística Fundamental Aplicada, primera edición
,PUBLIADCO, Cali
9. Estadística," Enciclopedia Microsoft® Encarta® 2000. © 1993-1999 Microsoft
Corporation.
10. Stockburger David W (1996) Introductory Statistics: Concepts, models an
applications, , http://www.psychstat.smsu.edu/sbk00.htm
11. Mendoza Duran Carlos. (1995 )Probabilidad y Estadística,
http://w3.mor.itesm.mx/~cmendoza/ma835/ma83500.html
12. Valdés Fernando ,Comprensión y uso de la estadística,
http://www.cortland.edu/flteach/stats/glos-sp.html
13. Hurtado Minotta Enrique A, Reflexiones para el Currículo,
http://www.geocities.com/soho/atrium/7521/tesis.html
14. Academic Freedom , www.hrw.org/wr2k/issues-01.htm
15. Gonzalez Felipe, Africa : El silencio de los tambores,
www.arrakis.es/~trazeg/gonzalez.html.
16. El año 2000, WWW.arrakis.es/~ trazeg/anno2000.html
17. Mendenhall, W.; D.D. Wackerly y R.L. Scheaffer. Estadística Matemática con
Aplicaciones. Grupo Editorial Iberoamérica. México.
18. Freund, John E. y Gary A. Simon. Estadística elemental. Prentice-Hall
Hispanoamericana, SA. México, 1994. (8ª edición.)
19. Spiegel, M.R. Estadística. McGraw-Hill. México. (Serie Schaum.)
20. http://www.unl.edu.ar/fave/sei/encuestas/index.html.
21. Wonnacott, Thomas H. y Ronald J. Wonnacott (1998) Introducción a la estadística.
Limusa/IPN. México.
18
MODULO II
DEFINICIONES Y CONCEPTOS BÁSICOS
2.1 ESTADISTICA: Se define como la rama de las matemáticas que se ocupa de
facilitar la toma de decisiones acertadas frente a una incertidumbre y por lo tanto,
desarrolla y utiliza técnicas para la recolección cuidadosa, presentación efectiva y el
análisis correcto de la información numérica. La estadística la podemos agrupar en dos
grandes ramas, la descriptiva o deductiva y la analítica o inferencia estadística.
2.1.1 ESTADISTICA DESCRIPTIVA: Es aquella que recopila, analiza, estudia y describe
a la totalidad de individuos de una población. Su finalidad es obtener información,
analizarla, elaborarla y simplificarla lo necesario para que pueda ser interpretada cómoda
y rápidamente y por lo tanto, pueda utilizarse eficazmente para el fin que se desee.
La estadística descriptiva también se puede definir como la rama de la estadística que se
ocupa del desarrollo y utilización de técnicas para la presentación eficaz de información
numérica con el objeto de poner de relieve los modelos que de otra forma quedarían
ocultos en un conjunto de datos.
2.1.2 ESTADISTICA ANALITICA: Conocida como inferencia estadística, se define como
la rama de la estadística que se encarga del desarrollo y utilización de técnicas
probabilística para analizar correctamente o sacar deducciones de informaciones
numéricas. Mientras la estadística descriptiva trabaja con todos los individuos de la
población, la estadística inferencial, trabaja con muestras, (subconjuntos formados por
algunos individuos de la población. A partir del estudio de la muestra se pretende inferir
aspectos relevantes de toda la población.
Cómo se selecciona la muestra, cómo se realiza la inferencia, y qué grado de confianza
se puede tener en ella son aspectos fundamentales de la estadística inferencial, para
cuyo estudio se requiere un alto nivel de conocimientos de estadística, probabilidad y
matemáticas.
A veces se deduce una verdad general, a partir de particularidades y en otras ocasiones
se obtienen conclusiones particulares a partir de un conocimiento general. Obtener
conclusiones acerca de un todo desconocido a partir de una parte conocida es el
razonamiento inductivo y funciona por ejemplo cuando un ingeniero de producción
concluye con un 95% de confianza de que es verdad contra un 5% de estar equivocado,
que el porcentaje promedio de desperdicio de un proceso productivo es del 3% anual
obtenido a partir de un muestreo de la producción. Por otra parte al obtener
deducciones sobre una parte desconocida partiendo de un todo conocido se llama
razonamiento deductivo. El razonamiento deductivo y el inductivo son complementarios
por lo tanto ante que los estadísticos puedan generalizar en forma segura de la parte al
todo, deben estudiar como es que la parte ha sido generada.
2.2 POBLACION: Es el conjunto de todas las observaciones de interés para el
investigador, o el conjunto de todos los elementos o eventos que tienen características
19
similares. La población puede ser finita o infinita. Es finita cuando todos sus elementos se
pueden contar con exactitud , en caso contrario es infinita.
2.3 PARAMETRO: Es cualquier medida descriptiva de la población completa de
observaciones que tienen interés para el investigador por ejemplo el ingreso promedio de
los docentes universitarios de las universidades colombianas.
2.4 MUESTRA: Es la porción representativa de la población, que se selecciona para un
estudio porque la población es demasiado grande para analizarla en totalidad. En otras
palabra la muestra es un subconjunto de la población seleccionada por medios científicos.
2.5 ESTADISTICO: Es cualquier medida descriptiva de la muestra y sirve para estimar el
parámetro de la población. El estadístico es a la muestra lo que el parámetro es a la
población. Por ejemplo el ingreso promedio de los docentes universitario de la Usaca es
el estadístico cuando la Usaca es una muestra de las universidades colombianas.
2.6 VARIABLES: Es una característica de la muestra o de la población que se analiza
en un estudio estadístico. Una variable puede ser cualitativa o cuantitativa.
2.6.1 VARIABLE CUALITATIVA: Es aquella que se puede expresar normalmente por
medio de palabra y no de números, por ejemplo, el estado civil, la nacionalidad, el sexo, la
profesión, la raza, el color de la piel de los profesores de la Usaca. Las variables
cualitativas pueden ser binomiales o multinomiales. Se pueden hacer observaciones
solo en dos categorías sobre una variable cualitativa binomial, por ejemplo, hombre o
mujer, bueno o malo, rico o pobre, ausente o presente, empleado o desempleado. Sobre
una variable cualitativa multinomial se pueden hacer observaciones en mas de dos
categorías, por ejemplo, en puestos de trabajo, colores, idiomas, estratos, nacionalidades,
religiones, etc.
2.6.2 VARIABLE CUANTITATIVA: Es aquella que se expresa numéricamente, por
ejemplo, las exportaciones de café, las ventas de acero, el ingreso per cápita, la
producción de autos, el decomiso de cocaína, las hectáreas fumigadas, etc. Las
variables cuantitativas pueden ser discretas o continuas.
2.6.2.1 VARIABLE CONTINUA: Es aquella que toma cualquier valor dentro de un
intervalo dado. Por muy cerca que estén dos observaciones siempre es posible hacer otra
medición que caigan dentro de esa dos. Los valores de una variable continua provienen
de las mediciones y de los pesajes.
2.6.2.2 VARIABLE DISCRETA: Es aquella que solo puede tomar determinados valores
por lo general, números enteros, por ejemplo, el numero de hijos de una familia, numero
de empleados de una empresa, numero de vacas en una hacienda, numero de carros
fabricados, etc.
2.7 UNIDAD ELEMENTAL: Son las personas u objetos que poseen las características
que interesan en una investigación estadística. Por ejemplo si alguien esta interesado en
la filiación política de los estudiantes de un curso, rápidamente identificaría a los
estudiantes de ese curso como unidades elementales, pero si quiere saber el estado su
rendimiento en estadística, las notas pueden ser tomadas como unidades elementales a
ser investigadas.
20
2.8 DATO: Es cualquier observación individual de una característica( variable) especifica,
susceptible de ser comparada. Cualquier conjunto de observaciones de una o mas
particularidades de interés, para una o mas unidades elementales, se denomina conjunto
de datos. Un conjunto de datos es univariado, bivariado o multivariado si contiene
una, dos, o mas de dos variables
En el cuadro No 1 que aparece a continuación se muestra una base de datos donde en
donde se pueden observar los diferentes componentes ( unidad elemental, tipos de
variables , datos , muestra, etc). CUADRO No 1
BASE DE DATOS DE LOS EMPLEADOS DE LA EMPRESA
Metalconsulting Ingenieria ltda
2.9 EXPERIMENTO: Es la recolección de datos provenientes de unidades elementales
que se efectúa ejerciendo control sobre algunos o todos los factores que pueden hacerlos
diferentes entre sí, afectando por lo tanto, la característica de interés en la observación.
2.10 ENCUESTA: Encuesta o estudio de observaciones es la recopilación de datos
provenientes de unidades elementales que se ejecutan sin controlar los factores que los
hacen diferentes entre sí y que pueden afectar las características de interés en la
observación. Existen dos tipos de encuestas, completas (censo ) y parciales
2.10.1 CENSO: Es una encuesta completa en la que se hacen observaciones sobre una
o mas características de interés para toda unidad elemental que exista. Un censo produce
siempre un conjunto de datos que consta de al menos una población estadística, pero
21
posiblemente contiene varias. Existen varios procedimientos para llevar a cabo un censo.
Una posibilidad es la observación directa de algunas actividades en curso, donde el
encuestador registra, por ejemplo los pesos netos de los bultos de café cuando son
llenado por una maquina, o las referencias y marcas de los computadores vendidos en
un almacén. Un censo también se puede hacer también mediante una entrevista
personal o telefónica en la que el investigador lee preguntas de una lista
cuidadosamente elaborada y anota las respuestas verbales que recibe. Otra forma sería
un censo por autonumeración como es el caso en que habiendo leído un conjunto de
instrucciones, algunas personas responden por escrito cuestionarios que recibieron por
correo normal, correo electrónico, por fax, o en la esquina de casa. Es frecuente que
estos mismos procedimientos se apliquen a encuestas parciales.
2.10.2 ENCUESTA MUESTRAL: Es un estudio parcial en el que se hacen observaciones
sobre una o más características de interés para solo un subconjunto de todas las
unidades elementales.
2.11 RAZONES PARA HACER UN MUESTREO: hay muchas y variadas razones para
realizar un muestrea y de una u otras formas todas están relacionadas con el tiempo, el
presupuesto, la confiabilidad y calidad de la información. Dentro de estas razones
listaremos algunas:
a) El costo de recopilar y procesar la información es menor cuanto menos
unidades elementales se tomen. Esta es una consideración crucial siempre que
el número de unidades elementales pertinentes sea grande. Obsérvese que las
empresas comerciales interesadas en conocer las preferencias de los
consumidores con relación a productos nuevos o ya conocidos nunca hacen
encuestas entre todos los consumidores, sino solo a un pequeño porcentaje de los
mismos. Las empresas incluso resuelven interrogantes sobre sus operaciones
internas por el método de muestreo, ya que un censo sería muy costoso y difícil de
manejar. Considérese un banco que desea averiguar el porcentaje de errores
cometidos mensualmente al abonar intereses en unos 4 millones de cuentas de
ahorros, o al facturar a unos 6 millones de cuentas de créditos. El costo a pagar en
empleados administrativos que hagan un censo de todas las cuentas será enorme
y no se justifica.
b) A veces un censo es físicamente imposible de realizar cuando el numero de
unidades elementales es muy grande o cuando son inaccesibles. En tales
casos situaciones el muestreo es inevitable o cuando es prácticamente imposible
ponerse en comunicación con algunas unidades elementales, como sería el caso
de aviones siniestrados en el mar o en regiones montañosas remotas o de
personas con domicilios desconocidos.
c) Un censo no tiene sentido cuando produce información que llega demasiado
tarde; por ejemplo, una encuesta de opinión política llevada a cabo antes de unas
elecciones. Un censo de millones de habitantes tardaría demasiado en dar
resultados, en cambio un muestreo es lo único que puede proporcionar con
oportunidad una información deseada.
d) El muestreo puede proporcionar datos mas precisos que un censo. Aunque
esto suene paradójico, es cierto, ya que se necesitan menos trabajadores de
estadística y se les puede capacitar mejor y supervisarlos de modo más eficiente;
por lo tanto para un costo dado se recibe información de mayor calidad.
e) Un censo no tiene sentido y es infinitamente costoso cuando adquirir la
información deseada destruye las unidades elementales de interés. Por
22
ejemplo medir la vida útil de las baterías o la calidad de los bombillos producidos
por una fabrica. Si se probaran todas las unidades elementales de interés se
gastaría toda la producción y las respuestas a las preguntas originales serían
inútiles.
2.12. TIPOS DE MUESTRAS: Teniendo en cuenta la frecuencia con que los ejecutivos,
gerentes, economistas, ingenieros e investigadores, utilizan las encuestas muestrales, es
importante comprender y analizar el significado de muestreo y tipos de muestreos. Se
obtienen diferentes tipos de muestras según sea el método de selección de las
unidades elementales para la observación. Entre los diferentes tipos tenemos las
muestras por conveniencias, de juicios y aleatorias.
2.12.1 MUESTRAS DE CONVENIENCIAS: Cuando la conveniencia sea la consideración
fundamental y solo se escojan para observación las unidades elementales mas fácilmente
accesibles, el subconjunto resultante de todas ellas o de una población estadística
asociada constituye una muestra por conveniencia. Es poco probable que este tipo de
muestra sea representativo de una población, en el sentido de que se pueda obtener
inferencias validas. Este procedimiento asegura todo lo contrario. Imagínese que a las
primeras 20 personas que sale de una fabrica se le pregunta acerca de sus salarios y se
obtiene así un promedio de $ 500.000 mensuales. Es difícil que se tenga confianza en
este resultado ya que la selección estuvo basada por entero en la conveniencia
personal, en donde no se tuvo en cuenta en averiguar si era lo representativo de la fuerza
laboral de la empresa considerada como un todo. Otros ejemplos son el de un senador
que juzga las actitudes de los electores que con base en el correo recibido toma una
muestra de conveniencia, al igual que una asistente que pide por teléfono la opinión de
los electores, sin tener en cuenta la de aquellos que no contestaron el teléfono, los que no
tienen ese servicio o que lo tienen y no aparecen en la guía telefónica.
2.12.2 MUESTRAS DE JUICIOS: Son aquellas donde el juicio personal, presumiblemente
basado en la experiencia previa, juega un papel importante en la selección de las
unidades elementales para la observación. Por lo tanto se cree que el juicio experto es
capaz de obtener una muestra representativa del todo. Dicho subconjunto de una
población asociada se denomina muestra de juicio. Sin embargo, formular dicho juicio
puede ser casi imposible, en especial cuando las unidades elementales son heterogéneas
y la muestra deseada pequeña. Un buen ejemplo de juicio experto es la construcción
mensual del índice de precio al consumidor ( IPC) donde el experto decide con base
en su juicio personal, entre prácticamente miles de millones de precios, cuales han de
muestrearse y que ponderación han de asignárseles. Determinar el IPC requiere
decisiones complejas relativas a que tiendas y en que zonas geográficas han de hacerse
las encuestas, en que días, y de que productos. Un precio cobrado a muchos clientes en
una tienda popular es más importante que uno cobrado a pocos clientes en una tienda
casi vacía; mas personas compran los sábados que los lunes, por lo tanto aprovechan las
ofertas de fin de semanas; las los frijoles, el arroz, la carne, las frutas parecen más
importantes que las de los refrescos, el té, los fósforos y el cine. En todas estas
cuestiones y en mas se aplica un juicio experto, cuando este falla, como es posible que
ocurra, la muestra termina siendo no representativa del todo asociado.
2.12.3 MUESTRAS ALEATORIAS: Son las más importantes ya que evitan el problema
de la falta de representatividad. Están formadas por un subconjunto de todas las unidades
elementales o de una población asociada de sus características, que se escoge por un
23
proceso aleatorio que dará a cada unidad o población asociada una posibilidad positiva y
conocida de ser seleccionada, aunque no necesariamente igual. Si se ejecuta en forma
correcta, el proceso de selección aleatoria no permite discernir al investigador que
unidades particulares del o población entran en la muestra. Como consecuencia de ello
dicha muestra tiende a llevar al máximo las oportunidades de hacer deducciones validas
sobre la totalidad de la que proviene. Las muestras aleatorias las podemos clasificar
en varios tipos a saber: aleatoria simple, aleatoria sistemática, aleatoria
estratificada, aleatoria agrupada
2.12.3.1 MUESTRA ALEATORIA SIMPLE: Es un subconjunto de una población,
escogida de tal modo que todo subconjunto posible del mismo tamaño tiene una
oportunidad igual de ser seleccionada. Este procedimiento requiere que cada unidad
individual tenga una oportunidad igual de selección. El procedimiento más común en la
practica de seleccionar una muestra aleatoria simple consiste en el uso de las tablas de
números aleatorios que consiste en una lista de números generada por un proceso
aleatorio de modo que cada digito posible tenga igual probabilidad de preceder o seguir
a cualquier otro.
2.12.3.2 MUESTRA ALEATORIA SISTEMATICA: Es un subconjunto de una población
escogida al seleccionar al azar uno de los primeros k elementos, incluyendo todo
elemento K-ésimo de ahí en adelante. Al utilizar este procedimiento K se determina al
dividir el tamaño de la población N entre el tamaño de una muestra n. Supóngase que
queremos seleccionar una muestra de 5 empresas donde se desea incluir cada vigésima
empresa, entre las 100 empresas mas grande del país listada y enumeradas de acuerdo a
sus utilidades en el último año. Lo primero que hacemos es dividir N/n ( k = 100/5 = 20)
para hallar k y luego procedemos a sacar aleatoriamente un número entre 00 y 19 de un
recipiente que contenga los dichos números o usamos una tabla de números aleatorios,
para hallar el punto de inicio, es decir el numero de la primera empresa seleccionada y a
partir de ahí hallar el resto de números. Suponga el primer numero seleccionado fue 05
entonces la muestra quedaría conformada por las empresas codificada con los números
05,25,45,65 y 85 Si la selección inicial hubiese sido 02 o 18 las muestras hubiesen sido
02, 22,42, 62, 82 o 18,38 58, 78 y 98 respectivamente.
2.12.3.3 MUESTRA ALEATORIA ESTRATIFICADA: Es un subconjunto de una
población escogida al tomar muestras aleatorias separadas (simples o sistemáticas) de
cada estrato de la población. Cuando la población a ser muestreada contiene dos o mas
subgrupos o estratos mutuamente exclusivos y claramente distinguibles, que difieren
mucho uno de otro con respecto a alguna característica de interés a la vez que sus
elementos son mas bien homogéneos podemos seleccionar una muestra aleatoria
estratificada. , donde los tamaños de las muestras separadas varían de acuerdo con la
importancia de los estratos. Si supiéramos que 10 de las 100 empresas enumeradas
contabilizaron el 70% de las ventas generales, mientras que las otras 90 facturaron el
30% restante y si las ventas fueran la característica de Interés para nosotros, quizás
desearíamos asegurarnos que en nuestro muestreo no se excluya a las 10 empresas
gigantes como podría pasar si se tomara una muestra aleatoria simple o sistemática.
Podríamos dividir el listado en dos grandes estratos ( 10 gigantes y 90 pequeñas) y luego
crear la muestra al seleccionar compañías de cada uno de los grupos. Para un 10% del
total de la muestra, podríamos seleccionar 7 empresas del estrato gigante y 3 del estrato
pequeño esperando que estas 10 compañías constituyan mas de la mitad de todas las
24
ventas. El muestreo aleatorio estratificado ha adquirido mucha importancia para los
encuestadores que desean predecir los resultados de las elecciones gubernamentales.
2.12.3.4 MUESTRA ALEATORIA AGRUPADA: En ocasiones cuando la población a
muestrear se dividen en forma natural en grupos , con base en la accesibilidad física se
toma una muestra aleatoria agrupada, que esta conformada por un subconjunto de la
población, escogido al tomar censos separados en un subconjunto de grupos
geográficamente distintos escogidos al azar. Alguien que deseara muestrear los
residentes o las tiendas de una ciudad , podría dividir la ciudad en manzanas , seleccionar
al azar unas cuantas ( por cualquiera de los métodos anteriores) y luego entrevistar a
cada residente o propietario de tienda ubicado dentro del perímetro escogido. Debido a la
proximidad geográfica de los entrevistados, este procedimiento ahorraría tiempo y gastos
considerables de transportes, en comparación con el muestreo aleatorio simple que
abarcara toda una ciudad en las que las unidades elementales de interés estarían
ubicadas en una multitud de lugares . El procedimiento descrito recibe también el nombre
de muestreo de grupo de una sola etapa. En ocasiones este muestreo es sustituido por el
llamado de grupo de etapas múltiples, que mas complejo. Un ejemplo de este último
podría ser una encuesta domiciliaria a nivel nacional dirigida como sigue: primero se
escoge al azar un subconjunto de departamentos ( grupos primarios), enseguida un
subconjunto de ciudades dentro de los departamentos previamente seleccionados (grupos
secundarios) y en tercer lugar un subconjunto de manzanas (grupos terciarios) en las
ciudades de los grupos secundarios . Nótese que las encuestas gubernamentales siempre
se realizan en las manzanas de los grupos terciarios.
2.13 ERRORES EN ENCUESTAS: Como hemos vistos se pueden recopilar datos al
tomar un censo o realizar varias formas de muestreo, de ahí que sea inevitable que los
datos de todas las encuestas estén sujetos a errores que pueden surgir de innumerables
y a veces inesperadas fuentes. En el mejor de los casos , los errores ocultan la verdad
solo ligeramente y en el peor pueden reducir el valor de una encuesta y darle un sentido
negativo, no hay algo mas desafortunado que saber algo que no es cierto. Los errores se
pueden generar durante la etapa de planeación de una encuesta, pero es mas probable
que se den en las últimas etapas , cuando se registran y procesan los datos. Sería
trabajo inoficioso enumerar todas las formas en que pueden presentarse errores en las
encuestas ; sin embargo debemos estar consciente del problema y por ahora veremos
dos categorías amplias de error que son : el error aleatorio y el error sistemático o sesgo.
2.13.1 ERROR ALEATORIO: Llamado también error de oportunidad o error muestral , es
igual a la diferencia entre el valor de una variable obtenido al tomar una muestra aleatoria
simple y el valor que resulta de efectuar un censo o del promedio de todas las muestras
aleatorias posibles del mismo tamaño. Este tipo de error esta asociado solo con
encuestas muestrales y resulta de la etapa en que se determinan las unidades de interés
de la población que han incluirse en la muestra. Este error puede ser positivo o negativo,
pequeño o grande, pero siempre es posible reducirlo al incrementar el tamaño de la
muestra o número de muestras aleatorias tomadas y es cero en un censo. Lo mas
importante es que el tamaño de este error puede ser estimado y muchas veces se
reporta junto con los datos observados.
2.13.2 ERROR SISTEMATICO: Llamado sesgo o error no muestral es igual a la
diferencia entre el valor de una variable obtenida al tomar un censo o al promediar los
resultados de todas las muestras aleatorias posibles de un cierto tamaño y el valor
25
verdadero . Desafortunadamente el sesgo puede ser difícil de detectarse y su tamaño a
diferencia del error muestral no se puede estimar por lo tanto los estadísticos que
busquen descubrir la verdad deben estar enterados de cuales son las fuentes
importantes de sesgos y hacer cuanto puedan por neutralizarla. ( Se pueden provocar
errores sistemáticos prácticamente desde el diseño de las encuestas. Errores
denominados sesgos de selección, sesgo de respuesta o sesgo de no respuestas ).
2.14 NIVELES DE MEDICION: Los datos se pueden clasificar por su nivel de medición
en cuatro tipos de datos de complejidad creciente a saber : datos nominales, ordinales,
de intervalo y de razón .
2.14.1 DATOS NOMINALES: El nivel de medición mas débil, que da una cantidad mínima
de información, produce datos nominales . Estos son números que solo nombran o
marcan diferencias de clases y sirve para clasificar observaciones sobre variables
cualitativas en grupos mutuamente exclusivos, donde los números de cada grupo pueden
contarse. Por ejemplo, el sexo de las personas es una variable que puede clasificarse en
masculino o femenino , donde también se puede codificar con los valores como 0 y 1
teniendo en cuenta que los números en este caso solo sirve para indicar categorías. Es
importante anotar que una medición nominal no lleva consigo ninguna indicación sobre el
orden de preferencia , sino que se limita a establecer una disposición en categorías en las
cuales se puede colocar cada observación.
2.14.2 DATOS ORDINALES: Son números que no solo poseen las características de los
datos nominales sino que por su tamaño se ordenan y clasifican observaciones en base a
su importancia, es decir, se jerarquizan a partir de algún criterio, por ejemplo los
resultados de cualquier actividad se pueden clasificar como excelente, bueno, regular,
malo y pésimo, los sondeos de opinión utilizan a menudo una escala ordinal , como muy
de acuerdo, de acuerdo, en desacuerdo, muy en desacuerdo y sin opinión. Al igual que
los datos nominales pueden utilizar números para ordenar las jerarquías.
2.14.3 DATOS DE INTERVALO: Estos son números que poseen todas las características
de los datos ordinales y además están relacionados entre si por intervalos o distancias
significativas porque todo los números están referidos a un punto cero arbitrario. Teniendo
en cuenta esta arbitrariedad, las proporciones de dichos números no tienen sentido La
suma y la resta son permisible pero no la multiplicación ni la división. Las escalas de
tiempo calendario, tiempo horario y de temperatura son muy buenos ejemplos de
mediciones que empiezan desde un punto cero ubicado arbitrariamente y luego utilizan
una distancia unitaria , igualmente arbitraria pero consistente, para expresar intervalos
entre números.
2.14.4 DATOS DE PROPORCION: El nivel de medición que produce la información mas
útil es proporcionada por los datos de proporción o razón, que son números que poseen
todas las características de los datos de intervalos y además tienen razones con sentido
porque están referidas a un punto cero absoluto natural que denota la ausencia total de la
característica que se miden. Todas las operaciones aritméticas se pueden realizar .
Ejemplos son las mediciones de salarios, edad, distancias, altura, pesos, volúmenes, etc.
2.15 ETAPAS BASICAS DEL METODO ESTADÍSTICO
26
Los aspectos básicos para desarrollar o realizar una investigación o experimento
utilizando el método estadístico, donde se parte de la observación de fenómenos, cuyas
condiciones de ocurrencia, pueden ser controlados o no por los investigadores, consta
como mínimo de las siguientes etapas:
2.15.1 OBJETIVO DE LA INVESTIGACIÓN.
Antes de iniciar cualquier investigación se debe tener bien definido Que y porque se va a
investigar , Como se llevara a cabo dicha investigación, es decir , en que condiciones y
con cuales recursos. Cuando y Donde se va realizar . La contestación adecuada al Qué,
Como, Cuando y Donde; su desglose en metas, tareas y actividades menores; La
obtención de los recursos físicos, financieros , bibliográficos y humanos son
fundamentales para el desarrollo del cronograma de la investigación.
2.15.2 UNIDAD DE INVESTIGACIÓN
Es el elemento de la población que origina la información y puede estar constituida por
uno o varios individuos u objetos ( un animal, una persona, una fabrica, un avión, etc ) y
denominarse simple o compleja. La unidad de investigación debe estar perfectamente
identificada, y ser fácilmente mensurable.
2.15.3 DETERMINACION DE LA POBLACIÓN Y DE LA MUESTRA
Como habíamos definido anteriormente la población es el conjunto de todas las
observaciones de interés para el investigador., también podemos definir la población
como el conjuntos de todos los elementos que tienen características comunes. Es
fundamental definir claramente la población a investigar clarificando si es finita o es
infinita y dada la dificultad que implica trabajar con poblaciones grandes es necesario
trabajar con subconjuntos o muestras de dicha población. Existen muchos métodos para
seleccionar y calcular el tamaño de la muestra. ( Este tema se desarrollará en estadística
III )
2.15.4 RECOLECCION DE LA INFORMACIÓN
Una de las etapas mas importantes de la investigación estadística es la recolección de
datos La información se puede recolectar por diferentes medios, entre los cuales los mas
comunes son: por observación directa, por encuestas, por publicaciones y/o fuentes
externas confiables que hallan realizados investigaciones estadísticas.
2.15.5 PROCESAMIENTO DE LA INFORMACIÓN
Consiste en ordenar la información , filtrarla, eliminando los posibles errores, (donde es
fundamental el conocimiento de la población por parte de quien depura y filtra para poder
detectar las falsedades en las respuestas), tabularla mediante la utilización de cuadros o
tablas donde se resume la información de acuerdo al interés especifico del investigador,
y analizar la información mediante los métodos y normas estadísticos. Cabe anotar que
para la presentación final hay que tener en cuenta a quien va dirigida la información por lo
tanto es indispensable combinar gráficos, tablas y/o cuadros con el fin de que la
información llegue con claridad y permita hacer los análisis fácilmente.
El avance tecnológico y la masificación de las computadoras hacen que estas tareas
manualmente engorrosas sean realizadas fácilmente y en muy corto tiempo.
2.15.6 PUBLICACION
27
Es la etapa final de entrega de la información después de revisada, donde quedan
consignados todo los resultados de la investigación. Estos resultados deben presentarse
adecuadamente de tal forma que puedan servir para estudios posteriores.
TALLER MODULO 2
1. Visite los homepages de las principales revistas y lea como mínimo 3 artículos
relacionados con su actividad
2. Lea los capítulos de introducción y generalidades que se encuentran en los cursos
de estadística on line.
3. Averigüe como se diseñan las encuestas, haga un resumen de lo básico que
deben contener y diseñe una encuesta de acuerdo a su actividad
Copyright © ;Ing. Enrique A Hurtado Minotta, all rights reserved
REVISTAS ELECTRONICAS
10. Journal of Statistics Education. Excelente revista (¡gratuita!) editada por la
American Statistical Association sobre educación estadística (a todos los niveles)
11. Homepage de la American Statistical Association. La mayor asociación de
estadísticos, editora de Journal of Agricultural, Biological, and Environmental
Statistics, Journal of the American Statistical Association, Journal of Statistics
Education y The American Statistician entre otras revistas.
12. Environmental and Ecological Statistics
13. Community Ecology
14. Journal of Agricultural, Biological, and Environmental Statistics
15. Bulletin of the Ecological Society of America (gratuita; contiene artículos de
ecología estadística)
16. Journal of Statistical Software (gratuita)
17. InterStat (Statistics on the Internet) (gratuita)
18. Probability and Statistics Journals on the Web
ESTADISTICA ON LINE
55. Aula Virtual de Bioestadística, Universidad Complutense
56. Curso de bioestadística de la Universidad de Málaga
57. Apuntes de Bioestadística. Unidad de Bioestadística Clínica del Hospital Ramón y
Cajal
58. Lecciones de Estadística, 5campus.org (análisis multivariante...)
59. Curso de Bioestadística de la Universidad Nacional de Misiones (Argentina)
60. Curso de estadística (para ingenieros) de una universidad mexicana
61. Cursos de estadística de la Universidad de California, Los Angeles
62. Cursos de estadística de la Universidad de Michigan
63. Electronic Statistics Textbook
28
64. A New View of Statistics
65. HyperStat Statistics Textbook
66. Statistics at Square One
67. Statistics Every Writer Should Know
68. Introductory Statistics: Concepts, Models, and Applications
69. Multivariate Statistics: Concepts, Models, and Applications
70. A complete guide to nonlinear regression
71. Ordination Methods for Ecologists
72. Annotated Bibliography of Canonical Correspondence Analysis and related
constrained ordination methods 1986-1993
73. Multivariate Statistics: an Introduction
74. A glossary of ordination-related terms
75. Glossary of Statistical Terms and Medical Citations for Statistical Issues
76. Glossary of over 30 statistical terms
77. EVSC 503 Applied Statistics for the Environmental Sciences
78. http://s9000.furman.edu/mellonj/spss1.htm
79. http://www.indiana.edu/~statmath/stat/spss/win/index.html
80. http://www.utexas.edu/cc/stat/tutorials/spss/SPSS1/Outline1.html
81. http://web.uccs.edu/lbecker/SPSS/content.htm
82. http://core.ecu.edu/psyc/wuenschk/SPSS/SPSS-Data.htm
83. http://www.tulane.edu/~ panda2/Analysis2/ahome.html
84. http://www.shef.ac.uk/~ scharr/spss/index2.htm
85. http://calcnet.mth.cmich.edu/org/spss/index.html
86. http://calcnet.mth.cmich.edu/org/spss/toc.htm
87. http://www.public.asu.edu/~pythagor/spssworkbook.htm
88. http://lib.stat.cmu.edu/
89. http://www.stat.ufl.edu/vlib/statistics.html
90. http://www.statserv.com/softwares.html
91. http://www.maths.uq.edu.au/~gks/webguide/
92. http://www.statistics.com/
93. http://www.helsinki.fi/~jpuranen/links.html#stc
94. http://www.maths.uq.edu.au/~gks/webguide/free.html
95. http://nhsbig.inhs.uiuc.edu/
96. http://www.okstate.edu/artsci/botany/ordinate/software.htm
97. http://life.bio.sunysb.edu/ee/biometry/
29
98. http://life.bio.sunysb.edu/morph/software.html
99. http://pbil.univ-lyon1.fr/ADE-4/ADE-4.html
100. http://ourworld.compuserve.com/homepages/Rainer_Wuerlaender/statsoft.h
tm
101. http://www.stat.auckland.ac.nz/~mja/Programs.htm
102. http://it.stlawu.edu/~rlock/maa99/
103. http://it.stlawu.edu/~rlock/tise98/java.html
104. http://www.stat.vt.edu/~sundar/java/applets/
105. http://www.kuleuven.ac.be/ucs/java/index.htm
106. http://noppa5.pc.helsinki.fi/koe/
107. http://www2.kenyon.edu/people/hartlaub/MellonProject/mellon.html
Demostraciones Java para el aprendizaje de la estadística
108. Electronic Textbook (UCLA), programa on-line de representación y cálculo
de funciones de densidad y de distribución (normal, F, ji-cuadrado, números
aleatorios...). Equivalente a un libro de tablas
BIBLIOGRAFÍA
22. Montgomery Douglas y Runger George.( 1996), Probabilidad y Estadística
aplicada a la Ingeniería., Mcgraw-Hill, Mexico
23. Montgomery Douglas y Hines William.( 1995), Probabilidad y Estadística aplicada
a la Ingeniería. y Administración, segunda edición ,CECSA, México
24. Mendenhall William, Wackerly Dennis y Scheaffer Richard (1994), Estadística
Matemáticas con Aplicaciones , segunda edición, Grupo Editorial Iberoamerica. M,
México
25. Govinden Portus Lincoyan.( 1998), Introducción a la Estadística,. Mcgraw-Hill,
Santafé de Bogotá
26. Webster Allen L.( 1998), Estadística aplicada a la Empresa y a la Economía,
segunda edición, Mcgraw-Hill, Madrid
27. Kohler Heinz.( 1996), Estadística para Negocios y Economía, primera edición
,CECSA, México
28. Martinez Bencardino Ciro ( 1995), Estadística , sexta edición ,ECOE EDICIONES
Santafé de Bogotá.
29. Alvarez C Ricardo ( 1994), Estadística Fundamental Aplicada, primera edición
,PUBLIADCO, Cali
30. Estadística," Enciclopedia Microsoft® Encarta® 2000. © 1993-1999 Microsoft
Corporation.
31. Stockburger David W (1996) Introductory Statistics: Concepts, models an
applications, , http://www.psychstat.smsu.edu/sbk00.htm
32. Mendoza Duran Carlos. (1995 )Probabilidad y Estadística,
http://w3.mor.itesm.mx/~cmendoza/ma835/ma83500.html
30
33. Valdés Fernando ,Comprensión y uso de la estadística,
http://www.cortland.edu/flteach/stats/glos-sp.html
34. Hurtado Minotta Enrique A, Reflexiones para el Currículo,
http://www.geocities.com/soho/atrium/7521/tesis.html
35. Academic Freedom , www.hrw.org/wr2k/issues-01.htm
36. Gonzalez Felipe, Africa : El silencio de los tambores,
www.arrakis.es/~trazeg/gonzalez.html.
37. El año 2000, WWW.arrakis.es/~ trazeg/anno2000.html
38. Mendenhall, W.; D.D. Wackerly y R.L. Scheaffer. Estadística Matemática con
Aplicaciones. Grupo Editorial Iberoamérica. México.
39. Freund, John E. y Gary A. Simon. Estadística elemental. Prentice-Hall
Hispanoamericana, SA. México, 1994. (8ª edición.)
40. Spiegel, M.R. Estadística. McGraw-Hill. México. (Serie Schaum.)
41. http://www.unl.edu.ar/fave/sei/encuestas/index.html.
42. Wonnacott, Thomas H. y Ronald J. Wonnacott (1998) Introducción a la estadística.
Limusa/IPN. México.
.
31
MODULO III
GRÁFICOS ESTADISTICOS
La mejor forma de visualizar de un solo golpe la información de un conjunto de observaciones o
datos, que conforman una población , ya sea que estén organizados en tablas y cuadros , es
mediante las representaciones gráficos.
Estas representaciones tienen la gran ventaja, de que no se necesita mucha formación para
entender e interpretar la información que en ellos se consignan , por lo tanto llega con la misma
facilidad al pueblo común y corriente , lo mismo que a los profesionales de cualquier rama del
saber.
La entrega de la información en gráficos , diagramas o dibujos es un verdadero arte funcional, que
no solamente sirve para presentar datos, eventos u observaciones sino también para expresar
ideas que se quieren resaltar o destacar.
Al preparar un grafico , el estadístico se manifiesta como un artista , que aporta su imaginación y
su temperamento para comunicar un mensaje que su auditorio debe asimilar.
Entre los gráficos mas importantes tenemos, los gráficos de líneas, gráficos de barras, gráficos
circulares, gráficos, gráficos de área, histogramas, ojivas y pictogramas.
Actualmente hay infinidades de paquetes estadísticos que en abrir y cerrar de ojos ejecutan
rutinas y subrutinas que elaborar con gran rapidez cualquier representación grafica.
3.1 GRAFICOS
Un grafico o diagrama es un dibujo complementario a una tabla o cuadro que permite observar las
tendencias de un fenómeno en estudio y facilita el análisis estadístico de las variables
relacionadas.
Todo grafico , al igual que todo cuadro, debe estar compuesta por las siguientes partes como
mínimo:
Titulo o nombre: Este debe ser claro y conciso , de tal forma que responda a las
preguntas , sobre lo que se relaciona , cuando, como y donde se hicieron las
observaciones.
Cuerpo : El cuerpo es el grafico en si , cuya elección debe considerar los diferentes tipos
de variables a relacionar, el publico a quien va dirigido y el diseño artístico del grafico.
Nota de pie de grafico: Aquí se presentan aclaraciones respecto al grafico , las escalas
de los ejes o se otorgan créditos a las fuentes respectivas..
3.1.1 GRAFICOS DE LINEAS:
Usado principalmente para mostrar el comportamiento de variables cuantitativas a través de
tiempo. Esta conformado por la unión de segmentos rectilíneos, que resaltan las variaciones de
las variables. Generalmente la variable independiente siempre va en el eje de la abscisa y la
variable dependiente en el eje de la ordenada.
EJEMPLO 1
32
Utilizando un grafico de líneas . graficar la información del cuadro 3.1
CUADRO 3.1
TASA DE INFLACIÓN EN COLOMBIA
PERIODO 1990 - 2000
Año 1990 1991 1992 1993 1994 1995 1996 1997 1998 1999
2000
% anual 32.36
26.82 25.13 22.60 22.59 19.46 21.63 17.68 16.70
9.23 8.75
Fuente : Dane
DESARROLLO
GRAFICO 3.1
TASA DE INFLACIÓN ANUAL DE COLOMBIA
PERIODO 1990 - 2000
TASA DE INFLACION DE COLOMBIA
0
5
10
15
20
25
30
35
1990
1991
1992
1993
1994
1995
1996
1997
1998
1999
2000
AÑO
PORCENTAJE ANUAL
% anual
Como se puede observar del grafico 3.1, la tasa de inflación colombiana desde la ultima
década del siglo XX, viene mostrando una disminución continua , partiendo de un 32.36% en
1990 hasta un 8.75% en el año 2000., consecuencia de la política económica del país
EJEMPLO 2
Utilizando la información del cuadro 3.2 mediante graficas de líneas muestre :
1. La tendencia del promedio de la tasa representativa para el periodo 1993 2001
2. Compare la tendencia de la tasa representativa para el mes de enero y el promedio anual.
3. La tendencia para los meses de enero, junio, diciembre y el promedio , use linéas
compuestas o apiladas
33
CUADRO 3.2 COLOMBIA, TASA REPRESENTATIVA DEL MERCADO *
PERIODO 1993 - 2001
Pesos por dólar
Mes 1993 1994 1995 1996 1997 1998 1999 2000 2001
Enero 745,52
816,15
846,63 1.011,19
1.027,06 1.323,16
1.570,01 1.922,46
2.240,80
Febrero 749,08
817,67
850,90 1.029,64
1.074,24 1.346,12
1.567,07 1.950,64
2.257,45
Marzo 764,38
819,76
865,83 1.044,98
1.062,16 1.357,10
1.550,15 1.956,26
2.310,57
Abril 771,79
829,87
873,39 1.050,93
1.060,55 1.360,65
1.574,67 1.986,77
2.346,73
Mayo 779,71
841,40
876,95 1.066,24
1.075,18 1.386,28
1.641,33 2.055,88
2.324,98
Junio 784,24
830,94
874,86 1.071,96
1.082,37 1.386,61
1.693,99 2.119,54
2.298,85
Julio 795,08
819,06
893,22 1.064,10
1.102,40 1.371,54
1.818,63 2.160,34
2.298,27
Agosto 804,61
814,82
935,10 1.044,84
1.132,70 1.390,46
1.876,93 2.187,63
2.301,23
Septiembre 809,66
830,06
964,17 1.040,84
1.222,49 1.520,52
1.975,64 2.214,02
2.332,19
Octubre 814,45
839,32
984,96 1.015,78
1.262,89 1.587,38
1.978,71 2.174,77
2.310,02
Noviembre 814,08
830,03
1.000,58 998,18 1.294,56 1.562,71
1.944,64 2.136,74
2.308,59
Diciembre 803,53
829,19
988,18 1.000,55
1.296,87 1.523,64
1.889,20 2.185,84
2.291,18
Promedio 786,34
826,52
912,90 1.036,60
1.141,12 1.426,35
1.756,75 2.087,57
2.301,74
Se refiere a la tasa promedio, calculada considerando únicamente los días hábiles
DESARROLLO
1. En grafico 3.2 observamos el crecimiento gradual de la tasa representativa a través del
periodo en consideración, pasando 786.34 pesos por dólar en 1993 a 2301.34 en el 2001
lo que representa un incremento porcentual de192.72 % respecto a 1993.
GRAFICO 3.2
COLOMBIA, TASA REPRESENTATIVA DEL MERCADO *
PERIODO 1993 - 2001
34
COLOMBIA
TASA REPRESENTATIVA DEL MERCADO
1993 - 2001
0,00
400,00
800,00
1.200,00
1.600,00
2.000,00
2.400,00
1993 1994 1995 1996 1997 1998 1999 2000 2001
AÑOS
PESOS POR DOLAR
Promedio
2 La grafica 3.3 muestra el comportamiento de la tasa representativa durante el periodo en
consideración para el promedio anual y el mes de enero de cada año. Nótese que el
crecimiento para los meses de enero es de 200.57%, un 7.85% ligeramente superior al
incremento del promedio anual .
GRAFICO 3.3
COLOMBIA, TASA REPRESENTATIVA DEL MERCADO *
PERIODO 1993 - 2001
TASA DE CAMBIO
0
500
1000
1500
2000
2500
1993 1994 1995 1996 1997 1998 1999 2000 2001
AÑOS
PESOS POR DOLAR
Enero
Promedio
2. En el grafico 3.4 se muestra la tendencia de los meses a través del periodo en
consideración; obsérvese que aquí se presenta la tendencia del aporte de cada valor a lo
largo del tiempo..
GRAFICO 3.4
35
COLOMBIA, TASA REPRESENTATIVA DEL MERCADO *
PERIODO 1993 - 2001
TASA REPRESENTATIVA
2.240,80
2.298,85
2.291,18
2.221,74
0
1000
2000
3000
4000
5000
6000
7000
8000
9000
10000
1993 1994 1995 1996 1997 1998 1999 2000 2001
AÑOS
PESOS POR DOLAR
Promedio
Diciembre
Junio
Enero
3.1. 2 GRÁFICOS DE BARRAS
Esta constituido por barras rectangulares de igual anchura, con separaciones iguales entre si.
La dimensión mayor de los rectángulos debe ser proporcional a la variable dependiente y la
dimensión menor se escoge con el criterio de que los rectángulos no queden juntos, pegados o
traslapados. Se utilizan generalmente para mostrar, comparar y resaltar las diferencias entre
eventos sucesivos en un conjunto de datos y/o frecuencias de variables cualitativas o
comportamiento en el tiempo , cuando el numero de observaciones o datos es reducido.
Pueden ser de barras horizontales, barras verticales, barras compuestas horizontales o
verticales y barras apiladas. Todas estas barras pueden ser en valores absolutos o en valores
relativos o porcentuales.
Cabe anotar que al comparar varias poblaciones entre si , cuando los tamaños de las
poblaciones son diferentes, es conveniente utilizar las frecuencias relativas, ya que en otro
caso podrían resultar engañosas.
EJEMPLO 3
A partir de la información consignada en el cuadro 3.3 elaborar los siguientes gráficos:
1. Un grafico de barras compuestas
2. Un grafico de barras apiladas en %
3. Un grafico de barras apiladas en valores absolutos
4. Un grafico de barras simples para la facultad de medicina
CUADRO 3.3
ESTUDIANTES MATRICULADOS
UNIVERSIDAD ABC
PERIODO 1996 - 2000
Año 1995
1996
1997
1998
1999
2000
TOTALES
MEDICINA 400 500 600 800 950 1200
4450
ODONTOLOGÍA 300 350 500 600 750 900 3400
INGENIERIA MECANICA 200 280 400 520 700 950 3050
INGENIERIA METALURGICA
100 200 380 450 600 700 2430
INGENIERIAQUIMICA 300 500 750 900 1100
1350
4900
INGENIERIA INDUSTRIAL 450 650 850 1000
1150
1300
5400
DERECHO 500 560 650 740 800 1000
4250
TOTALES 2250
3040
4130
5010
6050
7400
27880
DESARROLLO
36
Todos los gráficos de este ejemplo se elaboraron utilizando el software de Excel.
1. En el grafico 3.5 se muestran y se comparan el numero de estudiantes matriculados en
cada facultad por año.
GRAFICO 3.5
ESTUDIANTES MATRICULADOS
UNIVERSIDAD ABC
PERIODO 1996 - 2000
GRAFICO DE BARRAS COMPUESTAS
ESTUDIANTES MATRICULADOS
PERIODO 1995 - 2000
1200
900 950
700
1350 1300
1000
0
200
400
600
800
1000
1200
1400
MEDICINA
INGENIERIA MECANICA
INGENIERIA METALURGICA
INGENIERIAQUIMICA
INGENIERIA INDUSTRIAL
DERECHO
FACULTAD
NUMERO DE ESTUDIANTES
1995
1996
1997
1998
1999
2000
2. En el grafico 3.6 se muestran en barras apiladas los porcentajes correspondiente al numero
de estudiantes matriculados en cada facultad por año. Nótese que el porcentaje en cada
barra o rectángulo apilado es siempre el 100%.
ESTUDIANTES MATRICULADOS
GRAFICO 3.6
UNIVERSIDAD ABC
PERIODO 1996 - 2000
37
GRAFICO DE BARRAS APILADAS EN PORCENTAJE
ESTUDIANTES MATRICULADOS
UNIVERSIDAD ABC
0%
10%
20%
30%
40%
50%
60%
70%
80%
90%
100%
1995 1996 1997 1998 1999 2000
AÑO
% DE ESTUDIANTESPOR
FACULTAD
DERECHO
INGENIERIA
INDUSTRIAL
INGENIERIAQU
IMICA
INGENIERIA
METALURGICA
INGENIERIA
MECANICA
ODONTOLOGÍ
A
MEDICINA
3. En el grafico 3.7 se muestra en barras apiladas en valores absolutos el numero de
estudiantes por facultad para el periodo en consideración.
GRAFICO 3.7
ESTUDIANTES MATRICULADOS
UNIVERSIDAD ABC
PERIODO 1996 - 2000
38
GRAFICO DE BARRAS APILADAS EN VALORES ABSOLUTOS
ESTUDIANTES MATRICULADOS
UNIVERSIDAD ABC
1200
900
950
700
1350
1300
1000
0
1000
2000
3000
4000
5000
6000
MEDICINA ODONTOLOGÍA INGENIERIA MECANICA INGENIERIA METALURGICA INGENIERIAQUIMICA INGENIERIA INDUSTRIAL DERECHO
FACULTAD
NUMERO DE ESTUDIANTES
2000
1999
1998
1997
1996
1995
5. En el grafico 3.8 se muestran en barras circulares simples el numero de estudiantes
matriculados en la facultad de medicina por año.
GRAFICO 3.8
ESTUDIANTES MATRICULADOS
FACULTAD DE MEDICINA
PERIODO 1996 - 2000
39
3.1. 3 GRAFICOS CIRCULARES
También llamados de sectores , tortas o pasteles, por su forma de circunferencia dividida en
sectores por medio de radios que dan la impresión de un torta partida en porciones. Estos
gráficos pueden ser cerrados o explosionados o abiertos.
Se usan para representar variables cualitativas en valores absolutos o en porcentajes. Para su
construcción se sigue el siguiente procedimiento.
Exprese cada categoría o clase en porcentaje respecto al total de la información
Convierta cada porcentaje a grados multiplicándolo por 3.6 ya que el 1% equivale a 3.6
grados.
Escoja un diámetro de tal forma que facilite la visualización de la información.
Represente en el circulo cada una de las categoría de acuerdo a su magnitud en grados.
Identifique cada sector con el nombre de la categoría o clase y/o el porcentaje
Identifique artísticamente cada sector y bautice el grafico.
EJEMPLO 4
Utilizando la información del cuadro 3.3 construir :
1. Un grafico circular abierto que muestre la distribución porcentual de los estudiantes por
facultad para el periodo 1995 - 2000
2. Un grafico circular tridimensional que muestre lo pedido en 1
3. Un grafico circular abierto que muestre la distribución de los estudiantes por el numero de
ellos matriculados en cada facultad
4. Un grafico circular cerrado que muestre la distribución porcentual de los estudiantes por
facultad para el periodo 1995 - 2000
400 500 600
800 950
1200
0
200
400
600
800
1000
1200
NUMERO DE
ESTUDIANTES
1995 1996 1997 1998 1999 2000
AÑO
ESTUDIANTES MATRICULADOS EN MEDICINA
PERIODO 1995 -- 2000
1995
1996
1997
1998
1999
2000
40
DESARROLLO
Todos los gráficos de este ejemplo fueron elaborados con Excel
1. En este grafico podemos observar que los estudiantes matriculados en la facultad de
ingeniería industrial representa el 19% del total de estudiantes matriculados en el periodo
analizado.
GRAFICO 3.9
GRAFICO CIRCULAR
DISTRIBUCION TOTAL DE ESTUDIANTES POR FACULTADES
PERIODO 1995 --- 2000
16%
12%
11%
9%
18%
19%
15%
MEDICINA
ODONTOLOGÍA
INGENIERIA MECANICA
INGENIERIA METALURGICA
INGENIERIAQUIMICA
INGENIERIA INDUSTRIAL
DERECHO
2. Este grafico 3.10 tridimensional muestra la misma información que el anterior , lo que lo
hace interesante es que es un cuadro muy agradable a la vista . Nótese que la facultad con
menor participación es la de ingeniería metalúrgica con solo el 9%.
GRAFICO 3.10
41
GRAFICO CIRCULAR
DISTRIBUCION TOTAL DE ESTUDIANTES POR FACULTADES
PERIODO 1995 --- 2000
16%
12%
11%
9%18%
19%
15%
MEDICINA
ODONTOLOGÍA
INGENIERIA MECANICA
INGENIERIA METALURGICA
INGENIERIAQUIMICA
INGENIERIA INDUSTRIAL
DERECHO
3. En el grafico 3.11 se muestra el numero de estudiantes por facultad para el periodo 1995
2000
GRAFICO 3.11
42
GRAFICO CIRCULAR
DISTRIBUCION TOTAL DE ESTUDIANTES POR
FACULTADES PERIODO 1995 - 2000
4450
3400
3050
2430
4900
5400
4250
4. En grafico 3.12 se muestra el porcentaje de estudiante matriculados que conforman cada
facultad.
GRAFICO 3.12
GRAFICO CIRCULAR
FACULTADES PERIODO 1995 - 2000
MEDICINA
ODONTOLOGÍA
12%
METALURGICA
9%
A
18%
INDUSTRIAL
19%
15%
INGENIERIA
11%
43
3.1.4 HISTOGRAMAS FRECUENCIAS
Los histogramas se construyen dibujando barras contiguas que tienen como base la anchura o
tamaño de los intervalos y como altura las frecuencias respectivas de cada intervalo de clase.
Los histogramas pueden ser en valores absolutos , valores relativos.
EJEMPLO 5
Con la información del cuadro 3.4 , construir usando Excel
1. Un histograma de 8 intervalos en valores absolutos
2. Un histograma de 8 intervalos en valores relativos
3. Un histograma ordenado (Pareto ) en valores absolutos y relativos
4. Repetir 1 utilizando SPSS 11
CUADRO 3.4
PRODUCCION DE ALAMBRON DE 9.5 mm EN TONS
PERIODO 1999 - 2001
1998 1999 2000 2001 TOTALES
ENERO 1000 800 1400 1700 4900
FEBRERO 1500 1100 1800 2500 6900
MARZO 2000 1400 2200 3300 8900
ABRIL 2500 1700 2600 4100 10900
MAYO 3000 2000 3000 4900 12900
JUNIO 3500 2300 3400 5700 14900
JULIO 4000 2600 3800 6500 16900
AGOSTO 4500 2900 4200 7300 18900
SEPTIEMBRE5000 3200 4600 8100 20900
OCTUBRE 5500 3500 5000 8900 22900
NOVIEMBRE
6000 3800 5400 9700 24900
DICIEMBRE 6500 4100 5800 10500 26900
TOTALES 46998 31399 45200 75201 190800
DESARROLLO
Para construir seguimos el siguiente procedimiento:
1. Digitamos o copiamos la información en la ventana de Excel, tal como se muestra en
figura.
44
2. En la ventana de excel clickeamos en herramientas, análisis de datos y aparece la
siguiente ventana.
3. Sombreamos histograma y damos aceptar y aparece la siguiente ventana
45
4. En la ventana anterior se introduce los rangos de la información ( aparecen en rojo en la
ventana principal) y se chulea la casillas para PARETO si queremos el histograma
ordenado de mayor a menor; si no lo queremos ordenado dejamos en blanco esta casilla.
Chuleamos porcentaje acumulado y crear grafico y obtenemos un histograma el cual
editamos siguiendo la instrucciones del programa.
CUADRO 3.5
TABLA DE FRECUENCIA*
PRODUCCION DE ALAMBRON DE 9.5 mm EN TONS
PERIODO 1999 2001
TONELADAS Frecuencia % acumulado TONELADAS Frecuencia % acumulado
800 1 2,08% 3600 13 27,08%
2200 11 25,00% 2200 11 50,00%
3600 13 52,08% 5000 11 72,92%
5000 11 75,00% 6400 5 83,33%
6400 5 85,42% 7800 3 89,58%
7800 3 91,67% 9200 2 93,75%
9200 2 95,83% 10600 2 97,92%
10600 2 100,00% 800 1 100,00%
y mayor... 0 100,00% y mayor... 0 100,00%
CUADRO 3.6
TABLA DE FRECUENCIA*
PRODUCCION DE ALAMBRON DE 9.5 mm EN TONS
PERIODO 1999 2001
PRODUCCION FRECUENCIA
800  x < 2200 1
46
2200  x < 3600 11
3600  x < 5000 13
5000  x < 6400 11
6400  x < 7800 5
7800  x < 9200 3
9200  x < 10600
2
10600  x < 12000 2
TOTAL 48
Se construyó esta tabla de frecuencia a partir de la edición del histograma obtenido.
CUADRO 3.6
TABLA DE FRECUENCIA
PRODUCCION DE ALAMBRON DE 9.5 mm EN TONS
PERIODO 1999 2001
Clase Frecuencia
% acumulado
800 - 2200 1 2,08%
2200 - 3600 11 25,00%
3600 - 5000 13 52,08%
5000 - 6400 11 75,00%
6400 - 7800 5 85,42%
7800 - 9200 3 91,67%
9200 - 10600 2 95,83%
10600 - 12000
2 100,00%
GRAFICO 3.13
PRODUCCION DE ALAMBRON DE 9.5 mm EN TONS
PERIODO 1999 2001
HISTOGRAMA
0
2
4
6
8
10
12
14
800 2200 3600 5000 6400 7800 9200 y
mayor...PRODUCCION
Frecuencia
,%
20,%
40,%
60,%
80,%
100,%
120,%
Frecuencia
% acumulado
47
GRAFICO 3.14
PRODUCCION DE ALAMBRON DE 9.5 mm EN TONS
PERIODO 1999 2001
En los gráficos 3.13 y 3.14 se muestran histogramas en valores absolutos y en valores
relativos ya editados de la producción de alambrón. En el grafico 3.15 se muestra un
histograma ordenado en valores absolutos y en valores relativos.
GRAFICO 3.14
PRODUCCION DE ALAMBRON DE 9.5 mm EN TONS
PERIODO 1999 2001
HISTOGRAMA ORDENADO
( PARETO )
0
2
4
6
8
10
12
14
3600 2200 5000 6400 7800 9200 y
mayor...
800
Clase
Frecuencia
,%
20,%
40,%
60,%
80,%
100,%
120,%
Frecuencia
% acumulado
48
5. En el grafico 3.16 se muestra el histograma pedido en valores absolutos y en grafico 3.17
el mismo grafico con los ejes intercambiados. Lo importante a resaltar es como la
frecuencia en los intervalos varía ligeramente debido a que SPSS trabajó con intervalo
cerrado por la izquierda y abierto por la derecha . mientras que Excel trabajó con intervalos
abierto por la izquierda y cerrado por la derecha. Para cualquier análisis cualquiera de las
forma es correcta.
GRAFICO 3.16
PRODUCCION DE ALAMBRON DE 9.5 mm EN TONS
PERIODO 1999 2001
PRODUCCION
10600,0 - 12000,0
9200,0 - 10600,0
7800,0 - 9200,0
6400,0 - 7800,0
5000,0 - 6400,0
3600,0 - 5000,0
2200,0 - 3600,0
800,0 - 2200,0
HISTOGRAMA
Frecuencia
16
14
12
10
8
6
4
2
022
3
7
9
14
11
GRAFICO 3.17
PRODUCCION DE ALAMBRON DE 9.5 mm EN TONS
PERIODO 1999 2001
49
PRODUCCION
800,0 - 2200,0
2200,0 - 3600,0
3600,0 - 5000,0
5000,0 - 6400,0
6400,0 - 7800,0
7800,0 - 9200,0
9200,0 - 10600,0
10600,0 - 12000,0
HISTOGRAMA
Frecuencia
1614121086420
2
2
3
7
9
14
11
3.1.5 HISTOGRAMAS DE FRECUENCIAS ACUMULADAS
Se obtiene a partir de una distribución de frecuencias, tomando en el eje horizontal las
fronteras de clase de cada intervalo de la variable y en el eje vertical las frecuencias
acumuladas correspondientes a cada intervalo de clase. Puede construirse en valores
absolutos o en valores relativos.
En el grafico 3.18 se muestra un histograma de frecuencias acumulada en valores relativos y
3.19 en valores absolutos.
GRAFICO 3.18
PRODUCCION DE ALAMBRON DE 9.5 mm EN TONS
PERIODO 1999 2001
HISTOGRAMA DE FRECUENCIAS ACUMULADA
2,08%
25,00%
52,08%
75,00%
85,42% 91,67% 95,83% 100,00%
,%
10,%
20,%
30,%
40,%
50,%
60,%
70,%
80,%
90,%
100,%
800 2200 3600 5000 6400 7800 9200 10600
PRODUCCION
FRECUENCIA ACUMULADA
GRAFICO 3.19
50
PRODUCCION DE ALAMBRON DE 9.5 mm EN TONS
PERIODO 1999 2001
HISTOGRAMA DE FRECUENCIAS ACUMULADAS
1
12
25
36
41 44 46 48
0
10
20
30
40
50
60
800 2200 3600 5000 6400 7800 9200 10600
PRODUCCION
FRECUENCIAS
ACUMULADAS
3.1.6 POLIGONOS DE FRECUENCIA
Se construyen a partir de una distribución de frecuencia , uniendo los puntos medios
superiores de los rectángulos de un histograma de frecuencias absolutas o relativas. Estos
puntos medios corresponden a las marcas de clase de los intervalos de clase, Los polígonos
pueden ser en valores absolutos o en valores relativos.
En la grafica 3.20 se muestra el polígono de frecuencia en valores absolutos de los datos del
cuadro 3.4
GRAFICO 3.20
PRODUCCION DE ALAMBRON DE 9.5 mm EN TONS
PERIODO 1999 2001
POLIGONO DE FRECUENCIAS
01
11
13
11
5
32 2
00
2
4
6
8
10
12
14
0
1500
2900
4300
5700
7100
8500
9900
11300
12700
MARCA DE CLASE (PRODUCCION )
FRECUENCIA
F
3.1.7 OJIVAS
Llamados también polígonos de frecuencias acumuladas. Se construyen a partir una
distribución de frecuencia acumulada uniendo cada valor de frecuencia acumulada en eje
51
vertical con su respectivo valor de frontera de clase en eje horizontal. Pueden ser mayor o
menor que en valores absolutos o en valores relativos.
En los gráficos 3.21 y 3.22 se muestran las ojivas en valores absolutos y valores relativos de
los datos del cuadro 3.4
GRAFICO 3.21
PRODUCCION DE ALAMBRON DE 9.5 mm EN TONS
PERIODO 1999 2001
OJIVAS EN VALORES ABSOLUTOS
0
12
25
36 41 44 46 48
01
12
25
36 41 44 46 4848 47
36
23
12 7420
1
0
10
20
30
40
50
60
800 2200 3600 5000 6400 7800 9200 10600 12000
FRONTERA DE CLASE (PRODUCCION)
FRECUENCIA
ACUMULADA
FC
FAC<
FAC>
GRAFICO 3.22
PRODUCCION DE ALAMBRON DE 9.5 mm EN TONS
PERIODO 1999 2001
OJIVAS EN VALORES RELATIVOS
0,00
20,00
40,00
60,00
80,00
100,00
800
2200
3600
5000
6400
7800
9200
10600
12000
FRONTERA DE CLASE (PRODUCCION )
FRECUENCIA
ACUMULADA %
FC
FAC<%
FAC>%
3.1.8 PICTOGRAMAS
Expresan con dibujos alusivos al tema en consideración las frecuencias de las modalidades de
la variable. Estos gráficos se hacen representando a diferentes escalas un mismo dibujo. El
escalamiento de los dibujos debe ser tal que el área de cada uno de ellos sea proporcional a la
frecuencia de la modalidad que representa. Los pictogramas se utilizan para mostrar
comparaciones impactantes, llamando de esta manera la atención del publico ,independiente
de su nivel cultural.
Este tipo de grafico se utiliza mucho en los medio de comunicación donde los expertos ponen
en juego su creatividad e ingenio con el fin de llamar la atención del auditorio con una vistosa y
llamativa presentación de los datos.
52
EJEMPLO 6
Utilizando un pictograma representar la población de conejos que se muestra en la tabla
adjunta CUADRO 3.6
POBLACIÓN DE CONEJOS DE CRIADEROS
AÑO 1999
GRANJA CANTIDAD (EN MILES) PORCENTAJE
%
LA CONEJA 600 10.00
LA CONEJA BLANCA 800 13.33
EL CONEJO LOCO 1200 20.00
EL CONEJO ENAMORADO 1400 23.33
LA CONEJERA 2000 33.34
TOTAL 6000 100.00
DESARROLLO
GRAFICO 3.22A
EJEMPLO 7
Teniendo en cuenta la importancia del software estadístico SPSS, en este ejemplo
aprenderemos a construir gráficos de barras, de líneas, circulares e histogramas a partir del
archivo Datos de empleados que viene con el software.
53
DESARROLLO
Empezaremos construyendo un grafico de barras para lo cual seguiremos el siguiente
proceso:
1. Empezamos SPSS, pulsando inicio ( start) , luego programa y finalmente SPSS para
Windows , Aparece la siguiente pantalla de dialogo que dice Abrir archivo
2. Damos un clic en el archivo Datos de empleados y abrimos el archivo. Aparece la
ventana del Editor de datos con 474 casos y 10 variables
54
3. Para obtener un grafico cualquiera, por ejemplo, de barras que muestre el numero de
empleados en cada categoría ; en el menú de la ventana del Editor de datos
seleccionamos Graficos.( Graphs) Aparece tipos de gráficos , seleccionamos grafico de
barras, y escogemos el tipo de graficas que nos interese, para este caso Simple. Pulsamos
definir
55
4. Después de pulsar definir , aparece la siguiente ventana en donde se selecciona categoría
laboral en la parte izquierda y se mueve hacia el eje de categoría clickeandola en la flecha
derecha.
56
5. Finalmente damos Aceptar y obtenemos en la ventana de resultados el grafico de barras
solicitado. GRAFICO 3.23
6. Este grafico obtenido lo podemos editar , haciendo doble clic sobre el grafico , que
inmediatamente abre una ventana editora., en donde podemos modificar el grafico,
cambiándole el nombre, el color de las barras , etc. Como se puede ver en grafico
editado. En este grafico observamos que la clasificación laboral esta compuesta por
363 empleados administrativos,84 directivos y 27 de seguridad.
57
GRAFICO 3.24
B. Para producir un grafico de barras compuesto que muestre la categoría laboral de los
empleados según el sexo, procederemos así :
1. Desde la ventana del Editor de datos, seleccionamos Gráficos/Barras y chuleamos barras
compuestas, pulsamos definir y obtenemos la siguiente ventana.
2. En esta ventana señalamos categoría laboral y la movemos hacia el eje de categorías
clickeando en la flecha correspondiente , lo mismo hacemos con la variable sexo, la cual la
movemos a la casilla definir por grupos. Damos aceptar y obtenemos el grafico pedido.
58
GRAFICO 3.25
3. Damos doble clic en grafico y entramos a la ventana de edición, en donde le damos el
toque final al grafico. En este grafico podemos ver claramente que el personal
administrativo esta compuesto 157 mujeres y 206 hombres, el personal directivo por 74
hombres y 10 mujeres y el personal de seguridad solamente por 27 hombres.
GRAFICO 3.26
59
59
C. Para producir un grafico circular que muestre el porcentaje de empleados
perteneciente a cada categoría laboral , seguimos el siguiente proceso:
1. Desde la ventana del Editor de datos escogemos Gráficos /sector y obtenemos el
siguiente cuadro de dialogo y seleccionamos resúmenes para grupos de casos.
2. Pulsamos definir y obtenemos la ventana siguiente en donde se sombrea la
categoría laboral y se mueve hacia la casilla definir sector. Se selecciona % de
casos en los Sectores representan.
60
3. Damos aceptar y obtenemos el grafico pedido en la ventana de resultados.
GRAFICO 3.27
4. Hacemos doble clic sobre el grafico para modificarlo, abriendo la ventana de
edición en donde al seleccionar Gráficos/opciones , clickeamos % , colocamos los
títulos, subtítulos, pie de pagina, cambiamos de color , configuración etc, es decir ,
damos el toque final al grafico. Cerramos el editor de grafico y regresamos a la
ventana de resultados. En el grafico observamos que 76.6% de los empleados son
administrativos, el 17.7% directivos y 5.7% de seguridad.
61
GRAFICO 3.28
D. Finalmente vamos a construir un histograma para la variable salario actual y
seguiremos el siguiente proceso:
1. Desde la ventana del editor de datos seleccionamos estadística /frecuencia y en
ventana adjunta que aparece, sombreamos salario actual y lo pasamos a la
derecha; pulsamos gráficos y en esta nueva ventana clickeamos histograma y
obtendremos en la ventana de resultado el histograma que se muestra abajo.
62
GRAFICO 3.29
2. Hacemos doble clic sobre el histograma y entramos al editor de gráficos
63
3. En el editor de gráficos seleccionamos diseño y en cuadro de dialogo que se abre,
señalamos intervalo que nos conduce al cuadro de dialogo eje de intervalo,
señalamos intervalos personalizados como se puede ver en las figuras adjuntas.
4. En la ventana de eje de intervalo, definimos el numero de intervalos personalizados
que debe tener el histograma ( el histograma original tiene 25 y lo cambiamos a 10 ).
64
Damos continuar y en la ventana del eje de intervalo pulsamos etiquetas y el cuadro
de dialogo podemos seleccionar marca de clase ( punto medio ) o rango (( para
nuestro ejemplos escogemos rango. Y damos continuar y obtenemos el histograma
modificado que se muestra abajo.
GRAFICO 3.30
65
Salario actual
125000,0 - 137500,0
112500,0 - 125000,0
100000,0 - 112500,0
87500,0 - 100000,0
75000,0 - 87500,0
62500,0 - 75000,0
50000,0 - 62500,0
37500,0 - 50000,0
25000,0 - 37500,0
12500,0 - 25000,0
Frecuencia
250
200
150
100
50
021
32
46
213
143
5. Este grafico se puede seguir modificando aprovechando todas las posibilidad que
permite este programa. Cuando se considere que el histograma es el queremos
cerramos el editor de gráficos y volvemos a la pagina de resultados. Se Salva el
resultado y se imprime .
GRAFICO 3.31
66
Salario actual
12500,0 - 25000,0
25000,0 - 37500,0
37500,0 - 50000,0
50000,0 - 62500,0
62500,0 - 75000,0
75000,0 - 87500,0
87500,0 - 100000,0
100000,0 - 112500,0
112500,0 - 125000,0
125000,0 - 137500,0
Frecuencia
250200150100500
46
213
143
Cabe anotar que hay otros puntos de partida para construir histogramas, por ejemplo
partiendo del editor de datos y seleccionado gráficos/histograma o utilizando los
gráficos interactivos .
TALLER MODULO III.
1. A partir de la información de cualquier base de datos, que puede conseguirse en
Internet de acuerdo a su preferencia o especialidad, construya todos los gráficos
estudiados de la siguiente forma:
Manualmente
Utilizando Excel
Utilizando SPSS
Minitab
SAS
BASES DE DATOS:
1. Political Database of the Americas ... the Western Hemisphere. Base de datos con
información política de los 25 países de la hemisferia del oeste.
http://www.georgetown.edu/pdba/
http://www.georgetown.edu/pdba/spanish.html
http://www.georgetown.edu/pdba/Elecdata/Col/colombia.html
2.FAOSTAT es una base de datos estadísticos integrada on-line que actualmente
67
contiene más de 1 millón de series anuales internacionales en las siguientes
materias: http://apps.fao.org/inicio.htm
3. DEPARTAMENTO ADMINISTRATIVO NACIONAL DE ESTADISTICA.
http://www.dane.gov.co/Enlaces/enlaces.html
http://www.dane.gov.co/index.html
http://www.dane.gov.co/Enlaces/Organismos_Estadisticos/America/america.html
http://www.dane.gov.co/Enlaces/Organismos_Estadisticos/Europa/europa.html
http://www.dane.gov.co/Enlaces/Organismos_Estadisticos/Asia/asia.html
http://www.dane.gov.co/Enlaces/Organismos_Estadisticos/Africa/africa.html
4.. PROEXPORT COLOMBIA promueve las exportaciones colombianas. Apoya y asesora
empresarios colombianos ... 091)5242015. Proexport. Quienes Somos Sobre ...
www.proexport.com.co/
http://www.proexport.com.co/VBeContent/home.asp?Perfil=1
5. DEPARTAMENTO NACIONAL DE PLANEACION
http://www.dnp.gov.co/03_PROD/PUBLIC/13P_MS.HTM
http://www.dnp.gov.co/03_PROD/BASES/BASES.HTM
6 BANCO DE LA REPUBLICA
http://www.banrep.gov.co/
http://www.banrep.gov.co/economia/ctanal1sec_ext.htm#tasa
7. ICFES El Instituto Colombiano para el Fomento de la Educación Superior ICFES
http://www.icfes.gov.co/
**SUGERENCI A: Trat e I nicialment e de resolver los ej er cicios manualment e y
chequee los r esult ados de la mayor part e de los ej ercicios ut ilizando cualquier
sof t war e est adíst ico, ( SSPS 11, Excel , et c)
Copyright © ;Ing. Enrique A Hurtado Minotta, all rights reserved
REVISTAS ELECTRONICAS
19. Journal of Statistics Education. Excelente revista (¡gratuita!) editada por la American
Statistical Association sobre educación estadística (a todos los niveles)
20. Homepage de la American Statistical Association. La mayor asociación de estadísticos,
editora de Journal of Agricultural, Biological, and Environmental Statistics, Journal of the
American Statistical Association, Journal of Statistics Education y The American
Statistician entre otras revistas.
21. Environmental and Ecological Statistics
22. Community Ecology
23. Journal of Agricultural, Biological, and Environmental Statistics
24. Bulletin of the Ecological Society of America (gratuita; contiene artículos de ecología
estadística)
68
25. Journal of Statistical Software (gratuita)
26. InterStat (Statistics on the Internet) (gratuita)
27. Probability and Statistics Journals on the Web
ESTADISTICA ON LINE
109. Aula Virtual de Bioestadística, Universidad Complutense
110. Curso de bioestadística de la Universidad de Málaga
111. Apuntes de Bioestadística. Unidad de Bioestadística Clínica del Hospital Ramón y
Cajal
112. Lecciones de Estadística, 5campus.org (análisis multivariante...)
113. Curso de Bioestadística de la Universidad Nacional de Misiones (Argentina)
114. Curso de estadística (para ingenieros) de una universidad mexicana
115. Cursos de estadística de la Universidad de California, Los Angeles
116. Cursos de estadística de la Universidad de Michigan
117. Electronic Statistics Textbook
118. A New View of Statistics
119. HyperStat Statistics Textbook
120. Statistics at Square One
121. Statistics Every Writer Should Know
122. Introductory Statistics: Concepts, Models, and Applications
123. Multivariate Statistics: Concepts, Models, and Applications
124. A complete guide to nonlinear regression
125. Ordination Methods for Ecologists
126. Annotated Bibliography of Canonical Correspondence Analysis and related
constrained ordination methods 1986-1993
127. Multivariate Statistics: an Introduction
128. A glossary of ordination-related terms
129. Glossary of Statistical Terms and Medical Citations for Statistical Issues
130. Glossary of over 30 statistical terms
131. EVSC 503 Applied Statistics for the Environmental Sciences
132. http://s9000.furman.edu/mellonj/spss1.htm
133. http://www.indiana.edu/~statmath/stat/spss/win/index.html
134. http://www.utexas.edu/cc/stat/tutorials/spss/SPSS1/Outline1.html
135. http://web.uccs.edu/lbecker/SPSS/content.htm
69
136. http://core.ecu.edu/psyc/wuenschk/SPSS/SPSS-Data.htm
137. http://www.tulane.edu/~panda2/Analysis2/ahome.html
138. http://www.shef.ac.uk/~scharr/spss/index2.htm
139. http://calcnet.mth.cmich.edu/org/spss/index.html
140. http://calcnet.mth.cmich.edu/org/spss/toc.htm
141. http://www.public.asu.edu/~pythagor/spssworkbook.htm
142. http://lib.stat.cmu.edu/
143. http://www.stat.ufl.edu/vlib/statistics.html
144. http://www.statserv.com/softwares.html
145. http://www.maths.uq.edu.au/~gks/webguide/
146. http://www.statistics.com/
147. http://www.helsinki.fi/~jpuranen/links.html#stc
148. http://www.maths.uq.edu.au/~gks/webguide/free.html
149. http://nhsbig.inhs.uiuc.edu/
150. http://www.okstate.edu/artsci/botany/ordinate/software.htm
151. http://life.bio.sunysb.edu/ee/biometry/
152. http://life.bio.sunysb.edu/morph/software.html
153. http://pbil.univ-lyon1.fr/ADE-4/ADE-4.html
154. http://ourworld.compuserve.com/homepages/Rainer_Wuerlaender/statsoft.htm
155. http://www.stat.auckland.ac.nz/~mja/Programs.htm
156. http://it.stlawu.edu/~rlock/maa99/
157. http://it.stlawu.edu/~rlock/tise98/java.html
158. http://www.stat.vt.edu/~sundar/java/applets/
159. http://www.kuleuven.ac.be/ucs/java/index.htm
160. http://noppa5.pc.helsinki.fi/koe/
161. http://www2.kenyon.edu/people/hartlaub/MellonProject/mellon.html
Demostraciones Java para el aprendizaje de la estadística
162. Electronic Textbook (UCLA), programa on-line de representación y cálculo de
funciones de densidad y de distribución (normal, F, ji-cuadrado, números aleatorios...).
Equivalente a un libro de tablas
BIBLIOGRAFÍA
43. Montgomery Douglas y Runger George.( 1996), Probabilidad y Estadística
aplicada a la Ingeniería., Mcgraw-Hill, Mexico
70
44. Montgomery Douglas y Hines William.( 1995), Probabilidad y Estadística aplicada
a la Ingeniería. y Administración, segunda edición ,CECSA, México
45. Mendenhall William, Wackerly Dennis y Scheaffer Richard (1994), Estadística
Matemáticas con Aplicaciones , segunda edición, Grupo Editorial Iberoamerica. M,
México
46. Govinden Portus Lincoyan.( 1998), Introducción a la Estadística,. Mcgraw-Hill,
Santafé de Bogotá
47. Webster Allen L.( 1998), Estadística aplicada a la Empresa y a la Economía,
segunda edición, Mcgraw-Hill, Madrid
48. Kohler Heinz.( 1996), Estadística para Negocios y Economía, primera edición
,CECSA, México
49. Martinez Bencardino Ciro ( 1995), Estadística , sexta edición ,ECOE EDICIONES
Santafé de Bogotá.
50. Alvarez C Ricardo ( 1994), Estadística Fundamental Aplicada, primera edición
,PUBLIADCO, Cali
51. Estadística," Enciclopedia Microsoft® Encarta® 2000. © 1993-1999 Microsoft
Corporation.
52. Stockburger David W (1996) Introductory Statistics: Concepts, models an
applications, , http://www.psychstat.smsu.edu/sbk00.htm
53. Mendoza Duran Carlos. (1995 )Probabilidad y Estadística,
http://w3.mor.itesm.mx/~cmendoza/ma835/ma83500.html
54. Valdés Fernando ,Comprensión y uso de la estadística,
http://www.cortland.edu/flteach/stats/glos-sp.html
55. Hurtado Minotta Enrique A, Reflexiones para el Currículo,
http://www.geocities.com/soho/atrium/7521/tesis.html
56. Academic Freedom , www.hrw.org/wr2k/issues-01.htm
57. Gonzalez Felipe, Africa : El silencio de los tambores,
www.arrakis.es/~trazeg/gonzalez.html.
58. El año 2000, WWW.arrakis.es/~ trazeg/anno2000.html
59. Mendenhall, W.; D.D. Wackerly y R.L. Scheaffer. Estadística Matemática con
Aplicaciones. Grupo Editorial Iberoamérica. México.
60. Freund, John E. y Gary A. Simon. Estadística elemental. Prentice-Hall
Hispanoamericana, SA. México, 1994. (8ª edición.)
61. Spiegel, M.R. Estadística. McGraw-Hill. México. (Serie Schaum.)
62. http://www.unl.edu.ar/fave/sei/encuestas/index.html.
63. Wonnacott, Thomas H. y Ronald J. Wonnacott (1998) Introducción a la estadística.
Limusa/IPN. México.
.
ehurtado@usc.edu.co
71
MODULO IV
DISTRIBUCIÓN DE FRECUENCIA
4.1 FILAS DE DATOS
Una fila de datos consiste en datos recopilados que no han sido organizados numéricamente; por
ejemplo el ingreso salarial de los docentes universitario de la Usaca por orden alfabético.
4.2 ORDENACIONES
Una ordenación es un conjunto de datos numéricos en orden creciente o decreciente. La diferencia
entre el valor mayor y el valor menor se denomina Rango de ese conjunto de datos. Por ejemplo
Si el ingreso mayor entre los 1000 profesores de la Usaca es de $ 10.000.000 y el menor $
250.000, el rango de los ingresos de los docente en esta universidad será de $ 9.750.000
4.3 TABLA DE FRECUENCIA
Al resumir grandes colecciones de datos, es útil distribuirlas en clases o categorías y determinar
el numero de elementos u observaciones que pertenecen a cada clase , llamada frecuencia de
clase .
La distribución tabular de lo datos por clases junto con las correspondientes frecuencias de clase
se denomina distribución de frecuencia o tabla de frecuencia.|
El cuadro 4.1 muestra la distribución de frecuencias o tabla de frecuencia del peso nominal de una
muestra de 30 paquetes de azúcar con una tolerancia de un gramo.
De esta tabla de frecuencia podemos observar que esta conformado por 5 clases o categorías,
donde la primera categoría esta comprendida entre 1828 y 1902 gramos con una frecuencia de 5
paquetes. La quinta categoría esta conformada desde 2128 hasta 2202 con una frecuencia de
clase de 1. CUADRO 4.1
TABLA DE FRECUENCIA PESO NOMINAL DE 30 PAQUETES DE AZUCAR
CON UN GRAMO DE PRECISION
PESO EN GRAMOS
NUMERO DE PAQUETES
FRECUENCIA
1828 - 1902 5
1903 - 1977 11
1978 - 2052 8
2053 - 2127 5
2128 - 2202 1
Teniendo en cuenta la necesidad de facilitar el análisis de la información obtenida
mediante las encuestas y bajo la premisa de que ODmayoría de los estudios
implican el procesamiento de d cientos de datos u observaciones se hace
necesario procesar esta información a través de las famosas tablas de frecuencia en
donde se facilita su manejo ya que se presenta en forma tabular y permite
visualizar fácilmente toda la información. En este modelo estudiaremos la forma
de construir manualmente las tablas de distribución de frecuencia , los
diagramas de tallo y hoja, los histogramas en valores absolutos y
porcentuales , lo mismo que las ojivas y demás gráficos que manejan
frecuencias. Utilizaremos algunos software estadísticos que agilizan y permiten
procesar eficientemente la información.
72
TOTAL 30
4.3 INTERVALOS DE CLASE Y LIMITES DE CLASE
Un símbolo que define una clase como 1978 2052 en tabla frecuencia se llama intervalo de clase
. Los números extremos 1978 y 2052 se llaman limite inferior y limite superior de clase
respectivamente. Cuando un intervalo de clase carece de un limite inferior o superior se llama
intervalo de clase abierto.
3.4 FRONTERAS DE CLASE O LIMITES REALES ( FC )
Se denotan como FC y es igual a la semisuma del limite superior de una clase con el limite inferior
de la siguiente . Por ejemplo las fronteras de clase del tercer intervalo de clase son 1977.5 y
2052.5 para la inferior y superior respectivamente.
19771978
1977.5
2
20522053
2052.5
2
FCI
FCS
+
==
+
==
4.5 TAMAÑO O ANCHURA DE UN INTERVALO DE CLASE ( C )
Es la diferencia entre la frontera de clase superior e inferior. Si todos los intervalos de clase de una
distribución de frecuencia tienen la misma anchura la denotaremos por C. En tal caso C es igual a
la diferencia entre dos limites superiores o inferiores de clases sucesivas. De la tabla de frecuencia
anterior tenemos:
2052.51977.575
CFCSFCI
===
4.6 MARCA DE CLASE (MC )
Es el punto medio del intervalo de clase y se calcula promediando los limites superior e inferior de
clase. De la tabla de frecuencia tenemos que la marca de clase del tercer intervalo es:
19782052
2015
22
LILS
MC++
===
4.7 FRECUENCIA RELATIVA ( FR )
La frecuencia relativa de un intervalo de clase es igual a su frecuencia absoluta dividida por la
frecuencia total de todos los intervalos de clases. y se expresa generalmente en % .De la tabla de
frecuencia observamos que la frecuencia absoluta del tercer intervalo de clase es 8 , por lo tanto su
frecuencia relativa es del 26.27%
La suma de todas las frecuencias relativas es igual a 1 al 100%.
( ) ( )
8
100%100%26.67%
30
F
FRFT
===
4.8 HISTOGRAMA
Consiste en un conjunto de rectángulos con base en el eje X, centro en las marcas de clase ,
longitudes iguales a los tamaños de los intervalos de clase y áreas proporcionales a la frecuencias
de clase.
73
Si los intervalos de clase tienen todos la misma anchura, las alturas de los rectángulos son
proporcionales a las frecuencias de clase, de ahí que es usual tomar las alturas iguales a las
frecuencias de clase. En caso contrario deben ajustarse las alturas.
Este histograma así construido se denomina histograma en valores absolutos. Cuando se cambian
los valores de la frecuencia absoluta por los respectivos valores de frecuencia relativa , el
histograma se denomina histograma de frecuencias relativas o en porcentajes.
4.9 POLIGONO DE FRECUENCIA
Un polígono de frecuencia es un grafico de líneas de las frecuencias con relación a las marcas de
clase. Se obtiene conectando los puntos medios de las partes superiores de los rectángulos del
histograma. Puede ser en valores absolutos o en valores relativos cuando se obtiene a partir de
los histogramas en valores absolutos y en valores relativos respectivamente.
4.10 DISTRIBUCION DE FRECUENCIAS ACUMULADAS
La frecuencia total acumulada de todos los valores menores que la frontera de clase superior de un
intervalo dado se denomina frecuencia acumulada hasta ese intervalo inclusive.
Una tabla de frecuencias acumuladas se denomina distribución de frecuencias acumuladas.
4.11 OJIVAS VALORES ABSOLUTOS
La grafica que recoge las frecuencias acumuladas por debajo de cualquier frontera de clase
superior respecto a dicha frontera se llama polígono de frecuencias acumuladas u ojiva.
Estas ojivas pueden ser mayor que o menor que en valores absolutos o en valores relativos
4.12 DISTRIBUCION DE FRECUENCIAS RELATIVAS
La frecuencia acumulada relativa es la frecuencia acumulada dividida por la frecuencia total .
Cuando se usa la frecuencias acumuladas relativas en lugar de las frecuencias acumuladas
absolutas se obtiene la tabla de frecuencias relativas
4.13. OJIVAS EN PORCENTAJES
Es la representación grafica de las frecuencias acumuladas relativas, también se denomina
polígono de frecuencias acumuladas en porcentaje y puede se mayor que o menor que.
4.14. REGLAS GENERALES PARA CONSTRUIR UNA DISTRIBUCIÓN DE
FRECUENCIA
Existen muchos procedimientos para construir tablas de frecuencia y aunque su uso es cada vez
mas limitado, dado que todos los paquetes estadísticos hacen esta labor , queremos sugerir el
siguiente procedimiento:
1. Hallar el rango de los datos
2. Dividir el rango en un numero adecuado de intervalos de clases del mismo tamaño;
generalmente se suelen tomar entre 5 y 20 intervalos de clases según los datos. También
hay una regla que dice que el numero de intervalos es igual a la raíz cuadrada del numero
de datos cuando este no es muy grande. Si el numero de datos es muy grande trabajamos
con logaritmos.
#
13.22(#)
NICDATOS
NICLOGDATOS
=
=+
3. Hallar el tamaño del intervalo escogiendo como C el valor impar posterior al obtenido de
la división del rango entre el numero de intervalo ,en caso de que el resultado sea par.
74
R
C
NIC
=
4. Encontrar la frontera de clase inferior del primer intervalo usando la siguiente formula :
( ) ( )
1
2
MENOR
NICCR
FCIV
=
Si el valor encontrado para la frontera de clase inferior del primer intervalo termina en entero se le
resta o se le suma 0.5 , en caso contrario se deja igual.
5. Formar la tabla de frecuencia sumándole a frontera de clase inferior el valor de C, para
posteriormente restarle y sumarle a cada frontera de clase 0.5 y obtener los limites superior
e inferior de cada intervalo.
6. Utilizar una hoja de conteo para determinar cuantas observaciones o datos caen dentro de
cada intervalo de clase, es decir , hallar la frecuencia. Para realizar el conteo se debe
decidir si se trabaja con intervalos abiertos por la izquierda y cerrado por la derecha o
cerrado por la izquierda y abierto por la derecha . Esto se debe hacer para evitar el doble
conteo.
EJEMPLO 1
Para comprobar la eficiencia de los obreros encargados del proceso de llenado de paquetes de
azúcar de peso nominal 2000 gramos , un supermercado realizo una muestra con 30 paquetes
tomados al azar. Los resultados fueron los siguiente :
Se pide construir una tabla de frecuencia.
1930
1985
1954
1972
1967
2120
2025
2061
1966
1876
1909
1999
1830
1988
1880
2075
1977
1934
1898
2015
1946
2053
2047
2200
2030
1865
2005
1943
1910
2093
DESARROLLO
75
( ) ( ) ( ) ( )
1
1
22001830370
305.475
370
1175
5
575370
1830
22
18302.51827.5
MENOR
R
NIC
R
C
NIC
NICCR
FCIV
FCI
==
==
=+=+=
==
==
DATOS ORDENADOS EN ORDEN CRECIENTE
1830
1946
2015
1865
1954
2025
1876
1966
2030
1880
1967
2047
1898
1972
2053
1909
1977
2061
1910
1985
2075
1930
1988
2093
1934
1999
2120
1943
2005
2200
FORMACIÓN DE FRONTERAS DE CLASES
FCI +C
=FCS FRECUENCIA
1827.5
75 1902.5
1902.5
75 1977.5
1977.5
75 2052.5
2052.5
75 2127.5
2127.5
75 2202.5
TABLA DE CONTEO
PESO
PESO
FCI +
0.5 =
LI
FCI -
0.5 =
LS CONTEO F
1828 1902 1830 1865 1876 1880 1898 5
1903 1977 1909 1910
1930
1934
1943
1946
1954
1966
1967
1972
1977
11
1978 2052 1985 1988 1999 2005 2015 2025 2030 2047 8
2053 2127 2053 2061 2075 2093 2120 5
2128 2202 2200 1
Total 30
CUADRO 4.2
TABLA DE FRECUENCIA PESO NOMINAL DE 30 PAQUETES DE AZUCAR
76
CON UN GRAMO DE PRECISION
PESO EN GRAMOS
NUMERO DE PAQUETES
FRECUENCIA
1828 - 1902 5
1903 - 1977 11
1978 - 2052 8
2053 - 2127 5
2128 - 2202 1
TOTAL 30
EJEMPLO 2
Con los datos consignados en la tabla de frecuencia encontrada en el ejemplo anterior Calcular y/o
construir lo siguiente:
a) Un histograma en valores absolutos
b) Un histograma en valores relativos
c) Una ojiva menor que y una ojiva mayor que en valores absolutos
d) Una ojiva menor que y otra mayor que en valores relativos
DESARROLLO
a)
CUADRO 4.3
TABLA DE FRECUENCIA
PESO NOMINAL DE 30 PAQUETES DE AZUCAR
CON UN GRAMO DE PRECISION
LI LS F FR % MC FCI FCS C FAC<
FAC>
FAC>%
FAC<%
1827 1827,5
0 30 100,00 0,00
1828 1902 5 16,67 1865 1827,5
1902,5
75 5 25 83,33 16,67
1903 1977 11 36,67 1940 1902,5
1977,5
75 16 14 46,67 53,33
1978 2052 8 26,67 2015 1977,5
2052,5
75 24 6 20,00 80,00
2053 2127 5 16,67 2090 2052,5
2127,5
75 29 1 3,33 96,67
2128 2202 1 3,33 2165 2127,5
2202,5
75 30 0 0,00 100,00
TOTAL
30 100,00
77
PESO EN GRAMOS DE PAQUETES DE AZUCAR
2202,5 - 2277,5
2127,5 - 2202,5
2052,5 - 2127,5
1977,5 - 2052,5
1902,5 - 1977,5
1827,5 - 1902,5
HISTOGRAMA EN VALORES ABSOLUTOS
NUMERO DE PAQUETES ( F )
12
10
8
6
4
2
01
5
8
11
5
GRAFICO 4.1
78
PESO EN GRAMOS DE PAQUETES DE AZUCAR
1827,5 - 1902,5
1902,5 - 1977,5
1977,5 - 2052,5
2052,5 - 2127,5
2127,5 - 2202,5
2202,5 - 2277,5
HISTOGRAMA EN VALORES ABSOLUTOS
NUMERO DE PAQUETES ( F )
121086420
5
8
11
5
GRAFICO 4.2
MARCA DE CLASE
2240,0
2165,0
2090,0
2015,0
1940,0
1865,0
HISTOGRAMA EN VALORES ABSOLUTOS
NUMERO DE PAQUETES ( F )
12
10
8
6
4
2
01
5
8
11
5
GRAFICO 4.3
79
79
POLIGONO DE FRECUENCIA
MARCA DE CLASE
2165,002090,002015,001940,001865,001790,00
NUMERO DE PAQUETES
12
11
10
9
8
7
6
5
4
3
2
1
0
12
10
8
6
4
2
0
GRAFICO 4.4
GRAFICO 4.5
80
POLIGONOS DE FRECUENCIAS RELATIVAS
MARCA DE CLASE
2165,002090,002015,001940,001865,001790,00
FRECUENCIA RELATIVA %
40
36
32
28
24
20
16
12
8
4
0
40
36
32
28
24
20
16
12
8
4
0
GRAFICO 4.6
.
OJIVAS < Y > EN VALORES ABSOLUTOS
PESO EN GRAMOS - FC
2202,50
2127,50
2052,50
1977,50
1902,50
1827,50
NUMERO DE PAQUETES
30
25
20
15
10
5
0
30
20
10
0
FAC<
FAC>
GRAFICO 4.7
.
81
OJIVAS EN VALORES RELATIVOS
PESOS EN GRAMOS - FC
2202,50
2127,50
2052,50
1977,50
1902,50
1827,50
NUMERO DE PAQUETES EN %
100
90
80
70
60
50
40
30
20
10
0
100
80
60
40
20
0
FAC>
FAC<
GRAFICO 4.8
4.15 DIAGRAMA DE PARETO.
Es un histograma para datos categóricos, se usa mucho en el control de calidad, ya
que se pueden resaltar los diversos atributos, fallas o problemas en un producto o un
proceso. Las categorías o intervalos están ordenados de modo que en la parte
izquierda aparece la categoría con la mayor frecuencia, seguida por la categoría que
tienen la mayor frecuencia y así sucesivamente. Este tipo de histograma lleva el
nombre del economista italiano V. Pareto y en general exhibe la ley de Pareto , que
dice que la mayor parte de los defectos aparece solo en unas pocas categorías.
EJEMPLO 3
Construir un diagrama de Pareto con la siguiente información sobre los defectos
estructurales en las puertas de un automóvil:
6 abolladuras, 11 partes ensambladas fuera de secuencia, 14 partes mal ajustadas,
20 faltas de agujeros, 9 partes no lubricadas, 34 partes fuera de contorno y 7 partes
con rebabas.
DESARROLLO
Se construyó el diagrama de Pareto utilizando la información de los defectos
después de codificarlos en el editor de datos de SSPS 11.
Tipo de defecto Cantidad
Abolladuras 6
Ensamble 11
Ajuste 14
Agujeros 20
82
Lubricación 9
Contorno 34
Rebabas 7
DIAGRAMA DE PARETO
TIPOS DE DEFECTOS
abolladuras
rebabas
lubricación
ensamble
ajuste
agujeros
Contorno
Frecuencia
100
90
80
70
60
50
40
30
20
10
0
Porcentaje
100
75
50
25
0
7
9
11
14
20
34
4.16 DIAGRAMA DE TALLO Y HOJA
Se ideo por parte del estadígrafo John Turkey como alternativa al histograma. Este diseño
proporciona una impresión visual rápida del numero de observaciones de una clase. Para
construir un diagrama de este tipo, la observación o dato se divide en dos partes: un tallo,
formado por uno o mas dígitos principales y una hoja , la cual contiene el resto de los
dígitos. En general se debe escoger un numero relativamente pequeño de tallos en
comparación con el numero de observaciones. Se recomienda seleccionar entre 5 y 20
tallos; estos tallos se colocan ordenados de menor a mayor en la parte izquierda del
diagrama y al lado de cada tallo se ponen todas que corresponden a los valores
observados, tal como se encuentran en el conjunto de datos.
El diagrama de tallo y hoja o también llamado diagrama de árbol es uno de los mejores
métodos para la caracterización de los datos porque al mismo tiempo organiza y
presenta los datos en forma tabular como grafica , con la ventaja que no se pierden las
observaciones o datos originales. Si giramos 90 grados el diagrama de tallo y hoja
tendremos prácticamente un histograma donde las hojas representarían las barras
verticales o frecuencias. Cabe anotar que a partir de este diagrama también podemos
construir una tabla de frecuencia.
EJEMPLO
Elaborar utilizando los datos de los paquetes de azúcar :
a) Un diagrama de tallo y hojas con 5 intervalos y una tabla de frecuencia
b) Un diagrama de tallo y hoja con 10 intervalos y una tabla de frecuencia
83
c) Un diagrama de Tallo y hoja utilizando SPSS
DESARROLLO
a) Para construir el diagrama de tallo y hoja tomamos como tallo los dos primeros
dígitos y como hoja los dos restante y obtenemos el diagrama que se muestra a
continuación. DIAGRAMA DE TALLO Y HOJA PARA EL PESO
DE PAQUETES DE AZUCAR
TALLO HOJA FRECUENCIA
18 30,65,76,80,98 5
19 09,10,30,34,43,46,54,66,67,72,77,85,88,99
14
20 05,15,25,30,47,53,61,75,93 9
21 20 1
22 00 1
Para elaborar la tabla de frecuencia partimos de la información del diagrama y
establecemos los intervalos con una tolerancia de un gramo y obtenemos la siguiente
tabla. TABLA DE FRECUENCIA
PESO DE LOS PAQUETES DE AZUCAR
PESO EN GRAMOS
FRECUENCIA
1800 - 1899 5
1900 - 1999 14
2000 - 2099 9
2100 - 2199 1
2200 - 2299 1
b) Cuando estimamos que la información suministrada por el diagrama anterior, no
es suficiente, podemos dividir cada tallo en dos partes; la inferior ( I ) conteniendo
todo los datos menores que la mitad del intervalo y la superior (S) con todos los
datos mayores o iguales a la mitad del intervalo. La tabla de frecuencia se
construye de manera similar a la anterior.
DIAGRAMA DE TALLO Y HOJA PARA EL PESO
DE PAQUETES DE AZUCAR
TALLO HOJA FRECUENCIA
18I 30 1
18S 65,76,80,98 4
19I 09,10,30,34,43,46 6
19S 54,66,67,72,77,85,88,99
8
20I 05,15,25,30,47 5
20S 53,61,75,93 4
21I 20 1
21S - 0
22I 00 1
22S 0 0
84
TABLA DE FRECUENCIA
PESO DE LOS PAQUETES DE AZUCAR
PESO EN GRAMOS
FRECUENCIA
1800 - 1849 1
1850 - 1899 4
1990 - 1949 6
1950 - 1999 8
2000 - 2049 5
2050 - 2099 4
2100 - 2149 1
2150 - 2199 0
2200 - 2249 1
2250 - 2300 0
c) Este es diagrama de tallo y hoja generado por SSPS 11
EJEMPLO 2
En la tabla adjunta se muestran los datos de 80 muestras de una aleación de aluminio litio.
TABLA
RESISTENCIA A LA TRACCIÓN DE 80 MUESTRAS DE UNA ALEACIÓN
ALUMINIO LITIO EN PSI
105 201 153 186 120 170 118 149
97 175 183 174 121 250 150 135
245 151 174 199 181 171 148 158
163 157 154 115 160 172 158 169
207 178 190 193 194 135 229 146
134 180 70 167 184 133 156 123
218 131 101 171 165 208 158 133
199 228 142 163 145 158 176 110
PESO EN GRAMOS DE PAQUETES DE AZUCAR
Stem-and-Leaf Plot ( DIAGRAMA DE TALLO Y HOJA )
Frequency Stem & Leaf
1,00 18 . 3
4,00 18 . 6789
6,00 19 . 013344
8,00 19 . 56677889
5,00 20 . 01234
4,00 20 . 5679
1,00 21 . 2
1,00 Extremes (>=2200)
85
160 154 149 88 160 168 180 141
196 221 200 186 150 181 167 143
A partir de esta información utilizando SSPS 10 construya:
a) Un histograma en valores absolutos con 9 intervalos
b) Un histograma en valores absolutos con 7 intervalos
c) Un histograma en valores absolutos con 10 intervalos
d) Un histograma en valores absolutos con 12 intervalos
e) Un diagrama de tallo y hoja
DESARROLLO
TABLA
DATOS ORDENADOS EN ORDEN CRECIENTE
70
123 145 154 163 172 183 200
88
131 146 156 163 174 184 201
97
133 148 157 165 174 186 207
101
133 149 158 167 175 186 208
105
134 149 158 167 176 190 218
110
135 150 158 168 178 193 221
115
135 150 158 169 180 194 228
118
141 151 160 170 180 196 229
120
142 153 160 171 181 199 245
121
143 154 160 171 181 199 250
86
RESISTENCIA A LA TRACCIÓN
230,0 - 250,0
210,0 - 230,0
190,0 - 210,0
170,0 - 190,0
150,0 - 170,0
130,0 - 150,0
110,0 - 130,0
90,0 - 110,0
70,0 - 90,0
HISTOGRAMA DE LOS DATOS DE RESISTENCIA A LA TRACCION
GENERADO POR SSPS 10
FRECUENCIA
30
25
20
15
10
5
0
Std. Dev = 34,40
Mean = 162,9
N = 80,00
2
4
10
17
22
14
6
3
2
87
RESISTENCIA A LA TRACCIÓN
70,0 - 90,0
90,0 - 110,0
110,0 - 130,0
130,0 - 150,0
150,0 - 170,0
170,0 - 190,0
190,0 - 210,0
210,0 - 230,0
230,0 - 250,0
HISTOGRAMA DE LOS DATOS DE RESISTENCIA A LA TRACCION
GENERADO POR SSPS 10
FRECUENCIA
302520151050
Std. Dev = 34,40
Mean = 162,9
N = 80,00
4
10
17
22
14
6
88
RESISTENCIA A LA TRACCIÓN
224,3 - 250,0
198,6 - 224,3
172,9 - 198,6
147,1 - 172,9
121,4 - 147,1
95,7 - 121,4
70,0 - 95,7
HISTOGRAMA DE LOS DATOS DE RESISTENCIA A LA TRACCION
GENERADO POR SSPS 10
7 INTERVALOS DE CLASE
FRECUENCIA
40
30
20
10
0
Std. Dev = 34,40
Mean = 162,9
N = 80,00
4
8
17
29
12
8
89
RESISTENCIA A LA TRACCIÓN
235,0 - 250,0
220,0 - 235,0
205,0 - 220,0
190,0 - 205,0
175,0 - 190,0
160,0 - 175,0
145,0 - 160,0
130,0 - 145,0
115,0 - 130,0
100,0 - 115,0
85,0 - 100,0
70,0 - 85,0
HISTOGRAMA DE LOS DATOS DE RESISTENCIA A LA TRACCION
GENERADO POR SSPS 10
12 INTERVALOS DE CLASE
FRECUENCIA
20
10
0
Std. Dev = 34,40
Mean = 162,9
N = 80,002
33
8
11
16
17
9
5
3
2
EJEMPLO 3
El cuadro adjunto muestra una distribución de frecuencia de la vida media de 400 circuitos
integrados, probados en la empresa Soy Feliz & Cia .
CUADRO 3.
VIDA MEDIA DE CIRCUITOS INTEGRADOS
Vida media
en horas
Número de
circuitos integrados
RESISTENCIA A LA TRACCION
Stem-and-Leaf Plot
Frequency Stem & Leaf
1,00 Extremes (=<70)
2,00 0 . 89
22,00 1 . 0011122233333344444444
45,00 1 . 555555555555666666666677777777788888888999999
8,00 2 . 00001222
2,00 Extremes (>=245)
Stem width: 100
Each leaf: 1 case(s)
90
300 - 399 14
400 - 499 46
500 - 599 58
600 - 699 76
700 - 799 68
800 - 899 62
900 - 999 48
1000 - 1099
22
1100 - 1199
6
Construir y/o calcular a partir de esta información lo siguiente:
a) Un histograma de frecuencia absolutas
b) Un histograma de frecuencia relativas
c) Las ojivas en valores absolutos
d) Un histograma de frecuencias acumuladas en % menor que
e) El % de circuitos integrados con vida media d 560 horas
f) El numero de circuitos integrados con vida media mayor que 970 horas
g) El porcentaje de circuitos integrados con vida media entre 620 y 800 horas
h) El porcentaje de circuitos integrados con vida media entre 500 y 1050 horas
DESARROLLO
Con los datos suministrados elaboramos el siguiente cuadro para los datos de interés.
Vida media
en horas F Fr FC FAC<
FAC>
FAC>%
FAC<%
0 299.5 0 400 100 0
300 - 399 14
3.5 399.5 14 386 96.5 3.5
400 - 499 46
11.5
499.5 60 340 85.0 15.0
500 - 599 58
14.5
599.5 118 282 70.5 29.5
600 - 699 76
19.0
699.5 194 206 51.5 48.5
700 - 799 68
17.0
799.5 262 138 34.5 65.5
800 - 899 62
15.5
899.5 324 76 19.0 81.0
900 - 999 48
12.0
999.5 372 28 7.0 93.0
1000 - 1099
22
5.5 1099.5
394 6 1.5 98.5
1100 - 1199
6 1.5 1199.5
400 0 0 100
1. Todos gráficos fueron realizados utilizando el software SPSS 11
91
HISTOGRAMA EN VALORES ABSOLUTOS
Vida media en horas
1100 - 1199
1000 - 1099
900 - 999
800 - 899
700 - 799
600 - 699
500 - 599
400 - 499
300 - 399
numero de integrados ( F )
80
60
40
20
06
22
48
62
68
76
58
46
14
b)
HISTOGRAMA DE FRECUENCIAS RELATIVAS
Vida media en horas
1100 - 1199
1000 - 1099
900 - 999
800 - 899
700 - 799
600 - 699
500 - 599
400 - 499
300 - 399
frecuencia relativa ( FR )
20
15
10
5
02
6
12
16
17
19
15
12
4
c)
92
OJIVAS EN VALORES ABSOLUTOS
Vida media en horas ( FC )
1199,50
1099,50
999,50
899,50
799,50
699,50
599,50
499,50
399,50
299,50
frecuencia acumulada ( FAC )
400
350
300
250
200
150
100
50
0
400
300
200
100
0
OJIVAS
FAC<
FAC>
d)
HISTOGRAMA DE FRECUENCIA ACUMULADA EN % MENOR QUE
vida media en horas
1100 - 1199
1000 - 1099
900 - 999
800 - 899
700 - 799
600 - 699
500 - 599
400 - 499
300 - 399
Porcentaje acumulado ( % FAC )
100
80
60
40
20
0
100
89
78
67
56
44
33
22
11
93
e) Para hallar el porcentaje de circuitos integrados con vida media menor que 560
horas , aplicamos la interpolación en las fronteras de clase y las frecuencias
acumuladas menor que y obtenemos:
599.5560118
599.5499.511860
39.5118
10058
118(0.395)(58)95.09
(95.09)(100)
%23.8%
400
x
x
x
circuitos
=
=
==
==
Q
d) Para encontrar el numero de circuitos integrados mayor que 970 horas , utilizamos
las fronteras de clase y las frecuencias acumuladas mayor que y obtenemos
999.597028
999.5899.57628
29.528
10048
28(0.295)(48)42.16
x
x
xcircuitos
=
=
==
e) Para encontrar el % de circuitos integrados entre 620 y 800 horas se sigue el mismo
proceso , teniendo cuidado de utilizar solamente una de las columnas de frecuencias
acumuladas,; puede se cualquiera de las cuatros; utilizaremos la frecuencia
acumulada menor que en porcentaje. Cabe anotar que todos esos resultados se
pueden también obtener de una forma grafica a partir de las ojivas.
1
1
1
2
2
2
21
19899.5800
899.5799.51934.5
1999.5
10015.5
19(0.995)(15.5)34.4%
51.5699.5620
699.5599.551.570.5
51.579.5
10019
51.5(0.795)(19)66.6%
%66.634.432.2%
x
x
x
x
x
x
circuitosxx
=
=
==
=
=
==
==−=
Q
94
TALLER MODULO 4 **
**SUGERENCIA: Trate Inicialmente de resolver los ejercicios manualmente y chequee los
resultados de la mayor parte de los ejercicios utilizando cualquier software estadístico, (
SSPS 11, Excel , etc)
1. Supóngase que se desea hacer un estudio del comportamiento de las ventas en la
fabrica de bombillos “ El Iluminado Santiaguino ”. Para dicho estudio se
selecciono una muestra aleatoria entre las ventas de los últimos 6 meses,
correspondiente a 50 días . Los valores en millones de pesos se muestran en la
tabla adjunta. A partir de los datos redondeados construir y/o calcular lo siguiente:
TABLA
VENTAS DIARIAS
6.8 9.1 16.9
18.7
15.4
22.5
17.4
12.4
20.3
18.6
16.3
9.6 27.8
15.5
22.9
12.6
14.5
21.5
29.3
19.3
18.7
4.9 8.9 14.3
24.4
34.5
18.7
36.7
21.3
11.5
10.8
30.4
5.3 11.9
21.7
26.7
9.4 23.2
7.5 23.3
8.6 14.7
19.8
22.3
31.7
13.9
17.5
25.7
13.6
5.8
a) Una tabla de frecuencia
b) Un histograma y su respectivo polígono en valores absolutos
c) Un histograma y su respectivo polígono en valores relativos
d) Una ojiva menor que y otra mayor que en valores absolutos
e) Calcular el % de días con ventas diarias superiores a 20 millones de pesos ?
f) Calcular el numero de días con ventas inferiores a 20 millones de pesos ?
g) Calcular el numero de días con ventas entre 8.5 y 23.5 millones de pesos ?
h) Calcular el % de días con ventas entre 8.5 y 23.5 millones de pesos ?
i) Para que % de días, el valor de las ventas fueron inferiores a $18 millones de
pesos ?
j) Para que numero de días el valor de las ventas fueron inferiores a 28.5 millones de
pesos ?
2. En una muestra aleatoria de 50 familias tomada en el Barrio Alfonso López de la
ciudad de Buenaventura, con mira a detectar el numero de hijos por grupo familiar, se
encontraron los datos que se muestran en la tabla adjunta:
95
TABLA
NUMERO DE HIJOS POR FAMILIA
6 1 6 1 4
5 4 4 2 6
3 6 2 5 2
6 5 5 3 3
7 4 8 3 4
5 1 3 3 5
1 3 3 1 2
6 4 2 5 3
6 1 1 2 1
3 5 5 3 8
A partir de esta información construya y / o calcule lo siguiente:
a) un Diagrama de tallo y hoja
b) Una tabla de frecuencia
c) Un histograma en valores absolutos y su respectivo polígono
d) Las ojivas relativas
e) El porcentaje de familia con menos de 3 hijos
f) El porcentaje de familia con mas de 4 hijos
g) El porcentaje de familia con 1 a 4 hijos
3. A partir de los datos de una muestra aleatoria de la edad de 50 estudiantes de la
facultad de Administración de Empresas, que se muestra en la tabla adjunta:
TABLA
EDAD DE LOS ESTUDIANTES DE LA FACULTAD
DE ADMINISTRACIÓN DE EMPRESAS
USACA
19 21 16 21 24
25 24 24 22 17
23 16 22 25 20
18 20 22 23 23
17 24 18 23 24
25 21 23 23 22
21 23 23 21 22
17 24 22 25 23
26 21 21 22 21
23 25 25 23 18
a) Elaborar una tabla de frecuencia con 7 intervalos
b) Construir un histograma en valores absolutos y su respectivo polígono
c) Construir un histograma en valores relativos y su respectivo polígono
d) Construir las ojivas en valores relativos
e) Construir las ojivas en valores absolutos
f) Calcular el % de estudiantes con edades mayores de 21 años
96
g) Calcular el numero de estudiantes con edades inferiores a 20 años
h) Calcular el % de estudiantes con edades entre 18 y 20.5 años
i) Sacar Conclusiones
4. A partir de una muestra aleatoria del peso ( en kilogramos ) de 50 estudiantes de
la facultad de medicina con mira analizar la tendencia se encontraron los datos
que se muestran en la tabla adjunta:
TABLA
PESO ( KGR ) DE LOS ESTUDIANTES
DE LA FACULTAD DE MEDICINA
USACA
86 61 86 91 54
75 74 54 92 66
63 76 72 55 72
66 95 65 73 83
67 54 68 83 94
75 71 63 63 95
91 63 73 61 52
96 94 72 55 73
76 91 71 52 51
73 85 75 53 58
a. Un diagrama de tallo y hoja
b. Una tabla de frecuencia
c. Construir un histograma en valores absolutos y su respectivo polígono
d. Construir un histograma en valores relativos y su respectivo polígono
e. Construir las ojivas en valores relativos
f. Construir las ojivas en valores absolutos
g. Calcular el numero de estudiantes con peso por encima del 75 kgrs
h. Calcular peso medio de los estudiantes
i. Calcular el numero de estudiantes con peso por debajo del 65 kgrs
j. Calcular los pesos correspondiente al 25 , 50 y 75 % a partir de las ojivas
relativas
k. Sacar conclusiones.
5. La siguiente tabla adjunta muestra la distribución de cargas máximas en
toneladas que soportan los cables producidos por cierta fabrica. Construya y/o
calcule: TABLA
CARGA MÁXIMA
Carga máxima
En toneladas Numero de
Cables
9.3 - 9.7 2
9.8 - 10.2 5
10.3 - 10.7 12
10.8 - 11.2 17
11.3 - 11.7 14
11.8 - 12.2 6
97
12.3 - 12.7 3
12.8 - 13.2 1
a) Un histograma en valores absolutos y su respectivo polígono
b) Las ojivas en valores mayor que y menor que en porcentaje
c) El numero de cables que soportan mas de 10 toneladas
d) El numero de cable que soportan menos de 12 toneladas
e) El porcentaje de cable que soportan entre 9.5 y 12.5 toneladas
6. En la tabla adjunta se muestra la distribución de frecuencia del salario promedio anual
de los 100 empleados de una empresa metalúrgica. A partir de esta información
Construya y/o calcule lo siguiente:
TABLA
SALARIOS DE LOS EMPLEADOS
SALARIOS
$ NUMERO DE
EMPLEADOS
300.000 - 500.000 30
500.000 - 700.000 20
700.000 - 900.000 12
900.000 - 1.100.000
10
1.100.000 - 1.300.000
8
1.300.000 - 1.500.000
6
1.500.000 - 1.700.000
9
1.700.000 o MAS 5
TOTAL 100
a) Un histograma en valores absolutos y su respectivo polígono
b) Las ojivas relativas mayor y menor que
c) El porcentaje de empleados con salarios superiores a $ 800.000
d) El porcentaje de empleados con salarios inferiores a $ 500.000
e) El numero de empleados con salarios entre $ 400.000 y $ 1.000.000
REVISTAS ELECTRONICAS
28. Journal of Statistics Education. Excelente revista (¡gratuita!) editada por la
American Statistical Association sobre educación estadística (a todos los niveles)
29. Homepage de la American Statistical Association. La mayor asociación de
estadísticos, editora de Journal of Agricultural, Biological, and Environmental
Statistics, Journal of the American Statistical Association, Journal of Statistics
Education y The American Statistician entre otras revistas.
30. Environmental and Ecological Statistics
31. Community Ecology
98
32. Journal of Agricultural, Biological, and Environmental Statistics
33. Bulletin of the Ecological Society of America (gratuita; contiene artículos de
ecología estadística)
34. Journal of Statistical Software (gratuita)
35. InterStat (Statistics on the Internet) (gratuita)
36. Probability and Statistics Journals on the Web
ESTADISTICA ON LINE
163. Aula Virtual de Bioestadística, Universidad Complutense
164. Curso de bioestadística de la Universidad de Málaga
165. Apuntes de Bioestadística. Unidad de Bioestadística Clínica del Hospital
Ramón y Cajal
166. Lecciones de Estadística, 5campus.org (análisis multivariante...)
167. Curso de Bioestadística de la Universidad Nacional de Misiones (Argentina)
168. Curso de estadística (para ingenieros) de una universidad mexicana
169. Cursos de estadística de la Universidad de California, Los Angeles
170. Cursos de estadística de la Universidad de Michigan
171. Electronic Statistics Textbook
172. A New View of Statistics
173. HyperStat Statistics Textbook
174. Statistics at Square One
175. Statistics Every Writer Should Know
176. Introductory Statistics: Concepts, Models, and Applications
177. Multivariate Statistics: Concepts, Models, and Applications
178. A complete guide to nonlinear regression
179. Ordination Methods for Ecologists
180. Annotated Bibliography of Canonical Correspondence Analysis and related
constrained ordination methods 1986-1993
181. Multivariate Statistics: an Introduction
182. A glossary of ordination-related terms
183. Glossary of Statistical Terms and Medical Citations for Statistical Issues
184. Glossary of over 30 statistical terms
185. EVSC 503 Applied Statistics for the Environmental Sciences
186. http://s9000.furman.edu/mellonj/spss1.htm
99
187. http://www.indiana.edu/~statmath/stat/spss/win/index.html
188. http://www.utexas.edu/cc/stat/tutorials/spss/SPSS1/Outline1.html
189. http://web.uccs.edu/lbecker/SPSS/content.htm
190. http://core.ecu.edu/psyc/wuenschk/SPSS/SPSS-Data.htm
191. http://www.tulane.edu/~ panda2/Analysis2/ahome.html
192. http://www.shef.ac.uk/~ scharr/spss/index2.htm
193. http://calcnet.mth.cmich.edu/org/spss/index.html
194. http://calcnet.mth.cmich.edu/org/spss/toc.htm
195. http://www.public.asu.edu/~pythagor/spssworkbook.htm
196. http://lib.stat.cmu.edu/
197. http://www.stat.ufl.edu/vlib/statistics.html
198. http://www.statserv.com/softwares.html
199. http://www.maths.uq.edu.au/~gks/webguide/
200. http://www.statistics.com/
201. http://www.helsinki.fi/~jpuranen/links.html#stc
202. http://www.maths.uq.edu.au/~gks/webguide/free.html
203. http://nhsbig.inhs.uiuc.edu/
204. http://www.okstate.edu/artsci/botany/ordinate/software.htm
205. http://life.bio.sunysb.edu/ee/biometry/
206. http://life.bio.sunysb.edu/morph/software.html
207. http://pbil.univ-lyon1.fr/ADE-4/ADE-4.html
208. http://ourworld.compuserve.com/homepages/Rainer_Wuerlaender/statsoft.h
tm
209. http://www.stat.auckland.ac.nz/~mja/Programs.htm
210. http://it.stlawu.edu/~rlock/maa99/
211. http://it.stlawu.edu/~rlock/tise98/java.html
212. http://www.stat.vt.edu/~sundar/java/applets/
213. http://www.kuleuven.ac.be/ucs/java/index.htm
214. http://noppa5.pc.helsinki.fi/koe/
215. http://www2.kenyon.edu/people/hartlaub/MellonProject/mellon.html
Demostraciones Java para el aprendizaje de la estadística
216. Electronic Textbook (UCLA), programa on-line de representación y cálculo
de funciones de densidad y de distribución (normal, F, ji-cuadrado, números
aleatorios...). Equivalente a un libro de tablas
100
BIBLIOGRAFÍA
64. Montgomery Douglas y Runger George.( 1996), Probabilidad y Estadística
aplicada a la Ingeniería., Mcgraw-Hill, Mexico
65. Montgomery Douglas y Hines William.( 1995), Probabilidad y Estadística aplicada
a la Ingeniería. y Administración, segunda edición ,CECSA, México
66. Mendenhall William, Wackerly Dennis y Scheaffer Richard (1994), Estadística
Matemáticas con Aplicaciones , segunda edición, Grupo Editorial Iberoamerica. M,
México
67. Govinden Portus Lincoyan.( 1998), Introducción a la Estadística,. Mcgraw-Hill,
Santafé de Bogotá
68. Webster Allen L.( 1998), Estadística aplicada a la Empresa y a la Economía,
segunda edición, Mcgraw-Hill, Madrid
69. Kohler Heinz.( 1996), Estadística para Negocios y Economía, primera edición
,CECSA, México
70. Martinez Bencardino Ciro ( 1995), Estadística , sexta edición ,ECOE EDICIONES
Santafé de Bogotá.
71. Alvarez C Ricardo ( 1994), Estadística Fundamental Aplicada, primera edición
,PUBLIADCO, Cali
72. Estadística," Enciclopedia Microsoft® Encarta® 2000. © 1993-1999 Microsoft
Corporation.
73. Stockburger David W (1996) Introductory Statistics: Concepts, models an
applications, , http://www.psychstat.smsu.edu/sbk00.htm
74. Mendoza Duran Carlos. (1995 )Probabilidad y Estadística,
http://w3.mor.itesm.mx/~cmendoza/ma835/ma83500.html
75. Valdés Fernando ,Comprensión y uso de la estadística,
http://www.cortland.edu/flteach/stats/glos-sp.html
76. Hurtado Minotta Enrique A, Reflexiones para el Currículo,
http://www.geocities.com/soho/atrium/7521/tesis.html
77. Academic Freedom , www.hrw.org/wr2k/issues-01.htm
78. Gonzalez Felipe, Africa : El silencio de los tambores,
www.arrakis.es/~trazeg/gonzalez.html.
79. El año 2000, WWW.arrakis.es/~ trazeg/anno2000.html
80. Mendenhall, W.; D.D. Wackerly y R.L. Scheaffer. Estadística Matemática con
Aplicaciones. Grupo Editorial Iberoamérica. México.
81. Freund, John E. y Gary A. Simon. Estadística elemental. Prentice-Hall
Hispanoamericana, SA. México, 1994. (8ª edición.)
82. Spiegel, M.R. Estadística. McGraw-Hill. México. (Serie Schaum.)
83. http://www.unl.edu.ar/fave/sei/encuestas/index.html.
84. Wonnacott, Thomas H. y Ronald J. Wonnacott (1998) Introducción a la estadística.
Limusa/IPN. México.
.
101
MODULO V
MEDIDAS DE TENDENCIA CENTRAL
Copyright © ;Ing. Enrique A Hurtado Minotta, all rights reserved
Los datos, al igual que los seres vivientes, frecuentemente tienden a congregarse alrededor de
ciertos lugares de reunión favoritos. Los estudiantes los fines de semanas tienden a reunirse en
los bares , en los estadios , centros de hermandad y muy raras ocasiones en la biblioteca. De
modo similar los números también parecen disfrutar de la compañía de otros números y
comparten las inclinaciones a agruparse en torno de algún punto central. Esta posición central
suele llamarse sencillamente la media o promedio.
En este modulo aprenderemos a calcular las diferentes medidas de tendencia central para datos
agrupados y datos sin agrupar.
5. MEDIDAS DE TENDENCIAS CENTRAL.
Son aquellas medidas que suelen situarse hacia centro de un conjunto de datos ordenados por
magnitud. Entre las medidas de tendencia central tenemos la media aritmética, la mediana, la
moda, media geométrica, la media armónica,
5.1 MEDIA ARITMÉTICA
Es por excelencia una de las medidas mas utilizada, tanto que a veces , la utilizamos tan
familiarmente , cuando decimos que Xiomara conversadora emperdenida habla en promedio 3
horas diarias por teléfono, lo que no necesariamente quiere decir que cada día hable 3 horas sino
que es el resultado promedio de un muestra , en donde en 7 días de observación se obtuvieron
valores de 2, 3, 4, 5 , 3 ,1 ,3 , encontrándose que el numero de horas hablada tiende agruparse
alrededor de 3.
Matemáticamente la media aritmética o promedio aritmético de un conjunto de n datos , x1, x2,
x3,...... ...xn , se denota por x y se define como la sumatoria de todo los valores observados dividido
entre el numero de observaciones.
X
n
X
n
xxxx
n
i
n==
+++
1
321 ......
EJEMPLO 1
Calcular el numero promedio de horas conversadas telefónicamente por Xiomara a partir de los
siguientes datos :
TABLA 5. 1
DISTRIBUCIÓN DE FRECUENCIAS
LLAMADAS TELEFONICAS
Día Duración-hr
Xi
Domingo 2 1
102
Lunes 3 2
Martes 4 3
Miércoles 5 4
Jueves 3 5
Viernes 1 6
Sábado 3 7
3
7
21
7
3135432 ==
++++++
=X
Como puede verse al utilizar la formula Xiomara tiene una media aritmética de 3 horas de
conversación telefónica.
5.2 MEDIA ARITMÉTICA PONDERADA :
Se utiliza cuando los datos tienen diferentes grados de importancia , lo cual puede estar
representado por la frecuencia de clase o cualquier otra característica importante.
Matemáticamente se calcula así :
n
nn
n
i
n
ii
WWW
XWXWXW
W
XW
X....
.....
21
2211
1
1
++
++
==
Donde
Wi = Factor de ponderación
Xi = Valores de la variable
También se puede escribir así :
n
nn
n
i
n
ii
fff
XfXfXf
f
Xf
X....
.....
21
2211
1
1
++
++
==
Donde
F = frecuencia
N = Frecuencia total
EJEMPLO 2
Si el primer parcial de estadística vale el 30%, el segundo el 30% y el examen final el 40% y las
notas obtenidas por Rene Fernando fueron de 4.0, 3.5 y 4.5 respectivamente . Hallar la calificación
promedio de Rene Fernando.
DESARROLLO
Usamos la media ponderada y obtenemos que la calificación promedio es de 4.05
103
05.4
4.03.03.0
5.4*4.05.3*3.00.4*3.0
1
1=
++
++
==
n
i
n
ii
W
XW
X
EJEMPLO 3
Resolver el ejemplo de Xiomara utilizando la formula la media ponderada .
DESARROLLO
Observamos la frecuencia de cada dato y utilizando la media ponderada en función de la
frecuencia, encontramos que la media es igual a la encontrada anteriormente.
3
11311
5*14*13*32*11*1
1
1=
++++
++++
==
n
i
n
ii
f
Xf
X
5.3 MEDIA ARITMÉTICA PARA DATOS AGRUPADOS
Cuando los datos se dan agrupados, es decir, en una tabla de frecuencia, se puede calcular la
media aritmética utilizando la siguiente formula :
n
nn
n
i
n
ii
fff
XfXfXf
f
Xf
X....
.....
21
2211
1
1
++
++
==
Donde
Xi = Marca de clase
fi =frecuencia de clase
EJEMPLO 4
Calcular la media aritmética para la tabla de distribución formada con los datos de la resistencia de
la aleación cobre litio
TABLA 5. 2
DISTRIBUCIÓN DE FRECUENCIAS
RESISTENCIA A LA TRACCIÓN DE 80 MUESTRAS
DE UNA ALEACIÓN ALUMINIO LITIO EN PSI
Resistencia Numero de muestras
PSI ( lbs/pul2 )
F
70 – 90 2
90 – 110 3
110 – 130 6
104
130 – 150 14
150 –170 22
170 – 190 17
190 – 210 10
210 – 230 4
230 – 250 2
DESARROLLO
TABLA 5. 3
DISTRIBUCIÓN DE FRECUENCIAS
RESISTENCIA A LA TRACCIÓN DE 80 MUESTRAS
DE UNA ALEACIÓN ALUMINIO LITIO EN PSI
LI LS F MC F*MC
70 90 2 80 160
90 110 3 100 300
110
130 6 120 720
130
150 14
140 1960
150
170 22
160 3520
170
190 17
180 3060
190
210 10
200 2000
210
230 4 220 880
230
250 2 240 480
TOTALES
80
13080
5.163
80
13080 ===
F
FMC
X
5.4 MEDIANA
Es la medida de tendencia central que divide los datos ordenados en magnitud de una serie en
dos partes iguales. También a veces se le denomina media posicional , porque se sitúa en el
centro exacto del conjunto de datos una vez que la serie ha sido ordenada. La mitad de las
observaciones estarán por encima de la mediana y la otra mitad por debajo de ella.
Antes de calcular la mediana es preciso ordenar las observaciones de la serie en orden creciente
o decreciente y determinar su posición teniendo en cuenta si el numero de datos es par o impar.
En un conjunto de datos ordenados con un numero impar de observaciones la posición central o
posición de la mediana se calcula así:
105
2
1+
=N
PME
Si el número de observaciones es par, la posición es igual a la media de los dos valores centrales.
EJEMPLO 5
Hallar la mediana de las notas obtenidas por Enrique Jr en:
a) matemáticas financiera si estas fueron 3.5, 4.1, 3.8, 4.5 y 3.9
b) estadística si las notas fueron 4.7, 4.3, 3.0, 3.7, 4,0 y 4.5.
DESARROLLO
a) Ordenando los datos en orden creciente tenemos:
3.5
3.8
3.9
4.1
4.5
9
.
3
3
2
15
2
1
=
=
+
=
+
=
ME
N
PME
de donde observamos que la posición central corresponde al tercer dato , cuyo valor
es 3.9 por lo tanto la mediana es 3.9
b) Igual que a ordenamos los datos y aplicamos la formula obtenemos la posición 3.5
que corresponde a la media de lo dos valores centrales que es 4.15, por lo tanto
la mediana es 4..15
3.0
3.7
4.0
4.3
4.5
4.7
15.4
2
3.4.4
5.3
2
16
2
1
=
+
=
=
+
=
+
=
ME
N
PME
5.5 MEDIANA PARA DATOS AGRUPADOS
Cuando los datos están tabulados en una tabla de frecuencia la mediana se obtiene por
interpolación y se calcula así:
( )
C
F
FN
FCIME
ME
AC
ME
+=
2/
106
FCIME = Frontera de clase inferior de la clase mediana
C = Anchura del intervalo de la clase mediana
FAC = Frecuencia acumulada que precede a la clase mediana
FME = Frecuencia de la clase mediana
N = Frecuencia total
EJEMPLO 6
Para los datos del cuadro 5.2 Calcular la mediana.
DESARROLLO
TABLA 5. 4
DISTRIBUCIÓN DE FRECUENCIAS
RESISTENCIA A LA TRACCIÓN DE 80 MUESTRAS
DE UNA ALEACIÓN ALUMINIO LITIO EN PSI
Resistencia Numero de muestras
Frecuencia acumulada
PSI ( lbs/pul2 )
F FAC
70 – 90 2 2
90 – 110 3 5
110 – 130 6 11
130 – 150 14 25
150 –170 22 47
170 – 190 17 64
190 – 210 10 74
210 – 230 4 78
230 – 250 2 80
6.16320
22
252/80
150 =
+=ME
Utilizando la formula de la mediana y los datos de la tabla de frecuencia calculamos y
obtenemos que la resistencia mediana de la aleación es de 163.6 psi
5.6 LA MODA
La moda de un conjunto de números es el valor que mas se repite , es decir, el valor que
ocurre con mayor frecuencia.
No existe la moda cuando todos los datos presentan igual frecuencia. Cuando la serie
presenta mas de dos modas se dice que es multimodal ..
EJEMPLO 7
Hallar la moda de las notas obtenidas por Enrique Jr en:
a) Microeconomía si estas fueron 3.8, 4.5, 3.8, 4.4, 4.0, y 4.7
107
b) Finanzas 2 si las notas fueron 4.5, 4.7, 4.5, 3.6, 3.5, y 4.7
c) estadística si las notas fueron 4.7, 4.3, 3.0, 3.7, 4,0 y 4.5.
DESARROLLO
a) la nota modal en microeconomía es 3.8 ya que es la nota que mas se repite, por lo tanto
esta serie es unimodal 3.8
4.5
3.8
4.4
4.0
4.7
c) la serie de finanzas es bimodal ya que tiene 2 modas que son 4.5 y 4.7
4.5
4.7
4.5
3.6
3.5
4.7
d) En estadística la serie es amodal , ya que ningún valor se repite
3.0
3.7
4.0
4.3
4.5
4.7
5.7 MODA PARA DATOS AGRUPADOS
Por definición la moda e la observación mas frecuente que se presenta , por lo tanto , se
encontrara en el intervalo de clase de mayor frecuencia , llamado intervalo de clase
modal. Para calcular la moda utilizaremos la siguiente formula :
( )
CFCIMO MO
+
+=
21
1
FCIMO = Frontera de clase inferior de la clase modal
C = Anchura del intervalo de la clase modal
1 = Exceso de la frecuencia modal sobre la frecuencia de la clase que la precede
2 = Exceso de la frecuencia modal sobre la frecuencia de la clase que la sigue.
EJEMPLO 8
Calcular la resistencia modal para los datos de la aleación de aluminio - litio del cuadro
5.2
DESARROLLO
A partir de los datos del cuadro 5.5 y utilizando la formula calculamos la moda, obteniendo
un valor de 162.3
108
( ) ( ) ( )
3.16220
17221422
1422
150 =
+
+=MO
TABLA 5. 5
DISTRIBUCIÓN DE FRECUENCIAS
RESISTENCIA A LA TRACCIÓN DE 80 MUESTRAS
DE UNA ALEACIÓN ALUMINIO LITIO EN PSI
Resistencia Numero de muestras
Frecuencia acumulada
PSI ( lbs/pul2 )
F FAC
70 – 90 2 2
90 – 110 3 5
110 – 130 6 11
130 – 150 14 25
150 –170 22 47
170 – 190 17 64
190 – 210 10 74
210 – 230 4 78
230 – 250 2 80
5.8 RELACION EMPÍRICA ENTRE LA MEDIA ,LA MEDIANA Y LA MODA
Para curvas de frecuencias unímodales que sean poco asimétricas se cumple la
siguiente relación empírica :
(
)
MEDIANAMEDIAMODAMEDIA =3
109
Las graficas 5.1 y 5.2 muestran las posiciones relativas de la media , la mediana y la
moda para curvas de frecuencias asimétricas a la derecha y a la izquierda. Para curvas
simétricas los 3 valores coinciden ver grafica 5.3
En las curvas distribución de frecuencias tenemos:
En la simétrica la media = Mediana = moda
En la asimétrica sesgada a la derecha la media > mediana > moda
En la asimétrica sesgada a la izquierda la media <mediana < moda
5.9 COMPARACION ENTRE LA MEDIA ARITMÉTICA ,LA MEDIANA Y LA MODA.
La media aritmética es la medida de tendencia central mas común y tiene la ventaja que
se entiende y se calcula con mucha facilidad a partir de datos agrupados y datos no
agrupados y se presta para manipulaciones e interpretaciones algebraicas posteriores.
Desafortunadamente , la media aritmética esta afectada por los valores extremos o
atípicos y a diferencia de la mediana , puede experimentar desviaciones drásticas a
causa de las observaciones muy por encima o por debajo de ella.
Por ejemplo la media aritmética y la mediana de los datos 30, 40, 50, 60 y 70, es 50 y
representa una medida excelente del punto central de los datos. Si el ultimo dato envés
de 70 fuera 700, la media aritmética se convertiría en 180, mientras tanto la mediana
seguiría siendo 50. Como la mediana no es afectada por este valor extremo , refleja con
mayor credibilidad el centro verdadero del conjunto de datos.
Al igual que la mediana la moda es menos afectada por unas cuantas observaciones
atípicas. Si tuviéramos 30, 40, 50, 50 y70, la moda seguiría siendo 50 aunque el ultimo
valor fuera 700. Pero si no hay moda o si el conjunto de datos es multimodal , su
utilización puede causar confusión.
Es de vital importancia utilizar adecuadamente las medidas de tendencia central en la
toma de decisiones.
5.10 MEDIA GEOMÉTRICA
La media geométrica G de un conjunto de números positivos X1, X2 , X3, .... XN es la raíz
enésima del producto de esos números.
NN
XXXXG....
321
=
110
Generalmente la media geométrica se utiliza casi siempre para calcular la tasa de
crecimiento porcentual medio a lo largo del tiempo de determinadas series.
EJEMPLO 9
Calcular la media geométrica de los siguiente números 2 , 4, 8, 9 y 5.
DESARROLLO
92.4288059842 55 === XXXXG
EJEMPLO 10
El gerente general de Metalconsulting Ingeniería desea determinar la tasa de crecimiento
medio de los ingresos de la Firma , a partir de los datos del cuadro 5.6 Si la tasa de
crecimiento medio es inferior a la media del sector , que es del 12 %, ; Usted como asesor
le recomendaría una nueva lanzar una campaña de publicidad.?
TABLA 5. 6
INGRESOS ANUALES DE METALCONSULTING INGENIERIA LTDA
PERIODO 1995 –2000
AÑO
INGRESOS EN MILLONES $
PORCENTAJE DEL AÑO ANTERIOR
1995
68 --- ---
1996
76 76/68 = 1.12
1997
78 78/76 = 1.03
1998
85 85/78 = 1.09
1999
90 90/85 = 1.06
2000
95 95/90 = 1.06
DESARROLLO
A partir del crecimiento porcentual de los de los ingresos de cada año respecto al anterior ,
calculamos la media geométrica de la serie y obtenemos un crecimiento medio anual del 7.74% ((
1.0774 -1 )(100)) para los 6 años
( ) ( ) ( ) ( ) ( )
5
1.121.031.091.061.061.0716
G==
1.121.031.091.061.065.36
1.072
55
X++++
===
Si utilizáramos la media aritmética obtendríamos un incremento promedio del 7.2%
111
Si aplicamos el incremento medio del 7.16% y del 7.2% a la serie que empieza con 68
observamos que el valor obtenido con la media geométrica es mucho mas cercano al valor real
que el obtenido con la media aritmética . Por lo tanto la media geométrica es mucho mas
representativa ya que representa el cambio medio a lo largo del tiempo.
Como la tasa de crecimiento de Metalconsulting (7.2% ) es inferior a la tasa media del sector ( 12
%) es necesario emprender una nueva campaña de publicidad con mira incrementar los ingresos.
TABLA 5. 7
68.0000X1.0716 = 72.8688
72.8688X1.0716 = 78.0862
78.0862X1.0716 = 83.6771
83.6771X1.0716 = 89.6684
89.6684X1.0716 =96.08872
68.0000X1.072 = 72.8960
72.8960X1.072 = 83.7709
83.7709X1.072 = 89.8024
89.8024X1.072 = 96.2682
96.2682X1.072 = 103.199
Cabe anotar que la media geométrica siempre será menor que la media aritmética , exceptuándose
los casos pocos frecuentes de que todos los incrementos porcentuales sean iguales.
5.10 MEDIA ARMONICA H
La media armónica H de un conjunto de números X1, X2 , X3, .... XN es el reciproco
de la media aritmética de los recíprocos de esos números . Se calcula así:
==
=X
N
XN
HN
ii
1
11
1
1
EJEMPLO 12
Calcular la media armónica de 2, 4 y 8 ?
DESARROLLO
43.3
8
1
4
1
2
1
3=
++
=H
EJEMPLO 13
El ingeniero Rene Fernando viaja de Cali a Buenaventura a 60 Km/hr y regresa de
Buenaventura a Cali a 80 Km/hr . Hallar la velocidad media del viaje completo. Tómese S
como la distancia entre Cali y B/tura
112
DESARROLLO
Utilizando la formula básica de velocidad aprendida en física , calculamos la velocidad
media del viaje redondo y encontramos que es igual a 68.57 Km/hr, que es a su vez es la
media armónica de 60 y 80 Km/hr .
Téngase en cuenta que la velocidad media no se puede calcular como la media aritmética
de 60 y 80 ya que daría 70 Km/hr , lo cual es incorrecto.
H
V
HRKMH
HRKM
SS
SS
TIEMPO
DISTANCIA
VVELOCIDAD
S
T
S
T
VELOCIDAD
DISTANCIA
TIEMPO
TOTAL
TOTAL
CALITURAB
TURABCALI
=
=
+
=
=
+
+
===
=
=
=
/57.68
80
1
60
1
2
/57.68
8060
80
60
/
/
5.11 MEDIDAS DE POSICIONAMIENTO
Si un conjunto de datos esta ordenado por magnitud el valor central o la media de los dos
valores centrales que divide al conjunto en dos partes iguales es la mediana. Extendiendo
este concepto , podemos pensar en aquellos valores que dividen al conjuntos en 4 partes
iguales ; estos valores denotados por Q Cuartiles y se llaman primer cuartil para Q1,
segundo cuartil para Q2 y tercer cuartil para Q3.
Similarmente , los valores que dividen los datos en 10 partes iguales se denominan Deciles
y se denotan por D1,D2,D3 hasta D9. Igualmente los valores que dividen al conjunto en
100 partes iguales, se denominan Percentiles y se denotan P1, P2, P3 hasta P99.
Cabe anotar que Q2 = D5 = P50 = MEDIANA .
Todo conjunto de datos tiene tres cuartiles que lo dividen en cuatro partes iguales , como
puede verse en la grafica 3.1
Si se considera que fila es un conjunto de datos dispuestos en serie ordenada, se pueden
identificar tres cuartiles que dan lugar a cuatro subconjuntos de igual tamaño en el conjunto
de datos.
Subconjunto1 Subconjunto2 Subconjunto3 Subconjunto4
0% 25% 50% 75% 100%
Q1 Q2 Q3
113
El primer cuartil es el valor por debajo del cual se sitúa a lo sumo el 25% de los datos y por
encima del cual se encuentra el 75% restante. El segundo cuartil esta exactamente en el
centro , por lo tanto la mitad de los datos están por debajo de este valor y la otra mitad por
encima. El tercer cuartil es el valor por debajo del cual se encuentran como máximo el 75%
de los datos y por encima del cual se halla el 25 %.
La determinación de los cuartiles demuestra su utilidad con mucha frecuencia . Por ejemplo
la mayoría de las universidades solo reciben a los estudiantes cuyas pruebas de estado
(ICFES ) los ubique en el tercer cuartil , es decir, que estén ubicados en el 25% superior de
los aspirantes. También es muy frecuente encontrar que los directivos universitarios se
muestran muy interesados en encontrar las causas que crean problemas entres los
estudiantes universitarios cuyo desempeño esta ubicado en el primer cuartil , es decir , en el
25% inferior de toda la comunidad universitaria.
Cabe anotar que las grandes multinacionales solo están interesadas en contratar
profesionales que estén ubicado en el 10% superior de todos los aspirantes, es decir , que
ubicado en decil nueve o su equivalente el percentil 90.
Para calcular los cuartiles, deciles y percentiles se debe tener en cuenta si los datos están
sin agrupar o están agrupados . Para datos sin agrupar primero localizamos la ubicación y
por ultimo hallamos el valor correspondiente a esa ubicación.
( )
( )
( )
+=
+=
+=
100
1
10
1
4
1
P
NL
D
NL
Q
NL
P
D
Q
Donde:
LQ es la ubicación del cuartil deseado Q
LD es la ubicación del decil deseado D
LP es la ubicación del percentil deseado P
N es el numero de datos
Para datos agrupados utilizamos las siguiente formulas
114
P
N
L
D
N
L
Q
N
L
P
D
Q
=
=
=
100
10
4
Donde:
LQ es la ubicación del cuartil deseado Q
LD es la ubicación del decil deseado D
LP es la ubicación del percentil deseado P
N es el numero de datos
C
F
FP
N
FCIP
C
F
FD
N
FCID
C
F
FQ
N
FCIQ
P
ACPP
P
D
ACDD
D
Q
ACQD
Q
+=
+=
+=
100
10
4
Donde:
FCIQ = Frontera de clase inferior de la clase donde se localiza el cuartil deseado
C = Anchura del intervalo de la clase donde se localiza el cuartil deseado
FACQ = Frecuencia acumulada que precede a la clase donde se ubica el cuartil deseado
FQ = Frecuencia de la clase donde se encuentra el cuartil deseado
N = Frecuencia total
QD = Numero del cuartil deseado (1, 2 o 3)
Q = Cuartil deseado
FCID = Frontera de clase inferior de la clase donde se localiza el decil deseado
C = Anchura del intervalo de la clase donde se localiza el decil l deseado
F ACD = Frecuencia acumulada que precede a la clase donde se ubica el decil deseado
115
FD = Frecuencia de la clase donde se encuentra el decil deseado
N = Frecuencia total
DD = Numero del decil deseado (1, 2 , 3......9)
D = Decil deseado
FCIP = Frontera de clase inferior de la clase donde se localiza el percentil deseado
C = Anchura del intervalo de la clase donde se localiza el percentil deseado
F ACP = Frecuencia acumulada que precede a la clase donde se ubica el percentil
deseado
FP = Frecuencia de la clase donde se encuentra el decil deseado
PD = Numero del percentil deseado (1, 2 , 3......99)
P = Decil deseado
EJEMPLO 14
Calcular para los datos sin agrupar de las pruebas de resistencias para la aleación de
aluminio litio del cuadro adjunto 5.6
Los cuartiles Q1, Q2 y Q3.
Los deciles 4, 6 y 9
Los percentiles 30, y 95
La media , la median y la moda
TABLA 5. 8
RESISTENCIA A LA TRACCIÓN
ALEACIÓN DE ALUMINIO LITIO
70 123
145
154
163
172
183
200
88 131
146
156
163
174
184
201
97 133
148
157
165
174
186
207
101
133
149
158
167
175
186
208
105
134
149
158
167
176
190
218
110
135
150
158
168
178
193
221
115
135
150
158
169
180
194
228
118
141
151
160
170
180
196
229
120
142
153
160
171
181
199
245
121
143
154
160
171
181
199
250
1. Como se puede observar la posición del primer cuartil es 20.25, lo que nos indica que Q1
esta situado en el 25% de camino entre el dato 20 (143) y el dato 21 (145) es decir que Q1
es igual al valor de la posición 20 mas el 25% de la diferencia entre el valor de la posición
21 y la posición 20, por lo tanto el primer cuartil tiene un valor de 143.5.
Todos los cuartiles ,deciles o percentiles se pueden calcular así o por medio de las formulas dadas.
116
( )
( )
( )
( )
( )
( )
( )
( )
( )
1
1
2
2
3
3
6
6
9
1
80120.25
4
1430.25145143143.5
2
80140.5
4
1600.5163160161.5
3
80160.75
4
1810.75183181182.5
6
80148.6
10
1700.6171170170.6
9
8017
10
Q
Q
Q
D
D
L
Q
L
Q
L
Q
L
D
L
=+=
=+=
=+=
=+=
=+=
=+=
=+=
=+=
=+=
( )
( )
( )
( )
( )
9
30
30
95
95
2
2.9
2010.9207201206.4
30
80124.3
100
1490.3149149149
95
80176.95
100
2210.95228221227.65
13031
162.89
80
161.5
158
P
P
D
L
P
L
P
X
XN
MEDIANAQ
MODA
=+=
=+=
=+=
=+=
=+=
===
==
=
Obsérvese que la moda corresponde al valor que mas se repite.
EJEMPLO 15
Calcular utilizando los datos del cuadro 5.4 para la aleación de aluminio litio . los
cuartiles, el decil 4 y el percentil 30.
TABLA 5. 4
DISTRIBUCIÓN DE FRECUENCIAS
RESISTENCIA A LA TRACCIÓN DE 80 MUESTRAS
DE UNA ALEACIÓN ALUMINIO LITIO EN PSI
Resistencia
Numero
de
muestras
Frecuencia
acumulada
117
muestras
PSI
lbs/pul2 F FAC
70 – 90 2 2
90 – 110 3 5
110 – 130 6 11
130 – 150 14 25 Q1
150 –170 22 47 Q2
170 – 190 17 64 Q3
190 – 210 10 74
210 – 230 4 78
230 – 250 2 80
DESARRROLLO
Cabe anotar que los valores calculados a partir de datos agrupados, dados que estos son
aproximaciones y están sometidos al redondeo, pueden variar ligeramente de los
obtenidos a partir de datos no agrupados.
Primero ubicamos la posición del primer cuartil y observamos que corresponde a la
frecuencia acumulada de 20 y que se ubica en el cuarto intervalo de clase (130 150),
luego aplicamos la formula correspondiente.
De manera similar se calculan los demás cuartiles. deciles y percentiles.
( )
( ) ( )
( )
( ) ( )
1
1
2
2
80
120
4
80
111
4
13020142.85
14
80
240
4
80
225
4
15020163.6
22
Q
Q
L
Q
L
Q
==
=+=
==
=+=
118
( )
( ) ( )
( )
( ) ( )
( )
( ) ( )
3
3
4
4
30
30
80
360
4
80
347
4
17020185.3
17
80
432
10
80
425
10
15020156.4
22
80
3024
100
80
3011
100
10020148.6
14
Q
D
P
L
Q
L
D
L
P
==
=+=
==
=+=
==
=+=
EJEMPLO 16
Resolver los dos últimos ejemplos utilizando los programas estadísticos Excel y SPSS10.
Use los tutoriales que vienen en cada programa.
DESARROLLO
TABLA 5. 9
119
TABLA 5. 10
Statistics
PSI
N Valid 80
Missing
0
Mean 162,8875
Std. Error
of Mean 3,8463
Median 161,5000
Mode 158,00
Std.
Deviation
34,4027
Variance 1183,5441
Range 180,00
Minimum
70,00
Maximum
250,00
Sum 13031,00
Percentiles
10 118,2000
20 135,0000
25 143,5000
30 149,0000
40 156,4000
45 158,0000
120
50 161,5000
60 170,6000
65 174,0000
70 179,4000
75 182,5000
80 189,2000
90 206,4000
TABLA 5. 11
TALLER 5**
2. Supóngase que se desea hacer un estudio del comportamiento de las ventas en la
fabrica de bombillos “ El Iluminado Santiaguino”. Para dicho estudio se
selecciono una muestra aleatoria entre las ventas de los últimos 6 meses,
correspondiente a 50 días . Los valores en millones de pesos se muestran en la
tabla adjunta. A partir de los datos redondeados construir y/o calcular lo siguiente:
TABLA 5. 12
VENTAS DIARIAS
6.8 9.1 16.9
18.7
15.4
22.5
17.4
12.4
20.3
18.6
16.3
9.6 27.8
15.5
22.9
12.6
14.5
21.5
29.3
19.3
121
18.7
4.9 8.9 14.3
24.4
34.5
18.7
36.7
21.3
11.5
10.8
30.4
5.3 11.9
21.7
26.7
9.4 23.2
7.5 23.3
8.6 14.7
19.8
22.3
31.7
13.9
17.5
25.7
13.6
5.8
k) Una tabla de frecuencia
l) Un histograma y su respectivo polígono en valores absolutos
m) Un histograma y su respectivo polígono en valores relativos
n) Una ojiva menor que y otra mayor que en valores absolutos
o) Calcular el % de días con ventas diarias superiores a 20 millones de pesos ?
p) Calcular el numero de días con ventas inferiores a 20 millones de pesos ?
q) Calcular el numero de días con ventas entre 8.5 y 23.5 millones de pesos ?
r) Calcular el % de días con ventas entre 8.5 y 23.5 millones de pesos ?
s) Para que % de días, el valor de las ventas fueron inferiores a $18 millones de
pesos ?
t) Para que numero de días el valor de las ventas fueron inferiores a 28.5 millones de
pesos ?
3. La vida útil en almacenamiento de una película fotográfica de alta velocidad esta
siendo investigada por un grupo interdisciplinario en una empresa . Se disponen
de los siguientes datos que se muestran en la tabla adjunta.
TABLA 5. 13
VIDA UTIL DE PELÍCULA FOTOGRAFICA EN DIAS
110
165
128
137
127
125
160
140
121
141
115
151
125
127
148
114
142
124
128
150
150
121
122
134
133
126
120
135
140
122
127
126
125
122
125
130
128
142
127
135
155
135
145
124
141
165
145
128
125
150
a) Construya una tabla de frecuencia con 7 intervalos
b) Construya un histograma en valores absolutos y su respectivo polígono
c) Construya un histograma en valores relativos y su respectivo polígono
d) Construyas las ojivas en valores absolutos
e) Construya las ojivas en valores relativos
f) Calcule la media, la moda y la mediana
g) Calcule los cuartiles y los deciles
h) Saque conclusiones de los resultados.
4. El porcentaje de algodón en una tela utilizada para elaborar camisas para hombre
se muestran en la tabla adjunta.
122
TABLA 5. 14
CONTENIDO DE ALGODÓN EN PORCENTAJE
33.3 34.2 33.8 34.8 32.8 32.6 35.8 33.1 34.6 34.5
35.4 33.1 34.5 33.6 33.5 33.1 35.9 34.7 33.6 33.5
35.3 34.5 36.2 32.5 34.2 34.6 37.6 34.3 35.4 34.7
36.5 35.6 34.7 34.5 35.7 35.4 37.3 34.4 36.1 35.6
37.8 34.3 34.6 35.1 34.7 35.9 34.6 34.5 33.5 34.4
35.4 35.1 35.3 36.8 35.3 34.7 35.4 35.2 31.2 35.2
33.7 34.7 35.4 37.9 36.4 33.6 35.4 35.1 33.8 34.7
33.6 33.6 34.6 39.5 34.6 32.9 37.8 34.6 37.9 34.6
33.7 35.4 34.9 38.2 35.9 33.5 32.1 32.9 35.4 35.4
32.5 33.6 35.0 36.4 35.6 31.6 31.2 32.0 33.3 36.6
a) Construya una tabla de frecuencia
b) Construya un histograma y su respectivo polígono
c) Construya las ojivas mayores y menores que
d) Calcule las medidas de tendencia central mas adecuadas
e) Calcule los cuartiles y los percentiles 45 y 90
f) Saque conclusiones.
5. Los datos que se muestran en la siguiente tabla muestran el rendimiento % de la
refinación de 100 cargas o lotes de chatarra de cobre por el proceso de piro
refinación metalúrgica.
TABLA 5. 15
RENDIMIENTO DEL PROCESO DE PIROREFINACION ( %)
95.1 96.4 98.6 97.5 96.8 99.6 91.2 93.4 89.7 90.1
99.1 96.7 92.4 95.4 96.7 90.2 93.4 92.2 89.3 92.1
85.6 82.6 84.0 95.3 85.3 92.5 98.7 90.3 90.0 91.5
92.1 90.5 91.2 92.5 91.2 90.1 96.4 96.2 95.0 81.5
96.2 89.3 95.3 87.2 93.4 92.1 96.7 92.3 96.2 85.2
92.3 95.2 95.4 88.1 98.7 91.5 82.6 96.5 94.2 84.3
96.5 88.5 95.5 89.2 93.4 98.5 90.5 86.5 98.0 95.5
86.3 84.3 95.0 88.8 92.2 99.0 89.3 85.3 88.5 95.6
81.3 87.6 85.2 90.5 90.3 89.2 95.2 82.6 89.1 92.0
82.6 90.2 87.3 95.0 95.2 85.4 87.5 88.9 90.0 95.1
a) Construya una tabla de tabla de frecuencia con 10 intervalos
b) Construya un histograma y su respectivo polígono
c) Construya las ojivas mayor y menor que
d) Calcule la media , la mediana y la moda
e) Calcule los cuartiles analíticamente y compare los resultados con los obtenidos a
partir de las ojivas
f) Que porcentaje de cargas tienen rendimiento por encima del 95%
123
g) Cuantas cargas están ubicadas por debajo del primer cuartil
h) Saque conclusiones.
6. La siguiente tabla muestra los datos sobre el octanaje de varias mezclas de
gasolina.
TABLA 5. 16
OCTANAJE EN MEZCLAS DE GASOLINA
88.5 87.8 83.4 86.7 91.5 88.8 96.5 100.3 96.5 92.6
94.7 91.2 91.2 94.3 89.9 88.6 95.5 87.8 84.3 89.4
84.3 86.7 88.5 90.8 90.1 87.5 96.2 95.7 93.2 89.5
90.1 93.4 88.3 90.1 98.8 94.5 84.3 89.7 88.8 92.1
89.0 96.1 93.4 91.5 88.8 92.1 85.6 85.4 88.7 92.0
89.9 89.5 87.5 88.9 85.4 90.1 86.7 96.0 92.7 87.5
91.6 90.4 91.1 92.4 91.2 89.4 90.2 95.1 89.5 88.5
90.4 91.7 90.5 93.7 90.7 95.4 92.7 98.2 96.1 95.5
90.2 90.6 91.2 94.2 92.2 92.3 91.0 94.0 92.4 92.0
a) Construir una tabla de frecuencia con 9 intervalos
b) Construir un histograma y su respectivo polígono
c) Construir un juego de ojivas
d) Calcular la media, la mediana y la moda
e) Calcular los percentiles 20, 45, 65,85 y 95
f) Cuantas mezclas de gasolina están ubicadas en el 25% superior
g) Que porcentaje de mezclas de gasolina están en el 25% inferior
h) Sacar conclusiones
7. Laboratorios Sweet Dreams , interesado en acabar con el insomnio en los
pacientes que sufren de este tremendo flagelo, esta investigando los efectos que
surte su nuevo producto “ just dream flying”. Como parte del estudio se trataron 60
pacientes y se midió el tiempo que tardaba de comenzar a actuar dicho fármaco.
Los resultados en minutos se muestran en la siguiente tabla en valores brutos.
TABLA 5. 17
TIEMPO DE REACCION DEL FÁRMACO
JUST DREAM FYING
23.4 21.4 13.5 18.8 11.8
25.2 8.5 16.7 18.5 26.7
21.6 26.4 25.3 24.4 21.8
28.8 21.8 14.8 18.4 26.3
9.2 26.6 14.6 31.3 8.5
21.5 11.9 30.5 21.4 21.3
19.0 22.8 16.4 28.5 21.5
22.6 16.6 16.7 23.8 13.5
22.9 29.8 26.4 9.4 20.3
20.2 26.9 19.9 27.3 22.8
124
13.5 23.4 28.5 18.2 22.7
21.5 23.4 17.3 15.3 18.8
a) A partir de los datos redondeados , aplicando el criterio de la cifra par , construya
una tabla de frecuencia con 8 intervalos
b) Construya un histograma en valores y su respectivo polígono
c) Construya un juego de ojivas
d) Calcule el numero de paciente cuyo tiempo de reacción fue inferior a 23 minutos
e) Calcule el numero de paciente cuyo tiempo de reacción fue superior a 15 minutos
f) Calcule el porcentaje de paciente cuyo tiempo de reacción fue entre 11 y 23
minutos
g) Calcule el tiempo promedio de reacción
h) Calcule el tiempo de reacción de la mediana y el modal
i) Calcule el primer y tercer cuartil e interprete su resultado.
8. El salario promedio anual de una empresa de inversiones es de $ 792.500. Los
salarios promedios de los hombres y de las mujeres fueron de $ 950.000 y $
500.000 respectivamente. Hallar los porcentajes de hombres y de mujeres
empleados en la empresa ?
9. Si la edad promedio de los 6 integrante de mi grupo familiar es 30. Cual será
dentro de X años ?
10. Las ventas de un almacén se incrementaron en los últimos 5 años en los
siguientes porcentajes: 25%, 20% 18%, 23% y 17%, Calcule:
a) El porcentaje de incremento con base al primer año ?
b) El promedio geométrico del incremento anual ?
11. Los Salarios aumentaron en los últimos 4 años de la década pasada en Ecuador
en 28%,23%,27%, y 25% ; calcule:
a) la tasa de crecimiento total en los 4 años ? R/ 150%
b) La media anual de crecimiento ? R/ 25.75%
c) La media geométrica anual de crecimiento ? R/ 25.75%
12. La pérdida del poder adquisitivo de la moneda de un país en los últimos 5 años
fue del 20%, 15%, 25%, 30% y 27%; Calcule:
a) El porcentaje de perdida del valor del ultimo año respecto al primer año ?
b) El promedio geométrico de la perdida anual ?
13. En una industria se ha controlado el tiempo que tardan 3 obreros en ensamblar un
motor . Uno demora 6 horas, otro 8 horas y un tercero demora 5 horas. Encuentre
el rendimiento de un obrero cuyo trabajo sea representativo de los rendimientos de
los dos obreros (obrero tipo) que sirva de base para análisis financiero ?R/ 6.1
horas
14. En una empresa de transporte se estudió el tiempo empleados por los buses en el
recorrido de cierta ruta y se encontraron los siguientes tiempos para los 5 buses
asignados: 7.3 horas, 6.8 horas, 7.4 horas, 6.4 horas y 7.6 horas. Encuentre el
tiempo que debe asignarse a un bus tipo para estudios económicos ? R/ 7.07
horas
15. Un contratista recibe dos oferta para pintar un edificio: una cuadrilla de obreros
ofrece pintar el edificio en 28 días , la otra se compromete a hacerlo en 35 días. El
contratista decide entregar el trabajo a las dos cuadrillas para que trabajen
simultáneamente. Halle el tiempo que emplearán en pintar el edificio ?
125
16. Halle el valor promedio para un kilogramo de mercancía adquirida en 3 lotes así :
500 kilogramos a $ 25.40 cada uno, 300 kilogramos a $ 29.5 por kilogramo y 700
kilogramos a $ 23.60 cada uno ?
17. El salario promedio mensual de 90 trabajadores de una fabrica fue de $ 450.000.
Hallar el monto de la nomina mensual ?
18. Cuanto debe sacar Enrique Jr en el examen final de estadística para ganar la
materia , si esta se gana con 3.5 y las notas que obtuvo fueron 4.5 en el primer
parcial , 3.1 en el segundo parcial . las ponderaciones de los exámenes son 30,
30 y 40% para el primero, segundo y examen final respectivamente ?
19. Tres profesores de estadística dieron notas promedios en sus cursos con 40, 30 y
25 estudiantes de 3.5, 3.8 y 4.2 respectivamente . Cual fue la calificación media de
los 3 cursos ?
20. De 500 estudiantes universitarios cuya estatura media es de 1.65 metros , 150 son
mujeres. Si la estatura media de las mujeres es igual al 95% de la estatura de los
hombres. Cual es la estatura media de los hombres ?
21. En un curso hay 30 hombres con una edad media de 18 años y 20 mujeres , las
que en promedio son 20% mas jóvenes . Cual es la edad media del curso ?
22. Si la media aritmética de dos números es 5 y la media geométrica de los mismos
es 4. Cual es la media armónica ? R/ 3.2
23. Rene viaja en auto de la ciudad A hasta la ciudad B con una velocidad media de
40 km/h y vuelve de la ciudad B hasta la A con una velocidad media de 60 km/h.
Hallar la velocidad media del viaje completo ? R/ 48 km/h
24. Un avión vuela una distancia de 900 kilómetros . Si cubre el primer y el ultimo
tercio del viaje a 250 km/h y el tercio del medio a 300 km/h. Calcular la velocidad
media ? R/ 264.7 km/h
25. El precio medio de un centenar de artículos es de $ 85.70; los artículos se dividen
en dos grupos con medias de $ 75.80 y $ 97.80. Cuantos artículos hay encada
grupo ? R/ 45 y 55
26. En un examen realizado a tres cursos de estadística con un total de 100 alumnos,
el puntaje medio general fue de 70. Los puntajes medios de los grupos A y B
fueron de 71 y 65 respectivamente. Se perdieron los archivos con las notas del
curso C, pero los monitores recuerdan que los curso A y B tenían el mismo
numero de estudiantes, mientras el curso C tenía 5 estudiantes menos que el
curso A. Cual es el promedio de las notas del curso C ?
27. Hallar dos números cuya media aritmética es 9 y cuya media geométrica es 7.2 ?
28. Una suma P de dinero se invierte a un cierto interés . Después de 15 años el
dinero se ha triplicado . Cual será el saldo al final de los 20 años si el interés se
capitaliza:
a) Semestralmente ? R/ 4.326 P
b) mensualmente,
c) trimestralmente
29. Una empresa de transportes tiene 3 automotores diferentes que emplean en el
recorrido entre dos pueblos 16, 15 y 12 horas, respectivamente . Encuentre el
tiempo que emplearía un automotor tipo que sirva de base para un estudio de
costos ? R/ 14.12 horas
30. La población de un de Colombia creció en los últimos 5 años de 35 millones a 40.
millones; calcule:
a) La tasa de crecimiento total en los 5 años
b) La tasa de crecimiento anual
126
31. El gerente de Mercadeo de una distribuidora de café, tiene un grupo de 50
vendedores; cada año los vendedores reportan el precio promedio del kilogramo
de café dentro de su respectivas zonas . Con esta información el gerente elabora
la siguiente tabla adjunta.
TABLA 5. 18
PRECIO DEL KILOGRAMO DE CAFÉ
PRECIO
$ NUMERO DE
VENDEDORES
1000 - 1050
2
1050 - 1100
6
1100 - 1150
9
1150 - 1200
13
1200 - 1250
10
1250 - 1300
5
1300 - 1350
3
1350 - 1400
2
a) Elaborar un histograma en valores relativos y su polígono
b) Construir las ojivas en valores absolutos
c) Calcular los precios promedio, modal y mediano
d) Calcular todos los deciles e interpretarlos
32. La siguiente tabla adjunta muestra la distribución de cargas máximas en toneladas
que soportan los cables producidos por cierta fabrica:
TABLA 5. 19
CARGA MAXIMA
Carga máxima
En toneladas Numero de
Cables
9.3 - 9.7 2
9.8 - 10.2 5
10.3 - 10.7 12
10.8 - 11.2 17
11.3 - 11.7 14
11.8 - 12.2 6
12.3 - 12.7 3
12.8 - 13.2 1
a) Construir un histograma en valores relativos y su polígono
b) Construir las ojivas en valores absolutos
c) Determinar las cargas máxima media, modal y mediana
d) Los cuartiles e interpretar su resultado
33. La tabla adjunta recoge los ingresos anuales en dólares, de los agentes de bolsa
de una empresa de Corredores.
127
TABLA 5. 20
INGRESOS DE LOS CORREDORES EN 1999
INGRESOS
$ US NUMERO DE
CORREDORES
40.000 - 70.000 5
70.000 - 90.000 12
90.000 - 110.000 10
110.000 - 130.000
15
130.000 - 150.000
24
150.000 - 170.000
11
170.000 - 190.000
9
190.000 - 210.000
6
210.000 - 230.000
3
a) Calcular los ingresos medios , medianos y modales
b) Calcular los percentiles 10 y 90, explicar su significado
c) Calcular el numero de corredores con ingresos entre 115.000 y 215.000
d) Calcular el porcentaje de corredores con ingresos superiores al 75%
34. El Gerente general de una de una microempresa de electrónica, presentó
recientemente un componente revolucionario de un relé eléctrico que espera
tendrá una creciente aceptación . Ahora enfrenta al problema de decidir como
medir el crecimiento medio de sus ventas a lo largo de los últimos años . Usted
como asesor que le sugeriría ?
35. Como propietario de una agencia de publicidad, Mister Hurt gana 60 millones de
pesos anuales. Sus ochos 6 empleados mas recientes ganan 16, 25, 23, 28, 30 y
29. Que medida de tendencia central piensa usted que es la mejor indicación del
promedio de los 7 sueldos ?
36. A partir de una muestra aleatoria de la edad de 50 estudiantes de la facultad:
a) Elaborar una tabla de frecuencia
b) Construir un histograma en valores absolutos y su respectivo polígono
c) Construir un histograma en valores relativos y su respectivo polígono
d) Construir las ojivas en valores relativos
e) Construir las ojivas en valores absolutos
f) Calcular los cuartiles e interpretarlos
g) Calcular los deciles e interpretarlos
h) Sacar Conclusiones
128
** SUGERENCIA: Trate Inicialmente de resolver los ejercicios manualmente y chequee los
resultados de la mayor parte de los ejercicios utilizando cualquier software estadístico, ( SSPS
11, Excel , etc)
Copyright © ;Ing. Enrique A Hurtado Minotta, all rights reserved
REVISTAS ELECTRONICAS
37. Journal of Statistics Education. Excelente revista (¡gratuita!) editada por la
American Statistical Association sobre educación estadística (a todos los niveles)
38. Homepage de la American Statistical Association. La mayor asociación de
estadísticos, editora de Journal of Agricultural, Biological, and Environmental
Statistics, Journal of the American Statistical Association, Journal of Statistics
Education y The American Statistician entre otras revistas.
39. Environmental and Ecological Statistics
40. Community Ecology
41. Journal of Agricultural, Biological, and Environmental Statistics
42. Bulletin of the Ecological Society of America (gratuita; contiene artículos de
ecología estadística)
43. Journal of Statistical Software (gratuita)
44. InterStat (Statistics on the Internet) (gratuita)
45. Probability and Statistics Journals on the Web
ESTADISTICA ON LINE
217. Aula Virtual de Bioestadística, Universidad Complutense
218. Curso de bioestadística de la Universidad de Málaga
219. Apuntes de Bioestadística. Unidad de Bioestadística Clínica del Hospital
Ramón y Cajal
220. Lecciones de Estadística, 5campus.org (análisis multivariante...)
221. Curso de Bioestadística de la Universidad Nacional de Misiones (Argentina)
222. Curso de estadística (para ingenieros) de una universidad mexicana
223. Cursos de estadística de la Universidad de California, Los Angeles
224. Cursos de estadística de la Universidad de Michigan
225. Electronic Statistics Textbook
226. A New View of Statistics
227. HyperStat Statistics Textbook
228. Statistics at Square One
229. Statistics Every Writer Should Know
230. Introductory Statistics: Concepts, Models, and Applications
129
231. Multivariate Statistics: Concepts, Models, and Applications
232. A complete guide to nonlinear regression
233. Ordination Methods for Ecologists
234. Annotated Bibliography of Canonical Correspondence Analysis and related
constrained ordination methods 1986-1993
235. Multivariate Statistics: an Introduction
236. A glossary of ordination-related terms
237. Glossary of Statistical Terms and Medical Citations for Statistical Issues
238. Glossary of over 30 statistical terms
239. EVSC 503 Applied Statistics for the Environmental Sciences
240. http://s9000.furman.edu/mellonj/spss1.htm
241. http://www.indiana.edu/~statmath/stat/spss/win/index.html
242. http://www.utexas.edu/cc/stat/tutorials/spss/SPSS1/Outline1.html
243. http://web.uccs.edu/lbecker/SPSS/content.htm
244. http://core.ecu.edu/psyc/wuenschk/SPSS/SPSS-Data.htm
245. http://www.tulane.edu/~ panda2/Analysis2/ahome.html
246. http://www.shef.ac.uk/~ scharr/spss/index2.htm
247. http://calcnet.mth.cmich.edu/org/spss/index.html
248. http://calcnet.mth.cmich.edu/org/spss/toc.htm
249. http://www.public.asu.edu/~pythagor/spssworkbook.htm
250. http://lib.stat.cmu.edu/
251. http://www.stat.ufl.edu/vlib/statistics.html
252. http://www.statserv.com/softwares.html
253. http://www.maths.uq.edu.au/~gks/webguide/
254. http://www.statistics.com/
255. http://www.helsinki.fi/~jpuranen/links.html#stc
256. http://www.maths.uq.edu.au/~gks/webguide/free.html
257. http://nhsbig.inhs.uiuc.edu/
258. http://www.okstate.edu/artsci/botany/ordinate/software.htm
259. http://life.bio.sunysb.edu/ee/biometry/
260. http://life.bio.sunysb.edu/morph/software.html
261. http://pbil.univ-lyon1.fr/ADE-4/ADE-4.html
262. http://ourworld.compuserve.com/homepages/Rainer_Wuerlaender/statsoft.h
tm
130
263. http://www.stat.auckland.ac.nz/~mja/Programs.htm
264. http://it.stlawu.edu/~rlock/maa99/
265. http://it.stlawu.edu/~rlock/tise98/java.html
266. http://www.stat.vt.edu/~sundar/java/applets/
267. http://www.kuleuven.ac.be/ucs/java/index.htm
268. http://noppa5.pc.helsinki.fi/koe/
269. http://www2.kenyon.edu/people/hartlaub/MellonProject/mellon.html
Demostraciones Java para el aprendizaje de la estadística
270. Electronic Textbook (UCLA), programa on-line de representación y cálculo
de funciones de densidad y de distribución (normal, F, ji-cuadrado, números
aleatorios...). Equivalente a un libro de tablas
BIBLIOGRAFÍA
85. Montgomery Douglas y Runger George.( 1996), Probabilidad y Estadística
aplicada a la Ingeniería., Mcgraw-Hill, Mexico
86. Montgomery Douglas y Hines William.( 1995), Probabilidad y Estadística aplicada
a la Ingeniería. y Administración, segunda edición ,CECSA, México
87. Mendenhall William, Wackerly Dennis y Scheaffer Richard (1994), Estadística
Matemáticas con Aplicaciones , segunda edición, Grupo Editorial Iberoamerica. M,
México
88. Govinden Portus Lincoyan.( 1998), Introducción a la Estadística,. Mcgraw-Hill,
Santafé de Bogotá
89. Webster Allen L.( 1998), Estadística aplicada a la Empresa y a la Economía,
segunda edición, Mcgraw-Hill, Madrid
90. Kohler Heinz.( 1996), Estadística para Negocios y Economía, primera edición
,CECSA, México
91. Martinez Bencardino Ciro ( 1995), Estadística , sexta edición ,ECOE EDICIONES
Santafé de Bogotá.
92. Alvarez C Ricardo ( 1994), Estadística Fundamental Aplicada, primera edición
,PUBLIADCO, Cali
93. Estadística," Enciclopedia Microsoft® Encarta® 2000. © 1993-1999 Microsoft
Corporation.
94. Stockburger David W (1996) Introductory Statistics: Concepts, models an
applications, , http://www.psychstat.smsu.edu/sbk00.htm
95. Mendoza Duran Carlos. (1995 )Probabilidad y Estadística,
http://w3.mor.itesm.mx/~cmendoza/ma835/ma83500.html
96. Valdés Fernando ,Comprensión y uso de la estadística,
<