
En los métodos multivariados, se supone que las variables están
correlacionadas, pero las observaciones sobre los individuos son
independientes. Generalmente se supone también que el conjunto de
variables que intervienen en el análisis poseen una distribución normal
multivariada. Esta suposición permite que el análisis multivariado se
desarrolle paralelamente al correspondiente análisis univariado basado
en una distribución normal.
Clasificación de los métodos multivariados:
1) Dirigidas o motivadas por las variables: se enfocan en las relaciones
entre variables.
Ejemplos: matrices de correlación, análisis de componentes principales,
análisis de factores y análisis de regresión.
2) Dirigidas o motivadas por los individuos: se enfocan en las
relaciones entre individuos. Ejemplos: análisis discriminante, análisis
de conglomerados y análisis multivariado de varianza.
Análisis exploratorio multivariado
Las estadísticas descriptivas (multivariadas), como su nombre lo indica,
sirven para describir el comportamiento de un conjunto de datos, entre
ellas las más importantes son:
· Media Muestral
· Varianza Muestral
· Correlación Muestral
· Diagrama de Dispersión
· Componentes Principales
Inferencia estadística
El problema de inferencia estadística consiste en aproximar el valor de
ciertas características poblacionales (llamadas parámetros) por medio de
resúmenes (llamados estadísticas) generados a partir de la información
contenida en una muestra obtenida de la población.
Estimación Puntual: El problema de estimación puntual consiste en
proporcionar un valor puntual que aproxime al parámetro de interés. Los
métodos clásicos de estimación puntual de parámetros son: método de
momentos y método de máxima verosimilitud.
Pruebas de Hipótesis: El problema de contraste de hipótesis en
estadística consiste en decidir cuál de dos hipótesis es correcta. La
decisión se toma de acuerdo con la información de la muestra.
La prueba de hipótesis de mayor importancia en datos multivariados es
probar si la correlación entre dos variables es significativamente
distinta de cero.
Intervalos de Confianza: El calcular un intervalo de confianza es un
problema de estimación por intervalo, en donde lo que se proporciona es
un conjunto de valores altamente posibles como aproximaciones al
parámetro.
Al igual que en el caso de pruebas de hipótesis, el intervalo de
confianza de mayor interés es el de la correlación entre dos variables.
Uso de correlaciones para agrupar variables. Es posible que cuando se
tiene un conjunto grande de variables, exista cierta relación entre
algunas de las variables. El coeficiente de correlación entre parejas de
variables permite agrupar variables de tal manera que variables en el
mismo grupo tengan correlaciones altas y variables en grupos diferentes
tengan correlaciones bajas.
Técnicas Seleccionadas del Análisis Multivariado
Análisis de Regresión Múltiple
La regresión es una técnica utilizada para la investigación y modelación
de las relaciones existentes entre variables que inciden en un
determinado fenómeno de la realidad. Un analista económico, por ejemplo,
pudiera estar interesado en establecer la relación que existe entre la
situación que presentan los índices financieros de una empresa y un
probable escenario de desequilibrio o no.
En un sentido amplio, la regresión es un proceso que tiene como
finalidad ajustar un modelo a un conjunto de datos u observaciones. En
realidad, la ecuación de regresión es sólo una aproximación de la
relación existente entre las variables. La regresión puede ser utilizada
como herramienta descriptiva o como herramienta inferencial.
En el primer caso, el investigador puede estar interesado en encontrar
la mejor ecuación lineal de predicción. También puede controlar un
conjunto de factores presentes en el fenómeno para evaluar. En el
segundo caso, o sea, inferencial, el investigador está interesado en
realizar estimaciones de los parámetros poblacionales a través del
examen de una muestra de observaciones y verificar algunas pruebas de
hipótesis tales como si existe realmente una relación lineal entre las
variables independientes, o sea, si una variable independiente
específica no tiene efecto lineal sobre la dependiente.
Análisis de Componentes Principales
El análisis de componentes principales (ACP), es una técnica estadística
que fue propuesta a principios del siglo XIX por Karl Pearson como parte
del análisis de factores. Sin embargo la complejidad de los cálculos
retrasó su desarrollo hasta la aparición de los computadores y su
utilización en la segunda mitad del siglo XX.
El objetivo principal que persigue el ACP es la representación de las
medidas numéricas de varias variables en un espacio de pocas dimensiones
donde nuestros sentidos puedan percibir relaciones que de otra manera
permanecerían ocultas en dimensiones superiores. Dicha representación
debe ser tal que al desechar dimensiones superiores (generalmente de la
tercera o cuarta en adelante) la pérdida de inormación sea mínima. Lo
anterior, aunque sugiere que el ACP es una técnica descriptiva, no niega
la posibilidad de que también pueda ser utilizado con fines de
inferencia.
El ACP permite reducir la dimensionalidad de los datos, transformando el
conjunto de p variables originales en otro conjunto de q variables
incorrelacionadas, llamadas componentes principales. Las p variables son
medidas sobre cada uno de los n individuos, obteniéndose una matriz de
datos de orden np (p < n). En el ACP existe la opción de usar la matriz
de correlaciones o bien, la matriz de covarianzas. En la primera opción
se le está dando la misma importancia a todas y a cada una de las
variables; esto puede ser conveniente cuando el investigador considera
que todas las variables son igualmente relevantes. La segunda opción se
puede utilizar cuando todas las variables tengan las mismas unidades de
medida y además, cuando el investigador juzga conveniente destacar cada
una de las variables en función de su grado de variabilidad.
Las q nuevas variables (componentes principales) son obtenidas como
combinaciones lineales de las variables originales. Los componentes se
ordenan en función del porcentaje de varianza explicada. En este
sentido, el primer componente será el más importante por ser el que
explica mayor porcentaje de la varianza de los datos. Queda a criterio
del investigador decidir cuántos componentes se elegirán en el estudio.
El ACP tiene la ventaja de no exigir supuestos tales como la normalidad.
Aplicaciones
Entre los usos más frecuentes del ACP están:
1) Como técnica de análisis exploratorio que permite descubrir
interrelaciones entre los datos y de acuerdo con los resultados,
proponer los análisis estadísticos más apropiados.
2) Reducir la dimensionalidad de la matriz de datos con el fin de evitar
redundancias y destacar relaciones. En la mayoría de los casos, tomando
sólo los primeros componentes, se puede explicar la mayor parte de la
variación total contenida en los datos originales.
3) Construir variables no observables (componentes) a partir de
variables observables. Por ejemplo, la inteligencia de una persona no es
observable directamente, en cambio, se puede medir distintos aspectos de
ésta mediante pruebas psicométricas. Las variables que miden los
distintos aspectos de la inteligencia tienden a covariar; esto sugiere
que expresan la mismas características pero de diferente forma y que
sólo hay un pequeño número de rasgos no directamente medibles, que se
denominan Indicadores sintéticos y que vienen estimados por los
componentes.
4) Bajo ciertas circunstancias, es de gran utilidad usar estos
componentes incorrelacionados, como datos de entrada para otros
análisis. Por ejemplo, en el caso de la regresión múltiple cuando las
variables independientes presentan alta colinealidad es preferible hacer
la regresión sobre los componentes principales en lugar de usar las
variables originales.
Análisis Discriminantes
Técnica y herramienta estadística que permite predecir el comportamiento
nominal de una variable dependiente a través de una combinación lineal
de las variables independientes, también llamadas variables predictivas,
características o parámetros, que hagan que los puntajes promedios de
las categorías de las variables dependientes en ésta combinación lineal
se diferencien en forma máxima.
Utilizada en investigaciones de mercado, por ejemplo, para predecir si
las ventas potenciales en un territorio dado de mercado serán "buenas" o
"malas" ,las variables dependientes, con base en ciertas evaluaciones
sobre el ingreso personal disponible por territorio, densidad de
población y número de ventas al detalle, las variables predictivas.
Otros ejemplos de aplicación es en instituciones financieras, donde
definidas cuentas "problemáticas" o "serias", a cada una de ellas se les
describe parámetros como tasas de crédito, números de veces en mora,
razones de deuda a capital, existencia de demandas, posteriormente se
obtienen aquellas variables predictivas que mejor puedan discriminar en
que una determinada unidad de análisis, individuos, objetos o en éste
caso una cuenta pueda convertirse en "seria " o "problemática". Dos son
los objetivos centrales del análisis discriminante:
1.-predecir la categoría de una unidad de análisis u objeto o individuo.
2.-determinar cuales son las variables predictoras con mayor poder
discriminante para clasificar a las unidades de análisis para que tengan
uno o el otro atributo de la variable dependiente.
La forma de conseguir los objetivos es vía la obtención de una función
discriminante:
FD = ß1 X1 + ß2 X2 + ...............+ ßm Xm
donde xm es la m-ésima variable independiente. La función discriminante
obtenida por programas computacionales como el systat, BMD-07M o el
statgrafics determinan los valores para cada variable independiente de
los ß que reciben el nombre de coeficientes discriminantes, betas
discriminantes o pesos discriminantes. Cada beta discriminante calculado
tiene un monto o coeficiente determinado y su correspondiente signo
positivo o negativo. El coeficiente de los betas determina el peso de
cada una de las variables independientes en la discriminación y el
signo, positivo o negativo, representa su asignación en uno u otro de
los subgrupos definidos por las variables dependientes. La finalidad es
remplazar una unidad de análisis, objeto o individuo de la población
objetivo con sus variables independientes, parámetros o característica
en la función obtenida y calcular a priori su categoría. Algebráicamnte
la función discriminante representa una combinatoria lineal de los datos
originales que maximizan la razón de variabilidad entre grupos (por una
parte la cuentas problemáticas y por otra las seria) a variabilidad
intra grupos. El criterio que se utiliza para decidir cuando son
diferentes al máximo la variabilidad de grupos es la prueba análisis de
varianza F o también denominada F de Snedecor, conocida para hallar
diferencias entre las varianzas. Por lo tanto, los coeficientes
discriminantes se derivan de tal forma que:
Variabilidad entre Grupos
F = --------------------------------- sea máxima
Variabilidad intra Grupos
El punto de partida de cualquier análisis discriminante es la
determinación de la matriz de datos de variables dependientes, de
carácter nominal, la que puede ser calculada por componentes principales
o dadas.
3. Un Caso de Estudio. Hoteles Miramar
La Cadena de Hoteles Miramar S.A., con 10 años de operación, ha
consolidado su posición en la zona del Caribe, con instalaciones en casi
todos los países del área. La Junta de Accionista ha solicitado a la
Junta de Dirección de sus hoteles, una clasificación de los mismos, de
acuerdo a los resultados de su actividad económica con el propósito de
tomar decisiones en aquellos que han quedado rezagados en sus metas.
Para realizar este trabajo, la Junta de Dirección contrata a una
consultora, dedicada a temas económicos y de auditoria, y le solicita
que se examinen en cada uno de los 30 hoteles que posee la Cadena las
variables siguientes: Crecimiento de las Ventas, de la Rentabilidad
Económica y el Costo por Peso.
La consultora decide que para lograr el objetivo propuesto debían apelar
a las técnicas multivariadas, específicamente al análisis de componentes
principales y el análisis discriminante. En el procesamiento de la
información se empleó el Sistema Statgraphics, de uso muy extendido. Los
resultados que se brindan a continuación provienen de los resultados que
brinda ese Sistema.
ANALISIS DE COMPONENTES PRINCIPALES
RESUMEN
Variables Analizadas:
Crecimiento de las Ventas
Rentabilidad Económica
Costo por peso
Número de casos: 30
Estandarización: si
Número de componentes extraídas: 1
Análisis de Componentes Principales
-----------------------------------------------------------------------------
Por ciento
Componente de Varianza Por ciento
Número Valor Propio Explicada Acumulado
1 2,7729800 92,433 92,433
2 0,1507870 5,026 97,459
3 0,0762356 2,541 100,000
----------------------------------------------------------------------------
Comentario
---------------
El propósito ha sido obtener una combinación lineal de las 3 variables
estudiadas, que explique la mayor parte de la variabilidad de los datos,
en este caso, la primera componente explica el 92.433% de la
variabilidad de los datos originales.

Table of Component Weights
Componente
1
------------
Crecimiento de las Ventas 0,584118
Rentabilidad Económica 0,577760
Costo por peso 0,570088
Comentario
El cuadro anterior muestra los coeficientes de las variables de la
primera componente principal, cuya ecuación viene dada por:
0,584118*Crecimiento de las Ventas + 0,57776*Rentabilidad Económica +
0,570088*Costo por peso
Donde a los valores de las variables en la ecuación han sido
estandarizados, es decir, se les ha sustraído sus valores medios y
divididos por la desviación estándar.
ANALISIS DISCRIMINANTE
Resumen
Variable de Clasificación: Col_7
Variables Independientes:
Crecimiento de las Ventas
Rentabilidad Económica
Costo por peso
Número de casos: 30
Número de Grupos: 2
Función Porcentaje Correlación
Discriminante Valor Propio Relativo Canónica
-----------------------------------------------------------------------------
1 3,14232 100,00 0,87097
Functions Wilks Chi-Square DF P-Value
Derived Lambda
-----------------------------------------------------------------------------
1 0,241411 37,6633 3 0,0000
Comentario
Este procedimiento está diseñado para obtener un conjunto de funciones
discriminantes que puedan ayudar a predecir la variable dependiente
basado en los valores cuantitativos de las variables independientes.
Unos 30 casos fueron empleados para obtener un modelo discriminante en
dos grupos. Tres variables predictivas fueron introducidas. La primera
función discriminante es estadísticamente significativa a un nivel de
significación del 95%.

Función Discriminante para la variable Dependiente
Coeficientes Estandarizados
---------------------------------
Rentabilidad Económica 0,736324
Crecimiento de las Ventas 0,171982
Costo por peso 0,196148
-----------------------------------------------------------------------
Coeficientes no Estandarizados
-------------------------------------
Rentabilidad Económica 0,1371040
Crecimiento de las Ventas 0,0454077
Costo por peso 0,0629418
Constante -25,5891
Comentario
---------------
El cuadro anterior muestra los coeficientes de la función usada para
discriminar entre los diferentes niveles de la variable dependiente. De
particular interés son los coeficientes estandarizados. La primera
función discriminante estandarizada es:
0,736324*Rentabilidad Económica + 0,171982*Crecimiento de las Ventas +
0,196148*Costo por peso
A partir de las magnitudes relativas de los coeficientes de la ecuación
anterior, se puede determinar como la variable dependiente puede
emplearse para discriminar entre grupos.
Tabla de Clasificación
Tamaño Grupos
Grupos del Grupo 1 2
---------------------------------------------------------------
1 15 15 0
(100,0%) (0,0%)
2 15 0 15
(0,0%) (100,0%)
----------------------------------------------------------------
Por ciento de clasificación correcta: 100,0%
Resumen de las Estadísticas del Grupo
--------------------------------------------------------------------------------------------
Variable Dependiente 1 2 TOTAL
CANTIDAD 15 15 30
--------------------------------------------------------------------------------------------
MEDIAS
Rentabilidad Económica 97,38 115,227 106,303
Crecimiento de las Ventas 94,06 104,893 99,4767
Costo por peso 99,3667 107,093 103,23
---------------------------------------------------------------------------------------------
DEVIACIÓN ESTANDAR
Rentabilidad Económica 4,29737 6,26241 10,4986
Crecimiento de las Ventas 4,47386 2,94533 6,6485
Costo por peso 2,37296 3,71377 4,98163
---------------------------------------------------------------------------------------------
Coeficientes de la Función de Clasificación para la variable dependiente
------------------------------------------------------------------------------
1 2
Rentabilidad Económica -0,738405 -0,268809
Crecimiento de las Ventas 2,29896 2,45449
Costo por peso 9,06632 9,28191
Constante -523,306 -610,951
Resultado
-523,306 - 0,738405*Rentabilidad Económica + 2,29896*Crecimiento de las
Ventas + 9,06632*Costo por peso
Esta función es utilizada como predictora de la variable dependiente
para las nuevas observaciones.
Estadísticas
Matriz de Covarianzas
Rentabilidad Económica Crecimiento Ventas Costo por
peso
Rentabilidad Económica 28,8426
14,6768 9,36831
Crecimiento de las Ventas 14,6768
14,3452 7,93248
Costo por peso 9,36831 7,93248 9,71152
Matriz de Correlación
Rentabilidad Económica Crecimiento Ventas Costo por
peso
Rentabilidad Económica 1,0 0,721541
0,559758
Crecimiento de las Ventas 0,721541
1,0 0,672066
Costo por peso 0,559758 0,672066
1,0
Comentario
Este cuadro muestra las correlaciones estimadas entre las variables
independientes dentro de cada Grupo.
La entidad consultora resume los resultados obtenidos de la forma
siguiente:
La mitad de los hoteles de la Cadena Miramar presentan problemas en sus
operaciones.
La metodología empleada y las ecuaciones encontradas permiten
discriminar si un Hotel se encuentra o no con problemas en sus
operaciones.
Este estudio deberá debe realizarse tanto en período de baja como alta
turística.
El indicador crecimiento de las ventas tiene el peso fundamental en el
resultado de las operaciones de los Hoteles, le sigue a continuación la
rentabilidad de las ventas y finalmente el costo por peso.
Se aconseja efectuar una revisión rigurosa de la situación que presentan
aquellos Hoteles que no logran estar en el grupo de resultados
satisfactorios.
4. Bibliografía
· Linares Fintes, Gladys; Acosta Ramírez, Liliam; Sintache Vega, Vivian.
¨ Estadística Multivariada ¨ENDES, Stgo de Cuba. Cuba. 1986.
· htpp://www.emagister.com//Comunidad_Emagister_quiebra_2001
· htpp://www.google.es//Análisis de Componentes Principales. ¨
Componentes Principales con Statgraphics ¨. 2005
· htpp://www.google.es//Análisis Multivariado. ¨ Análisis Multivariado¨.
2005
· htpp://www.google.es.//Análisis Discriminante. ¨ Salud Financiera de
una Empresa. Modelo Altman para Mercados Emergentes ¨. 2006
· htpp://www.google.es//Análisis Discriminante. ¨ Análisis Discriminante
¨. 2006
Rigoberto Fernández Licenciado en Matemática. Especialidad Estadística Matemática. Profesor de la Escuela de Altos Estudios de Hotelería y Turismo. Es autor de un libro sobre temas económicos y ha colaborado y realizado artículos para revistas y eventos científicos. Ha participado en la elaboración de materiales de apoyo a la docencia y realizado asesoramiento teórico y práctico en temas económicos en instalaciones gastronómicas, tiendas minoristas y hoteles. Posee educación post graduada tanto en el país como en el extranjero y participado en eventos internacionales. Participó en el diseño de planes de estudio y programas en especialidades económicas. rfernandezarrobaeaeht.tur.cu -
Acerca de GestioPolis
Participar en la comunidad
Derechos de Autor
GestioPolis es la primera comunidad de conocimiento en negocios de Hispanoamérica
Derechos Reservados sobre el concepto del sitio web
GestioPolis.com © 2008 Carlos López / Webprofit Ltda.
| Hazte miembro de GestioPolis |
|
Y Descarga 11 eBooks
GRATIS |