Introducción
El análisis económico financiero de las empresas turísticas, muestra cada día mayor relevancia y significación en la literatura nacional e internacional, las técnicas tradicionales son empleadas con más frecuencia y la evaluación de sus resultados permiten tomar las decisiones adecuadas en el momento preciso. El presente artículo expone y sugiere el empleo de herramientas de la estadística multivariada, las que pueden ser utilizadas entre otros, en el sector empresarial y muy en particular en el sector turístico. El trabajo muestra un ejemplo a partir de un Caso de Estudio que intenta estimular su empleo por parte de especialistas e investigadores en el área turística.
Comentarios acerca de las Técnicas Multivariadas
Las aplicaciones de la estadística multivariada están presentes en distintas áreas o ramas de la ciencias, como por ejemplo en: Investigación de mercados (para identificar características de los individuos con el propósito de determinar qué tipo de personas compran determinado producto); en el sistema de educación de cualquier tipo de especialidad (para conocer los estudiantes que tendrán éxito y concluirán satisfactoriamente sus estudios); en la agricultura (al estudiar la resistencia de determinado tipo de cosechas a daños por plagas y sequías); en el deporte (para conocer a partir de medidas antropométricas las posibilidades de obtener buenos resultados en un deporte específico); en la psicología (al estudiar la relación entre el comportamiento de adolescentes y actitudes de los padres); en la economía (para conocer el nivel de desarrollo de un territorio en relación con otros y realizar inferencias a partir de variables económicas fundamentales, entre otros).
Los datos multivariados surgen cuando a un mismo individuo se le mide más de una característica de interés. Un individuo puede ser un objeto o concepto que se puede medir. Más generalmente, los individuos son llamados unidades experimentales. Ejemplos de objetos: personas, animales, terrenos, compañías, países, etc. Ejemplos de conceptos: amor, amistad, noviazgo, etc. Una variable es una característica o atributo que se le mide a un individuo.
Objetivos de las técnicas multivariadas:
- Simplificación: Los métodos multivariados son un conjunto de técnicas que permiten al investigador interpretar y visualizar conjuntos grandes de datos (tanto en individuos como en variables), a partir de su simplificación o reducción.
- Relación: Encontrar relaciones entre variables, entre individuos y entre ambos.
Relación entre variables
Existe relación entre variables cuando las mismas miden características comunes. Ejemplo: Suponga que se realizan exámenes de español, matemática e historia a estudiantes de nivel 12, seleccionados en las entidades turísticas del país, para el ingreso en la carrera de licenciatura en turismo. Si cada uno de los estudiantes obtiene calificaciones altas, regulares o bajas en los tres exámenes, entonces los exámenes estarían relacionados entre sí. En este caso, la característica común que estos exámenes pueden estar midiendo podría ser la «inteligencia general» que les permita comenzar esa carrera universitaria.
Relación entre individuos
Existe relación entre individuos si alguno de ellos son semejantes entre sí. Ejemplo: Suponga que se evalúan diferentes tipos de cervezas respecto a su nivel de aceptación y se miden, por ejemplo, los consumos de las mismas para diferentes grupos de edades, se podría esperar que las cervezas claras y oscuras tengan algún tipo de relación, o que los tipos de cervezas sean totalmente diferentes.
En los métodos multivariados, se supone que las variables están correlacionadas, pero las observaciones sobre los individuos son independientes. Generalmente se supone también que el conjunto de variables que intervienen en el análisis poseen una distribución normal multivariada. Esta suposición permite que el análisis multivariado se desarrolle paralelamente al correspondiente análisis univariado basado en una distribución normal.
Clasificación de los métodos multivariados:
- Dirigidas o motivadas por las variables: se enfocan en las relaciones entre variables. Ejemplos: matrices de correlación, análisis de componentes principales, análisis de factores y análisis de regresión.
- Dirigidas o motivadas por los individuos: se enfocan en las relaciones entre individuos. Ejemplos: análisis discriminante, análisis de conglomerados y análisis multivariado de varianza.
Análisis exploratorio multivariado
Las estadísticas descriptivas (multivariadas), como su nombre lo indica, sirven para describir el comportamiento de un conjunto de datos, entre ellas las más importantes son:
- Media Muestral
- Varianza Muestral
- Correlación Muestral
- Diagrama de Dispersión
- Componentes Principales
Inferencia estadística
El problema de inferencia estadística consiste en aproximar el valor de ciertas características poblacionales (llamadas parámetros) por medio de resúmenes (llamados estadísticas) generados a partir de la información contenida en una muestra obtenida de la población.
Estimación Puntual: El problema de estimación puntual consiste en proporcionar un valor puntual que aproxime al parámetro de interés. Los métodos clásicos de estimación puntual de parámetros son: método de momentos y método de máxima verosimilitud.
Pruebas de Hipótesis: El problema de contraste de hipótesis en estadística consiste en decidir cuál de dos hipótesis es correcta. La decisión se toma de acuerdo con la información de la muestra.
La prueba de hipótesis de mayor importancia en datos multivariados es probar si la correlación entre dos variables es significativamente distinta de cero.
Intervalos de Confianza: El calcular un intervalo de confianza es un problema de estimación por intervalo, en donde lo que se proporciona es un conjunto de valores altamente posibles como aproximaciones al parámetro.
Al igual que en el caso de pruebas de hipótesis, el intervalo de confianza de mayor interés es el de la correlación entre dos variables.
Uso de correlaciones para agrupar variables. Es posible que cuando se tiene un conjunto grande de variables, exista cierta relación entre algunas de las variables. El coeficiente de correlación entre parejas de variables permite agrupar variables de tal manera que variables en el mismo grupo tengan correlaciones altas y variables en grupos diferentes tengan correlaciones bajas.
Técnicas Seleccionadas del Análisis Multivariado
Análisis de Regresión Múltiple
La regresión es una técnica utilizada para la investigación y modelación de las relaciones existentes entre variables que inciden en un determinado fenómeno de la realidad. Un analista económico, por ejemplo, pudiera estar interesado en establecer la relación que existe entre la situación que presentan los índices financieros de una empresa y un probable escenario de desequilibrio o no.
En un sentido amplio, la regresión es un proceso que tiene como finalidad ajustar un modelo a un conjunto de datos u observaciones. En realidad, la ecuación de regresión es sólo una aproximación de la relación existente entre las variables. La regresión puede ser utilizada como herramienta descriptiva o como herramienta inferencial.
En el primer caso, el investigador puede estar interesado en encontrar la mejor ecuación lineal de predicción. También puede controlar un conjunto de factores presentes en el fenómeno para evaluar. En el segundo caso, o sea, inferencial, el investigador está interesado en realizar estimaciones de los parámetros poblacionales a través del examen de una muestra de observaciones y verificar algunas pruebas de hipótesis tales como si existe realmente una relación lineal entre las variables independientes, o sea, si una variable independiente específica no tiene efecto lineal sobre la dependiente.
Análisis de Componentes Principales
El análisis de componentes principales (ACP), es una técnica estadística que fue propuesta a principios del siglo XIX por Karl Pearson como parte del análisis de factores. Sin embargo la complejidad de los cálculos retrasó su desarrollo hasta la aparición de los computadores y su utilización en la segunda mitad del siglo XX.
El objetivo principal que persigue el ACP es la representación de las medidas numéricas de varias variables en un espacio de pocas dimensiones donde nuestros sentidos puedan percibir relaciones que de otra manera permanecerían ocultas en dimensiones superiores. Dicha representación debe ser tal que al desechar dimensiones superiores (generalmente de la tercera o cuarta en adelante) la pérdida de inormación sea mínima. Lo anterior, aunque sugiere que el ACP es una técnica descriptiva, no niega la posibilidad de que también pueda ser utilizado con fines de inferencia.
El ACP permite reducir la dimensionalidad de los datos, transformando el conjunto de p variables originales en otro conjunto de q variables incorrelacionadas, llamadas componentes principales. Las p variables son medidas sobre cada uno de los n individuos, obteniéndose una matriz de datos de orden np (p < n). En el ACP existe la opción de usar la matriz de correlaciones o bien, la matriz de covarianzas. En la primera opción se le está dando la misma importancia a todas y a cada una de las variables; esto puede ser conveniente cuando el investigador considera que todas las variables son igualmente relevantes. La segunda opción se puede utilizar cuando todas las variables tengan las mismas unidades de medida y además, cuando el investigador juzga conveniente destacar cada una de las variables en función de su grado de variabilidad.
Las q nuevas variables (componentes principales) son obtenidas como combinaciones lineales de las variables originales. Los componentes se ordenan en función del porcentaje de varianza explicada. En este sentido, el primer componente será el más importante por ser el que explica mayor porcentaje de la varianza de los datos. Queda a criterio del investigador decidir cuántos componentes se elegirán en el estudio. El ACP tiene la ventaja de no exigir supuestos tales como la normalidad.
Aplicaciones
Entre los usos más frecuentes del ACP están:
- Como técnica de análisis exploratorio que permite descubrir interrelaciones entre los datos y de acuerdo con los resultados, proponer los análisis estadísticos más apropiados.
- Reducir la dimensionalidad de la matriz de datos con el fin de evitar redundancias y destacar relaciones. En la mayoría de los casos, tomando sólo los primeros componentes, se puede explicar la mayor parte de la variación total contenida en los datos originales.
- Construir variables no observables (componentes) a partir de variables observables. Por ejemplo, la inteligencia de una persona no es observable directamente, en cambio, se puede medir distintos aspectos de ésta mediante pruebas psicométricas. Las variables que miden los distintos aspectos de la inteligencia tienden a covariar; esto sugiere que expresan la mismas características pero de diferente forma y que sólo hay un pequeño número de rasgos no directamente medibles, que se denominan Indicadores sintéticos y que vienen estimados por los componentes.
- Bajo ciertas circunstancias, es de gran utilidad usar estos componentes incorrelacionados, como datos de entrada para otros análisis. Por ejemplo, en el caso de la regresión múltiple cuando las variables independientes presentan alta colinealidad es preferible hacer la regresión sobre los componentes principales en lugar de usar las variables originales.
Análisis Discriminantes
Técnica y herramienta estadística que permite predecir el comportamiento nominal de una variable dependiente a través de una combinación lineal de las variables independientes, también llamadas variables predictivas, características o parámetros, que hagan que los puntajes promedios de las categorías de las variables dependientes en ésta combinación lineal se diferencien en forma máxima.
Utilizada en investigaciones de mercado, por ejemplo, para predecir si las ventas potenciales en un territorio dado de mercado serán «buenas» o «malas» ,las variables dependientes, con base en ciertas evaluaciones sobre el ingreso personal disponible por territorio, densidad de población y número de ventas al detalle, las variables predictivas. Otros ejemplos de aplicación es en instituciones financieras, donde definidas cuentas «problemáticas» o «serias», a cada una de ellas se les describe parámetros como tasas de crédito, números de veces en mora, razones de deuda a capital, existencia de demandas, posteriormente se obtienen aquellas variables predictivas que mejor puedan discriminar en que una determinada unidad de análisis, individuos, objetos o en éste caso una cuenta pueda convertirse en «seria » o «problemática». Dos son los objetivos centrales del análisis discriminante:
- predecir la categoría de una unidad de análisis u objeto o individuo.
- determinar cuales son las variables predictoras con mayor poder discriminante para clasificar a las unidades de análisis para que tengan uno o el otro atributo de la variable dependiente.
La forma de conseguir los objetivos es vía la obtención de una función discriminante:
FD = ß1 X1 + ß2 X2 + ……………+ ßm Xm
donde xm es la m-ésima variable independiente. La función discriminante obtenida por programas computacionales como el systat, BMD-07M o el statgrafics determinan los valores para cada variable independiente de los ß que reciben el nombre de coeficientes discriminantes, betas discriminantes o pesos discriminantes. Cada beta discriminante calculado tiene un monto o coeficiente determinado y su correspondiente signo positivo o negativo. El coeficiente de los betas determina el peso de cada una de las variables independientes en la discriminación y el signo, positivo o negativo, representa su asignación en uno u otro de los subgrupos definidos por las variables dependientes. La finalidad es remplazar una unidad de análisis, objeto o individuo de la población objetivo con sus variables independientes, parámetros o característica en la función obtenida y calcular a priori su categoría. Algebráicamnte la función discriminante representa una combinatoria lineal de los datos originales que maximizan la razón de variabilidad entre grupos (por una parte la cuentas problemáticas y por otra las seria) a variabilidad intra grupos. El criterio que se utiliza para decidir cuando son diferentes al máximo la variabilidad de grupos es la prueba análisis de varianza F o también denominada F de Snedecor, conocida para hallar diferencias entre las varianzas. Por lo tanto, los coeficientes discriminantes se derivan de tal forma que:
Variabilidad entre Grupos
F = ——————————— sea máxima
Variabilidad intra Grupos
El punto de partida de cualquier análisis discriminante es la determinación de la matriz de datos de variables dependientes, de carácter nominal, la que puede ser calculada por componentes principales o dadas.
Un Caso de Estudio. Hoteles Miramar
La Cadena de Hoteles Miramar S.A., con 10 años de operación, ha consolidado su posición en la zona del Caribe, con instalaciones en casi todos los países del área. La Junta de Accionista ha solicitado a la Junta de Dirección de sus hoteles, una clasificación de los mismos, de acuerdo a los resultados de su actividad económica con el propósito de tomar decisiones en aquellos que han quedado rezagados en sus metas.
Para realizar este trabajo, la Junta de Dirección contrata a una consultora, dedicada a temas económicos y de auditoria, y le solicita que se examinen en cada uno de los 30 hoteles que posee la Cadena las variables siguientes: Crecimiento de las Ventas, de la Rentabilidad Económica y el Costo por Peso.
La consultora decide que para lograr el objetivo propuesto debían apelar a las técnicas multivariadas, específicamente al análisis de componentes principales y el análisis discriminante. En el procesamiento de la información se empleó el Sistema Statgraphics, de uso muy extendido. Los resultados que se brindan a continuación provienen de los resultados que brinda ese Sistema.
Análisis de componentes principales
Resumen
Variables Analizadas:
Crecimiento de las Ventas
Rentabilidad Económica
Costo por peso
Número de casos: 30
Estandarización: si
Número de componentes extraídas: 1
Análisis de Componentes Principales
—————————————————————————–
Por ciento
Componente de Varianza Por ciento
Número Valor Propio Explicada Acumulado
1 2,7729800 92,433 92,433
2 0,1507870 5,026 97,459
3 0,0762356 2,541 100,000
—————————————————————————-
Comentario
—————————————————————————-
El propósito ha sido obtener una combinación lineal de las 3 variables estudiadas, que explique la mayor parte de la variabilidad de los datos, en este caso, la primera componente explica el 92.433% de la variabilidad de los datos originales.
Table of Component Weights
Componente 1
—————————————————————————-
Crecimiento de las Ventas 0,584118
Rentabilidad Económica 0,577760
Costo por peso 0,570088
—————————————————————————-
Comentario
—————————————————————————-
El cuadro anterior muestra los coeficientes de las variables de la primera componente principal, cuya ecuación viene dada por:
0,584118*Crecimiento de las Ventas + 0,57776*Rentabilidad Económica + 0,570088*Costo por peso
Donde a los valores de las variables en la ecuación han sido estandarizados, es decir, se les ha sustraído sus valores medios y divididos por la desviación estándar.
Análisis discriminante
Resumen
Variable de Clasificación: Col_7
Variables Independientes:
Crecimiento de las Ventas
Rentabilidad Económica
Costo por peso
Número de casos: 30
Número de Grupos: 2
Función Porcentaje Correlación
Discriminante Valor Propio Relativo Canónica
—————————————————————————–
1 3,14232 100,00 0,87097
Functions Wilks Chi-Square DF P-Value
Derived Lambda
—————————————————————————–
1 0,241411 37,6633 3 0,0000
—————————————————————————-
Comentario
—————————————————————————-
Este procedimiento está diseñado para obtener un conjunto de funciones discriminantes que puedan ayudar a predecir la variable dependiente basado en los valores cuantitativos de las variables independientes. Unos 30 casos fueron empleados para obtener un modelo discriminante en dos grupos. Tres variables predictivas fueron introducidas. La primera función discriminante es estadísticamente significativa a un nivel de significación del 95%.
Función Discriminante para la variable Dependiente
Coeficientes Estandarizados
———————————
Rentabilidad Económica 0,736324
Crecimiento de las Ventas 0,171982
Costo por peso 0,196148
———————————————————————–
Coeficientes no Estandarizados
————————————-
Rentabilidad Económica 0,1371040
Crecimiento de las Ventas 0,0454077
Costo por peso 0,0629418
Constante -25,5891
—————————————————————————-
Comentario
—————————————————————————-
El cuadro anterior muestra los coeficientes de la función usada para discriminar entre los diferentes niveles de la variable dependiente. De particular interés son los coeficientes estandarizados. La primera función discriminante estandarizada es:
0,736324*Rentabilidad Económica + 0,171982*Crecimiento de las Ventas + 0,196148*Costo por peso
A partir de las magnitudes relativas de los coeficientes de la ecuación anterior, se puede determinar como la variable dependiente puede emplearse para discriminar entre grupos.
Tabla de Clasificación
Tamaño Grupos
Grupos del Grupo 1 2
—————————————————————
1 15 15 0
(100,0%) (0,0%)
2 15 0 15
(0,0%) (100,0%)
—————————————————————-
Por ciento de clasificación correcta: 100,0%
Resumen de las Estadísticas del Grupo
——————————————————————————————–
Variable Dependiente 1 2 TOTAL
CANTIDAD 15 15 30
——————————————————————————————–
MEDIAS
Rentabilidad Económica 97,38 115,227 106,303
Crecimiento de las Ventas 94,06 104,893 99,4767
Costo por peso 99,3667 107,093 103,23
———————————————————————————————
DEVIACIÓN ESTANDAR
Rentabilidad Económica 4,29737 6,26241 10,4986
Crecimiento de las Ventas 4,47386 2,94533 6,6485
Costo por peso 2,37296 3,71377 4,98163
———————————————————————————————
Coeficientes de la Función de Clasificación para la variable dependiente
——————————————————————————
1 2
Rentabilidad Económica -0,738405 -0,268809
Crecimiento de las Ventas 2,29896 2,45449
Costo por peso 9,06632 9,28191
Constante -523,306 -610,951
Resultado
-523,306 – 0,738405*Rentabilidad Económica + 2,29896*Crecimiento de las Ventas + 9,06632*Costo por peso
Esta función es utilizada como predictora de la variable dependiente para las nuevas observaciones.
Estadísticas
Matriz de Covarianzas
Rentabilidad Económica Crecimiento Ventas Costo por peso
Rentabilidad Económica 28,8426 14,6768 9,36831
Crecimiento de las Ventas 14,6768 14,3452 7,93248
Costo por peso 9,36831 7,93248 9,71152
Matriz de Correlación
Rentabilidad Económica Crecimiento Ventas Costo por peso
Rentabilidad Económica 1,0 0,721541 0,559758
Crecimiento de las Ventas 0,721541 1,0 0,672066
Costo por peso 0,559758 0,672066 1,0
Comentario
Este cuadro muestra las correlaciones estimadas entre las variables independientes dentro de cada Grupo.
La entidad consultora resume los resultados obtenidos de la forma siguiente:
La mitad de los hoteles de la Cadena Miramar presentan problemas en sus operaciones.
La metodología empleada y las ecuaciones encontradas permiten discriminar si un Hotel se encuentra o no con problemas en sus operaciones.
Este estudio deberá debe realizarse tanto en período de baja como alta turística.
El indicador crecimiento de las ventas tiene el peso fundamental en el resultado de las operaciones de los Hoteles, le sigue a continuación la rentabilidad de las ventas y finalmente el costo por peso.
Se aconseja efectuar una revisión rigurosa de la situación que presentan aquellos Hoteles que no logran estar en el grupo de resultados satisfactorios.
Bibliografía
- Linares Fintes, Gladys; Acosta Ramírez, Liliam; Sintache Vega, Vivian. ¨ Estadística Multivariada ¨ENDES, Stgo de Cuba. Cuba. 1986.
- htpp://www.emagister.com//Comunidad_Emagister_quiebra_2001
- htpp://www.google.es//Análisis de Componentes Principales. ¨ Componentes Principales con Statgraphics ¨. 2005
- htpp://www.google.es//Análisis Multivariado. ¨ Análisis Multivariado¨. 2005
- htpp://www.google.es.//Análisis Discriminante. ¨ Salud Financiera de una Empresa. Modelo Altman para Mercados Emergentes ¨. 2006
- htpp://www.google.es//Análisis Discriminante. ¨ Análisis Discriminante ¨. 2006