El análisis económico financiero de las empresas turísticas, muestra
cada día mayor relevancia y significación en la literatura nacional e
internacional, las técnicas tradicionales son empleadas con más
frecuencia y la evaluación de sus resultados permiten tomar las
decisiones adecuadas en el momento preciso. El presente artículo expone
y sugiere el empleo de herramientas de la estadística multivariada, las
que pueden ser utilizadas entre otros, en el sector empresarial y muy en
particular en el sector turístico. El trabajo muestra un ejemplo a
partir de un Caso de Estudio que intenta estimular su empleo por parte
de especialistas e investigadores en el área turística.
2. Comentarios acerca de las Técnicas Multivariadas
Las aplicaciones de la estadística multivariada están presentes en
distintas áreas o ramas de la ciencias, como por ejemplo en:
Investigación de mercados (para identificar características de los
individuos con el propósito de determinar qué tipo de personas compran
determinado producto); en el sistema de educación de cualquier tipo de
especialidad (para conocer los estudiantes que tendrán éxito y
concluirán satisfactoriamente sus estudios); en la agricultura (al
estudiar la resistencia de determinado tipo de cosechas a daños por
plagas y sequías); en el deporte (para conocer a partir de medidas
antropométricas las posibilidades de obtener buenos resultados en un
deporte específico); en la psicología (al estudiar la relación entre el
comportamiento de adolescentes y actitudes de los padres); en la
economía (para conocer el nivel de desarrollo de un territorio en
relación con otros y realizar inferencias a partir de variables
económicas fundamentales, entre otros).
Los datos multivariados surgen cuando a un mismo individuo se le mide
más de una característica de interés. Un individuo puede ser un objeto o
concepto que se puede medir. Más generalmente, los individuos son
llamados unidades experimentales. Ejemplos de objetos: personas,
animales, terrenos, compañías, países, etc. Ejemplos de conceptos: amor,
amistad, noviazgo, etc. Una variable es una característica o atributo
que se le mide a un individuo.
Objetivos de las técnicas multivariadas:
1) Simplificación: Los métodos multivariados son un conjunto de técnicas
que permiten al investigador interpretar y visualizar conjuntos grandes
de datos (tanto en individuos como en variables), a partir de su
simplificación o reducción.
2) Relación: Encontrar relaciones entre variables, entre individuos y
entre ambos.
2.1) Relación entre variables: Existe relación entre variables cuando
las mismas miden características comunes. Ejemplo: Suponga que se
realizan exámenes de español, matemática e historia a estudiantes de
nivel 12, seleccionados en las entidades turísticas del país, para el
ingreso en la carrera de licenciatura en turismo. Si cada uno de los
estudiantes obtiene calificaciones altas, regulares o bajas en los tres
exámenes, entonces los exámenes estarían relacionados entre sí. En este
caso, la característica común que estos exámenes pueden estar midiendo
podría ser la "inteligencia general" que les permita comenzar esa
carrera universitaria.
2.2) Relación entre individuos: Existe relación entre individuos si
alguno de ellos son semejantes entre sí. Ejemplo: Suponga que se evalúan
diferentes tipos de cervezas respecto a su nivel de aceptación y se
miden, por ejemplo, los consumos de las mismas para diferentes grupos de
edades, se podría esperar que las cervezas claras y oscuras tengan algún
tipo de relación, o que los tipos de cervezas sean totalmente
diferentes.

En los métodos multivariados, se supone que las variables están
correlacionadas, pero las observaciones sobre los individuos son
independientes. Generalmente se supone también que el conjunto de
variables que intervienen en el análisis poseen una distribución normal
multivariada. Esta suposición permite que el análisis multivariado se
desarrolle paralelamente al correspondiente análisis univariado basado
en una distribución normal.
Clasificación de los métodos multivariados:
1) Dirigidas o motivadas por las variables: se enfocan en las relaciones
entre variables.
Ejemplos: matrices de correlación, análisis de componentes principales,
análisis de factores y análisis de regresión.
2) Dirigidas o motivadas por los individuos: se enfocan en las
relaciones entre individuos. Ejemplos: análisis discriminante, análisis
de conglomerados y análisis multivariado de varianza.
Análisis exploratorio multivariado
Las estadísticas descriptivas (multivariadas), como su nombre lo indica,
sirven para describir el comportamiento de un conjunto de datos, entre
ellas las más importantes son:
· Media Muestral
· Varianza Muestral
· Correlación Muestral
· Diagrama de Dispersión
· Componentes Principales
Inferencia estadística
El problema de inferencia estadística consiste en aproximar el valor de
ciertas características poblacionales (llamadas parámetros) por medio de
resúmenes (llamados estadísticas) generados a partir de la información
contenida en una muestra obtenida de la población.
Estimación Puntual: El problema de estimación puntual consiste en
proporcionar un valor puntual que aproxime al parámetro de interés. Los
métodos clásicos de estimación puntual de parámetros son: método de
momentos y método de máxima verosimilitud.
Pruebas de Hipótesis: El problema de contraste de hipótesis en
estadística consiste en decidir cuál de dos hipótesis es correcta. La
decisión se toma de acuerdo con la información de la muestra.
La prueba de hipótesis de mayor importancia en datos multivariados es
probar si la correlación entre dos variables es significativamente
distinta de cero.
Intervalos de Confianza: El calcular un intervalo de confianza es un
problema de estimación por intervalo, en donde lo que se proporciona es
un conjunto de valores altamente posibles como aproximaciones al
parámetro.
Al igual que en el caso de pruebas de hipótesis, el intervalo de
confianza de mayor interés es el de la correlación entre dos variables.
Uso de correlaciones para agrupar variables. Es posible que cuando se
tiene un conjunto grande de variables, exista cierta relación entre
algunas de las variables. El coeficiente de correlación entre parejas de
variables permite agrupar variables de tal manera que variables en el
mismo grupo tengan correlaciones altas y variables en grupos diferentes
tengan correlaciones bajas.
Técnicas Seleccionadas del Análisis Multivariado
Análisis de Regresión Múltiple
La regresión es una técnica utilizada para la investigación y modelación
de las relaciones existentes entre variables que inciden en un
determinado fenómeno de la realidad. Un analista económico, por ejemplo,
pudiera estar interesado en establecer la relación que existe entre la
situación que presentan los índices financieros de una empresa y un
probable escenario de desequilibrio o no.
En un sentido amplio, la regresión es un proceso que tiene como
finalidad ajustar un modelo a un conjunto de datos u observaciones. En
realidad, la ecuación de regresión es sólo una aproximación de la
relación existente entre las variables. La regresión puede ser utilizada
como herramienta descriptiva o como herramienta inferencial.
En el primer caso, el investigador puede estar interesado en encontrar
la mejor ecuación lineal de predicción. También puede controlar un
conjunto de factores presentes en el fenómeno para evaluar. En el
segundo caso, o sea, inferencial, el investigador está interesado en
realizar estimaciones de los parámetros poblacionales a través del
examen de una muestra de observaciones y verificar algunas pruebas de
hipótesis tales como si existe realmente una relación lineal entre las
variables independientes, o sea, si una variable independiente
específica no tiene efecto lineal sobre la dependiente.
Análisis de Componentes Principales
El análisis de componentes principales (ACP), es una técnica estadística
que fue propuesta a principios del siglo XIX por Karl Pearson como parte
del análisis de factores. Sin embargo la complejidad de los cálculos
retrasó su desarrollo hasta la aparición de los computadores y su
utilización en la segunda mitad del siglo XX.
El objetivo principal que persigue el ACP es la representación de las
medidas numéricas de varias variables en un espacio de pocas dimensiones
donde nuestros sentidos puedan percibir relaciones que de otra manera
permanecerían ocultas en dimensiones superiores. Dicha representación
debe ser tal que al desechar dimensiones superiores (generalmente de la
tercera o cuarta en adelante) la pérdida de inormación sea mínima. Lo
anterior, aunque sugiere que el ACP es una técnica descriptiva, no niega
la posibilidad de que también pueda ser utilizado con fines de
inferencia.
El ACP permite reducir la dimensionalidad de los datos, transformando el
conjunto de p variables originales en otro conjunto de q variables
incorrelacionadas, llamadas componentes principales. Las p variables son
medidas sobre cada uno de los n individuos, obteniéndose una matriz de
datos de orden np (p < n). En el ACP existe la opción de usar la matriz
de correlaciones o bien, la matriz de covarianzas. En la primera opción
se le está dando la misma importancia a todas y a cada una de las
variables; esto puede ser conveniente cuando el investigador considera
que todas las variables son igualmente relevantes. La segunda opción se
puede utilizar cuando todas las variables tengan las mismas unidades de
medida y además, cuando el investigador juzga conveniente destacar cada
una de las variables en función de su grado de variabilidad.
Las q nuevas variables (componentes principales) son obtenidas como
combinaciones lineales de las variables originales. Los componentes se
ordenan en función del porcentaje de varianza explicada. En este
sentido, el primer componente será el más importante por ser el que
explica mayor porcentaje de la varianza de los datos. Queda a criterio
del investigador decidir cuántos componentes se elegirán en el estudio.
El ACP tiene la ventaja de no exigir supuestos tales como la normalidad.
Aplicaciones
Entre los usos más frecuentes del ACP están:
1) Como técnica de análisis exploratorio que permite descubrir
interrelaciones entre los datos y de acuerdo con los resultados,
proponer los análisis estadísticos más apropiados.
2) Reducir la dimensionalidad de la matriz de datos con el fin de evitar
redundancias y destacar relaciones. En la mayoría de los casos, tomando
sólo los primeros componentes, se puede explicar la mayor parte de la
variación total contenida en los datos originales.
3) Construir variables no observables (componentes) a partir de
variables observables. Por ejemplo, la inteligencia de una persona no es
observable directamente, en cambio, se puede medir distintos aspectos de
ésta mediante pruebas psicométricas. Las variables que miden los
distintos aspectos de la inteligencia tienden a covariar; esto sugiere
que expresan la mismas características pero de diferente forma y que
sólo hay un pequeño número de rasgos no directamente medibles, que se
denominan Indicadores sintéticos y que vienen estimados por los
componentes.
4) Bajo ciertas circunstancias, es de gran utilidad usar estos
componentes incorrelacionados, como datos de entrada para otros
análisis. Por ejemplo, en el caso de la regresión múltiple cuando las
variables independientes presentan alta colinealidad es preferible hacer
la regresión sobre los componentes principales en lugar de usar las
variables originales.
Análisis Discriminantes
Técnica y herramienta estadística que permite predecir el comportamiento
nominal de una variable dependiente a través de una combinación lineal
de las variables independientes, también llamadas variables predictivas,
características o parámetros, que hagan que los puntajes promedios de
las categorías de las variables dependientes en ésta combinación lineal
se diferencien en forma máxima.
Utilizada en investigaciones de mercado, por ejemplo, para predecir si
las ventas potenciales en un territorio dado de mercado serán "buenas" o
"malas" ,las variables dependientes, con base en ciertas evaluaciones
sobre el ingreso personal disponible por territorio, densidad de
población y número de ventas al detalle, las variables predictivas.
Otros ejemplos de aplicación es en instituciones financieras, donde
definidas cuentas "problemáticas" o "serias", a cada una de ellas se les
describe parámetros como tasas de crédito, números de veces en mora,
razones de deuda a capital, existencia de demandas, posteriormente se
obtienen aquellas variables predictivas que mejor puedan discriminar en
que una determinada unidad de análisis, individuos, objetos o en éste
caso una cuenta pueda convertirse en "seria " o "problemática". Dos son
los objetivos centrales del análisis discriminante:
1.-predecir la categoría de una unidad de análisis u objeto o individuo.
2.-determinar cuales son las variables predictoras con mayor poder
discriminante para clasificar a las unidades de análisis para que tengan
uno o el otro atributo de la variable dependiente.
La forma de conseguir los objetivos es vía la obtención de una función
discriminante:
FD = ß1 X1 + ß2 X2 + ...............+ ßm Xm
donde xm es la m-ésima variable independiente. La función discriminante
obtenida por programas computacionales como el systat, BMD-07M o el
statgrafics determinan los valores para cada variable independiente de
los ß que reciben el nombre de coeficientes discriminantes, betas
discriminantes o pesos discriminantes. Cada beta discriminante calculado
tiene un monto o coeficiente determinado y su correspondiente signo
positivo o negativo. El coeficiente de los betas determina el peso de
cada una de las variables independientes en la discriminación y el
signo, positivo o negativo, representa su asignación en uno u otro de
los subgrupos definidos por las variables dependientes. La finalidad es
remplazar una unidad de análisis, objeto o individuo de la población
objetivo con sus variables independientes, parámetros o característica
en la función obtenida y calcular a priori su categoría. Algebráicamnte
la función discriminante representa una combinatoria lineal de los datos
originales que maximizan la razón de variabilidad entre grupos (por una
parte la cuentas problemáticas y por otra las seria) a variabilidad
intra grupos. El criterio que se utiliza para decidir cuando son
diferentes al máximo la variabilidad de grupos es la prueba análisis de
varianza F o también denominada F de Snedecor, conocida para hallar
diferencias entre las varianzas. Por lo tanto, los coeficientes
discriminantes se derivan de tal forma que:
Variabilidad entre Grupos
F = --------------------------------- sea máxima
Variabilidad intra Grupos
El punto de partida de cualquier análisis discriminante es la
determinación de la matriz de datos de variables dependientes, de
carácter nominal, la que puede ser calculada por componentes principales
o dadas.
3. Un Caso de Estudio. Hoteles Miramar
La Cadena de Hoteles Miramar S.A., con 10 años de operación, ha
consolidado su posición en la zona del Caribe, con instalaciones en casi
todos los países del área. La Junta de Accionista ha solicitado a la
Junta de Dirección de sus hoteles, una clasificación de los mismos, de
acuerdo a los resultados de su actividad económica con el propósito de
tomar decisiones en aquellos que han quedado rezagados en sus metas.
Para realizar este trabajo, la Junta de Dirección contrata a una
consultora, dedicada a temas económicos y de auditoria, y le solicita
que se examinen en cada uno de los 30 hoteles que posee la Cadena las
variables siguientes: Crecimiento de las Ventas, de la Rentabilidad
Económica y el Costo por Peso.
La consultora decide que para lograr el objetivo propuesto debían apelar
a las técnicas multivariadas, específicamente al análisis de componentes
principales y el análisis discriminante. En el procesamiento de la
información se empleó el Sistema Statgraphics, de uso muy extendido. Los
resultados que se brindan a continuación provienen de los resultados que
brinda ese Sistema.
ANALISIS DE COMPONENTES PRINCIPALES
RESUMEN
Variables Analizadas:
Crecimiento de las Ventas
Rentabilidad Económica
Costo por peso
Número de casos: 30
Estandarización: si
Número de componentes extraídas: 1
Análisis de Componentes Principales
-----------------------------------------------------------------------------
Por ciento
Componente de
Varianza Por ciento
Número Valor Propio Explicada Acumulado
1 2,7729800 92,433 92,433
2 0,1507870 5,026 97,459
3 0,0762356 2,541 100,000
----------------------------------------------------------------------------
Comentario
---------------
El propósito ha sido obtener una combinación lineal de las 3 variables
estudiadas, que explique la mayor parte de la variabilidad de los datos,
en este caso, la primera componente explica el 92.433% de la
variabilidad de los datos originales.

Table of Component Weights
Componente
1
------------
Crecimiento de las Ventas 0,584118
Rentabilidad Económica 0,577760
Costo por peso 0,570088
Comentario
El cuadro anterior muestra los coeficientes de las variables de la
primera componente principal, cuya ecuación viene dada por:
0,584118*Crecimiento de las Ventas + 0,57776*Rentabilidad
Económica + 0,570088*Costo por peso
Donde a los valores de las variables en la ecuación han sido
estandarizados, es decir, se les ha sustraído sus valores medios y
divididos por la desviación estándar.
ANALISIS DISCRIMINANTE
Resumen
Variable de Clasificación: Col_7
Variables Independientes:
Crecimiento de las Ventas
Rentabilidad Económica
Costo por peso
Número de casos: 30
Número de Grupos: 2
Función
Porcentaje Correlación
Discriminante Valor Propio Relativo
Canónica
-----------------------------------------------------------------------------
1 3,14232 100,00
0,87097
Functions Wilks Chi-Square DF P-Value
Derived Lambda
-----------------------------------------------------------------------------
1 0,241411 37,6633
3 0,0000
Comentario
Este procedimiento está diseñado para obtener un conjunto de funciones
discriminantes que puedan ayudar a predecir la variable dependiente
basado en los valores cuantitativos de las variables independientes.
Unos 30 casos fueron empleados para obtener un modelo discriminante en
dos grupos. Tres variables predictivas fueron introducidas. La primera
función discriminante es estadísticamente significativa a un nivel de
significación del 95%.

Función Discriminante para la variable Dependiente
Coeficientes Estandarizados
---------------------------------
Rentabilidad Económica 0,736324
Crecimiento de las Ventas 0,171982
Costo por peso 0,196148
-----------------------------------------------------------------------
Coeficientes no Estandarizados
-------------------------------------
Rentabilidad Económica 0,1371040
Crecimiento de las Ventas
0,0454077
Costo por peso 0,0629418
Constante
-25,5891
Comentario
---------------
El cuadro anterior muestra los coeficientes de la función usada para
discriminar entre los diferentes niveles de la variable dependiente. De
particular interés son los coeficientes estandarizados. La primera
función discriminante estandarizada es:
0,736324*Rentabilidad Económica + 0,171982*Crecimiento de las Ventas +
0,196148*Costo por peso
A partir de las magnitudes relativas de los coeficientes de la ecuación
anterior, se puede determinar como la variable dependiente puede
emplearse para discriminar entre grupos.
Tabla de Clasificación
Tamaño Grupos
Grupos del Grupo 1 2
---------------------------------------------------------------
1 15 15 0
(100,0%) (0,0%)
2 15 0 15
(0,0%) (100,0%)
----------------------------------------------------------------
Por ciento de clasificación correcta: 100,0%
Resumen de las Estadísticas del Grupo
--------------------------------------------------------------------------------------------
Variable Dependiente 1
2 TOTAL
CANTIDAD 15
15 30
--------------------------------------------------------------------------------------------
MEDIAS
Rentabilidad Económica 97,38 115,227 106,303
Crecimiento de las Ventas 94,06 104,893 99,4767
Costo por peso
99,3667 107,093 103,23
---------------------------------------------------------------------------------------------
DEVIACIÓN ESTANDAR
Rentabilidad Económica 4,29737 6,26241 10,4986
Crecimiento de las Ventas 4,47386 2,94533 6,6485
Costo por peso 2,37296 3,71377 4,98163
---------------------------------------------------------------------------------------------
Coeficientes de la Función de Clasificación para la variable dependiente
------------------------------------------------------------------------------
1 2
Rentabilidad Económica -0,738405 -0,268809
Crecimiento de las Ventas 2,29896 2,45449
Costo por peso 9,06632 9,28191
Constante
-523,306 -610,951
Resultado
-523,306 - 0,738405*Rentabilidad Económica + 2,29896*Crecimiento de las
Ventas + 9,06632*Costo por peso
Esta función es utilizada como predictora de la variable dependiente
para las nuevas observaciones.
Estadísticas
Matriz de Covarianzas
Rentabilidad Económica Crecimiento Ventas Costo por peso
Rentabilidad Económica
28,8426
14,6768 9,36831
Crecimiento de las Ventas 14,6768
14,3452 7,93248
Costo por peso 9,36831 7,93248 9,71152
Matriz de Correlación
Rentabilidad Económica Crecimiento Ventas Costo por peso
Rentabilidad Económica 1,0
0,721541 0,559758
Crecimiento de las Ventas 0,721541
1,0 0,672066
Costo por peso 0,559758
0,672066
1,0
Comentario
Este cuadro muestra las correlaciones estimadas entre las variables
independientes dentro de cada Grupo.
La entidad consultora resume los resultados obtenidos de la forma
siguiente:
La mitad de los hoteles de la Cadena Miramar presentan problemas en sus
operaciones.
La metodología empleada y las ecuaciones encontradas permiten
discriminar si un Hotel se encuentra o no con problemas en sus
operaciones.
Este estudio deberá debe realizarse tanto en período de baja como alta
turística.
El indicador crecimiento de las ventas tiene el peso fundamental en el
resultado de las operaciones de los Hoteles, le sigue a continuación la
rentabilidad de las ventas y finalmente el costo por peso.
Se aconseja efectuar una revisión rigurosa de la situación que presentan
aquellos Hoteles que no logran estar en el grupo de resultados
satisfactorios.
4. Bibliografía
· Linares Fintes, Gladys; Acosta Ramírez, Liliam; Sintache Vega, Vivian.
¨ Estadística Multivariada ¨ENDES, Stgo de Cuba. Cuba. 1986.
· htpp://www.emagister.com//Comunidad_Emagister_quiebra_2001
· htpp://www.google.es//Análisis de Componentes Principales. ¨
Componentes Principales con Statgraphics ¨. 2005
· htpp://www.google.es//Análisis Multivariado. ¨ Análisis Multivariado¨.
2005
· htpp://www.google.es.//Análisis Discriminante. ¨ Salud Financiera de
una Empresa. Modelo Altman para Mercados Emergentes ¨. 2006
· htpp://www.google.es//Análisis Discriminante. ¨ Análisis Discriminante
¨. 2006