El presente trabajo intenta mostrar las bondades de los métodos estadísticos de pronósticos en el turismo, al constituir herramientas de gran valor en el proceso de dirección, en el cual, uno de los aspectos a tomar en cuenta es la previsión de las situaciones a las que se enfrentará la organización con el mayor nivel de certidumbre. Son técnicas de amplio uso y de probada validez en el mundo contemporáneo y en todas las ramas de la ciencia y la técnica. Hoy día es casi imposible operar una organización sin contar con pronósticos acerca del desarrollo futuro de la misma, tomando en cuenta, para ello, tanto el comportamiento del entrono en que se desarrolla la misma como sus problemas internos. Se realiza un análisis de series anuales y mensuales de los arribos de turistas a una instalación. Se emplean métodos de análisis de regresión y alisamiento exponencial y sus resultados, constituye un punto de partida para el diseño de estrategias futuras.
Introducción
Toda entidad turística debe poseer información general y particular
sobre los mercados que emiten turistas hacia él y observar su
comportamiento, además de conocer sobre otros que potencialmente puedan
ser de su interés. Pero el hecho cierto es que debe contarse con
información que sustente las decisiones que se tomen. Lo cual le
facilitará, entender y prever los resultados que obtendrá con cierto
nivel de certidumbre.
El presente trabajo está orientado a realizar un estudio del
comportamiento de los arribos de turistas a un hotel durante los últimos
8 años (2000-2007), concentrándose en los cuatro países de mayor emisión
(Mercado 1, Mercado 2, Mercado 3 y Mercado 4), a partir de los cual se
obtienen pronósticos de los arribos para el 2008 con el propósito de
fundamentar las acciones comerciales que se deben acometer.
Para realizar este estudio se utilizaron las técnicas estadísticas de
Regresión Lineal y Análisis de la Series Cronológicas de los arribos de
turistas durante el período seleccionado.
Marco Teórico Referencial
Definición de Serie de Tiempo, conceptos, pasos para su análisis.
Definición de Serie de Tiempo: Se llama Serie de Tiempo, Serie
Cronológica, Time Series, a un conjunto de observaciones que toma una
variable en diferentes momentos del tiempo.
A continuación definiremos los componentes principales que caracterizan
una serie de tiempo: tendencia, estacionalidad y aleatoriedad.
Tendencia: Es la componente de largo plazo que constituye la base del
crecimiento o declinación de una serie histórica. Las fuerzas básicas
que producen o afectan la tendencia de una serie son: cambios en la
población, inflación, cambio tecnológico e incremento en la
productividad, entre otros.
Estacionalidad: Las fluctuaciones estaciónales se encuentran típicamente en los datos clasificados por trimestre mes o semana. La variación estacional se refiere a un patrón de cambio regularmente recurrente a través del tiempo. El movimiento se completa dentro de la duración de un año y se repite así mismo años tras año.
Aleatoriedad: Los movimientos irregulares (al azar) representan todos
los tipos de movimientos de una serie de tiempo que no sea tendencia,
variaciones estaciónales y fluctuaciones cíclicas.
Un modelo clásico para una serie de tiempo, supone que una serie x(1),
..., x(n) puede ser expresada como suma o producto de tres componentes:
tendencia, estacionalidad y un término de error aleatorio. No se ha
considerado el componente cíclico en este caso, dado la limitada
información con que se contó y al hecho de que los pronósticos se
refieren a un horizonte corto.
Existen tres modelos de series de tiempos, que generalmente se aceptan
como buenas aproximaciones a las verdaderas relaciones, entre los
componentes de los datos observados.Estos son:
1. Aditivo: X(t) = T(t) + E(t) + A(t)
2. Multiplicativo: X(t) = T(t) • E(t) • A(t)
3. Mixto: X(t) = T(t) • E(t) + A(t)
Donde:
X(t) serie observada en instante t.
T(t) componente de tendencia.
E(t) componente estacional.
A(t) componente aleatoria (accidental).
Una suposición usual es que A(t) sea un componente aleatorio o ruido
blanco con media cero y varianza constante (homocedasticidad).
Cuando el pronóstico se basa en los datos de la serie de tiempo, la
construcción del modelo matemático o función de pronóstico tiene que ir
precedida por el análisis de las mismas.
Para analizar cualquier serie de tiempo el primer paso a seguir es:
Detectar Outlier, se refiere a puntos de la serie que se escapan de lo
normal. Un outliers es una observación de la serie que corresponde a un
comportamiento anormal del fenómeno (sin incidencias futuras) o a un
error de medición. Se debe determinar desde fuera si un punto dado es
outlier o no. Si se concluye que lo es, se debe omitir o reemplazar por
otro valor antes de analizar la serie.
Existen varios métodos para la estimación, en nuestro caso empleamos el
Método de descomposición en tendencia y estacionalidad el que consiste
en calcular tendencia de la serie original, separando el movimiento
regular a largo plazo del conjunto de oscilaciones.
1- Estimación de la tendencia.
Existen varios métodos para estimar la tendencia los más usados consisten en:
a) Ajustar una función del tiempo, como un polinomio, una exponencial
u otra función suave de t.
b) Media móvil simple ponderada o alisamiento exponencial.
c) Utilizar diferencias.
El inconveniente que presentan los promedios móviles es que como los
mismos no representan una función matemática, no pueden ser utilizados
para la elaboración de pronósticos y en la práctica sólo son empleados
como vía para la determinación del componente estacional.
En el trabajo que se desarrolla se utiliza el modelo de regresión
lineal, donde la variable denominada independiente es el tiempo y la
variable dependiente lo constituyen las cifras de arribos de los
diferentes mercados analizados.
Uno de los aspectos que se tuvo en cuenta en la aplicación del modelo de
regresión lineal antes descrito, fue la comprobación de las hipótesis
del modelo, cuestión de suma importancia, pues contribuye a tenar la
garantía requerida respecto a los estimadores de los parámetros del
modelo (estimadores eficientes), obtenidos a partir de la aplicación de
los mínimos cuadrados.
En el análisis de las series cronológicas de esos mercados pero con una
periodicidad mensual se empleó el método de alisamiento exponencial de
Holt–Winters (tanto aditivo como multiplicativo), este procedimiento
utiliza para el cálculo de la estacionalidad el modelo X-11,
desarrollado por el Buró de Censos de EEUU.
2- Eliminar la tendencia de la serie.
Esta operación consiste en restar de la serie original la tendencia
si el modelo es aditivo o dividiendo la serie original por la tendencia
si el modelo es multiplicativo.
Las series generadas a partir de la original por eliminación de la
tendencia se denominan “series de residuos” y deberán contener
predominantemente fluctuaciones estaciónales.
3. Estimación de la estacionalidad.
Se puede calcular por el método porcentaje medio, método porcentaje de la tendencia y método promedio móvil en porcentaje.
3.1 Método del porcentaje medio: En este método expresamos los datos de cada mes como porcentajes del promedio anual. Los porcentajes para meses correspondientes en distintos años se promedian entonces (usando una media o una mediana). Los doce porcentajes resultantes dan el índice estacional.
3.2 Método del porcentaje de tendencia: En este método expresamos los datos para cada mes como porcentajes de valores de tendencia mensuales. Un promedio apropiado de los porcentajes para meses correspondientes da entonces el índice requerido.
3.3 Método del promedio móvil en porcentaje: En este método
calculamos un promedio móvil de doce meses. Como los resultados
obtenidos así caen entre meses sucesivos en lugar de en el centro del
mes (que es donde caen los datos originales), calculamos un promedio
móvil de dos meses de ese promedio móvil de doce meses.
El resultado se llama a veces un promedio móvil de doce meses centrado.
Tras hacer eso, expresamos los datos originales de cada mes como un
porcentaje del promedio móvil centrado de 12 meses que corresponde a los
datos originales. Los porcentajes de los meses correspondientes se
promedian a continuación, dando el índice buscado.
4. Comparar el comportamiento de las cifras reales y los valores
correspon-dientes ajustados por el modelo.
Consiste en comparar los valores reales con los ajustados según el
modelo empleado, con el propósito de observar el comportamiento de los
errores, de manera que su magnitud debe ser pequeña, menor o a lo sumo
igual a un 5 %.
5. Finalmente, realizamos los pronósticos del siguiente período.
Estos pronósticos deben ser ajustados sistemáticamente, en la medida que se vayan conociendo las cifras reales del período en cuestión, aspecto que permitirá perfeccionar el modelo de pronóstico. En esa actualización es necesario volver a reconstruir el modelo, a la luz de la nueva información.
Los pronósticos así obtenidos, deben ser considerados como un
elemento adicional de apoyo para la toma de decisiones, aspecto sobre el
cual se hizo referencia anteriormente.
Análisis de Regresión, conceptos y métodos estadísticos.
Cuando se requiere establecer una relación de dependencia entre dos o
más variables para conocer como afecta una variable los cambios
producidos por la otra requerimos encontrar la ecuación que ofrezca tal
relación por lo que definimos como Ecuación de Regresión aquella que
expresa la relación entre la variable aleatoria Y y una variable X (no
aleatoria), de la forma Y=f(X), que pasa por el promedio de Y para cada
valor fijo de X; es decir, E (Y/X =f(x).
El análisis de regresión está relacionado con el estudio de la
dependencia de una variable, la variable dependiente, de una o más
variables adicionales, las variables explicativas con la perspectiva de
estimar y/o predecir el valor (poblacional) medio o promedio de la
primera en términos de valores conocidos o fijos (en muestreos
repetidos) de la segunda.
En el análisis de regresión estamos interesados en estimar o predecir el
valor promedio de una variable con base a los valores fijos de otras
variables, mientras que en el análisis de correlación, el objetivo
fundamental es la medición de la fuerza o grado de asociación lineal
entre dos variables. El coeficiente de correlación mide esta fuerza de
asociación.
Aunque el análisis de regresión tiene que ver con la dependencia de una
variable con relación a otras variables, esto no implica necesariamente
que exista una relación de causalidad. Al respecto, Kendall y Stuart,
señalan: “Una relación estadística, independientemente de que tan fuerte
y aparente sea, nunca puede establecer una conexión causal: nuestras
ideas de causación deben provenir de las estadísticas externas y en
última instancia, de algún tipo de teoría”.
Método de los mínimos cuadrados
El principio o método de los mínimos cuadrados selecciona el β1, y el β2 de tal forma que para un conjunto muestras, la suma de los cuadrados de los errores, Σei², es la más pequeña posible. En otras palabras, para una muestra dada, el método MCO nos brinda estimadores únicos de β1, y el β2 que producen el valor más pequeño posible de Σei².
Como el propósito del modelo no es solo estimar el o los coeficientes
de la regresión, sino hacer inferencia sobre los verdaderos valores de
los parámetros, entonces se hace necesario establecer los siguientes
supuestos:
1. El modelo de regresión es lineal en los parámetros.
Yi=B1+B2Xi+Ui i=1,2,…..,n Las variables deben ser lineales en sus
valores originales o después de alguna transformación adecuada.
La bondad del ajuste de un modelo de regresión puede conocerse por dos
vías: Los valores del coeficiente de determinación R² o por la
aplicación de la prueba F de Snedecor. En el primer caso, en la medida
que el R², que se define como el cociente entre la suma de cuadrados
explicada por la regresión y la suma de cuadrados total, se aproxime a
uno, el ajuste es mejor, y si se aproxima a cero el ajuste es malo. En
el caso de la prueba F, la cuestión es comparar la F calculada a partir
del análisis de varianza y la tabulada que está presente en las tablas
estadísticas; si la F obtenida de la información es superior a la de la
tabla, para un nivel de significación dado, entonces el ajuste es bueno.
2. El valor esperado de la perturbación aleatoria debe ser cero para
cualquier observación. E(Ui)=0 para todo i.
3. La varianza de las perturbaciones es constante (homocedasticidad)
Var(Ui)=d2 para toda i.
4. Independencia o no autocorrelación entre las perturbaciones.
Dados dos valores cualesquiera de X, XiXj para i¹ j, la correlación
entre Ui, Uj es cero. Cov(UiUj) para cualquier i¹ j
5. Independencia entre Ui y Xj para toda i y j.
Cov(UiXj)=0 i difiere de j para toda i y j
6. Normalidad Ui esta normalmente distribuido para toda i. Lo anterior
implica que: Ui ®IN(0,d2)
7. Debe disponerse de una información estadística suficientemente amplia
sobre el conjunto de variables observables implicadas en el modelo. Como
requisito mínimo para que pueda determinarse una solución se exige que
el numero de datos (n) debe ser superior al numero de parámetros (k)
(n>k).
Comprobación de los Supuestos del Modelo
Para la comprobación de los supuestos existen varios métodos
estadísticos, en los cuales se corroboran dos tipos de hipótesis que a
continuación explicamos:
La hipótesis que se prueba se conoce como hipótesis nula y se denota
como H0 y esta se contrasta frente a otra hipótesis llamada hipótesis
alternativa y se denota como H1.
La probabilidad de rechazar H0 cuando de hecho es verdadera se conoce
como el nivel de significación, que se denota por la letra griega (α).
En las pruebas de hipótesis es posible cometer 2 tipos de errores:
1. Rechazar H0 cuando es verdadero, esto se conoce como error Tipo I,
o error (α). (se llama nivel de significación del contraste).
2. No rechazar cuando es falsa, esto se conoce como error Tipo II o
error β (1-β) se conoce como potencia de la prueba.
Þ a= Prob (Rechazar H0/ H0 es verdadero)
Þ b= Prob (No rechazar H0/ H0 es falsa)
Métodos Estadísticos Aplicados:
1- Jarque–Vera para la Prueba de la Normalidad.
H0: U: sigue una distribución Normal.
H1: U: no sigue una Normal.
Región Crítica o de rechazo: W = {J-B > χ2{ 1 – α (p) }
o Se rechaza H0 cuando el valor de J-B cae en la región crítica, esto
significa que no hay normalidad.
o Se acepta H0 cuando J-B ≤ χ² 1 – α (p) (distribución ji cuadrado con p
grados de libertad y un nivel de significación α)
o El J-B se obtiene como salida del Eview.
o Si p-valor < α se rechaza H0
o Si p -valor > α no se rechaza H0
o p -valor = Probability.
2- Breusch–Godfrey Prueba de Autocorrelación (los residuos siguen algún
patrón)
H0: α1 = α2 = .…. αp = 0 no hay autocorrelación de orden p (número de
retardos)
H1: Algún αi ≠ 0 hay autocorrelación.
p -valor (salida del sistema Eview) < α se rechaza H0.
p -valor (salida del sistema Eview) > α No se rechaza H0.
3- Prueba de White se aplica par conocer si existe heterocedasticidad.
(Se detecta cuando aparecen patrones en los diagramas de dispersión de
e² contra Y).
H0: αi = 0 homocedasticidad.
H1: Algún αi ≠ 0 heterocedasticidad.
p-valor (salida del Eview) > α homocedasticidad.
p-valor (salida del Eview) ≤ α heterocedasticidad.
p-valor (salida del Eview) = Obs*R-squared.
En nuestro caso, como sólo se trabajo con una sola variable
independiente (el tiempo), no se analizó la multicolinealidad de las
variables dependientes.
En el análisis de las series cronológicas mensuales, se aplicó el
conocido procedimiento de alisamiento exponencial, en particular el del
Holt–Winters con estacionalidad aditiva y multiplicativa.
Alisamiento exponencial. Lo que trata es suavizar la serie y expresar
los pronósticos como una combinación ponderada de dos cantidades, el
valor de la variable real en el período anterior y el pronóstico hecho
para ese período de la variable. Se tiene en cuenta un valor de
ponderación (constante de suavización denominada (α) que determina en
que medida el período más reciente contribuye al pronóstico. El método
de alisamiento exponencial es útil cuando la serie cronológica no
presenta tendencia ni estacionalidad.
Una variante del método anterior es la denominada técnica de Alisamiento
Exponencial Holt–Winters, aplicado en series que presentan componente de
tendencia y estacionalidad.
Método de Holt–Winters
I.- Características principales.
Este procedimiento de alisado se ha de utilizar cuando se observa que
en la serie conviven un marcado componente de tendencia así como un
componente estacional apreciable. Se trata, como se verá a continuación,
de un procedimiento similar al de Holt, pero que incluye una ecuación
más para tratar el componente estacional.
Al igual que en el resto de alisados, la aproximación a cada componente
se realiza condensando la información existente hasta el momento t-1
para generar el valor de la serie en t, y posteriormente se agregan los
diferentes componentes.
Dado que hay dos formas principales de agregar los diferentes
componentes (tendencia y estacionalidad en este caso) se dice que éste
método puede tener por tanto dos formulaciones:
a) Método Holt-Winters aditivo: Los diferentes componentes se combinan
sumando donde “a” es la constante, “b” la tendencia y “c” el componente
estacional.
Ŷt+k=at+btk+ct+k-s
b) Método Holg-Winters multiplicativo: El componente estacional “c”
multiplica a la constante y a la tendencia (“a” y “b”).
Ŷt+k=(at+btk)ct+k-1
II.- Procedimiento (esquema multiplicativo)
En este documento el objetivo principal es desarrollar el esquema multiplicativo. El método aditivo sigue etapas análogas a las que veremos para el método multiplicativo, sin embargo las aproximaciones de los diversos componentes siguen formulaciones diferentes, y, tal y como hemos indicado en el apartado anterior, la manera de agregar dichos componentes para generar finalmente la serie alisada es también diferente.
La variable alisada, que denominaremos ŷ será:
Ŷt+k=(at+btk)ct+k-1
Donde:
a.- representa una parte constante (un volumen de ventas de carácter
fijo, en el caso de modelar las ventas de una empresa).
b.- representa la pendiente de la componente de tendencia (el ritmo
estructural de crecimiento o decrecimiento del volumen de ventas).
c.- representa el factor estacional en el periodo t (el incremento o
descenso del volumen de ventas que viene explicado por el momento del
tiempo en que se produce).
Las aproximaciones que este método plantea para los tres componentes son
las siguientes:
at=a1(Yt/ct-s)+(1-a2)(at-1+bt-2)
bt=a2(at-at-1)+(1-a2)bt-1
ct=a3(Yt/at)+(1-a3)ct-s)
Donde: “s” es un valor que depende de la frecuencia. Si la frecuencia de
la serie es anual “s” igual a 12 mientras que si la frecuencia es
trimestral la “s” toma el valor de 4.
Si se analiza la primera de las ecuaciones, se puede observar como
ofrece un valor de la constante en el momento t, tomando en primer lugar
la información que ofrece el valor de Yt corregido de estacionalidad, y
luego se añade la información que aportan los valores del momento
inmediatamente anterior tomando la suma de la estimación de la tendencia
más la constante del periodo anterior.
La segunda de las ecuaciones aproxima el valor de la tendencia en t
tomando por un lado la diferencia de las estimaciones de las constantes
en t y en t-1 y por otro lado el valor de la tendencia en el momento
anterior.
La tercera y última ofrece un acercamiento a los factores estaciónales,
tomando en consideración en primer lugar un acercamiento al efecto
estacional en el momento t, que se consigue dividiendo el valor de la
serie original en t entre una estimación de la constante (o nivel medio)
en t, y en segundo lugar el valor del factor estacional en el mismo
periodo del año anterior.
III.- Valores iniciales
En este, al igual que en el resto de procedimientos recursivos, se nos plantea el problema de dotar al proceso de valores iniciales, pues en los momentos de comienzo no hay historia suficiente como para poder calcularlos.
Las alternativas habitualmente utilizadas para generar los valores
iniciales de los diversos componentes son:
Valor inicial de la constante
a) Tomar un promedio de periodos completos. Se suele utilizar la
media del primer año o de los dos primeros años cuando el crecimiento
tendencial no es elevado. En caso de crecimientos tendenciales elevados
se utiliza el promedio del año para el cual se comienza a alisar la
serie (por lo general el segundo año, ya que las observaciones del
primer año y parte del segundo son utilizadas para obtener los valores
iniciales estaciónales)
b) Ajustar la serie a una función lineal con los datos del primer o dos
primeros años, y tomar como valor inicial el valor de la estimación de
la constante.
Valor inicial del componente tendencia.
a) Tomar la diferencia de la media de los valores de la serie del
segundo año menos la media de los valores del primer año, dividiendo
todo ello por la frecuencia de la serie para obtener un valor en la
escala adecuada.
b) Ajustando la serie original con una función lineal tomando los datos
del primer o dos primeros años, y utilizando la estimación del parámetro
tendencial como valor inicial.
Valores iniciales de los componentes estaciónales.
En este caso no se calcula un solo valor inicial sino hasta “s” valores
iniciales siendo “s” 12 en caso de frecuencia mensual, o 4 en caso de
frecuencia trimestral.
Los factores estaciónales iniciales se obtendrán siguiendo los pasos
explicados en la sección 3 de esta asignatura, que por recordar
brevemente se basaba en dividir el valor de la serie original en el
momento t entre un dos medias móviles centradas de orden 12 consecutivas
(de este modo se consigue eliminar del valor de la variable en el
momento t el nivel medio del año que rodea a cada observación).
Posteriormente se obtiene un promedio de cada uno de los factores
estaciónales así calculados para toda la serie.
IV.- Alisado y previsión.
El alisado de la serie se realiza en el periodo histórico, aplicando las fórmulas ya vistas para el cálculo de “a”, “b” y los “s” factores estaciónales y realizando en cada momento una previsión para el momento t+1.
Cuando se finalizan los datos históricos (momento t), la previsión
para el horizonte t+k, se realiza como ya se ha indicado siguiendo la
siguiente fórmula:
Ŷt+k=(at+btk)ct+k-s
Tanto para el alisado, como para la previsión será necesario asignar
valores a los tres parámetros que varían entre cero y uno. Al igual que
en los casos anteriores la selección de estos parámetros suele
realizarse en función de los valores que minimicen el valor del Error
Cuadrático medio.
Dado que al ser tres parámetros las combinaciones son múltiples se
aconseja comenzar ajustando los parámetros de uno en uno. En caso de la
tendencia sea elevada, se recomienda que los valores para a1 y a2 sean
elevados superiores a 0,7.
Importancia de la validación de los supuestos del modelo de regresión.
Si se cumplen las hipótesis del modelo, entonces, los estimadores
obtenidos por Mínimos Cuadrados Ordinarios (MCO) presentan las
siguientes Propiedades Probabilísticas:
Ø Lineales en Y
b*MCO=(X'X)-1X'Y=f(Y) y dado que las x son fijas en la muestra:
b*MCO=(X'X)-1X'Y=f(Y=f(u))
Ø Insesgadez
E(b*MCO)=E[(X'X)-1X'Y]=E[(X'X)-1X'(Xb+u)]=
=(X'X)-1X'Xb+E[(X'X)-1X'u]=b+ (X'X)-1X'E(u)= b*
Los estimadores por MCO son insesgados bajo el supuesto de que las x son
fijas.
Ø Optimalidad y eficiencia
V(b*MCO)=E[(b* -b)(b* -b)]=E[(X'X)-1X' u u'X(X'X)-1]=d
2u(X'X)-1(X'X)(X'X)-1] =d 2u(X'X)-1
Puede demostrarse, a través del Teorema de Gauss-Markov, que el
resultado obtenido es de varianza mínima.
Los estimadores por MCO son lineales insesgados y óptimos bajo los
supuestos de homocedasticidad y no autocorrelación.
Se plantea un nuevo supuesto adicional a las hipótesis básicas
planteadas anteriormente: La perturbación aleatoria sigue una
distribución Normal de acuerdo con esta estructura:
Las perturbaciones aleatorias que así se distribuyen se conocen como
ruido blanco.
Bajo este supuesto se podrían obtener un nuevo tipo de estimadores: los
de Máxima Verosimilitud. Para ello, bastaría con resolver un problema de
maximización de la función de probabilidad o verosimilitud. Se realizará
esta demostración para el modelo de regresión simple.
La idea que subyace es la de encontrar aquellos valores de los
parámetros que hacen máxima la probabilidad de que la muestra disponible
proceda de una población caracterizada por dichos parámetros.
Análisis Estadístico y Resultados
Para la realización de esta investigación se recopiló información sobre
la cantidad de turistas que arribaron al Hotel Excelencia, desde el año
2000 hasta el 2007, obtenidos de la base de datos histórica del Sistema
Informático. Esta información se tomó de forma anual y mensual para cada
mercado seleccionado y para el total de arribos de todos los mercados a
la instalación.
Estos datos se introdujeron como base de datos en el programa
informático Eview, a partir del cual se obtuvieron los resultados para
los distintos modelos de pronóstico que fueron analizados.
Adicionalmente el sistema realiza las pruebas estadísticas para validar
los supuestos del análisis de regresión. Toda la información que brinda
el sistema está representado por tablas y gráficos lo cual permite tomar
decisiones respecto al mejor modelo a emplear.
Debido a que se contó con datos anuales y mensuales se analizó la
información en dos variantes.
Variante I. Datos anuales.
a) Observación del diagrama de dispersión, con el propósito de
establecer el modelo de regresión a emplear.
b) Elaboración de la tabla de análisis de varianza para cada país.
c) Selección del modelo matemático.
d) Evaluación del comportamiento de las cifras reales y ajustadas.
e) Comprobación de los supuestos de los modelos lineales de regresión.
f) Elaboración de pronósticos.
Variante II. Datos mensuales:
a) Análisis de la serie de tiempo para datos mensuales por países.
b) Aplicación de la Técnica de Alisamiento de Holt–Winters para
estacionalidad aditiva y multiplicativa.
c) Selección del mejor modelo.
d) Elaboración de pronósticos.
Análisis de la regresión para datos anuales por países.
En el análisis de la regresión, se consideró como variable
independiente o explicativa: el tiempo y la variable dependiente o
explicada: los arribos de turistas para cada mercado.
Se obtuvo el modelo lineal aplicado a la información anual, para los
cuales se analizaron los supuestos de:
1- Ajuste de la Ecuación de Regresión. Apreciar si el coeficiente de
determinación, R² se aproxima al valor uno. Adicionalmente, aplicar la
prueba F, para verificar también el ajuste de la ecuación.
2- Homocedasticidad (varianza de los errores es constante). Prueba de
White.
3- Correlación serial (no autocorrelación de errores, los errores deben
ser independientes). Pruebas de Durbin Watson y de Breusch–Godfrey.
4- Prueba de Normalidad de los errores (la variable aleatoria debe
seguir una distribución normal) Prueba de Jaque–Vera.
Resultados obtenidos
En todos los casos, para la realización de las pruebas de hipótesis,
se tomó como nivel de significación el valor de a=0.05; es decir, el
Error de Tipo I será igual a dicho valor a.
Modelo lineal para el mercado 1
1- Se rechaza la hipótesis H1 por lo que existe homocedasticidad
(dado que: P-valo=0.777756>0.05; entonces se acepta H0: existe
homocedasticidad, es decir, la varianza de los errores es constante).
2- No se rechaza la hipótesis H0 por lo que no existe autocorrelación de
errores (dado que: P-valor=0.063530>0.05; entonces se acepta H0: no
existe autocorrelación de primer orden en los errores).
3- No se rechaza la hipótesis H0 la variable sigue una distribución
normal. (dado que: P-valor=0.830671>0.05; entonces se acepta H0: Los
errores siguen una distribución normal).
4- El valor del coeficiente de determinación es cercano a 1 por lo que
tienen buen ajuste (R2=0.7477)
Modelo lineal para el mercado 2
1- Se rechaza la hipótesis H1 por lo que existe homocedasticidad
(dado que: P-valor=0.464905>0.05; entonces se acepta: no existe
heterocedasticidad, es decir la varianza de los errores es constante).
2- No se rechaza la hipótesis H0 por lo que no existe autocorrelación de
errores (dado que: P-valor=0.306559 0.05; entonces se acepta H0: no
existe autocorrelación de primer orden en los errores).
3- No se rechaza la hipótesis H0 por lo que la variable sigue una
distribución normal (dado que: P-valor=0.71395>0.05; entonces se acepta
H0: los errores siguen una distribución normal).
4- El coeficiente de determinación es muy cercano a 1 por lo que el
ajuste es bueno (R2 = 0.927287).
Modelo lineal para el mercado 3
En el análisis de la serie anual al aplicar el paso detectar outlier, se detectaron dos puntos que se escapan de lo normal, correspondientes a los años 2000 y 2001, por lo que decidió omitir estos años.
1- Se rechaza la hipótesis H1 por lo que existe homocedasticidad
(dado que: P-valor=0.487063>0.05; entonces se acepta H0: no existe
heterocedasticidad).
2- No se rechaza la hipótesis H0 por lo que no existe autocorrelación de
errores (dado que: P-valor=0.578728>0.05; entonces se acepta H0: no
existe autocorrelación de primer orden en los errores).
3- No se rechaza la hipótesis H0 por lo que la variable sigue una
distribución normal (dado que: P-valor=0.476610>0.05; entonces se acepta
H0: los errores siguen una distribución normal).
4- El valor del coeficiente de determinación es cercano a 1 por lo que
tienen buen ajuste (R2=0.835561).
Modelo lineal para el mercado 4
1- Se rechaza la hipótesis H1 por lo que existe homocedasticidad
(dado que: P-valor=0.501998>0.05; entonces se acepta H0: no existe
heterocedasticidad).
2- No se rechaza la hipótesis H0 por lo que no existe autocorrelación de
errores (dado que: P-valor=0.096512>0.05; entonces se acepta H0: no
existe autocorrelación de primer orden en los errores).
3- No se rechaza la hipótesis H0 por lo que la variable sigue una
distribución normal (dado que: P-valor=0.887394>0.05; entonces se acepta
H0: los errores siguen una distribución normal).
4- El valor del coeficiente de determinación está más cercano al valor
cero que a 1 por lo que no hay un buen ajuste (R2 = 0.060442).
Modelo lineal para todos los mercados
1- Se rechaza la hipótesis H1 por lo que existe homocedasticidad
(dado que: P-valor=0.250889>0.05; entonces se acepta H0: no existe
heterocedastici-dad).
2- No se rechaza la hipótesis H0 por lo que no existe autocorrelación de
errores (dado que: P-valor=0.105385>0.05; entonces se acepta H0: no
existe autocorrelación de primer orden en los errores).
3- No se rechaza la hipótesis H0 por lo que la variable sigue una
distribución normal (dado que: P-valor=0.716070>0.05; entonces se acepta
H0: los errores siguen una distribución normal).
4- El valor del coeficiente de determinación es cercano a 1 por lo que
tienen buen ajuste (R2 = 0.822477).
Análisis de la serie de tiempo para datos mensuales por países.
Con los datos mensuales se obtuvieron las series que se muestran en
los gráficos de los anexos (Anexo 33), procediéndose a realizar la
descomposición de las series mensuales en los componentes de tendencia,
estacionalidad y variaciones irregulares empleando para ello el método
de Holt-Winters con estacionalidad tanto para un modelo multiplicativo
como aditivo, seleccionando finalmente el mejor modelo considerando el
que tuviera menor error cuadrático medio.
Tabla 1: Resultados obtenidos a través del análisis de series mensuales
a/ Modelo Holt-Winters Estacionalidad Aditiva
Ŷt+T=(at+btT)+Estacionalidad
b/ Modelo Holt-Winters Estacionalidad Multiplicativa Ŷt+T =(at
+btT)*Estacionalidad
a.- Representa una parte constante (por ejemplo, un volumen de turistas
de carácter fijo, en el caso de modelar los arribos de turistas al
hotel)
b.- Representa la pendiente de la componente de tendencia (el ritmo
estructural de crecimiento o decrecimiento del volumen de turistas)
Tabla 2: Resultados obtenidos a través del análisis de series anuales
Nota: Un valor negativo, significa que no arribarán turistas de esa
nacionalidad.
Cuando se comparan los pronósticos obtenidos por las dos variantes,
observamos que:
a) El pronóstico anual del mercado español, en cualquiera de las dos
variantes es muy similar.
b) De igual forma se comportan los pronósticos de los mercados mexicanos
y norteamericano.
c) En el caso del mercado francés, los resultados son diametralmente
opuestos, ello puede ser explicado de la forma siguiente:
En el gráfico 1, se representa la serie mensual de los turistas del
mercado 3 en el período 2000-2005, se aprecia que su tendencia en ese
período es significativamente decreciente, independientemente de los
movimientos estaciónales que se presentan en cada año.
Gráfico 1.
En el gráfico 2, se muestra una leve desaceleración de esa caída; esta
situación de los años 2006 y 2007 es captada en el modelo de
Holt–Winters de estacionalidad aditiva, ello incide favorablemente en el
resultado del pronóstico anual.
Gráfico 2.
Cuando analizamos la serie por años, apreciamos que la tendencia del
modelo matemático encontrado, muestra un decrecimiento abrupto y no toma
en cuenta una muy ligera recuperación en el año 2007, por lo que en el
caso del pronóstico por esta vía, el resultado es opuesto al anterior.
Gráfico 3.
Conclusiones
En el estudio del comportamiento histórico de los mercados principales
del hotel respecto al arribo de los turistas desde el 2000 al 2007
mediante la aplicación de las técnicas estadísticas se obtuvieron los
pronósticos de arribos por meses y anual del 2008 para cada mercado
seleccionado y el total de todos los mercados:
• Mercado 1. Se prevé un decrecimiento de un 50 % de los arribos de
turistas.
• Mercado 2. No se espera prácticamente arribo de turistas.
• Mercado 3. Según el modelo de Holt-Winters con estacionalidad aditiva
se prevé un crecimiento de un 54% para este mercado.
• Mercado 4. Se prevé una cifra similar al año 2007.
Recomendaciones
• Emplear la información anterior para diseñar las estrategias de
marketing en cada uno de los mercados.
• Mantener actualizada la base de datos y elaborar nuevos pronósticos
tomando en cuenta la nueva información que se vaya obteniendo.
Bibliografía
1. Areyano, Mireya. ¨ INTRODUCCIÓN AL ANÁLISIS CLÁSICO DE SERIES
CRONOLÓGICAS ¨. Consultado 2007.
2. CURSO DE PREDICCIÓN ECONÓMICA Y EMPRESARIAL.
www.uam.es/predysim. Edición 2004.
3. Fuente: htpp://www.EinsteinNet ¨ ANÁLISIS CLÁSICO DE SERIES
TEMPORALES ¨. Consultado 2008.
4. Fuente:
http://matematicas.reduaz.mx/Docentes/ltrueba/Series/Indice.htm
¨ BREVE EXPLICACIÓN DE LAS SERIES DE TIEMPO ¨. Consultado 2007
5. Fernández Padilla, Rigoberto. ¨ CONFERENCIA SOBRE SERIES DE TIEMPO ¨,
Power Point. Elaborado en Diciembre 2007.
7. Fernández, José Ángel. ¨ TÉCNICAS CUANTITATIVAS ELEMENTALES
DE PREVISIÓN UNIVARIANTE ¨. Método de Holt Winters. Curso 2003 – 2004
8. Ana Cecilia Kikut Valverde, Evelyn Muñoz Salas, Juan Carlos Quirós
Solano. ¨ ASPECTOS CONCEPTUALES DE LAS SERIES DE TIEMPO ¨. Consultado
2007.
9. Damodar, Econometría. Primera Parte. Editorial Felix Varela. La
Habana, 2006.
Nota: Es probable que en esta página web no aparezcan todos los elementos del presente documento. Para tenerlo completo y en su formato original recomendamos descargarlo desde el menú en la parte superior