Guía completa de la investigación econométrica: desde la teoría hasta la práctica
Introducción a la Investigación Econométrica
La investigación econométrica es el proceso de abstracción de la realidad con un conocimiento teórico previo, cuyo objetivo es describir, explicar y actuar. Un modelo es una representación simplificada de un proceso, institución o sistema, que se utiliza para explicarlo, describirlo y actuar sobre él mediante la predicción y el control. Un sistema es un ente representado por el modelo; un conjunto de elementos que interactúan. El sistema se define a partir de un subconjunto de elementos y sus relaciones más importantes. Se puede definir el sistema S como el conjunto de los elementos del sistema y sus relaciones: S = (A, R).
Modelos Matemáticos en Econometría
Dentro de los modelos matemáticos, encontramos los modelos económicos y econométricos. Un modelo econométrico es un modelo matemático de tipo estocástico que incluye una o varias variables aleatorias.
Tipos de Modelos para la Resolución de un Sistema
- Modelo mental: Representación no explícita de un sistema.
- Modelo verbal: Descripción en lenguaje ordinario del modelo mental.
- Modelo físico: Representación material o mediante objetos de un sistema.
- Modelo matemático o algebraico: Descripción del sistema con ayuda del lenguaje matemático.
Variables en un Modelo Econométrico
- Variable endógena (Y): La variable que se quiere explicar.
- Variables explicativas (Xi): Variables que explican las endógenas.
- Variables predeterminadas (X): Variables explicativas que están explicadas en el modelo.
- Exógenas: Variables que se determinan fuera del modelo e influyen en la endógena.
- Endógenas: Variables que se determinan dentro del modelo.
- Perturbación aleatoria (u): Recoge información sobre la endógena, pero no está determinada.
- Variables estocásticas: Valores desconocidos o aleatorios (U, Y). Son medibles porque tienen una distribución de probabilidad conocida.
- Variables cuantitativas y cualitativas.
- Variables contemporáneas y desplazadas.
Etapas de la Investigación Econométrica
Etapa 1: Especificación Inicial (Modelo Tentativo)
- Búsqueda o elección del campo de aplicación.
- Especificación inicial (periodo muestral, frecuencia de datos, forma funcional o matemática de la relación que une la variable endógena con las variables predeterminadas).
Etapa 2: Estimación y Contraste
- Estimación: Obtención de valores numéricos de los parámetros.
- Contraste: Comprobar que todos los parámetros son estadísticamente significativos, además de comprobar las hipótesis de partida referidas a la especificación.
Etapa 3: Validación
- Validación de los resultados obtenidos; deben ser aceptables tanto desde el punto de vista teórico como estadístico.
- Comprobar si satisfacen las relaciones impuestas por la teoría económica.
- Evaluar si el modelo se adecua bien o representa la realidad. Para ello, se comprueba la bondad del ajuste (coeficiente de determinación R con valores entre 0 y 1) y contrastes no paramétricos.
Etapa 4: Utilización del Modelo
- Análisis estructural: Ver el significado económico de los parámetros.
- Predicción: Obtener valores futuros de las variables explicativas para obtener valores futuros de la endógena.
- Evaluación de políticas: Dar valores a las variables controlables y ver cómo responde la variable endógena.
- Control óptimo: Fijar en la endógena un valor u objetivo a alcanzar, y ver los valores que hacen falta en las explicativas para llevar al valor fijado en la endógena.
Etapa 5: Reestimación del Modelo
Con el paso del tiempo, aparecen nuevos datos que debemos incluir en nuestro modelo y volver a estimar.
Hipótesis Básicas del Modelo
- Hipótesis de parámetros constantes (permanencia estructural): Los parámetros B deben ser constantes a lo largo de la muestra y en el futuro.
- Hipótesis de los grados de libertad: El rango de la matriz X debe ser igual al número de variables (k) y menor que el número de datos (n).
- Hipótesis de los regresores no estocásticos: Los valores de las variables explicativas (X) deben ser observables (valor determinado).
- Hipótesis de normalidad: La perturbación aleatoria tiene una distribución N(0, σ), siendo σ (la varianza) constante.
Hipótesis Básicas Referidas a la Perturbación Aleatoria
- Hipótesis de estacionalidad de la media: La media de la perturbación aleatoria es nula. En una especificación correcta del modelo, el término residual no introducirá un error de forma sistemática.
- Hipótesis de homocedasticidad: V(Ut) = E[(Ut) – E(Ut-n)] = σ. La varianza de Ut es constante, es decir, todas las perturbaciones aleatorias tienen la misma varianza. Por lo tanto, esta es independiente del tiempo o de los valores de X.
- Hipótesis de incorrelación serial: Cov(Ut, Ut-n) = E(Ut) * E(Ut-n) = 0. Por tanto, la covarianza será cero, es decir, no hay autocorrelación. Las perturbaciones correspondientes a distintos momentos de tiempo no están relacionadas entre sí (m.a.s.).
Obtención y Naturaleza de los Datos
Método de Obtención
- Datos experimentales: Se obtienen en un experimento controlado, es decir, de una situación en la que el sistema o proceso bajo investigación está aislado de influencias externas.
- Datos observacionales: Proceden de la observación de un sistema no experimental, es decir, no se controlan las condiciones del experimento. Se obtienen en campo.
Naturaleza de los Datos
Aunque los datos son cuantificaciones de hechos, estos pueden representar hechos cualitativos y cuantitativos.
- Datos cuantitativos: Expresados en escala cardinal o métrica (renta, precios, etc.).
- Datos cualitativos: Expresados en escala ordinal. Se refieren a atributos, aunque no existe ninguna medida. (Transformar el atributo en variables ficticias o dicotómicas, también denominadas dummy).
Criterios de Ordenación
- Ordenación cronológica.
- Otros criterios de ordenación: Para series de corte transversal. Ordenados en función de individuos, empresas, etc.
- Varios criterios de ordenación simultáneos.
- Datos de series temporales: Valores de una variable en el tiempo. Subíndice t.
- Datos de corte transversal: Miden una variable determinada en un mismo momento de tiempo para distintas entidades. Subíndice i.
- Datos de panel: Utilizan el criterio de ordenación temporal y series de corte transversal en las que se recogen datos sobre las mismas unidades o individuos en sucesivos momentos del tiempo. Subíndice it.
Grado de Agregación Temporal
- Datos de alta frecuencia: Varias observaciones al año. Corto plazo.
- Datos de baja frecuencia: Una única observación al año. Largo plazo.
Agregación Económica de los Datos
- Datos macroeconómicos.
- Datos microeconómicos.
Forma de Producción del Dato
- Datos de información subjetiva.
- Datos de información objetiva.
Grado de Observación
- Datos no observables.
- Datos observables.