Inferencia Estadística: Conceptos, Tipos de Muestreo y Estimación Puntual

Inferencia Estadística

La inferencia estadística es la cima de la estadística, cuyo objetivo es extraer conclusiones para una población a partir de los datos de una muestra. Se divide en dos tipos:

  • Paramétrica: Extraemos una muestra y nuestro objetivo es decir algo sobre el valor del parámetro. Decir algo de tres formas: estimación puntual, intervalos de confianza o contraste de hipótesis (establezco una hipótesis sobre lo que puede valer el parámetro; con los datos de la muestra tengo que decir si esta hipótesis se puede mantener o no).
  • No paramétrica: Función desconocida: no sabemos qué modelo podemos seguir, no sabemos los parámetros. Contraste de bondad de ajuste: ver si una variable sigue un modelo normal; si vemos que es normal, podemos aplicar técnicas paramétricas. Contraste de dependencia: ver si en un colectivo de población inmigrante hay relación entre nacionalidad y sector de trabajo.

Población y Muestra

  • Población: Todos los individuos objeto de estudio.
  • Muestra: Subconjunto de la población con la característica de ser representativo de la población.
  • Censo: Un estudio estadístico de la población. Toma de datos de todos los elementos de la población.
  • Investigación por muestreo:
    • Ventajas: Rapidez, ahorro de costes, estudio más detallado, procesos destructivos.
    • Desventajas: Error de muestreo.

Errores ajenos al muestreo: Se pueden dar en un censo y en una investigación por muestreo. Se deben a distintas causas: diseño del cuestionario, errores de los encuestados, errores de grabación de datos.

Tipos de Muestreo

  • Probabilístico:
    • Aleatorio simple: Existe un listado muy concentrado geográficamente. Hay con reemplazamiento (la población no está conocida) y sin reemplazamiento (dependiendo de si la muestra es muy grande).
    • Sistemático: En lugar de sacar un número al azar para formar la muestra, dividimos la población en N intervalos. Sacamos un número al azar del primer intervalo y después sacamos una cantidad constante para obtener el resto de elementos de la muestra.
    • Estratificado: La población se ha dividido en estratos, subconjuntos de la población que son homogéneos. La muestra de los estratos va a tener la misma representación que tiene en la población.
    • Conglomerado: Conjunto de elementos de la población. El muestreo de conglomerados identifica las conglomeraciones que tienden a ser internamente heterogéneos. Cada conglomerado tiene una amplia variedad de elementos.
    • Por etapas.
  • No aleatorio: Los criterios subjetivos pueden que sean buenos o no, pero el comportamiento es aceptado.

Muestreo Aleatorio Simple: Dos Requisitos

  1. Cada elemento de la población tiene la misma probabilidad de ser elegido que los restantes.
  2. Cada muestra tiene la misma probabilidad de ser elegida que las restantes.

Definición: Conjunto de variables aleatorias. Estas variables son independientes y tienen la misma función de probabilidad. Si la variable aleatoria es continua, hablaríamos de función de densidad de la muestra.

Concepto de Estadística

Extraemos una muestra aleatoria simple de tamaño que representamos con X1. Se llama estadístico a cualquier función aplicada a las variables de la muestra. Un estadístico es una variable aleatoria.

Estimación Puntual

Es un proceso que asigna un único valor al parámetro θ (theta) desconocido. Se llama estimador del parámetro θ a un estadístico que toma valores entre los posibles valores del parámetro.

Estimación: Es el resultado de aplicar un estimador a una muestra observada. Es un valor posible del estimador. La estimación depende del estimador y de la muestra observada obtenida. No cualquier estadístico vale como estimador.

Propiedades de los Estimadores

  • Insesgado: Aquel que en promedio acierta el verdadero valor del parámetro, es decir, puede ser por exceso y otros por defecto, pero la media coincidirá con el valor del parámetro.
  • Eficiente: Es un estimador insesgado con la menor varianza posible. Entre dos estimadores insesgados, el que tenga menor varianza es el más eficiente.
  • Consistente: Tengo que coger un estimador con poca variabilidad. Es consistente si la media que comentamos, el tamaño de la muestra, se aproxima cada vez más al verdadero valor del parámetro. En este caso extremo en el que la media es igual a la población, coincidirán con el verdadero valor del parámetro.