Técnicas de Análisis Multivariante: Análisis Cluster y Discriminante

Técnicas de Análisis Multivariante

Análisis Cluster

El Análisis Cluster es una técnica que permite agrupar individuos en función de sus características similares.

Tipos de Análisis Cluster

  • Supervisados: Existe un control para verificar si se cumple una hipótesis.
  • No supervisados: No hay ningún control.

Dentro de las técnicas no supervisadas, se encuentra el Análisis Cluster Jerárquico, que permite crear una jerarquía de grupos.

El Análisis Cluster No Jerárquico, por su parte, utiliza métodos como el de K-medias, que asigna individuos a grupos en función de su distancia a un centroide.

Tipos de Encadenamientos

  • Simple: Une grupos con los puntos extremos más cercanos.
  • Completo: Une grupos con los puntos más alejados entre sí.
  • Medio: Une grupos con las medias más cercanas.
  • De Ward: Une grupos con mayor similitud en dispersión.

Para realizar un Análisis Cluster, es necesario que las variables sean linealmente independientes y ortogonales. Esto se puede lograr mediante el Análisis de Componentes Principales o el Análisis Factorial.

El Cluster Bietápico permite dividir los datos en grupos cualitativos y luego aplicar Análisis Cluster a cada grupo.

Análisis Discriminante

El Análisis Discriminante es una técnica que permite clasificar individuos en grupos homogéneos en función de un conjunto de variables independientes.

Hipótesis del Análisis Discriminante

  • La población es una normal multivariante.
  • Las variables son linealmente independientes.
  • Los grupos tienen la misma matriz de varianzas y covarianzas.
  • Los centroides están lo suficientemente alejados.
  • Hit ratio superior al 90%.

Diseño del Experimento

  • Una variable cualitativa con p categorías.
  • M variables independientes métricas.
  • P-1 funciones discriminantes.

Hipótesis Estadísticas

  • Lambda de Wilks: Contrasta si la función discriminante discrimina bien.
  • Prueba de igualdad de medias: Contrasta si las medias de los grupos son diferentes.
  • M de Box: Contrasta si las matrices de varianzas de los grupos son iguales.
  • Correlación Canónica: Evalúa la adecuación de la función discriminante.

Ejecución del Experimento

  • Coeficientes estandarizados de las funciones discriminantes canónicas.
  • Valor de discriminación.
  • Hit Ratio.