Estadística Descriptiva: Guía Completa con Ejemplos
Estadística Descriptiva
La estadística descriptiva es una rama de las Matemáticas que recolecta, presenta y caracteriza un conjunto de datos para describir diversas características.
Variables Estadísticas
Al conjunto de los distintos valores numéricos que adopta un carácter cuantitativo se le llama variable estadística.
- Variables cualitativas o categóricas: no se pueden medir numéricamente.
- Variables cuantitativas: tienen valor numérico.
- Discretas: sólo pueden tomar valores enteros.
- Continuas: pueden tomar cualquier valor real dentro de un intervalo.
Conceptos Básicos
- Individuo: cualquier elemento que aporte información sobre el fenómeno que se estudia.
- Población: conjunto de todos los individuos.
- Muestra: subconjunto seleccionado de una población.
Tipos de Datos
- Datos discretos: Respuestas numéricas que surgen de un proceso de conteo.
- Datos continuos: Respuestas numéricas que surgen de un proceso de medición.
Medir: comparar una magnitud con otra.
- Medición Nominal: se establecen categorías distintivas que no implican un orden específico.
- Medición Ordinal: Se establecen categorías con dos o más niveles que implican un orden inherente entre sí. La escala de medición ordinal es cuantitativa.
- Medición de Intervalo: Establece la distancia entre una medida y otra. La escala de intervalo se aplica a variables continuas.
- Medición de Razón: Determina la distancia exacta entre los intervalos de una categoría.
Distribución de Frecuencias
La distribución de frecuencias es la forma en la que un conjunto de datos se clasifica en distintos grupos excluyentes entre sí.
- Frecuencia absoluta (fi): Cantidad de observaciones que pertenecen a cada grupo / cantidad de veces que se repite un suceso.
- Frecuencia relativa (hi): Se calcula dividiendo la frecuencia absoluta entre el número de datos.
- Frecuencia absoluta acumulada (Fi): Resulta de sumar las frecuencias absolutas con la anterior o las anteriores.
- Frecuencia relativa acumulada (Hi): Resultado de sumar las frecuencias relativas.
Medidas de Tendencia Central
Las medidas de tendencia central son medidas estadísticas que pretenden resumir en un solo valor a un conjunto de valores.
- Promedio o media (μ): La medida de tendencia central más conocida y utilizada es la media aritmética o promedio aritmético.
- Mediana: Es el valor de la variable que ocupa la posición central.
- Moda: La moda de una distribución se define como el valor de la variable que más se repite.
Medidas de Dispersión
Las medidas de dispersión miden el grado de dispersión de los valores de la variable.
- Rango de variación: diferencia entre el mayor valor de la variable y el menor valor de la variable.
- Coeficiente de variación: medida de dispersión relativa de los datos. «Desviación estándar de la muestra expresada como porcentaje de la media muestral.»
Probabilidad y Eventos
- Espacio muestral (E): es el conjunto de los diferentes resultados que pueden darse en un experimento aleatorio.
- Eventos independientes: cuando la ocurrencia o no ocurrencia de un evento no tiene efecto sobre la probabilidad de ocurrencia del otro evento.
- Eventos dependientes: Dos o más eventos serán dependientes cuando la ocurrencia o no ocurrencia de uno de ellos afecta la probabilidad de ocurrencia del otro (u otros).
- Variables aleatorias: Una variable aleatoria es un valor numérico que corresponde al resultado de un experimento aleatorio.
Nivel de Significancia
Nivel de significancia en estadística: Cuando el nivel de significancia (valor de p) es menor a 0.05 podemos decir que hay diferencia en los tratamientos o experimentos.
Prueba «t» de Student: se utiliza para determinar si hay una diferencia significativa entre las medias de dos grupos.
Cuando el nivel de significancia es mayor a 0.05 no hay diferencia entre los tratamientos o experimentos en los que se sometieron las muestras o sujetos de estudio.
Muestreo y Validez
- Muestra aleatoria: Para tener una muestra verdaderamente aleatoria de una población deberíamos asignar un número u otro identificador único a cada una de las unidades de la población.
- Validez externa: tiene que ver con si el estudio como totalidad puede ser generalizado.
- Validez interna alta: puede mostrar evidencia sólida de causalidad.
Visualización de Datos
Una manera muy efectiva de ver el panorama general de los datos cuando hacemos análisis simples de estadística descriptiva es hacer una gráfica tipo histograma o de caja y bigotes.
Redacción Científica
La redacción científica a través del lenguaje científico es la información eficaz, clara y sencilla del conocimiento científico. Se muestra a través de sus estilos:
- El estilo de contenido
- El estilo de presentación
- Impersonalidad: redactar en tercera persona en lugar de la primera.
- Claridad: el texto se lee y se entiende rápidamente.
- Precisión: usar las palabras que comunican exactamente lo que se quiere decir.
Citas y Referencias
Citas: Una cita es la mención a un texto, idea o frase ajena, envía al lector a la fuente de donde se sacó la información y está presente en la referencia bibliográfica. Nombre del autor, coma, año de publicación.
Notas de Pie de Página
Notas de pie de página: Las notas de pie de página son las llamadas de atención que el investigador hace en su trabajo para:
- Indicar la fuente de donde provienen los datos.
- Aclarar algún dato.
- Ampliar o explicar la idea.
Apéndices
Apéndices: Suplemento o adjunto a un documento de investigación, pero que no es parte del cuerpo del mismo documento.