Estadística: Conceptos, Tipos y Métodos

1er PARCIAL

Estadística: Rama de la matemática que se encarga de analizar y estudiar datos. 

Cuando hablamos de estadística nos referimos a la rama de la matemática que se encarga de analizar y estudiar datos, así como también buscar las explicaciones de los fenómenos que alteran los resultados.

La estadística es considerada una ciencia ya que estudia a una población de forma específica, a través de la recopilación de datos y con el objetivo de determinar un problema y buscar su solución. 

Características de la estadística

  • De las principales características de la estadística podemos destacar que:
  • Su estudio, uso y aplicación es fundamental para la toma de decisiones de diferentes ámbitos.
  • Da lugar a un proceso que estudia problemas sociales, científicos e industriales.
  • Es un sistema que puede tomar un tiempo hasta generar resultados verídicos y con soluciones pautadas.
  • Proporciona un resultado estimado, ya sea numérico o social, a la vez que ofrece conclusiones que conducen a una solución. 

Tipos de estadística

Descriptiva: también conocida como deductiva, es aquella estadística que se encarga de mostrar el resultado de los datos estudiados de forma específica, sin generalizaciones.

Inferencial: también conocida como inductiva, es aquella estadística que, a diferencia de la descriptiva, sí ofrece resultados junto con datos generales de investigación amplia.  

Objetivos 

  • Gracias a la investigación de datos específicos, mejora la comprensión de los hechos.

  • Realiza la inferencia de una población tomando como base los datos proporcionados.
  • La estadística descriptiva resume la información obtenida de los datos. 
  • La estadística inferencial ofrece datos y soluciones dentro de diferentes ámbitos.

Estadística descriptiva:

La estadística descriptiva es un tipo de estadística que trata de condensar o resumir todos los datos o características de una serie de valores, para describir determinados aspectos de la serie, siendo también identificada como estadística deductiva.  

Instrumentos o medidas de la estadística descriptiva

Razones, tasas y porcentajes: son medidas relativas que condensan información sobre la incidencia de una característica entre un grupo de unidades.

Distribución de frecuencia: forma de agrupación de los datos, en la cual estos se presentan en clases y cada clase exhibe su respectiva frecuencia.

Medidas de posición o de tendencia central: se dividen en promedios matemáticos: el aritmético, el geométrico y el armónico; y promedios no matemáticos: la mediana y la moda. 

Medidas de dispersión: para las variables cuantitativas, las medidas de dispersión que se pueden identificar son la desviación media, la desviación estándar o desviación típica, los rangos intercuartílicos y los valores mínimos y máximos. 

Estadística inferencial:

La estadística inferencial, también conocida como inductiva, es aquella estadística que realiza predicciones, proyecciones y juicios valorativos respecto a un gran conjunto de informaciones, basándose en datos reunidos a partir de una serie de informaciones más pequeña. 

Instrumentos de la estadística inferencial

Universo estadístico: consiste en fijar cuáles son los casos individuales que van a ser observados, así como su alcance en el espacio y tiempo de la investigación.

Unidad de investigación: constituida por los casos individuales que se estudian en la investigación, a través de los cuales se llega a la observación del fenómeno.

Momento estadístico: instante o período al que se referirán los datos individuales.

Muestreo: elección de una parte representativa o muestra de población, para describir al conjunto de la misma.

Muestreo probabilístico: técnica de muestreo en la que cada unidad de población tiene igual oportunidad de aparecer en la muestra.

Muestra aleatoria: número limitado de observaciones escogidas al azar de un todo agregado sobre un universo.

Riesgo de muestreo: siempre que se examina menos del 100 por ciento de una población, se está expuesto al riesgo de que la muestra no sea representativa. El riesgo de muestreo se controla mediante el tamaño de las muestras y los métodos de selección usados.

Teoría de probabilidades: es la base sobre la cual descansa la mayoría de las leyes estadísticas, y su mayor aplicación se encuentra en la estadística inductiva (teoría del muestreo), ya que los métodos probabilísticos señalan la posibilidad de que una muestra provea los datos necesarios para describir el universo total e indicar el grado de confianza que se le puede tener a los resultados obtenidos a través de la muestra. 

Individuo:

Cada uno de los elementos que forman parte de la población,  puede ser algo con existencia real, como una persona, un automóvil, o algo más abstracto como la temperatura, una opinión, un voto o un sentimiento.

Universo:

Conjunto de elementos a los cuales se quieren inferir los resultados.

Población:

Conjunto o colección de objetos al que esta referido un estudio estadístico. puede estar constituida por personas pero también por objetos de cualquier tipo de naturaleza. 

Muestra:

Subconjunto o parte del universo o población en el que se llevara acabo la investigación.

Muestreo:

Es el método utilizado para seleccionar a los componentes de la muestra del total de la población. Conlleva: reglas, procedimientos, criterios.

¿Qué son los métodos estadísticos?:

Son procedimientos para manejar datos cuantitativos y cualitativos mediante técnicas de recolección, recuento, presentación, descripción y análisis. 

Variable estadística:

es el conjunto de valores que puede tomar cierta característica de la población sobre la que se realiza el estudio estadístico y sobre la que es posible su medición. 

Datos cuantitativos:

Todo lo que se puede medir y contar. 

Datos cuantitativos continuos:

Este tipo de datos cuantitativos se refiere al flujo constante de valores posibles de la variable, estos datos no se restringen a valores enteros. Los datos cuantitativos continuos se miden en lugar de contarse.

Datos cuantitativos discretos:

Prácticamente hablamos de números enteros, por valores completos. Se cuentan, no se miden.

* La estadística, como método científico, consta de cuatro fases o etapas: Recopilación, Elaboración, Presentación e Interpretación.
* 11 Etapas del método estadístico: 1. Selección del tema, 2. Planteamiento del problema, 3. Fijación de los objetivos, 4. Formulación de hipótesis, 5. Definición de la unidad de observación y la unidad de medida, 6. Recolección, 7. Critica, clasificación y ordenación, 8. Tabulación de datos clasificados, 9. Presentación de datos estadísticos, 10. Análisis, 11. Interpretación.
Muestreo Probabilísticos:Cuando la muestra se elige al azar. 

Muestreo no probabilístico: El investigador no elige la muestra al azar, sino mediante determinados criterios subjetivos 


Muestreo aleatorio simple: Se asigna un número a cada individuo de la población y a través de algún medio mecánico se eligen tantos sujetos como sea necesario para completar el tamaño de muestra requerido.

Muestreo aleatorio estratificado: Se divide a la población en clases o estratos y se escoge aleatoriamente un número de individuos e cada estrato proporcional al número de componentes de cada estrato. 

Muestreo aleatorio sistemático: Aquí se llega a elegir a un individuos al azar y desde ahí con intervalos se termina de llenar la muestra 

Muestreo aleatorio por conglomerados: Este se utiliza cuando los individuos constituyen agrupaciones naturales, como tal «la unidad de muestreo» o es el individuo si no un conglomerado. 


2do PARCIAL 

Criterios para la construcción y elaboración de las técnicas de recolección de datos

1. La naturaleza del objeto de estudio.

2. Las posibilidades de acceso con los investigados.

3. El tamaño de la población o muestra.

4. Los recursos con los que se cuenta.

5. La oportunidad de obtener datos.

6. Tipo y naturaleza de la fuente de datos. 

Encuesta: Se establece el contacto con las unidades de observación por medio de cuestionarios . Pueden ser por teléfono, correo, personal u online. 

Entrevista: Es un diálogo entre las personas, siendo el entrevistador y el entrevistado. Pueden ser asistemática o libre, estructurada, focalizada, simultánea, sucesiva.

Análisis documental: se obtiene a través de fuentes secundarias como lo son: libros, revistas, folletos, periódicos. Instrumento: ficha de registro de datos. 

Observación de campo no experimental: Profundizar el conocimiento del comportamiento de exploración. Instrumento: guía de observación o de campo. 

Observación experimental: elabora datos en condiciones controladas por el investigador, o sea manipula las variables. Instrumento: la hoja o ficha de registro de datos. 

Cuestionarios: conjunto de preguntas destinados a recoger, procesar y analizar información sobre hechos estudiados en poblaciones (muestras). 


Escalas de actitudes: estas miden la intensidad de actitudes de forma objetiva, y para construirlo se seleccionan juicios de acuerdo a ciertas reglas a las que se ponen valores cuantitativos midiendo la aceptación o el rechazo. 

CONSTRUCCIÓN DE UN CUESTIONARIO

  1. Especificar la información requerida
  2. Determinar el tipo de preguntas y forma de recopilar la información
  3. Determinar el contenido de cada pregunta
  4. Determinar la forma de respuesta de cada pregunta
  5. Determinar las secuencias de las preguntas
  6. Evaluar y probar el cuestionario

TIPOS DE PREGUNTAS

El tipo de preguntas a considerar en la construcción de un cuestionario depende de la variable a la que se pretende medir. Pueden ser: 

  • Cerradas o estructuradas: dicotómicas y de opción múltiple, que estás pueden ser: simples o respuestas múltiples. 
  • Mixtas. 
  • Abiertas o no estructuradas. 

La escala de Likert, deben de ser estandarizados, y preparados en término de confiabilidad y validez. 

Dirección: Puede ser negativa o positiva; o en algunos casos neutral.

Intensidad: Esta es alta si la persona está fuertemente convencida que la actitud es justificada; o es baja si el sujeto no piensa así.

LOS PASOS A SEGUIR PARA LA CONSTRUCCIÓN DE UNA ESCALA DE LIKERT SON:

  1. Definición de la actitud o variable que se va a medir 
  2. Operacionalización de la variable 
  3. Determinación de la dirección positiva o negativa del ítem 
  4. Asignación de valores escalares en cada ítem 
  5. Administración de los ítems 
  6. Puntajes totales de cada persona, de acuerdo al tipo de respuesta. 
  7. Construcción de la escala final 


Criterios a seguir 

  • Evitar los ítems ambiguos que den mucha información 
  • Reflejar una opinión no un hecho 
  • Evitar ítems del pasado 
  • No utilizar palabra como todos, siempre, nadie. 
  • Expresarse en oraciones lógicas, simples, lenguaje claro

Confiabilidad: se refiere al grado en que su aplicación repetida al mismo sujeto u objeto produce resultado iguales. Medida de estabilidad, Método de formas alternativas o paralelas, mitades partidas, y consistencia interna. 

Validez: se refiere a la exactitud con que un instrumento mide lo que se propone medir, o sea su eficacia. Tipos Validez de contenido, predictiva, concurrente, de constructo (teórica) 

Validez de contenido: grado en el que el instrumento refleja un dominio específico de contenido de lo que se mide. Es el grado en que la medición representa al concepto o variable medida. 

Validez concurrente: relación entre los resultados del test y el índice del criterio obtenido aproximadamente al mismo tiempo. 

Validez de constructo: que tan exitosamente un instrumento representa y mide un concepto teórico.

Objetividad: grado de permeable a la influencia de los sesgos y tendencias de los investigadores que lo administran, califican e interpretan.

ESCALAS DE MEDICIÓN 

¿Qué es? Es considerada como un sistema que asigna valores numéricos a características susceptibles de medir. 

Escala Nominal: Se utiliza para representar a las variables cualitativas y determina múltiples categorías identificadas por un nombre convirtiéndolas en elementos mutuamente excluyentes, las categorías son exclusivas y solo existe una para cada elemento de la población.  Por ejemplo: el color del cabello (negro, castaño, otro); estado del artículo (buena, imperfecto); género de los estudiantes (masculino, femenino).

Escala Ordinal: Se caracteriza por presentar niveles con un rango determinado, lo que facilita la comparación entre ellos y es posible diferenciarlos como “mayor que” o “menor que”. Por ejemplo: estado de salud de una persona: sano, ligeramente afectado, enfermo, muy enfermo; producción de una empresa: alta, media, baja. 


Escala de Intervalos: Se caracteriza por establecer de forma ordenada los niveles y si la distancia entre uno y otro es la misma, lo cual conlleva a usar una unidad de distancia de referencia. Por ejemplo: la medición de la temperatura; para ello se pueden usar varios sistemas: el Celsius, Kelvin o Fahrenheit. 

Escala de Razones: Toma un cero no arbitrario (absoluto) que significa ausencia del atributo o la característica; esto facilita la comparación, tanto en intervalos como en razones, en cualquier sistema de medición que se utilice. Por ejemplo: a esta escala pertenecen todas aquellas mediciones que están relacionadas con el tiempo, longitud, superficie (áreas), capacidad (volúmenes), peso, dinero.  

TABLAS DE FRECUENCIAS 

¿Qué es? La tabla de frecuencias es una ordenación, en forma de tabla, de los datos estadísticos, asignado a cada dato su frecuencia correspondiente 

Frecuencia Absoluta:  La frecuencia absoluta es el número de veces que aparece un determinado valor en un estudio estadístico. Se representa por fi. La frecuencia absoluta fi, es el número de veces que se repite el valor xi. La suma de las frecuencias absolutas es igual al número total de datos, que se representa por N. 

Frecuencia Relativa:  La frecuencia relativa es el cociente entre la frecuencia absoluta de un determinado valor y el número total de datos. Se representa por fri , aunque algunos autores la representan con hi o ni. La suma de las frecuencias relativas es igual a 1. La frecuencia relativa también se puede expresar en forma de porcentajes. 

Frecuencia Acumulada:  Es la suma de las frecuencias absolutas de todos los valores inferiores o iguales al valor considerado. Se representa por Fi. Por tanto, la frecuencia acumulada del último dato, será siempre igual al número total de datos, Fn = N. 


GRÁFICAS

Objetivos generales: Las gráficas son sumamente útiles para la descripción visual de un conjunto de datos, pero no siempre son la mejor herramienta cando se desea hacer inferencias acerca de una población a partir de la información contenida en una muestra. Para este propósito, es mejor usar medidas numéricas para construir una imagen mental de los datos. 

Una gráfica de pastel es la conocida como gráfica circular que muestra la forma en que están distribuidas las medidas entre las categorías. 

Una gráfica de barras muestra la misma distribución de medidas en categorías, con la altura de la barra midiendo la frecuencia con la que se observa una categoría en particular.  

Solución: Para construir una gráfica de pastel, asigne un sector de círculo a cada categoría. El ángulo de cada sector debe ser proporcional a la magnitud de las medidas (o frecuencia relativa) en esa categoría. Como un círculo contiene 360°, se puede usar esta ecuación para hallar el ángulo: 

ÁNGULO=FRECUENCIA RELATIVA X 360°

EJEMPLO

CalificaciónFrecuencia FRÁngulo
A350.0875X 36031.5°
B2600.65X 360234°
C930.2325X 36083.7°
D120.03X 36010.8°

MEDIDAS DE TENDENCIA CENTRAL 

Las medidas de tendencia central sirven para resumir información del conjunto de datos numéricos por medio de números 

Las medidas de dispersión en cambio, es para saber cuanto varia el promedio en relación al absoluto 

LA MEDIA:  La media aritmética o promedio de un conjunto de n mediciones es igual a la suma de las mediciones dividida entre n.

La media, también conocida como promedio, es el valor que se obtiene al dividir la suma de un conglomerado de números entre la cantidad de ellos.


  • Considera todas las puntuaciones
  • El numerador de la fórmula es la cantidad de valores
  • Cuando hay puntuaciones extremas, no tiene una representación exacta de la muestra

Fórmula: 

LA MEDIANA: Es un conjunto; es un valor que se encuentra a la mitad de los valores, es decir, que al ordenar los números de menor a mayor, éste se encuentra justamente en medio entre los que están por arriba.  La mediana m de un conjunto de n mediciones es el valor de x que cae en la posición media cuando las mediciones son ordenadas de menor a mayor.

Fórmula:  

LA MODA: Es el valor que aparece más adentro de un conglomerado. La moda es la categoría que se presenta con más frecuencia o el valor de x que se presenta con más frecuencia. 

  • Bimodal= 2 modas  
  • Trimodal= 3 modas 
  • Multimodal= +4 modas o n modal 

Nota: cuando todos los datos tienen la misma frecuencia se dice que no existe moda 


MEDIDAS DE VARIABILIDAD 

Los conjuntos de datos pueden tener el mismo centro pero con aspecto diferente por la forma en que los número se dispersan desde el centro. 

  • Simetría/simétrica con respecto a su eje en el centro 
  • Sesgada cuando dos partes no coinciden 

Las medidas de variabilidad pueden ayudarle a crear una imagen mental de la dispersión de los datos. Presentaremos una de las más importantes. La medida más sencilla de variación en el rango.

Definición: El rango, R, de un conjunto de n mediciones se define como la diferencia entre la medición más grande y la más pequeña. 

Nota: depende el tamaño poblacional es que se podrá proporcionar información  

POR EJEMPLO: 

Definición: La varianza de una poblaciónde N mediciones es el promedio de los cuadrados de las desviaciones de las mediciones alrededor de su media μ. La varianza poblacional se denota con σ² y está dada por la fórmula: 

Definición: La varianza de una muestra de n mediciones es la suma de las desviaciones cuadradas de las mediciones alrededor la media x(x barra), dividida entre (n-1). La varianza muestral se denota con s² y está dada por la fórmula:  


Definición: La desviación estándar de un conjunto de mediciones es igual a la raíz cuadrada positiva de la varianza.