Evaluación Educativa: Teoría Clásica de los Tests (TCT) y Teoría de Respuesta al Ítem (TRI)

Conceptos Básicos de Evaluación

La Evaluación Referida al Criterio

Evalúa el grado en que los sujetos alcanzan los niveles que se predeterminan con antelación.

Las Escalas de Medida

Diferentes reglas en donde se asignan números a las diferentes propiedades de los objetos.

Un Baremo

El resultado de transformar puntuaciones directas mediante grupos normativos.

El Proceso de Validación del Constructo

Pretende la confirmación de las hipótesis formuladas en función de la teoría del constructo.

Un Test como Instrumento

Un instrumento que nos ayuda a observar las reacciones de los sujetos ante determinados reactivos y medir cualquier característica.

Teoría Clásica de los Tests (TCT)

Concepto Equivalente en la TRI y la TCT

El error típico de medida.

Utilidad de la Tabla de Especificaciones

Para determinar en ella todos los objetivos y contenidos que se pretenden medir en la prueba.

Utilidad de la Tipificación

Poder interpretar las puntuaciones de los sujetos por comparación con un grupo normativo.

Característica de las Escalas Típicas

Exige un mayor nivel de abstracción y son más técnicas al tener en cuenta la media y la desviación típica.

Relación entre Error de Medida y Fiabilidad

Cuanto menor es el error de medida, la fiabilidad aumenta, por lo que se hace más fiable.

El Índice de Dificultad

Expresa la proporción de personas que aciertan el ítem (su valor depende del grupo a partir del cual se realice la prueba).

Definición de la Puntuación Verdadera

La media o valor esperado en las puntuaciones empíricas que obtendríamos al medir a un sujeto infinitas veces.

Supuesto del Modelo Básico de la TCT

Que la media de los errores es cero.

El Error de Medida

La diferencia entre la puntuación empírica y verdadera.

El Error de Estimación (Y-Y´)

Diferencia entre la puntuación empírica o real en el criterio y la puntuación pronosticada.

Precisión de un Test

Si un test mide con precisión, se refiere a su fiabilidad.

Validez de un Test

Si un test mide lo que pretende, se refiere a su validez.

Relación entre Fiabilidad y Validez

Si un test es muy fiable, la validez puede ser alta o baja.

Si un test es válido, es que es fiable.

Técnica Test-Retest y Variabilidad

Para hallar la variabilidad mediante la técnica test-retest se aplica la correlación de Pearson.

Usos del Error Típico de Medida

Para estimar la puntuación verdadera en el test y para estudiar la significatividad de las diferencias entre puntuaciones.

Usos del Error Típico de Estimación

Para estimar la puntuación verdadera en el criterio a partir de la puntuación del test.

Diferencia entre Validez Concurrente y Predictiva

El intervalo de tiempo entre la aplicación del test y la aplicación del criterio.

Los Ítems del Test

Los ítems del test tienen que constituir una muestra suficiente y representativa.

Efecto de la Reducción de la Longitud del Test

Si se reduce la longitud del test, disminuye la fiabilidad y la validez predictiva.

Interpretación del Coeficiente de Fiabilidad

Estabilidad (test-retest), equivalencia (formas paralelas), consistencia interna (alfa de Cronbach y dos mitades).

Ventajas del Procedimiento de Dos Mitades para el Cálculo del Coeficiente de Fiabilidad

Dos mitades tiene más ventajas en cuanto a la rapidez y ganancia de tiempo.

Validez de Constructo de una Prueba

La validez de constructo de una prueba nos permite conocer si el test está formado por ítems cuyo contenido hace referencia al rasgo o rasgos que se pretenden medir.

Teoría de Respuesta al Ítem (TRI)

Supuestos de la TRI

Unidimensionalidad e independencia local.

Validez de Constructo

Determinar el grado en que cada una de las personas que realiza la prueba posee el grado de la misma es objeto de la validez de constructo.

Los Inventarios

Los inventarios son preguntas a las que deben contestar personas observadas.

Eliminación de Ítems en un Test

De un test se eliminan los ítems cuyo índice de homogeneidad y de validez es inferior a 0,20.

Características para la Clasificación de la Información

Las características en las que se pretende clasificar la información recogida tiene que ser mutuamente excluyentes.

Errores Asociados a las Puntuaciones Verdaderas

Tienen una media igual a cero y su desviación típica se llama error típico de medida.

Test Paralelos

Si medimos a los sujetos con test paralelos, esperamos que la variabilidad de sus puntuaciones obtenidas sea aleatoria.

Coincidencia entre Puntuación Observada y Puntuación Verdadera

Si coincide la puntuación observada y la puntuación verdadera, la fiabilidad será perfecta por lo que los errores de medida serán igual a 0.

Concepto de Curva Característica del Ítem (CCI)

Relación funcional entre la probabilidad de respuesta correcta a un ítem y el rasgo latente hipotético.

Relación entre Varianza de las Puntuaciones Empíricas y Coeficiente de Fiabilidad

A medida que la varianza de las puntuaciones empíricas u observadas se debe a sus puntuaciones verdaderas, aumenta el coeficiente de fiabilidad hasta aproximarse a 1.

Factores que Afectan al Coeficiente de Validez

Longitud, variabilidad y fiabilidad.

Puntuaciones Típicas Normalizadas

Puntuaciones típicas obtenidas a partir de un grupo normativo que se ajusta a la distribución normal.

Escala de Cociente Intelectual

CI = EM/EC x 100

Importancia de la Definición Operativa en la Elaboración de Instrumentos de Medida

En la elaboración de los instrumentos de medida es fundamental una definición operativa del rasgo que se quiere medir.

El Índice de Homogeneidad

Expresa la capacidad de discriminación entre las personas con baja y con alta capacidad en la prueba.

Poder Discriminatorio de un Ítem

El poder discriminatorio de un ítem es tanto mayor cuanto más se acerca el índice de dificultad a 0,50.

Cálculo de un Eneatipo

E = 2 x Z + 5

Fuente de Error en la Técnica de las Dos Mitades

Una fuente de error en la técnica de las dos mitades es la falta de paralelismo entre las dos mitades.

Las Listas de Control

Las listas de control son instrumentos adecuados para medir actitudes y conductas.

Relación entre Coeficiente de Validez y Coeficiente de Determinación

Si el coeficiente de validez es igual a 0 (rxy = 0), el coeficiente de determinación (rxy²) será igual a cero.

Investigación y Evaluación

Diferencia Fundamental entre Investigación y Evaluación

La evaluación persigue elaborar juicios de cara a tomar decisiones, mientras que la investigación busca conclusiones.

Importancia de la Evaluación en la Calidad Educativa

Si la evaluación es importante como factor de promoción de la calidad educativa, es porque moviliza los procesos educativos hacia las metas formalmente establecidas.

Relación entre Evaluación Sumativa y Formativa

Una de las funciones claves de la evaluación está caracterizada por la dicotomía «sumativa-formativa» de manera que la segunda siempre precede a la primera, temporalmente.

Dimensiones del Rendimiento Educativo

El rendimiento, como conceptualización del producto educativo, puede clasificarse según dos dimensiones fundamentales: individual-social y mediato-inmediato.

Carácter Indirecto de la Medida en Educación

El carácter indirecto de la medida en educación significa que medimos a través de las respuestas dadas por el sujeto a unos estímulos que exigen por ejercicio la capacidad objeto de medida.

Instrumentos para Conocer la Estructura de Clase

Cuando pretendemos conocer la estructura de clase de alumnos de 6º de Primaria utilizaremos como instrumentos de medida una o varias técnicas sociométricas.

Instrumento para Enumerar Conductas Significativas

¿Cómo se denomina el instrumento que hace una enumeración de conductas significativas e incidentes que afectan a los sujetos objeto de estudio? Listas de control.

Clasificación de las «Técnicas y Hábitos de Estudio» como Instrumentos de Medida

Como instrumento de medida, las «técnicas y hábitos de estudio» pueden clasificarse como instrumentos pedagógicos y externos.

Construcción de un Cuestionario

Una de las técnicas de medición más extendidas en todo tipo de estudios evaluativos e investigaciones es el cuestionario. Su construcción debe planificarse asegurando la determinación, con precisión, de la información relevante.

Supuesto de la TCT

Uno de los supuestos de la TCT es que la puntuación verdadera y el error no están relacionados.

Fiabilidad Absoluta

La fiabilidad absoluta es un concepto clave en la predicción de las puntuaciones verdaderas de un sujeto en el test.

Objetivo del Análisis de Ítems

El objetivo básico del análisis de ítems de un test es mejorar las condiciones técnicas de la prueba, eliminando los ítems deficientes.

Característica Compartida por la TRI y la TCT

¿Cuál de las siguientes características comparten la TRI y la TCT? A medida que aumenta el número de ítems del test, aumenta su fiabilidad o información del test.

Significado del Parámetro b en los Modelos TRI

¿Qué significado tiene el parámetro b en los modelos TRI? Dificultad.

Modelos TRI con un Solo Parámetro

¿Qué nombre reciben los modelos TRI que utilizan un solo parámetro del ítem para calcular su curva característica? Modelos de Rasch.

Limitación del ID de un Ítem en la TCT

En el contexto de la teoría clásica del testo, el ID de un ítem tiene la limitación importante porque depende de las características de la muestra de los sujetos.

Parámetro del Ítem Medido en la Misma Escala que el Rasgo Latente en la TRI

¿Cuál es el parámetro del ítem que se encuentra medido en la misma escala que el rasgo latente TRI? Información.

Análisis de Ítems

Ítem 1	Ítem 2
ID = 0,70	ID = 0,80
IH = 0,60	IH = 0,50
IV = 0,40	IV = 0,30

¿Cuál de los dos ítems es más fácil? 2

¿Cuál tiene mayor poder discriminatorio? 1 (ID cerca de 0,5)

¿Qué ítem comparte mayor varianza con el criterio? 1 (mayor IV)

¿Qué ítem comparte mayor varianza con el test? 1 (mayor IH)

¿Qué % de varianza del test viene explicado por el ítem 2? 0,50² x 100 = 25%

¿Qué % de varianza del criterio viene explicado por el ítem 1? 0,40² x 100 = 16%

¿Qué % de personas aciertan el ítem 1? 70%