Evaluación Educativa: Teoría Clásica de los Tests (TCT) y Teoría de Respuesta al Ítem (TRI)
Conceptos Básicos de Evaluación
La Evaluación Referida al Criterio
Evalúa el grado en que los sujetos alcanzan los niveles que se predeterminan con antelación.
Las Escalas de Medida
Diferentes reglas en donde se asignan números a las diferentes propiedades de los objetos.
Un Baremo
El resultado de transformar puntuaciones directas mediante grupos normativos.
El Proceso de Validación del Constructo
Pretende la confirmación de las hipótesis formuladas en función de la teoría del constructo.
Un Test como Instrumento
Un instrumento que nos ayuda a observar las reacciones de los sujetos ante determinados reactivos y medir cualquier característica.
Teoría Clásica de los Tests (TCT)
Concepto Equivalente en la TRI y la TCT
El error típico de medida.
Utilidad de la Tabla de Especificaciones
Para determinar en ella todos los objetivos y contenidos que se pretenden medir en la prueba.
Utilidad de la Tipificación
Poder interpretar las puntuaciones de los sujetos por comparación con un grupo normativo.
Característica de las Escalas Típicas
Exige un mayor nivel de abstracción y son más técnicas al tener en cuenta la media y la desviación típica.
Relación entre Error de Medida y Fiabilidad
Cuanto menor es el error de medida, la fiabilidad aumenta, por lo que se hace más fiable.
El Índice de Dificultad
Expresa la proporción de personas que aciertan el ítem (su valor depende del grupo a partir del cual se realice la prueba).
Definición de la Puntuación Verdadera
La media o valor esperado en las puntuaciones empíricas que obtendríamos al medir a un sujeto infinitas veces.
Supuesto del Modelo Básico de la TCT
Que la media de los errores es cero.
El Error de Medida
La diferencia entre la puntuación empírica y verdadera.
El Error de Estimación (Y-Y´)
Diferencia entre la puntuación empírica o real en el criterio y la puntuación pronosticada.
Precisión de un Test
Si un test mide con precisión, se refiere a su fiabilidad.
Validez de un Test
Si un test mide lo que pretende, se refiere a su validez.
Relación entre Fiabilidad y Validez
Si un test es muy fiable, la validez puede ser alta o baja.
Si un test es válido, es que es fiable.
Técnica Test-Retest y Variabilidad
Para hallar la variabilidad mediante la técnica test-retest se aplica la correlación de Pearson.
Usos del Error Típico de Medida
Para estimar la puntuación verdadera en el test y para estudiar la significatividad de las diferencias entre puntuaciones.
Usos del Error Típico de Estimación
Para estimar la puntuación verdadera en el criterio a partir de la puntuación del test.
Diferencia entre Validez Concurrente y Predictiva
El intervalo de tiempo entre la aplicación del test y la aplicación del criterio.
Los Ítems del Test
Los ítems del test tienen que constituir una muestra suficiente y representativa.
Efecto de la Reducción de la Longitud del Test
Si se reduce la longitud del test, disminuye la fiabilidad y la validez predictiva.
Interpretación del Coeficiente de Fiabilidad
Estabilidad (test-retest), equivalencia (formas paralelas), consistencia interna (alfa de Cronbach y dos mitades).
Ventajas del Procedimiento de Dos Mitades para el Cálculo del Coeficiente de Fiabilidad
Dos mitades tiene más ventajas en cuanto a la rapidez y ganancia de tiempo.
Validez de Constructo de una Prueba
La validez de constructo de una prueba nos permite conocer si el test está formado por ítems cuyo contenido hace referencia al rasgo o rasgos que se pretenden medir.
Teoría de Respuesta al Ítem (TRI)
Supuestos de la TRI
Unidimensionalidad e independencia local.
Validez de Constructo
Determinar el grado en que cada una de las personas que realiza la prueba posee el grado de la misma es objeto de la validez de constructo.
Los Inventarios
Los inventarios son preguntas a las que deben contestar personas observadas.
Eliminación de Ítems en un Test
De un test se eliminan los ítems cuyo índice de homogeneidad y de validez es inferior a 0,20.
Características para la Clasificación de la Información
Las características en las que se pretende clasificar la información recogida tiene que ser mutuamente excluyentes.
Errores Asociados a las Puntuaciones Verdaderas
Tienen una media igual a cero y su desviación típica se llama error típico de medida.
Test Paralelos
Si medimos a los sujetos con test paralelos, esperamos que la variabilidad de sus puntuaciones obtenidas sea aleatoria.
Coincidencia entre Puntuación Observada y Puntuación Verdadera
Si coincide la puntuación observada y la puntuación verdadera, la fiabilidad será perfecta por lo que los errores de medida serán igual a 0.
Concepto de Curva Característica del Ítem (CCI)
Relación funcional entre la probabilidad de respuesta correcta a un ítem y el rasgo latente hipotético.
Relación entre Varianza de las Puntuaciones Empíricas y Coeficiente de Fiabilidad
A medida que la varianza de las puntuaciones empíricas u observadas se debe a sus puntuaciones verdaderas, aumenta el coeficiente de fiabilidad hasta aproximarse a 1.
Factores que Afectan al Coeficiente de Validez
Longitud, variabilidad y fiabilidad.
Puntuaciones Típicas Normalizadas
Puntuaciones típicas obtenidas a partir de un grupo normativo que se ajusta a la distribución normal.
Escala de Cociente Intelectual
CI = EM/EC x 100
Importancia de la Definición Operativa en la Elaboración de Instrumentos de Medida
En la elaboración de los instrumentos de medida es fundamental una definición operativa del rasgo que se quiere medir.
El Índice de Homogeneidad
Expresa la capacidad de discriminación entre las personas con baja y con alta capacidad en la prueba.
Poder Discriminatorio de un Ítem
El poder discriminatorio de un ítem es tanto mayor cuanto más se acerca el índice de dificultad a 0,50.
Cálculo de un Eneatipo
E = 2 x Z + 5
Fuente de Error en la Técnica de las Dos Mitades
Una fuente de error en la técnica de las dos mitades es la falta de paralelismo entre las dos mitades.
Las Listas de Control
Las listas de control son instrumentos adecuados para medir actitudes y conductas.
Relación entre Coeficiente de Validez y Coeficiente de Determinación
Si el coeficiente de validez es igual a 0 (rxy = 0), el coeficiente de determinación (rxy2) será igual a cero.
Investigación y Evaluación
Diferencia Fundamental entre Investigación y Evaluación
La evaluación persigue elaborar juicios de cara a tomar decisiones, mientras que la investigación busca conclusiones.
Importancia de la Evaluación en la Calidad Educativa
Si la evaluación es importante como factor de promoción de la calidad educativa, es porque moviliza los procesos educativos hacia las metas formalmente establecidas.
Relación entre Evaluación Sumativa y Formativa
Una de las funciones claves de la evaluación está caracterizada por la dicotomía «sumativa-formativa» de manera que la segunda siempre precede a la primera, temporalmente.
Dimensiones del Rendimiento Educativo
El rendimiento, como conceptualización del producto educativo, puede clasificarse según dos dimensiones fundamentales: individual-social y mediato-inmediato.
Carácter Indirecto de la Medida en Educación
El carácter indirecto de la medida en educación significa que medimos a través de las respuestas dadas por el sujeto a unos estímulos que exigen por ejercicio la capacidad objeto de medida.
Instrumentos para Conocer la Estructura de Clase
Cuando pretendemos conocer la estructura de clase de alumnos de 6º de Primaria utilizaremos como instrumentos de medida una o varias técnicas sociométricas.
Instrumento para Enumerar Conductas Significativas
¿Cómo se denomina el instrumento que hace una enumeración de conductas significativas e incidentes que afectan a los sujetos objeto de estudio? Listas de control.
Clasificación de las «Técnicas y Hábitos de Estudio» como Instrumentos de Medida
Como instrumento de medida, las «técnicas y hábitos de estudio» pueden clasificarse como instrumentos pedagógicos y externos.
Construcción de un Cuestionario
Una de las técnicas de medición más extendidas en todo tipo de estudios evaluativos e investigaciones es el cuestionario. Su construcción debe planificarse asegurando la determinación, con precisión, de la información relevante.
Supuesto de la TCT
Uno de los supuestos de la TCT es que la puntuación verdadera y el error no están relacionados.
Fiabilidad Absoluta
La fiabilidad absoluta es un concepto clave en la predicción de las puntuaciones verdaderas de un sujeto en el test.
Objetivo del Análisis de Ítems
El objetivo básico del análisis de ítems de un test es mejorar las condiciones técnicas de la prueba, eliminando los ítems deficientes.
Característica Compartida por la TRI y la TCT
¿Cuál de las siguientes características comparten la TRI y la TCT? A medida que aumenta el número de ítems del test, aumenta su fiabilidad o información del test.
Significado del Parámetro b en los Modelos TRI
¿Qué significado tiene el parámetro b en los modelos TRI? Dificultad.
Modelos TRI con un Solo Parámetro
¿Qué nombre reciben los modelos TRI que utilizan un solo parámetro del ítem para calcular su curva característica? Modelos de Rasch.
Limitación del ID de un Ítem en la TCT
En el contexto de la teoría clásica del testo, el ID de un ítem tiene la limitación importante porque depende de las características de la muestra de los sujetos.
Parámetro del Ítem Medido en la Misma Escala que el Rasgo Latente en la TRI
¿Cuál es el parámetro del ítem que se encuentra medido en la misma escala que el rasgo latente TRI? Información.
Análisis de Ítems
Ítem 1 | Ítem 2 |
---|---|
ID = 0,70 | ID = 0,80 |
IH = 0,60 | IH = 0,50 |
IV = 0,40 | IV = 0,30 |
¿Cuál de los dos ítems es más fácil? 2
¿Cuál tiene mayor poder discriminatorio? 1 (ID cerca de 0,5)
¿Qué ítem comparte mayor varianza con el criterio? 1 (mayor IV)
¿Qué ítem comparte mayor varianza con el test? 1 (mayor IH)
¿Qué % de varianza del test viene explicado por el ítem 2? 0,502 x 100 = 25%
¿Qué % de varianza del criterio viene explicado por el ítem 1? 0,402 x 100 = 16%
¿Qué % de personas aciertan el ítem 1? 70%