Location via proxy:   [ UP ]  
[Report a bug]   [Manage cookies]                

TEMA 5 Psicometría

Descargar como docx, pdf o txt
Descargar como docx, pdf o txt
Está en la página 1de 4

TEMA 5: Analisis de los items de un test

1. Introducción ¿a que hace referencia los análisis de los ítems?


Todos los tests formados por elementos o ítems. Si conocemos la calidad de cada ítem
del test, seremos capaces de determinar la calidad de las puntuaciones totales, porque la
calidad de los ítems de un test es calidad del test.
Calidad de los ítems → Calidad del test
El principal propósito del análisis de ítems es mejorar el test a través de la revisión o
eliminación de ítems inefectivos. Así, aumentamos nuestra comprensión de un test (para
saber por qué un test es “fiable y válido”, o no)
El análisis de ítems se refiere a: Un grupo variado de estadísticas que se calculan para
cada ítem de un test. → Estas estadísticas del ítem ayudan a determinar el rol que cada
ítem juega en el test.
2. Principios en la construcción del test.
Muchos ítems: En la práctica de la construcción de un test se comienza escribiendo un
conjunto numeroso de ítems, generalmente mucho mayor que la prevista longitud del test.
Estos ítems se aplican a un grupo de sujetos (estudio piloto).
Las respuestas a los ítems dadas por estos sujetos se analizan.
Revisión: Depuración del test definitivo: mejorar el test
3. Estudio piloto
Con el estudio piloto podremos:
- Identificar ítems débiles
- Determinar la dificultad de cada ítem
- Conocer para cada ítem su poder discriminativo
- Fijar cuántos ítems formaran el test definitivo
- Establecer los límites de tiempo
- Calcular las intercorrelaciones entre los ítems para ver si es homogéneo
Sugerencias para hacer el estudio piloto
- Muestreo: representativa de la población objetivo, las características de la muestra
deben ser similares a la población objeto (a la población a la que va dirigida
nuestro test). Número de personas, 5-10 por ítems
- Administración: preguntar a los sujetos pilotos acerca del test (preguntas abiertas)
→ (validez aparente). Examinadores parecidos a los finales.
- Devolución de resultados. Facilita cooperación.
3.1. Índice de dificultad
Se utiliza en tests de aptitudes y rendimiento máximo/óptimo.
Se entiende por ÍNDICE DE DIFICULTAD (ID o pi) de un ítem la proporción de sujetos
que lo aciertan entre aquellos que lo han intentado resolver.
ID = A / N
A = Número de sujetos que aciertan el ítem
N = Número de sujetos que han intentado resolverlo
El índice de dificultad puede tomar valores entre 0 y 1.
La varianza de un ítem puede expresarse en términos de dificultad: La varianza, en una
variable dicotómica, viene dada por la proporción de aciertos (pi) (o índice de dificultad)
multiplicada por la proporción de no aciertos (qi =1-pi). σ 2i = pi qi
Semánticamente más apropiado llamarlo “índice de facilidad”.

A priori se puede considerar que el valor ideal es 0,50 porque maximiza el poder
discriminatorio del ítem.
Imaginemos que de 100 sujetos, 50 personas aciertan el ítem (pi = 50 y qi =50 o en
proporción pi=50/100= 0.5 y qi=1- 0.5=0.5). Esto significa que cada una de las 50 personas
que aciertan el ítem se diferencia (es diferente) de cada una de las 50 personas que no
aciertan el ítem, (50 x 50 = 2500 discriminaciones).
Si 75 aciertan y 25 no, 75 x 25 = 1875 discriminaciones.
Pero, si lo que nos interesa es, por ejemplo, seleccionar a los mejores 30 de 100
aspirantes para un puesto, el índice de dificultad promedio óptimo sería el 0,30.
Además, cuando se trata de ítems de elección múltiple, el índice pi puede estar
artificialmente aumentado por las respuestas debidas al azar. En este caso el valor óptimo
no es 0,50 sino más elevado, 0,70 podría ser un valor óptimo.
Una limitación de este índice es su dependencia directa de la muestra de sujetos en la
que se calcula.
El índice de dificultad no constituye una propiedad intrínseca del ítem, su valor
depende del tipo de sujetos a los que se les aplique.
3.2. Índice de discriminación.

Se dice que un ítem tiene poder discriminativo si distingue, discrimina, entre aquellos
sujetos que puntúan alto en el test y los que puntúan bajo, es decir, si discrimina entre los
eficaces en el test y los ineficaces.

El índice de discriminación se define como la correlación entre las puntuaciones de los


sujetos en el ítem y sus puntuaciones en el test (totales).

La fiabilidad del test se maximiza cuando los ítems tienen índices de discriminación
altos

Posibles coeficientes de correlación para la estimación del índice de discriminación:

- Coeficiente de correlación de Pearson


- Correlación biserial-puntual
- Correlación biserial
- Coeficiente Phi
- Correlación tetratórica
- Índice basado en proporciones de aciertos
CORRELACIÓN DE PEARSON (r)

Si los ítems y los totales que estamos analizando están medidos en una escala
cuantitativa, con un grado de variabilidad amplio, se calcula este coeficiente como grado de
la relación entre las puntuaciones del ítem y la puntuación total

CORRELACIÓN BISERIAL-PUNTUAL

Es una aplicación de la correlación de Pearson cuando una de las variables es


dicotómica y la otra cuantitativa continua.

Es habitual que los tests de aptitud tengan ítems dicotómicos (o se aciertan o se fallan)
y el test constituya una medida cuantitativa.

Para aplicar la fórmula, a la puntuación total del test (X) hay que descontarle el ítem
cuyo índice de discriminación se pretende hallar (X – j), de lo contrario una de las variables
a correlacionar estaría impropiamente incluida en la otra. A la puntuación total debemos
quitarle la puntuación del ítem (del que queremos medir su discriminación)

Interpretación del indice de discriminación propuesta por Backhoff

- Excelente: 0,40 o más


- Buena: 0,30 - 039
- Regular: 0,20 - 0,29
- Pobre: 0,00 - 0,19
3.3. ÍNDICE BASADO EN LAS PROPORCIONES DE ACIERTOS
Al contrario que los demás, no se basa en la correlación ítem-test.
Es la diferencia entre la proporción de sujetos competentes que aciertan el ítem (Pc) y
la proporción de sujetos incompetentes que también lo aciertan (Pi).
Se entiende por competente: aquellos que puntúan en el test por encima de la
mediana e incompetentes por debajo. Pueden utilizarse grupos más extremos como el
27%.
d= Pc – Pi
Interpretación:
- La capacidad discriminativa del ítem aumenta a medida que d se aleja de cero, bien
sea hacia 1 o hacia -1.
o 1 significaría que todos los competentes aciertan el ítem y todos los
incompetentes lo fallan.
o -1 significaría que todos los incompetentes lo aciertan y todos los
competentes lo fallan.
3.4. Índice de validez

Correlación con el criterio.

¿Qué correlación tengo que utilizar? Lo dicho en el índice de discriminación, dependerá


de la naturaleza de las variables.

La validez global se verá incrementada a medida que los ítems del test tienen índices
de validez elevados.

4. Elaboración y análisis de alternativas incorrectas (distractores)


Cuando son de elección múltiple.
Distractor: opción o alternativa incorrecta. Su función es la de decrecer la probabilidad
de acertar al azar.
Un índice de discriminación bajo puede venir dado porque las alternativas falsas
(distractores) atraen igual que la opción correcta. O porque hay opciones que no son
elegidas por nadie.
¿Qué aspectos hay que tener en cuenta al crear distractores?
- Plausibilidad: una opción incorrecta (distractor) es plausible cuando es elegida por
los sujetos con escasa competencia. Cuidar la construcción de las opciones
incorrectas.
- Orden: orden de la respuesta correcta
- Que sean elegidos por un mínimo de sujetos.
- Que sean aproximadamente igual de atractivos
5. Corrección azar
En los ítems de elección múltiple se puede acertar aun sin conocer la respuesta
correcta (AZAR).
Fórmula clásica para corregir el azar:
A=Número de aciertos
E= Número de errores
n= Número de alternativas del ítem

También podría gustarte