Luisa E. Lezama Escuela de Psicología, Universidad Central de Venezuela
Luisa E. Lezama Escuela de Psicología, Universidad Central de Venezuela
Luisa E. Lezama Escuela de Psicología, Universidad Central de Venezuela
Luisa E. Lezama
Escuela de Psicología, Universidad Central de Venezuela
luisalezam@yahoo.com
Resumen
Abstract
Conceptualización de Confiabilidad
Si se aplica una Prueba de Competencia Lingüística a un niño el lunes y
el martes de la misma semana, bajo idénticas condiciones, y si la prueba
no capta errores, el niño debería obtener más o menos el mismo puntaje
en las dos mediciones, en cuyo caso se diría que el proceso de medición es
confiable. Si las calificaciones del niño son distintas, esto se deberá a que
la prueba es sensible a medir error, ya que sus competencias lingüísticas
deberían ser las mismas tanto el lunes como el martes. En este ejemplo se
diría que los resultados son no confiables.
El concepto de confiabilidad, justamente, hace alusión a esa repetibilidad o
replicabilidad de los resultados en la medición de una variable. Un proceso
de medición es confiable si las medidas que se hacen “carecen de errores”, con
lo cual los resultados obtenidos en una determinada ocasión con la misma
covarianzas entre ellos S2t = S2T + S2e + covTe, pero dado que la correlación
entre los puntajes verdaderos y de error es cero, la covarianza será cero
y la ecuación quedará como: S2t = S2T + S2e, de donde se desprende que
S2e = S2t - S2T.
d. La varianza total del test S2t es igual para los test paralelos; la varianza
de los puntajes verdaderos S2T es la misma para todos los test paralelos,
puesto que los sujetos contribuyen con el mismo puntaje a las diversas
distribuciones de puntajes verdaderos; la varianza de error S2e, es la
misma ya que es el producto de la sensibilidad del instrumento a captar
errores azarosos. Pero mientras las personas tienen el mismo puntaje
verdadero Tj en infinitos test paralelos, el tamaño y la dirección de los
puntajes de error ej variarán azarosamente de un test paralelo a otro.
A partir de las consideraciones previas, es posible derivar de la ecuación
general para calcular una correlación , la fórmula especial para
el cálculo del coeficiente de confiabilidad. Supóngase que se obtienen los
puntajes de un individuo j en dos test paralelos (tj1 y tj2), por lo que se estableció
previamente, ellos se representan como tj1 = Tj1 + ej1 y tj2 = Tj2 + ej2, si se
sustituye con estos símbolos la ecuación anterior se tendrá que:
, que al ser desarrollada queda de este modo:
Como derivación de los supuestos del modelo lineal de Spearman, el segundo
y tercer término se hacen cero, debido a que la correlación entre los puntajes
verdaderos y de error es cero (reT = 0); el cuarto término también se hace
cero, toda vez que no existe correlación entre los puntajes de error (re e = 0),
quedando solo el primer término de la ecuación .
En vista de que las desviaciones estándares son iguales para los tests
paralelos, es decir St1= St2, ese primer término de la ecuación queda
donde Tj representa la desviación de los puntajes de los sujetos respecto a la
media de las distribuciones de los puntajes verdaderos, que partido entre N,
es igual a la varianza de los puntajes verdaderos . Dicho término
queda ubicado en el numerador de la expresión que es dividida entre S2t
por lo tanto la correlación es adicionalmente, si se sustituye en el
numerador S2T = S2t - S2e , la expresión también puede escribirse como , lo
cual implica que la confiabilidad es la proporción de varianza total que es
varianza verdadera, el resto del porcentaje de varianza total, es explicada por
la varianza de error. Es decir, que mientras la varianza verdadera explique
más la varianza total, menor será la varianza de error y mayor será la
confiabilidad de la medida.
Error de medición
Como se indicó anteriormente, una calificación está constituida por la suma
de un puntaje verdadero más un puntaje de error tj=Tj+ej; éste último es el
responsable de que la calificación de un individuo sea distinta de un test
paralelo a otro, ya que, según se supuso, el puntaje verdadero siempre es el
mismo.
El puntaje de error puede ser el resultado de: a) procesos sistemáticos o
errores constantes que afectan a todas las observaciones por igual, por lo que
no influyen en las comparaciones, siendo normalmente desconsiderados, ó
b) procesos aleatorios que afectan a ciertas observaciones de manera diferente
que a otras, en cuyo caso se le denomina sesgo, el cual puede provenir de las
más variadas fuentes.
De esos eventos aleatorios, que producen sesgo en las calificaciones, se ocupa
la confiabilidad. Ellos pueden provenir de muy variadas fuentes, las cuales
Especificidad y complementariedad de
los métodos de confiabilidad
Tabla 1
Dimensión de la conducta e identificación del porcentaje de acuerdos.
Dimensión Formulas
Frecuencia
Frecuencia y Duración
Duración
Actividades planificadas
Nota. De “Metodología para el desarrollo del estudio infantil desde la perspectiva
conductual”, por R. Lacasella, 2000.
Los criterios anteriores, si bien han sido propuestos en el marco del análisis
experimental de la conducta, sirven muy bien a quienes trabajan con pruebas
semi-objetivas, quienes también pueden recurrir a otros índices como el de
Hambleton y Novick o el coeficiente Kappa, que, usados regularmente en
el contexto de test criteriales, pueden ser empleados también acá en tanto
suponen identificar acuerdo entre calificadores.
El índice de Hambleton y Novick informa la proporción de sujetos
consistentemente clasificados por dos evaluadores en las categorías
consideradas a través de la ecuación . El
coeficiente Kappa, que también es un indicador de concordancia, informa
la proporción de clasificaciones consistentes entre dos evaluadores, más
allá que las esperables por el azar , donde Pr(a) es la proporción
de concordancias observadas y Pr(e) es la proporción esperada de que K
evaluadores coincidan (Martínez, 1996).
En cualquiera de los casos, lo relevante es destacar que este método de
confiabilidad, al informar los errores debido al examinador, da cuenta de
la repetibilidad de las calificaciones de las personas, independientemente de
quien lo examine, lo cual lo hace irrelevante si la prueba es de calificación
objetiva, pero indispensable cuando se trate de instrumentos semiobjetivos,
proyectivos o registros conductuales.
De lo expuesto en este trabajo se desprende que cada método para establecer
confiabilidad es sensible a determinadas fuentes de error, quedando a criterio
de quien construye un instrumento seleccionar el método pertinente según
la utilidad del mismo.
R eferencias bibliográficas
Aiken, L. (2003). Test psicológicos y evaluación. (11ra Ed.). México: Prentice
Hall.
Anastasi, A. & Drake, J. (1954). An Empirical Comparison of Certain
Techniques for Estimating the Reliability of Speeded Tests. Educational
and Psychological Measurement, 14 (3), 529- 540.
Anastasi, A. Urbina, S. (1998). Test Psicológicos. (7ma Ed.). México: Prentice
Hall.
Brown, F. (1980). Principios de la Medición en Psicología y Educación. (4ta Ed.).
México: El Manual Moderno.