Location via proxy:   [ UP ]  
[Report a bug]   [Manage cookies]                

Indice de Confiabilidad de Un Test

Descargar como docx, pdf o txt
Descargar como docx, pdf o txt
Está en la página 1de 6

INDICE DE CONFIABILIDAD DE UN TEST

Según (Sampietri, 2014)La confiabilidad de un instrumento de medición se refiere al


grado en que su aplicación repetir al mismo individuo u objeto produce resultados. Por
ejemplo, si se midiera en este momento la temperatura ambiental usando un termómetro
y este indicara que hay 22°C y un minuto más tarde se consultara otra vez y señalara
5°C tres minutos después se observara nuevamente y este indicara 40°C, dicho
termómetro no sería confiable, ya que su aplicación repetida produce resultados
distintos. Así mismo , si una prueba de inteligencia se aplica hoy a un grupo de personas
y de ciertos valores de inteligencia, al igual que en subsecuentes mediciones, tal prueba
no sería confiable(analiza los valores de tabla 9,1,suponiendo que los coeficientes de
inteligencia oscilaran entre 100 y 135).los resultados no son coherentes, pues no se
puede “confiar “en ellos.
Ejemplo de resultados proporcionados por un instrumento de medición sin confiabilidad

PRIMERA APLICACIÓN SEGUNDA TERCERA APLICACIÓN


APLICACIÓN
Mariana 135 Sergio 131 Guadalupe 127
Viridiana 125 Laura Guadalupe 127
130
Sergio 118 Chester 125 Mariana 118
Laura 110 Guadalupe 112 Laura 115
Guadalupe 108 Mariana 110 Chester 112
Chester 106 Viridiana Viridiana
105 108
Agustín Agustín Sergio
100 101 105

La confiabilidad de un instrumento de medición se determina mediante diversas


técnicas, las cuales se comentaran brevemente después de revisar los conceptos de
validez y objetividad.
FACTORES QUE PUEDEN AFECTAR LA CONFIABILIDAD Y LA VALIDEZ
Hay diversos factores que llegan a afectar la confiabilidad y la validez de los
instrumentos de recolección de los datos e introducen errores de la medición. Entre lo
cual se menciona los comunes:
LA IMPROVISACION:
Algunas personas creen que elegir un instrumento de medición o desarrollar –lo que es
algo que puede tomarse a la ligera Incluso, ciertos profesores piden a los alumnos que
construyan instrumentos de medición de un día para otro o, lo que es igual, una semana
a otra, lo cual habla de poco o nulo conocimiento del proceso de elaboración de
instrumentos de recolección de los datos. Esta improvisación genera casi siempre
instrumento poco validos o confiables
a) Utilizar instrumentos desarrollados en el extranjero que no han sido validos en
nuestro contexto: Cultura y tiempo traducir un instrumento, cuando adaptemos
los términos a nuestro lenguaje y los contextualicemos, no es ni remotamente
una validación. Constituyen primer y necesario paso, aunque solo es el
principio.
b) Usar instrumentos inadecuados para las personas a quienes se les aplica: Utilizar
un lenguaje muy elevado para los sujetos respondientes, no tomar en cuenta
diferencias de género, edad, conocimientos, memoria, nivel ocupacional y
educativo, motivación para contestar, capacidades de conceptualización, y otras
diferencias en los participantes , son errores que llegan a afectar la validez y la
confiabilidad. Este error ocurre a menudo cuando los instrumentos deben
administrarse a niños. Asimismo, hay grupos de la población que requieren
instrumentos apropiados para ellos, tal es el caso de las personas con
capacidades distintas. En la actualidad se han desarrollado diversas pruebas que
las toman en cuenta (por ejemplo, pruebas en sistema Braille para individuos
con capacidades visuales distintas o pruebas orales para personas que no pueden
escribir). Otro ejemplo son los indígenas o inmigrantes de otras culturas, pues en
ocasiones se les aplican instrumentos en un idioma o contexto que no es el suyo.
Quien realiza una investigación debe adaptarse siempre a los participantes y no
al revés, ya que es necesario brindarles todo tipo de facilidades

MÉTODOS ESTABLECER LA CONFIABILIDAD


1. Estabilidad: La estabilidad de una medición denota la magnitud con la cual se
obtienen los mismos resultados en las nuevas aplicaciones o usos. Las
evaluaciones de la estabilidad de un instrumento de medición se obtienen de
métodos conocidos como confiabilidad ante una prueba y su repetición, a lo que
se conoce como el método test-retest. La utilización de la técnica, requiere
asumir que el factor que se mide pasa el mismo tiempo en las dos pruebas (test y
retest) y que ningún cambio en el valor o la puntuación es consecuencia de un
error al azar.
2. La confiabilidad test - retest: evalúa la estabilidad de la medición a lo largo del
tiempo. En este procedimiento un mismo instrumento de medición se aplica dos
o más veces a un mismo grupo de personas, después de cierto período. Si la
correlación de los resultados de las diferentes aplicaciones es altamente positiva,
el instrumento se considera confiable.
3. Equivalencia – Formas Paralelas: En este caso, se administran diferentes
formas de la misma prueba al mismo grupo de personas, luego se correlacionan
los dos conjuntos de puntajes. Se dice que las pruebas son equivalentes si la
correlación es estadísticamente significativa. Ej.: cuando se necesita administrar
dos pruebas del mismo constructo dentro de un tiempo relativamente corto y se
desea eliminar la influencia de los efectos de la práctica sobre los puntajes de los
participantes.
4. Equivalencia -fiabilidad ínter evaluadores: es la valoración de la
concordancia entre mediciones realizadas por dos o más observadores que han
medido el mismo evento. Dos o más recolectores observan independientemente
y registran el mismo evento utilizando el procedimiento de recolección de datos
desarrollado para el estudio, o el mismo recopilador observa y registra un evento
en dos ocasiones66.
5. Homogeneidad: Establece la correlación de varios ítems con el instrumento que
se analiza. El método más antiguo es la técnica de división por mitades. En ella,
los puntos que comprenden la prueba se dividen en dos grupos, se cuantifican y
se les da una puntuación independiente, y los resultados cuantificados de las dos
medias pruebas se utilizan para computar un coeficiente de correlación. Ej.: en
un instrumento de 20 planteamientos, se divide en dos grupos de 10
planteamientos cada uno, pares y nones, luego se correlacionan los puntajes de
las dos mitades de pruebas, la correlación describe el coeficiente de
confiabilidad para una prueba de “la mitad de larga” y la Spearman Brown es
usada para inferir la confiabilidad de la prueba completa. El coeficiente de
correlación que describe la relación entre las dos mitades es una estimación de la
congruencia interna de la escala
Otros métodos basados en la consistencia interna
 Alfa de Cronbach (1951): El coeficiente alfa (α) es un indicador de la fiabilidad
de un test basado en su grado de consistencia interna. Indica el grado en que los
ítems de un test covarían.
 Coeficientes de Kuder-Richardson (1937): Se trata de dos fórmulas aplicables
a sendos casos particulares de alfa. KR20 se aplica en el caso en que los ítems
del test sean dicotómicos, y KR21, en el caso de que además de ser dicotómicos,
tengan la misma dificultad.
 Método de Rulon (1939): Una estimación de la fiabilidad de un test a partir de
las puntuaciones obtenidas en sus dos mitades. Considera que la diferencia entre
las dos mitades se debe sólo al error aleatorio.
 Método de Guttman/Flanagan (1945/1937): Otra fórmula basada en la
consistencia interna, equivalente a la de Rulon.
 Coeficiente beta (β): Propuesto por Raju (1977) para calcular la fiabilidad de
una batería compuesta por diversos subtests. En los casos en los que se desea
calcular la fiabilidad de una batería, se trata a los distintos subtests como si
fueran los ítems de un único test y se calcula el coeficiente alfa global. El
problema surge en los casos en los que los distintos subtests no tienen el mismo
número de ítems, lo que suele ser lo más frecuente, y que repercute en una
infraestimación del alfa global. El coeficiente beta permite sortear esta
infraestimación.
 Coeficientes theta (θ) y omega (Ω): Basados en el análisis factorial de los
ítems, son indicadores de la consistencia interna similares al coeficiente alfa. El
coeficiente theta fue desarrollado por Carmines y Zeller (1979); y el coeficiente
omega fue desarrollado por Heise y Bohrnstedt (1970).

Según (Silvia Arciniega & Brain Calderon, 2006) la confiabilidad de un instrumento de


medición se refiere a grado en que su aplicación repetida a mismo sujeto u objeto
produce iguales resultados.
Existen diversos procedimientos para calcular a confiabilidad de un instrumento de
medición. Todos utilizan fórmulas que producen coeficientes de confiabilidad, estos
coeficientes pueden oscilar desde 0 a 1. Donde e coeficiente 0 significa una
confiabilidad y uno representa un máximo de confiabilidad.
Entre más se acerque el coeficiente a cero, hay mayor error en la medición
PROCEDIMIENTOS PARA DETERMINAR LA CONFIABILIDAD

Según (Hernandez, Fernandez, & Baptista, 1997) citado por (Silvia Arciniega & Brain
Calderon, 2006) mencionan 3 procedimientos para determinar la confiabilidad mediante
un coeficiente, y son:

1. Medidas de estabilidad (confiablidad por test-retest): en este


procedimiento un mismo instrumento de medición (ítems-indicadores) es
aplicado dos o más veces a un mismo grupo de personas, después de un
periodo de tiempo. Si a correlación entre los resultados de as diferentes
aplicaciones es altamente positiva, el instrumento se considera confiable,
se trata de una especie de diseño panel, desde luego, e periodo de tiempo
entre las mediciones es un factor a considerar. Si el periodo es largo y la
variable susceptible de cambios puede confundir la interpretación del
coeficiente de confiabilidad obtenido por este procedimiento. Si el
periodo es corto, las personas puedes recordad como contestaron en la
primera aplicación del instrumento, para aparecer como as consistente de
lo que son en realidad.

2. Coeficiente alfa de cronbach: este coeficiente desarrollado por J, L


cronbach requiere una sola administración del instrumento de medición y
produce valores que oscilan entre cero y uno. Su ventaja reside en que
nos necesario dividir en dos mitades de los ítems del instrumento de
medición, simplemente se aplica la medición y se calcula el coeficiente
alpa.

3. Coeficiente KR-20: Kuder Richardson(1937) desarrollaron un


coeficiente para estimar la confiabilidad de una medición, su
interpretación es la misma que la del coeficiente alpha

Según (Hernandez, Fernandez, & Baptista, 1997), la confiabilidad de un instrumento de


medición se refiere al grado en que su aplicación repetida al mismo sujeto u objeto
produce resultados iguales (consistentes y coherentes).El significado de la confiabilidad,
tal como se aplica a las pruebas y a la evaluación puede clarificarse todavía más si se
destacan los siguientes puntos generales:

1. El significado de la confiabilidad se refiere a los resultados obtenidos con un


instrumento de evaluación y o al instrumento mismo. Cualquier instrumento en
particular puede tener cierto número de confiabilidades diferentes, según sea el
grupo involucrado y la situación en que se use. Así pues, es más apropiado
hablar de la confiabilidad de “los resultados de la prueba" o de “la medición”,
que de “la prueba” o “el instrumento”.
2. Un punto íntimamente relacionado con lo anterior es que una estimación de la
confiabilidad siempre se refiere a un tipo particular de consistencia. Los
resultados de las pruebas no son, en general, dignos de que uno se fie de ellos.
Son de fiar (o susceptibles de generalizarse) en tiempos diferentes, dados
diferentes conjuntos de preguntas, con encargos de calificar diferentes, etc. Es
posible que los resultados de las pruebas sean consistentes con respecto a uno
cualquiera de los anteriores elementos y que no tenga consistencia alguna con
respecto a otro. El tipo apropiado de consistencia en un caso particular lo dicta el
uso que va a hacerse con los resultados.
3. La confiabilidad es condición necesaria pero no suficiente de la validez.
Cualquier prueba que arroje resultados totalmente inconsistentes no puede en
forma alguna posible suministrar información veraz sobre el comportamiento
que se mide. Por otro lado, hay resultados de prueba sumamente consistentes
que pueden estar midiendo algo equivocado que se pueden usar de maneras que
no son apropiadas.
4. A diferencia de la validez, la confiabilidad es estrictamente un concepto
estadístico. El análisis lógico de una prueba suministrara poca evidencia por lo
que hace a la confiabilidad de las calificaciones. La prueba debe administrarse,
una o más veces, a un grupo apropiado de personas y debe determinarse también
la consistencia de los resultados. Dicha consistencia bien puede expresarse en
términos de cambio en las posiciones relativas de las personas dentro del grupo
o en términos del grado de variación que cabe esperar en la calificación de un
individuo especifico. Se informa de la consistencia del primer tipo por medio de
un coeficiente de correlación llamado coeficiente de confiabilidad. Se informa
de la consistencia del segundo tipo mediante el error normal de la medición.
Ambos métodos de expresar la confiablidad son de uso generalizado y por ello
deben comprenderlos las personas responsables de la interpretación de los
resultados de las pruebas.

Para cualquier instrumento de medida (sea psicológico, físico o para medir el


aprendizaje) es necesario conocer cuál es la precisión con la que se mide, es decir, que
tantos errores tiene la medición. Mientras menos errores tengan más confiable es, lo que
propiciaría que cada vez que midamos algo sus valores cambiarían muy poco.

Estimación de la confiabilidad: coeficientes de confiabilidad

El coeficiente de confiabilidad es una medida para estimar la confiabilidad teórica de las


puntuaciones obtenidas. Se entiende como la correlación entre X y X’ obtenidas por el
participante cuando se le proporcionan dos veces la misma medida. Éste modelo para
calcular la confiabilidad de un instrumento trata de determinar cómo los errores
aleatorios (en la medida) afectan las puntuaciones obtenidas por el sujeto. Para calcular
el coeficiente de confiabilidad usualmente se utilizan las siguientes estrategias:

Modelo
Test- Consiste en la aplicación del mismo test al sujeto después de un intervalo
Retest de tiempo. Finalmente se correlacionan las dos puntuaciones obtenidas en
las dos aplicaciones para conocer el coeficiente de confiabilidad. Cuando
se correlacionan las dos puntuaciones y se obtiene el coeficiente adecuado
significa que existe estabilidad temporal de las puntuaciones obtenidas
(Mateo, 2008)
Formas Se necesitan construir formar paralelas de instrumento (p. ej. Forma A y
Paralelas Forma B) que necesariamente tienen que ser equivalentes, las cuales se le
aplican al sujeto. Posteriormente se correlacionan las puntuaciones
obtenidas en ambas formas para obtener el coeficiente de equivalencia.
Cuando se correlacionan las dos puntuaciones y se obtiene el coeficiente
adecuado significa que existe equivalencia de las puntuaciones obtenidas.
(Mateo, 2008)

Dos Un mismo test se divide en dos mitades equivalentes (se aconseja que se
mitades realice de forma aleatoria) para aplicárselo al sujeto. Posteriormente de
correlacionan las puntaciones obtenidas en cada mitades. Cuando se
obtiene la correlación adecuada significa que el test es consistente en su
extensión. (Mateo, 2008)

Covarianza entre los reactivos de una Prueba (Consistencia Interna)


Este cálculo de la confiabilidad consiste en comparar la puntuación obtenida en todo el
test con las puntuaciones individuales de cada reactivo. Una de las grandes ventajas de
este método es que solo se necesita de una administración de la prueba para poder
calcularlo. Usualmente se utilizan dos métodos para su cálculo: el Alfa de Cronbach
(para reactivos continuos) y la Kuder-Richardson (para pruebas con reactivos
dicotómicos).

Alfa de Cronbach
El coeficiente Alfa fue propuesto por Lee J. Cronbach en 1951. Es un índice usado para
medir la confiabilidad de tipo consistencia interna de una escala.
Este término hace referencia al promedio de las correlaciones entre los reactivos que
forman parte de un instrumento de medición o, también, se puede concebir como la
medida en la cual algún constructo está presente en cada reactivo.

Kuder-Richardson, Coeficiente KR-20


Kuder y Richardson, en 1937, desarrollaron un coeficiente para estimar la confiabilidad
de una medición, cuya interpretación, es la misma que la anterior.

Los nombres distintos de ambos coeficientes se deben a que los autores difieren en sus
modelos teóricos, aunque estén relacionados, y los desarrollaron en tiempos distintos.

También podría gustarte