Validez Final
Validez Final
Validez Final
Se ha definido como el grado en que una prueba mide lo que está diseñada para medir.
Una desventaja de esta definición es la implicación de que una prueba solo tiene una
validez. La cual supuestamente es establecida por un solo estudio para determinar si la
prueba mide lo que se supone que debe medir. En realidad, una prueba puede tener
muchas clases de validez, dependiendo de los propósitos específicos para los cuales
fue diseñada, la población objetivo, las condiciones en que se aplica y el método para
determinar la validez.
Los métodos por los cuales puede determinarse la validez incluyen (1) analizar el
contenido de la prueba, (2) calcular la correlación entre las calificaciones en la prueba y
las calificaciones en el criterio de interés y (3) investigar las características psicológicas
particulares o constructos medios por la prueba. Todos esos procedimientos son útiles
en la medida que mejoran la comprensión de lo que mide una prueba y proporciona
información para tomar decisiones sobre la gente. También puede ser de interés
evaluar la validez creciente de una prueba, es decir que tanto añade a la prueba a la
predicción y comprensión de los criterios que ya son anticipados por otras medidas.
A diferencia de la confiabilidad, la cual es influida solo por los errores no sistemáticos
de medición, la validez es una prueba afectada tanto por los errores sistemáticos como
por los sistemáticos (constantes). Por esta razón, una prueba puede ser confiable sin
ser válida, pero no puede ser válida sin ser confiable, la confiabilidad es una condición
necesaria, pero no suficiente, para la validez.
VALIDEZ DE CONTENIDO
Se refiere al grado en que el test presenta una muestra adecuada de los contenidos a
los que se refiere, sin omisiones y sin desequilibrios de contenido. La validez de
contenido se utiliza principalmente con test de rendimiento, y especialmente con los test
educativos y test referidos al criterio. En este tipo de test se trata de comprobar los
conocimientos respecto a una materia o un curso. La validez de contenido descansa
generalmente en el juicio de expertos (métodos de juicio). Se define como el grado en
que los ítems que componen el test representan el contenido que el test trata de
evaluar. Por tanto, la validez de contenido se basa en (a) la definición precisa del
dominio y (b) en el juicio sobre el grado de suficiencia con que ese dominio se evalúa.
• Usar la misma puntuación de corte para todos los ítems de la escala, incluso si la
escala es multidimensional.
• No poner una puntuación de corte tan alta que implique eliminar muchos ítems. (Se
podrán eliminar más ítems con el cálculo de la fiabilidad y el análisis factorial).
ne - N/2
IVC= -----------------
N/2
mejor validez de contenido. Un índice IVC = 0 indica que la mitad de los expertos
han evaluado el ítems como esencial. Los ítems con una bajo IVC serán eliminados.
Lawshe (1975) sugiere que un IVC = .29 será adecuado cuando se hayan utilizado 40
expertos, un IVC = .51 será suficiente con 14 expertos, pero un IVC de, al menos, .99
será necesario cuando el número de expertos sea 7 o inferior.
Se refiere al grado en que el test correlaciona con variables ajenas al test (criterios) con
lo que se espera por hipótesis que debe correlacionar de determinado modo. Un criterio
es una variable distinta del test que se toma como referencia, que se sabe que es un
indicador de aquello que el test pretende medir o que se sabe que debe presentar una
relación determinada con lo que el test pretende medir. Se denomina coeficiente de
validez a la correlación del test con un criterio externo.
Este coeficiente de validez interna suele alcanzar el valor del coeficiente de validez
Hace referencia a la validez del resultado de la investigación para los sujetos
estudiados.
Validez factorial
Validez convergente-discriminante
Este tipo de validez se determina a partir de los resultados arrojados por la matriz
multirrasgo-multimétodo (diseño MRMM, sistematizado por Campbell y Fiske en 1959).
El sistema consiste en realizar mediciones de varios rasgos con distintos métodos de
medición. De este modo podemos encontrarnos con varios resultados.
Validez concurrente
Validez predictiva
la validez predictiva atañe a la precisión con que las puntuaciones de una prueba
predicen puntuaciones de criterio. Según lo indica la correlacion entre la
prueba( predictor) y un criterio del desempeño del futuro. La validez predictiva es de
interés sobre todo para las pruebas de aptitud o inteligencia. Ya que las puntuaciones
de esos tipos de instrumentos a menudo se correlacionan con las puntuaciones, notas
de cursos, calificaciones de pruebas de aprovechamiento y otros criterios de
desempeño.
La magnitud de un coeficiente de validez predictiva está limitada por la confiabilidad de
las variables de predicción y de criterio; no puede ser mayor que la raíz cuadrada del
producto de esas dos confiabilidades. Por esta y por otras razones, la correlación entre
un predictor y una variable de criterio, calculada mediante procedimientos descritos en
el apéndice A, varia con el criterio especifico, pero rara vez es mayor a.60. Como la
proporción de la varianza en la variable de criterio que puede ser explicada por la
variación en la variable predictora es igual al cuadrado de la correlación entre las
variables predictora y de criterio, por lo general no puede predecirse más de 36% de la
variación de las puntuaciones de criterio a partir de las puntuaciones obtenidas en una
prueba u otro instrumento psicométrico. Esto deja sin explicar o predecir un 64% de la
varianza de criterio. Considerando que la validez predictiva de la mayoría de las
pruebas es menor de .60, es comprensible por qué deben hacerse con cuidado las
afirmaciones concernientes con la posibilidad de predecir los criterios de desempeño a
partir de las puntuaciones obtenidas en las pruebas psicológicas.
3. PROCEDIMIENTOS PARA SU OBTENCIÓN
Métodos interpruebas: Utilizan las técnicas del análisis factorial (para evaluar
los factores que subyacen en las intercorrelaciones de las pruebas estudiadas),
la validez congruente (en tanto correlaciona los puntajes de la prueba con los
puntajes obtenidos en otra prueba de validez ya establecida), los estudios de
validez convergente y divergente discriminante (propuestos por Campbell).
BIBLIOGRAFIA