Validez Final

VALIDEZ
Se ha definido como el grado en que una prueba mide lo que está diseñada para medir.
Una desventaja de esta definición es la implicación de que una prueba solo tiene una
validez. La cual supuestamente es establecida por un solo estudio para determinar si la
prueba mide lo que se supone que debe medir. En realidad, una prueba puede tener
muchas clases de validez, dependiendo de los propósitos específicos para los cuales
fue diseñada, la población objetivo, las condiciones en que se aplica y el método para
determinar la validez.
Los métodos por los cuales puede determinarse la validez incluyen (1) analizar el
contenido de la prueba, (2) calcular la correlación entre las calificaciones en la prueba y
las calificaciones en el criterio de interés y (3) investigar las características psicológicas
particulares o constructos medios por la prueba. Todos esos procedimientos son útiles
en la medida que mejoran la comprensión de lo que mide una prueba y proporciona
información para tomar decisiones sobre la gente. También puede ser de interés
evaluar la validez creciente de una prueba, es decir que tanto añade a la prueba a la
predicción y comprensión de los criterios que ya son anticipados por otras medidas.
A diferencia de la confiabilidad, la cual es influida solo por los errores no sistemáticos
de medición, la validez es una prueba afectada tanto por los errores sistemáticos como
por los sistemáticos (constantes). Por esta razón, una prueba puede ser confiable sin
ser válida, pero no puede ser válida sin ser confiable, la confiabilidad es una condición
necesaria, pero no suficiente, para la validez.
VALIDEZ DE CONTENIDO
Se refiere al grado en que el test presenta una muestra adecuada de los contenidos a
los que se refiere, sin omisiones y sin desequilibrios de contenido. La validez de
contenido se utiliza principalmente con test de rendimiento, y especialmente con los test
educativos y test referidos al criterio. En este tipo de test se trata de comprobar los
conocimientos respecto a una materia o un curso. La validez de contenido descansa
generalmente en el juicio de expertos (métodos de juicio). Se define como el grado en
que los ítems que componen el test representan el contenido que el test trata de
evaluar. Por tanto, la validez de contenido se basa en (a) la definición precisa del
dominio y (b) en el juicio sobre el grado de suficiencia con que ese dominio se evalúa.
A pesar de que no se utiliza un índice de correlación para expresar la validez de
Contenido, existen procedimientos para cuantificarlo. Algunos de estos procedimientos

son:
a) Cálculo de descriptivos: Consiste en calcular la media y la desviación típica de todos

los ítems. A continuación, se determinará una puntuación de corte (o índice de validez
de contenido) que refleje, en base a la evaluación de los expertos (método de juicio),
que la puntuación del ítem es demasiado baja en relevancia como para ser incluido en
la escala. No hay reglas. La decisión dependerá del juicio propio. Por este motivo, se
han de tener en cuenta las siguientes cuestiones:
• Ser capaz de justificar la decisión sobre la puntuación corte.
• Usar la misma puntuación de corte para todos los ítems de la escala, incluso si la
escala es multidimensional.
• No poner una puntuación de corte tan alta que implique eliminar muchos ítems. (Se
podrán eliminar más ítems con el cálculo de la fiabilidad y el análisis factorial).
b) Índice de validez de contenido (IVC): Lawshe (1975) propuso un índice de validez

basado en la valoración de un grupo de expertos de cada uno de los ítems del test
como innecesario, útil y esencial. El índice se calcula a través de la siguiente fórmula:
ne - N/2
IVC= -----------------
N/2
Donde ne es el número de expertos que han valorado el ítem como esencial y N es el

número total de expertos que han evaluado el ítem.
El IVC oscila entre +1 y -1, siendo las puntuaciones positivas las que indican una
mejor validez de contenido. Un índice IVC = 0 indica que la mitad de los expertos
han evaluado el ítems como esencial. Los ítems con una bajo IVC serán eliminados.
Lawshe (1975) sugiere que un IVC = .29 será adecuado cuando se hayan utilizado 40
expertos, un IVC = .51 será suficiente con 14 expertos, pero un IVC de, al menos, .99
será necesario cuando el número de expertos sea 7 o inferior.
1. VALIDEZ DE CRITERIO O CRITERIAL
Se refiere al grado en que el test correlaciona con variables ajenas al test (criterios) con
lo que se espera por hipótesis que debe correlacionar de determinado modo. Un criterio
es una variable distinta del test que se toma como referencia, que se sabe que es un
indicador de aquello que el test pretende medir o que se sabe que debe presentar una
relación determinada con lo que el test pretende medir. Se denomina coeficiente de
validez a la correlación del test con un criterio externo.
La elección del criterio es el aspecto crítico en este procedimiento de determinación de

la validez, ya que es muy difícil obtener buenos criterios. Un mismo test puede tener
más de un tipo de validez, es decir puede estar validado con respecto a varios criterios
y los diferentes coeficientes de validez que resultan pueden tener valores diferentes.
Dentro del concepto de validez de criterio cabe distinguir a su vez entre:
- Validez externa y validez interna
- Validez concurrente y validez predictiva
a) Hablamos de validez externa si el test se ha validado con respecto a un criterio

externo, como por ejemplo, una evaluación de rendimiento. La correlación del test con
el criterio da lugar al coeficiente de validez externa. Hace referencia a la posibilidad de
generalización.
Sin embargo, hablaremos de validez interna si se correlaciona un test con otro con
validez reconocida que mide el mismo rasgo; los coeficientes de validez interna suelen
ser menores que los de validez externa y su interpretación es difícil. Para evitar errores
de interpretación se suele correlacionar un test con todos los test ya validados que
miden lo mismo y calcular un coeficiente de correlación múltiple.
Este coeficiente de validez interna suele alcanzar el valor del coeficiente de validez
Hace referencia a la validez del resultado de la investigación para los sujetos
estudiados.
b) La distinción entre validez concurrente y predictiva se emplea según se utilice un

criterio disponible en el momento (validez concurrente) o cuando se pretenda predecir
la conducta futura de un individuo (validez predictiva). Este tipo de validez se exige
especialmente para los instrumentos que se utilizan en selección y orientación
académica o profesional.
Cálculo del coeficiente de validez
Los procedimientos estadísticos utilizados en la validación referida a un criterio varían

según el número de predictores utilizados (uno o más tests) y el número de criterios
empleados (criterio único y criterio compuesto o múltiple). Martínez Arias (1995)
distingue los siguientes casos:
1. Un único test y un solo criterio: se emplearían los procedimientos de correlación y

regresión lineal simple.
2. Varios predictores (test) y un solo criterio: se emplea la correlación y regresión lineal

múltiple o el análisis discriminante.
3. Varios predictores y varios criterios: regresión lineal multivariante y la correlación

canónica.
2. VALIDEZ DE CONSTRUCTO
La validez predictiva es del mayor interés en la selección y ubicación en un contexto

ocupacional o educativo. La validez de un constructo es de mayor interés en las prueba
de personalidad. Por eso se puede definir como
“La validez de constructo de un instrumento de evaluación psicológica se refiere al

grado en que el instrumento mide un constructo particular, o concepto psicológico como
la ansiedad, la motivación para el logro, la extroversión-introversión o el neurocitismo.
La validez de constructo, que es el tipo más general de validez, no se determina de una
sola manera o por una investigación. Más bien involucra una red de investigaciones y
otros procedimientos diseñados para determinar un instrumento de evaluación que
supuestamente mide una variable de personalidad en realidad lo hace.”(Aiken, Cap. N.
5, Pág. n. 99).
El proceso de validación de constructo implica a partir del establecimiento de

deducciones de la teoría:
 Los juicios de expertos de que el contenido de la prueba corresponde al

constructo de interés.
 Análisis de la consistencia interna de la prueba.
 Estudios en grupos formados de manera experimental como en grupos que se
presentan de manera natural, de las relaciones entre las puntuaciones de la
prueba y otras variables en las cuales difieren los grupos.
 Correlaciones de las puntuaciones en la prueba con las puntuaciones en otras
pruebas y variables con las cuales se espera que tengan cierta relación,
seguidas por un análisis factorial de esas correlaciones.
 Interrogar con detalle a los examinados o a los calificadores acerca de sus
respuestas a una prueba o escala de calificación para revelarlos procesos
mentales específicos implicados al dar respuesta de los reactivos.
La información puede obtenerse de análisis racionales o estadísticos de las variables

evaluadas por el instrumento y por estudios de su capacidad para predecir la conducta
en las situaciones en que opera el constructo.
La evidencia a favor de estas validaciones de un instrumento psicométrico puede
obtenerse comprando las correlaciones entre las medidas de:
 El mismo constructo usando el mismo método.

 Diferente constructo usando el mismo método.
 El mismo constructo usando métodos diferentes.
 Diferentes constructos usando métodos diferentes.
Los resultados de dichas comparaciones no siempre resultan de esta manera; las

correlaciones entre diferentes constructos medidas por el mismo método son más altas
que las correlaciones entre el mismo constructo medidas por métodos diferentes. Esto
significa que el método es más importante que el constructo o rasgo particular en la
determinación de lo que está siendo medido que el constructo o rasgo que está siendo
evaluado.
Los procedimientos metodológicos más utilizados para la obtención de datos referentes

a la validez de constructos psicológicos han sido el análisis factorial y la matriz
multirrasgo-multimétodo. Ambos sistemas son indicadores respectivos de las
denominadas "validez factorial" y "validez convergente-discriminante
Validez factorial
El análisis factorial es una técnica del análisis multivariado que permite realizar una

estimación de los factores que dan cuenta de una serie de variables. Se trata de una
técnica de reducción de datos que permite encontrar grupos homogéneos de variables
a partir de un grupo de variables mucho más numeroso. Los criterios de formación de
grupos se basan en la necesidad de que las variables a agrupar correlacionen entre sí,
y cumplan el requisito de ser independientes. Es decir, formarán un grupo aquellas
variables que, siendo independientes entre sí, muestren un índice
de correlación elevado. Así, podremos hablar de validez factorial de un constructo en
aquellos casos en los que todas las medidas que se hayan diseñado para evaluarlo
arrojen resultados similares al ser sometidas a un análisis factorial. Este análisis puede
ser evaluatorio, si se realiza con la intención de descubrir la posible estructura
subyacente factorial de un conjunto de datos cualesquiera; o confirmatorio, si se realiza
con base en unas expectativas y teorías previas al respecto de esa estructura.
Validez convergente-discriminante
Este tipo de validez se determina a partir de los resultados arrojados por la matriz
multirrasgo-multimétodo (diseño MRMM, sistematizado por Campbell y Fiske en 1959).
El sistema consiste en realizar mediciones de varios rasgos con distintos métodos de
medición. De este modo podemos encontrarnos con varios resultados.
 Validez convergente: existe validez convergente cuando las mediciones del

mismo rasgo realizadas con distintos métodos correlacionan entre sí. El hecho de
que un mismo rasgo sea detectado por igual con varias metodologías diferentes, es
un indicador fiable de la existencia real de ese rasgo. Se dice que en este caso, las
medidas convergen.
 Validez discriminante: se refiere al grado de diferenciación entre distintos
constructos a partir de un único sistema de medición. Es decir, las medidas de
distintos rasgos por el mismo método muestran una baja correlación en
comparación con la que muestran las medidas del mismo rasgo con diferentes
métodos, señal de que los rasgos son independientes entre sí, e independientes al
sistema de medición empleado.
Validez concurrente
los procedimientos de validación concurrente se emplean siempre que una prueba se

aplica a personas clasificadas en varias categorías, como grupos de diagnóstico clínico
o niveles socioeconómicos, con el propósito de determinar si las puntuaciones en la
prueba de las personas ubicadas en una categoría son significativamente diferentes de
las de los individuos que se hallan en otras categorías. Si la calificación promedio varia
de modo sustancial de una categoría a otra, entonces la prueba puede usarse como
otra forma, quizá más eficiente, de asignar a la gente a esas categorías. Por ejemplo,
las puntuaciones en el inventario multifasico de personalidad de Minnesota (MMPI) han
sido útiles en la identificación de trastornos mentales específicos, porque se han
encontrado que los pacientes a quienes los psiquiatras diagnostican trastornos
particulares tienden a diferir del resto de la población en las puntuaciones que obtienen
ciertos grupos de reactivos ( escalas)
Validez predictiva
la validez predictiva atañe a la precisión con que las puntuaciones de una prueba
predicen puntuaciones de criterio. Según lo indica la correlacion entre la
prueba( predictor) y un criterio del desempeño del futuro. La validez predictiva es de
interés sobre todo para las pruebas de aptitud o inteligencia. Ya que las puntuaciones
de esos tipos de instrumentos a menudo se correlacionan con las puntuaciones, notas
de cursos, calificaciones de pruebas de aprovechamiento y otros criterios de
desempeño.
La magnitud de un coeficiente de validez predictiva está limitada por la confiabilidad de
las variables de predicción y de criterio; no puede ser mayor que la raíz cuadrada del
producto de esas dos confiabilidades. Por esta y por otras razones, la correlación entre
un predictor y una variable de criterio, calculada mediante procedimientos descritos en
el apéndice A, varia con el criterio especifico, pero rara vez es mayor a.60. Como la
proporción de la varianza en la variable de criterio que puede ser explicada por la
variación en la variable predictora es igual al cuadrado de la correlación entre las
variables predictora y de criterio, por lo general no puede predecirse más de 36% de la
variación de las puntuaciones de criterio a partir de las puntuaciones obtenidas en una
prueba u otro instrumento psicométrico. Esto deja sin explicar o predecir un 64% de la
varianza de criterio. Considerando que la validez predictiva de la mayoría de las
pruebas es menor de .60, es comprensible por qué deben hacerse con cuidado las
afirmaciones concernientes con la posibilidad de predecir los criterios de desempeño a
partir de las puntuaciones obtenidas en las pruebas psicológicas.
3. PROCEDIMIENTOS PARA SU OBTENCIÓN
 Métodos intrapruebas: cuyas fuentes de evidencia más usadas son: la validez

de contenido de la prueba, el análisis de los procesos psicológicos empleados al
responderla (pidiendo que los sujetos “razonen” en voz alta sus respuestas).
Otras técnicas estudian la estructura interna de la prueba, mediante el análisis de
los ítems y las correlaciones entre los diferentes subtests; asimismo, también
mediante el establecimiento de la homogeneidad a través del coeficiente alfa de
Cronbach o los coeficientes de Kuder.
 Métodos interpruebas: Utilizan las técnicas del análisis factorial (para evaluar
los factores que subyacen en las intercorrelaciones de las pruebas estudiadas),
la validez congruente (en tanto correlaciona los puntajes de la prueba con los
puntajes obtenidos en otra prueba de validez ya establecida), los estudios de
validez convergente y divergente discriminante (propuestos por Campbell).
 El método de los estudios relacionados con los criterios: Que implican la

diferenciación de grupos (evaluando la capacidad de la prueba para poder
diferenciar dos o más grupos naturalmente separados o diseñados
experimentalmente) y los coeficientes de validez (cuando la prueba es aplicada a
un grupo de sujetos en los que se estudian criterios relacionados con el
constructo teórico estudiado).
 El método de la manipulación experimental: Se manipula experimentalmente

una variable y se observa sus efectos sobre los puntajes de una prueba
psicológica o la relación de estos puntajes con algún criterio.
 El método de los estudios de la capacidad de generalización: Estos estudios
analizan sistemáticamente la prueba psicológica en una amplia gama de
dimensiones o en condiciones diferentes de administración (la matriz multirasgo-
multimétodo propuesta por Campbell y Fiske).
BIBLIOGRAFIA
 Aiken, Lewis R. (2003). Test psicológicos y evaluación, Capitulo N. 5, pág. N. 93 - 100

 Aliga, Tovar Jaime, Psicometría: Tests Psicométricos, Confiabilidad y Validez,
recuperado en línea:
file:///C:/Users/Santiago/Downloads/1U2LibroEAPAliaga.pdf.
 Castejón Costa, J. L. (1997). Introducción a los métodos y técnicas de investigación y

obtención de datos en psicología. Sant Vicent del Raspeig, España: ECU.
 Martínez Arias, M. R. (1995). Psicometría. Teoría de los test psicológicos y educativos.

Madrid, España: Síntesis.
 Wikipedia, (2011) Validez (psicometría), recuperado en línea:

https://es.wikipedia.org/wiki/Validez_(psicometr%C3%ADa)

Validez Final

Cargado por

Copyright:

Formatos disponibles

Validez Final

Cargado por

Información del documento

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Validez Final

Cargado por

Copyright:

Formatos disponibles

VALIDEZ

A pesar de que no se utiliza un índice de correlación para expresar la validez de

Contenido, existen procedimientos para cuantificarlo. Algunos de estos procedimientos

a) Cálculo de descriptivos: Consiste en calcular la media y la desviación típica de todos

• Ser capaz de justificar la decisión sobre la puntuación corte.

b) Índice de validez de contenido (IVC): Lawshe (1975) propuso un índice de validez

Donde ne es el número de expertos que han valorado el ítem como esencial y N es el

1. VALIDEZ DE CRITERIO O CRITERIAL

La elección del criterio es el aspecto crítico en este procedimiento de determinación de

Dentro del concepto de validez de criterio cabe distinguir a su vez entre:

- Validez externa y validez interna

- Validez concurrente y validez predictiva

a) Hablamos de validez externa si el test se ha validado con respecto a un criterio

b) La distinción entre validez concurrente y predictiva se emplea según se utilice un

Cálculo del coeficiente de validez

Los procedimientos estadísticos utilizados en la validación referida a un criterio varían

1. Un único test y un solo criterio: se emplearían los procedimientos de correlación y

2. Varios predictores (test) y un solo criterio: se emplea la correlación y regresión lineal

3. Varios predictores y varios criterios: regresión lineal multivariante y la correlación

La validez predictiva es del mayor interés en la selección y ubicación en un contexto

“La validez de constructo de un instrumento de evaluación psicológica se refiere al

El proceso de validación de constructo implica a partir del establecimiento de

 Los juicios de expertos de que el contenido de la prueba corresponde al

La información puede obtenerse de análisis racionales o estadísticos de las variables

 El mismo constructo usando el mismo método.

Los resultados de dichas comparaciones no siempre resultan de esta manera; las

Los procedimientos metodológicos más utilizados para la obtención de datos referentes

El análisis factorial es una técnica del análisis multivariado que permite realizar una

 Validez convergente: existe validez convergente cuando las mediciones del

los procedimientos de validación concurrente se emplean siempre que una prueba se

 Métodos intrapruebas: cuyas fuentes de evidencia más usadas son: la validez

 El método de los estudios relacionados con los criterios: Que implican la

 El método de la manipulación experimental: Se manipula experimentalmente

 Aiken, Lewis R. (2003). Test psicológicos y evaluación, Capitulo N. 5, pág. N. 93 - 100

 Castejón Costa, J. L. (1997). Introducción a los métodos y técnicas de investigación y

 Martínez Arias, M. R. (1995). Psicometría. Teoría de los test psicológicos y educativos.

 Wikipedia, (2011) Validez (psicometría), recuperado en línea:

También podría gustarte