Location via proxy:   [ UP ]  
[Report a bug]   [Manage cookies]                

Herrera, Sánchez & Jiménez (2001)

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 18

--

..

Eduardo Ponce de l¿ón Díaz


Aula Psicológica No. 3, 293-332 r
I

Cuando se empezó a recoger infoi- manera que el programa se extendió a


mación de niños gue habían sicio ex- toclo el Distrito Escolar.
puestos al proyecto, el evaluador se
formó la idea inicial de que el proyecto
no tenía éxito y, dehecho, estaba pro- , R-EFERENCIAS
CAPÍTUTO CUARTO
duciendo efectos contrarios e indesea-
bles; específicamente, el evaluador Briones, G. (1985) Eaaluación de progra-
pensó que se destrura la motivación de
los niños por la lectu¡a. El evaluador
mns sociales. Sa¡tiago de Chile,
PIEE
DE LA rroRÍa cr,Ásrcn DE Los Trsrs A LA rronia
consideró útil comparti¡ esta aprecia-
DE RESPUESTAAL ITEM
Lipsay, W y Cordray,D. (2000) Evalua-
ción con los directores del prog¡¿una, tion methods for social interven-
quienes al oír la presentación se pusie- tion. Annual Reuiew of Psychology,
ron hostiles y a la defensiva. Ellos su-
Aura Nidia Herreral
51_, 343 - 375.
girieron que tal vez Ia excesiva confian-
Nubia Rocío Sanchez, Hugo liménez Aailaz
Poncq de León, E. (2000). Metodología
za delevaluador en las pruebas utiliza- Llniaersidad Nacional de Colombia, Inboratorio de Psicontetría
de la inaestigación eaaluatiaa y social.
das, había Lirnitado su entendimiento Serie Aula Psicológica, N. 1. Bogo-
sobre 1o que realmente era eI proyecto. tá, Universidad El Bosque.
El objetivo central de cualquier pro- Teoría de Respuestn nI item (TRI) (Lord,
Es más, los directores del programa Suclrrn¿u:t, E. (1967). Eanluatiae reseArch.
ceso de medición psicológica a través i 980; Ivlartrn ez, 199 6; Wrigh t, 1967) .
afi¡maron que el evaluador tenía ses- New York. Russell Sage For-rndation.
de un test, es la estimación de Ia mag- La TCT, con un siglo de vida, puede
gos, dada slr formación en teorías Stuflebeam, D. (1982) Ivletodología de
nitud de un atributo o propiedad verse como el desarrollo de las Pro-
psicológicas comportamentales, lo que la evaluación. En: D. Stuflebeam.
humana a partir de la única informa- puestas de Spearman 09A4, D07) y
le impedía evaluar este prosarna que Eaaluación sistemática. Madrid,
ción empírica disponible: Ias resPues- Thurstone (7926,1927) sobre el uso e
estaba basado en teorías de la gestalt. Paidos.
tas de la*personas evalttadas. Esta cir- interpretación de Ia correlación en la
El evaluador se acornodó a estas opi- Weiss, C. (1,975). Inaestigación Eaalua-
cunstancia ha obligado a la psicología medición psicológica y la formulación
niones y elaboró el informe de tal tiaa. México, Tfillas.
a proponer modelos de interpretación de un modelo estadístico, que permi-
de dichas respuestas. Durante el úIti- tiera explicar las puntuaciones obser-
mo siglo y desde perspectivas diferen- vadas en las pruebas de inteligencia
tes aunque no contradictorias, dos y aptitudes (Spearman, 1927). Similar
aproximaciones han ocuPado un Pa- importancia para el desarrollo de esta
pel muy importante en este terreno: aproximación y sus futuras aplicacio-
la Teoría Clásica de los Test (TCT) y la nes en el campo de la psicología Y Ia

¡ Profesora Universidad Nacional de Colombia. Correo Eleclrónico: anherrer@bacata.usc.unal.edu.co


2 Psicólogos egresados de la Universidad Nacional de Colombia.

292
293
-r
Aura Nidio Herrera, Nubia Rocío Sáncha, Hugo Jinúnez Áuita DE I/TEORIA CIASICa DE LOS TE§TS A LATEIRIADE REsP UESTA AL \TEM

educación, tuvo el trabaio de E. L. ciendo énfasis en los asPectos funda- pruebar; I¡ es la ñagnitud ve¡dade¡a los ¿rrol¿s, hace referencia al modelo
Thomdike (1904). Esta aproximación, ñentales más que p¡ocedimentales. delmismoLxaminado (t) en el akibu- teórico de probabilidad adecuadopa_
que se ca¡acteriza por su sencillez Posteriormente se hace una breve corn- to que mide la prueba r; y el úttimo ra su estiÁación y el segundo, hace
rnatemática y su énfasis eri Ios Punta- Paración entre ellas en terminos de sus té¡¡¡ino, E{, representa la firagnitud referencia al valór espeiado de los
ies en Ias Pluebas totales, tuvo ldl im- veritajasylimitacionesnüisreconocidas. de eñor que afecta la ñedida hacien- e¡ror€s. Er! okaspalabias, si dispusiá
Pacto duante rnás de medio siglo y do que eI valor observado esté djstor- ramos de'todas'Ls aplicaciones posi-
continúa siendo tan popular ent¡e sionado con ÉsPecto al valo¡ ve¡da-
educadoÉs y psicórogo§, que alin hoy rronÍA cr.¡í,srcr or los rbsr Lf"*HJffh".HH]'rl"];f;
suele identificarse eEóneamente coñ Desde esta pe¡spectiv4 elproblema observado con respecto a"
todo el cuerpo teórico de Ia psicome- Como se mencionó antes, durante cent¡at de Ia ¡nedición psicótOdca se de akibuto, configurarian " ^"gnifua
unaáistri
trÍa (Muñiz, 198). las frimeras décadas del sigto XX el puede ¡esrrmir en la buiqueda de un bución no¡mal coi media igual a 0 y
Ya en la segundamitad del sigb XX modelo dominante en medición psi- modelo que proporciorie la mejor una variánza que nota¡e;os
coñ;
los trabajos de Birnbaum (1958) por cológica fue la TCT. Después de las estimación pala tós aos parametás: d. Ennotación eotadística esta afirma-
uná parte y de Rasch (1960) po¡ ok& propuestas iniciales antes menciona- a) la magnitud del atributo de interés, ción puede exp¡esa¡se co¡r1o a
-y(,",)
constituyeron hitos en el desar¡ollo de das surgieron desarrollos iñpo*antes es decü, (T/, y, b) el e¡¡o¡ de medida Esto impüca que aunque algunas prm_
Ia TRI; ar¡nque las ideas básicas que tanto en la forñalización de la teo¡ía, ( E, ). A¡nbois son parámetros inobser- tuaciones observadai de ,todasl las
die¡on origen a esta aproximación s€ como en la generación de procedi- vados que deben istimarse a pa*i¡ de posibles, subestiman la magnitud ve¡_
habían expuesto casi una década ant6 mientos especÍficos y aplicaciones lia puntuación obse¡vada; el primero áade¡a del atibuto mientrai que otas
Po! Laza$feld (1950) ; l.ard (7952) y concrctas sobre todo en el carnpo de se supone un pa¡árneko ñjo, mienkas la sobreestirnan, la suma de las desvia_
Lord (1953a; 1953b). A diferencia dé Iá educación. Muñiz (1998) bajo el que á er"ot es un componente aleato- ciones es igr.ral a 0; m conseo¡e¡cia,
la TCT, como su nombre lo indic4,la lh¡lo de "c¡onología psicoñékica" (p, rio y sobre cada uno dáellors ysr¡s r€la- la media de,todas,la¡ puntuaciones
TRI cent¡a su atención en las ca¡acte ' 26-27) prcserrt^ una ]ista bastante, ciones dtbe hacerse alguloi supues- observadas coincide con el valo¡ ver-
rfsticas de los ítems más que en los completa de los p¡incipales Eabajos. tos. Tales supuestos fthdamentan tan- dadero (TJ. Este constituye otro prin-
tests en su totalida4 y en las trcs últi- La TCT pa¡te del supuesto de que b la teorÍa coÍlo los métodos de esti- cipio fundimental de la fcf qr" pr"-
mas décadas, Eas Ia apalición de los la puntuación que r¡n exañinado ob-. mación y pueden dividüs€, con fi¡res di ¡esumi¡se como: el valor eiperado
comPutadoÉs, hmlos Ple§enciado un tiene en una prueba puede explica¡se. pur.amente .didácticos, en supuestos de las puntuaciones obse¡vadas es el
clecimiento importañte en la aplica- media¡te un modelo Iineal aditivo de ;ob¡e la distribución de los eirores y valor ve¡dade¡o de la magnitud de
ción de métodos de análisis derivados dos componentes: elprimero denomi- supuestos sob¡e la relación entre éstos akibuto que mide la prueba. En nota-
de esta aProximación (Fan, 1998; nadopunt aciónoe ladert I
ltro gonq y h magnitud de atributo que mide ción formal, suele eiplesarse como
Crocker & Algina, 1986; Hambleton, cido coÍlo er¡o¡ ¡le fiedída (Gulüksen, la prueba. tV )" To .
SwaminatharL & Roge¡s, 1991; Lor4 1950; Lo¡d,1980; l¡¡d &Novick,1966, Dent¡o de la prirnera categoría se l¡s supuestos de la segunda cate-
1980; Wright & Stone,1998). Nowakowska, 1983). Esta relación encueñhan básicamente dos: Ios erro- gorÍa hacen lefercncia a la ¡elaciónen-
Este tlabaio presenta las principales puede expresarse como X,t=r!+eu; res se distribuyen normalñente yla t¡e los e¡rorcs, yente éstos y Ia r¡agni-
caracterGticas teóricas ymetodológicas donde x, rep¡esenta la puntuación media de Ios erro¡es es igual á 0. EI tud del atributo que se mide. Et pri
de cada r¡na de Ia aPloxiracione§, ha_ que obtiene un examinado i en u¡a primer supuesto, dütn., ución notmal de mero de ellos afiima que el erroi es
RESP UESTA m lreu
DE IATEIRIA ctAsrcaDE Los rEsrs A rareor.i,q
DE
Aura.Nídía Herrerl,IVulia Rocío Sánchsz,, Hugo limenez Aaita

independiente de la magnitud del explicable por las punfuaciones ver- dos que arroje, dependen en gran Par-
(Nururally, 1987). La Figura 1 rePre-
atributo medido; es decir, no existe daderas, es producto de un error alea- te de la capacidad de tenga cada ítem senta alggnos ejemplos hipotéticos de
asociación entre las magnitudes del torio. Con base en este úrltimo requi- para reportar inforrnación sobre el relaciones entre la probabilidad de
atributo de los examinados y los erro- sito se deriva el último supuesto (Nu- átriUuto que mide Ia Prueba' acertar en un ítem (eje y) y Ia magni-
res que afectan las respectivas medi- rrnally, 7987). tud de atributo que mide Ia Prueba
(eje x). Las curyas (a), (b) son crecien-
das. En térrninos estadísticos esto se Un tercer supuesto dentro de esta Magnitud de atributo Y Probabili-
lraduce en'u.na correlación nula entre categoría y que también se basa en la dad de éxito en los ítems tes, es decir tienen Pendiente positiva;
los errores y los valores verdaderos noción de pruebas paralelas, hace re- mj.entras que Ia (c) tiene pendiente ne-
que mide la prueba y surele expresarse ferencia a Ia independencia entre los La principal característica que debe gativa; sin emb at1o ' el signo d'e Ia
formalmente como Per - 0, donde errores en u.na prueb a y lu punfuación tener un ítem de una prueba psicoló- pendiente es el mismo Para los dife-
PeT representa la correlación entre el verdadera de otra paralela. Nueva- gica es qlre su probabilidad de éxito ientes valores de x. Por el contrario la
error y el valor verdadero. mente, efl términos de correlación, ásté relacionada con }a magnitud del curva (d) no cumple con Ia condición
Según el segundo supuesto, los este se expresa como Pe¡T2 = 0 , donde atributo que mide ésta. Las caracterÍs- de monotonicidad Por cuanto su Pen-
errores de dos medidas del mismo PelT2 representa la correlación entre ticas que exponernos a continuación diente cambia de signo positivo a sig-
atributo son independientes entre sí. el error de medida en un test 1 y la hacen referencia precisamente a esta no negatit'o, en la medida que atunen-
Si e7 es el error para una prueb a I y puntuación verdadera de otro test pa- relación y se Pueden resulnir en tres: ta Ia mapitud del atributo (eje r)'
E
2 , el error para u,na prueb d 2, no hay ralelo 2. Este supuesto se viola si el Ia relación entre la probabilidad de En general, el suPuesto de mono-
variación conjr:nta entre estos errores. test 2 mide alguna dimensión que in- éxito en Lrn ítem y Ia magnitud del tonía se refiere a Ia Plesunta relación
qLle existe entre el valor verdadero del
Nuevamente, este supuesto hace refe- fluye en los errores del test L o si huy atributo es monótona, Ias puntuacio-
rencia a una correlación, pero ahora co¡relación entre el error de medid ay nes en los ítems Son linealmente adi- atributo medido y la mapitud esti-
entre et:rores aleatorios, y se expresa el atributo evaluado. tivas y los ítems de una Prueba en su mada de dicho atributo, Io que impli-
formalmente como p EtEz :0, donde ca que esta úItirna está sujeta a Ia mag-
Finalmente, la TCT centrada en el conjunto, tienden a medir el atributo
P u re2 es la correlación enke los erro- test supone el problema clel error de 'deseado. , nifud verdadera del atributo medido;
res et y e2 .La TCT acude al concepto medida como único para la prueba to- La relación entre Ia probabilidad de en otras palabras, hay una relación de
de prueba paralela como un test esta- tal. Supone que las diversas fuentes éxito en Ltn ítem y la magnitud de atributo
carnbio entre el valor del atributo me-
dísticamente igual a otro; es decir co- de error aleatorio se compensan para es monótona. Huy una relación monó-
dido y su estimación. La TCT supone
mo dos muestras independientes de generar una canfidad de error trpico tona entre estas dos variables cuando que cada Llno de los Ítems que cornPo-
r:rt mismo universo definido teórica- de medida común para toda Ia mues- el tipo de curva que rePresenta el atri-
r,"t Ia prueba cumPle con la premisa
mente, de posibles manifestaciones de monotonía; sin embarlo, no se ocu-
tra. En consecuencia, y teniendo en butó mectido con Ia probabilidad de
del mismo atributo. Así dos pruebas cuenta que una prueba está compues- resPoncler correctamente al ítem, pa de establecer el tipo de curva que
son estrictanlente paralelas si: a) tie- ta por uridades (los ítems) cada una mantiene una d.irección creciente o de- á.r.ribe Ia distribución de las res-
pr-restas para cada ítern. De otra parte,
nen la misma desviación estándar; b) de las cuales es manifestación del atri- creciente con respecto al eie de las or-
tienen Ia misma correlación con Lln u*r-,q.ru át carácter de monotonicidad
buto que mide la prueba total, las pro- denaclas; es decir, cgando la pendiente
conjunto de prmtuaciones verdaderas de estricta implica qlre la pendiente de
piedades de un test en términos de la de la gráfrca resultante no cambia
y c) Ia varianza de cada prueba no del trazo la curva no debe cambiar de signo en
consistencia y utilidad de los resulta- signo en todo el recorrido

297
296
RESPUESTA AL 1TEM
Aura Nüra Herrera, Nubia Rocío Sáncha, Hugo limnez Aaita DE TATEoRIActÁstc¡ DE LosrEsrs AIATE}RIADE

ninguna de las dos direcciones, este con pendiente positiva (+). Desde el 1,00
suPuesto no se toma con rigor, ya que punto de vista teórico esta circunstan-
algunos ítems pueden tener fluctua- cia no representa u,n problema impor- o
It
0,80
o
ciones leves y obtenerse una relación tante en el contexto cle Ia TCT, puesto 2
o.
11
I
0,60
de tendencia marcadamente lineal de que los fundamentos que se asumen at
1'

los puntajes con el akibuto (Nr:nrt a[y, no obligan el cumplimiento estricto :§


v 0,40
1987). La curva de la Figur a 2 ilustra del trazo en las curvas; es suficiente o
o.
o'
o.
cuatro inflexiones que cambian el sig- que h.uyu u,na tendencia a la monoto- o,20
no de Ia pendiente en cuatro mornen- nicidad (Andrich, 7989; Crocker et á1.,
0,00
tos, así: inicia con pendiente positiva 1986; Hambleton et al., 7991,; Muñiz, 101525303510 45 50
(+), cambia a (-) ,(+), (-) pura finalízar 1997 ; Martín ez, l99 6 ; Nunn ally, L9 87) .
P-rntaje total en la Prueba

inJlexiones (*, -, +, -, +)'


Figura z. cun,a de ripo no monotónico con cuatro

E(t, .IJ

representación gráfica (Hambleton et


«,
.p 'rc
ElmodelodelaTCTcentrasuaten-
-o
c,
E a.l-., 1991';, Muñiz, 1997; NunnallY'
ción en la información que se Pueda

-o -o
o o
obtener del test tomándol0 como un
L

o- o- 7s87)
I_,a suma de los perfiles para
Ltna serie
todo. Desde el punto de vista psico-
específica de ítems es aproxima-damente
(a) (b) métrico, en el modelo clásico 10s ele-
lineal,. El segr:rtdo suPuestó da razón
Magnituü del atributo Magnitud clel atributo
mentos del instrumento sólo adquie-
del carácter aditivo de los ítems de la
ren significado en relación con el con-
jtrnto total de la prueba a la qlre perte- prueba conservando la propiedad de
necen; en consecuencia, no sllPone
iineulidad. El valor calculado de Ia
magnittrd del atributo es la suma de
formas de distribución esPecíficas de de
el Ias respuestas correctas a los ítems
Ias putntuaciones, €s decir, no Prevé
E E(§
(I,
E p es-
Ia prueba. Aunque aParentemente
E(§ tipó de fr¡nción resultante del comPor- fe-
ta característica es obvia, algunos
-o
G'

tamiento del atributo con la probabi-


-o
o -o
o
o- o_
Iidad de responder correctamente el nómenos no sigtren este PrecePto'
ítern. En este sentido, Ia TCT recoge pongamos como ejemPlo la PerceP-
(.) Magnitud del atributo (d) empíricamen te Ia informaciót' y luego
.io" a"t sabor dulce. Cuando toma-
Magnitud del atributo
de procesarla estadísticamente esta- mos un café con azitcar inmediata-
blece las relaciones entre variables, menteclespuésdehaberConsLunido
Figura l. Ejernplos de monoticidad: (n) curv'ct tipo monotónico ascendente lineal; (b) curva tipo Lln caru*"Io ,la intensidad del sabor
nonoló¡tico ascendente no lineal; (c) aüta tipo monotónico clescendente; (d) curva no monotónica.
pudienclo tomar cualquier forma sLl
DE lArr,on Í.a cLAsIcA DE Los rEsrs A ;¡.reonÍa DE RESpUESTA at irc¡¡
AuraNidia Herrera,Nub¡lt Rocío Sánchta, Hugo límenez Auila

objeto d.e medición (Nunn al\y,7987). acluellas que su{an de fracciones de como suele llamarse en el contexto de
dulce que exPerimentamos no es Ia
Loprueba total puede verse entonces la prueba o de Ítems aislados, por la medición de desempeño. De otra
surna de los sabores dulces del café y
como una de muchas muestras Posi- ctranto reconoce que los problemas de parte, desde este marco de referencia,
del caramelo, sino Por el contrario, el
medición tienen tal grado de especifi- adernás de las estimaciones de Ia mag-
café Io saboreamos Lrn tanto insípido. bles del universo teórico de manifesta-
ciones de dicho atributo y, en conse- cidad, que Ia posibilidad de error que nitud verdadera de atributo (T) y del
En este caso Ia propiedad de aditivi-
cuencia, la medida será más Precisa pueden contener estos ítems fuera del error de medida (e), de los que hemos
dad para la percepción de lo dulce no
si dicha muestra se asemeja al uni- conjunto de la prueba es importante hablado antes, resulta relevante la
se cumple. De manera anáIoga, dos
verso. Con este punto de Partida, Ia (Nunn aLly, 1,987) evaluación de Ia capagidad que tiene
volúmenes de gas con la misma tem-
En su conjurnto, estos principios se la prueba como instrurnento total para
peratura no se combinan Para formar TCT somete la medida del atributo a
Ia conjugación de las pr:ntr-raciones de ptreden aplicar casi a cualquier rnasa brindar información consistente y pre-
un gas con el doble de temPeratura
todos los Íterns que comPonen el ins- de datos de una pruebuy no constitu- cisa sobre el atributo que mide, Io que
(S.rppes, 1,988).
yen restricciones de algút tipo, ni son en la TCT se conoce como confiabili-
En la TCT el supuesto de aditividad trumento de medida. Puesto que un
Ítem individual ofrece u-na cantidad específicos para algún sistema de va- dad y vali dez de las pruebas. Final-
sustenta el hecho de que la Puntua-
importante de error aleatorio de medi- riables, es decir; esta concepción que mente, aunque las propiedad es de Ia
ción total en la prueba, obtenida como
ción, derivado de una diversidad de impone pocos requerimientos a los medida se basan en Ia prueba global,
una combinación lineal (adición) del
factores que intervienen en Ia ejecu- datos hace que su aplicabilidad sea fá- Ia participación de los íterns que Ia
conjunto de puntuaciones en los ele-
ción del mismo, Ia TCT se vale de la cilmente adoptacla casi por cualquier componen cobra importancia ya que
mentos individr.rales, se considere Ia
totalidad de los ítems de Ia Prueba test. Además, suponerloE verdaderos son algunas de sus propiedades indi-
estimación de Ia magnitud real de
para establecer la puntuación medida, tiene implicaciones claras en el desa- viduales, que vistas en conjunto, con-
atributo. Gráficamente encontrarÍa-
con el argumento de qtre los errores rrollo de los procedirnientos estadís- figuran el perfil global de Ia prueba;
mos una curya que rePresenta Ia pr-rrt-
de rnedida se PromedianY, en conse- ticos y matemáticos que se adoptan esto sustenta las estimaciones de los
tuación totat obtenida por la combina-
cuencia, se anulan mutuamente- para el análisis de los datos y las esti- parámetros de los ítems. En adelante
ción lineal de los reactivos, con las
Un segundo argurnento Para que la maciones de interés. nos ocuparemos de estos tres subte-
mismas propiedades de monotoníuy
puntuación final sea determinada Por Uná derivación inrnediata de los mas de manera seParada.
aditividad mencionadas en los párra-
la suma de todos los ítems de la Prue- misrnos es el hecho de que las esti-
fos anteriores (Nunrtally, 1987).
ba,se basa en que uno de los objetivos maciones de Ia magnitud del atributo Estimación de Ia magnitud de atributo
Los ítems en su conjunto tienden a me-
de los procesos de medición es clasi- estén en función cie las resPuestas a
dir el atribttto qtrc se estttdia.La resPues-
ficar individuos con base en la medida la totalidad de los ítems de la prueba Cualquiera sea el artefacto que to-
ta de un examinado a cada uno de los
del atributo observado; Para tal fin, en f, además, en función de las caracte- memos como "medidor",la escala de
ítems que comPonen una Prueba es
el marco de la TCT un reducido nú- rísticas de Ia mttestra de donde Pro- medida debería permanecer relativa-
una manifestación o efecto de Ia mag-
mero de reactivos carecería de esta vienen las ptrntttaciones (Lord, 1980; mente estable, como es el caso de los
nitud de atributo que ésta mide; así,
capacid.ad de discriminación, Por Io Wright & Stone, 7998). Esto sustenta instrumentos para medir Ia longitud.
cada ítem mide el atributo Pero slt
el procedimiento de estimación del Inclependientemente de que el princi-
correlación con el rnismo es baj a, Ía- que se jrstifica el Lrso de múltiples
reactivos. Para resumir, Ia TCT no parámetro de magnitud de atributo pio operativo del dispositivo de medi-
zón que obliga a la utilización de va-
acepta a priori corno medidas válidas o de habilidad de los examinad.os, da sea una vara convencionaknente
rios reactivos qlre exploren el atributo

301
300
-:l

Sáncltn, Hugo linúnez Auila DE LA TEARIA CLASICA DE LOS TESTS A IATEORIADE RESP UESTA AL 1TEM
AuraNidia Herrera,Nubío Rocío

aceptada, una cinta métrica, uñ aPa- camente, de acuerdo con los suPLles- mismo exarninado en la prueba, Ty s Dentro de Ia TCT existe una varie-
rato de rnedición basado en ultraso- tos expuestos antes, dentro de la TC'f son la med ray desviación estándar de dad de transformaciones posibles de
la estimación primera de Ia magnittrd los puntajes brutos para el grupo de los puntajes brutos como estimación
nido, rayos inJrarrojos, o tiempo, enLre
de atributo es el nÚr-mero de ítems en examinados; y p y o son Ia media y de la magmtucl de atribnto, pero todas
otros; el resultado final será siempre
los curales el sujeto puntÚra; si se trata desviación estándar de Ia nueva escala elias son expresiones que buscan bási-
un valor con ligeras variaciones qLte/
de una prueba de ejecución máxima convencional. carnente facilitar la interpretación psi-
en contextos de no mucha Precisión,
pueden ser despreciables. Sin embar- corno ap titr-rd, inteligencia o conoci- A manera de ejemplo, si se usan cológica de los resultados y Ia compa-
mientos, ésta es el número de resPues- una med La y una d esviación estándar ración entre restrltados encontraCos
go,las estimaciones que arroia LLn Pro-
tas correctas, conocido como Puntaje de 50 y 70, respectivamente, el puntaje con base en instrumentos o poblacio-
ceso de medición dentro de Ia TCT es-
bruto. Sin embargo, esta estimación, típico para un puntaje bruto r, se ob- nes de exarninados diferentes. AIgu-
tán afectados por las características
particulares del instrumento y de Ia en escala ordinal, depende del núme- tendría como T (
*''' ) . I o +50. Esta nas de las escalas comúnmente usadas

población donde haya sido aplicado ro de elementos que cotlforman la \ , t. hoy son: a) Ios centiles expresan cada
pn-reba y en Consecuencia el resltltado transformación hace que quienes hayan puntaje bruto en térrninos de los per-
el instrumento. Para ilustrar esta si-
no eS Cornparable entre prucb..ls coll tenido un pultaje bruto igual al prome- centiles correspondientes en el grupo
buación podelnos remilirnos al desem-
diferente núrmero de ítems. dio del grupo, tengan un puntaje están- de examinados (muestra normativa),
peño de individLros en Prlrebas de in-
Una de las transformaciones más dar igual a 50; y qlre quienes hayan teni- b) las escalas normalizadas son expre-
teligencia. En estas Pruebas la magni-
comúnmente trsadas Son las escalas do un pr-rntaje brtrto superior a Ia media siones del puntaje bn-rto con base en
tud de inieligencia para un individtto
d"pende, además de su caPacidad basadas en Ia desviación estándar de en una desviación estándar, tengan un la distribución de probabilidad acu-
la distribución de los puntajes brutos puntaje estándar igrral a 60, indepen- mulada de una norm aL, y c) transfor-
para resolver exitosamente Ia prueba,
para el gruPo de sujetos. Se trata de dienternente del número de ítems en la maciones lineales qLre tienen la forma
del desempeño de las demás Personas
una transformaciÓn lineal que hace prueb a y de los valores de la mediu y de la T antes expuesta. García (7993),
en Ia misma; en este sentido, Ia magni-
coincidir la media del grlrPo con Lrn desviagón típica del grupo. La transfor- Anastasi & Urbina (1998) y Martínez
tud de la propiedad evaluadu Para un
valor convencional (generalmente 50 maciónZ o T, como se corloce general- (7996), por mencionar sólo algr-rnas
individlto, cambia en fr-rnción del de-
o 100) y Ia desviación estándar con mente, hace comparables los resultados fuentes recientes, presentan una
sernpeño global de los evalttados'
otro valor también convencional (ge- entre pruebas diferentes, asignando exposición de diferentes tipos de
Existe tanta variedad de artefactos
neralmente 10 o 15). El resultado de puntajes estándar significativos en tér- escalas, sus ventajas y limitaciones.
posibles que ptreden medir ur atribr-r-
to determinado, como variedad de Po- esta transformación Para cada pr-rntaje rninos de la posición relativa del exami-
sibles escalas, interfiriendo en ia com- bruto en la PrLleba, se conoce como nado dentro dql grLtpo total de exami- Confiabilidad y validez
parabilidad de los datos. Debido a que pLlrltaje típico, tipificado o estánclar. nados con el que se compare. Sin embar-
En síntesis, la transformación Se ex- go,sigue siendo una estimación depen- De actrerdo con la exposición ante-
Ias puntuaciones obterudas en la TCT
diente de las características del gruPo rior, la confiabilidad yIa validez hacen
casi siempre son de escalas diferentes,
,\.rl(+)
presa como T,= " o + P; ctonde
de referencia; Lm mismo individuo com- referencia a propiedades del instru-
se han desarrollado y adoptado méto-
doncle T_ es el puntaje transformado parado corl grllpos diferentes pr-rede mento de medición como fr-rente de
dos de Ia estadística Para transformar
o p Llntaje estándar para cualqr-rier tener estimaciones muy diferentes de sr-r información para la estimación de Ia
estas pr.rntr-raciones de tal manera qlte
searl comparables entre sí. EtPecífi- exarninado i, x¡es el pr-rntaje brr-rto del magnitud de atributo. magnitud de atributo y Para arrojar
Ayra Nidia Herrera, Nubía Rocío Sanchn, Hugo [iménez Aaita DE ¿¡TI,ONL¡ CIASrcA DE LOS rESTS A RESPUESTA M frTU
'¡.TEONI¡,DE

resultados útiles en la práctica. Para vados de manera sistemática produ-


tratar estos temas volvamos al pr:rtto ciendo consistentemente subestima-
de partida que antes expresábamos ciones o sobrestimaciones del valor
como X iJ = T,¡ * E,t; a esta afirmación verdadero. En medidas rePetidas
subyace un principio fundamental estos errores no producen varianza en
que no es exclusivo de la TCT ni de la el mismo sentido de los anteriores, (b)
medición en psicol ogía sino que es sino que su efecto es el sesgo en los
aplicable a la medición en ciencia: res ultados (Bha ttacha rrya& Johnsdn,
toda medida está sujeto a error 1"977 ; Gullil.s€ñ, 1950).
(Thorndike, 1951; BunS€, 1985). Una ilustración del efecto de cada
Sin embarBo, se Pueden distinguir tipo de error puede verse en la Figura
dos tipos de errores: aleatorios y siste- 3 en Ia que las cuatro gráficas rePre-
máticos. Los primeros se refieren a las sentan disfribuciones hipotéticas de las
fluctuaciones de las puntuaciones que puntuaciones observadas Xi en un
se producen en ausencia de razones universo de medidas de un mismo
teóricas o empíricas y, en consecuen- atributo de un examinado i. Si, de <-- l-->
cia, se consideran: como factores del acuerdo con la notación anterior, T, es
azar o se atribuyen sencillamente a la magnitud verdadera de atributo que
variaciones caprichosas del objeto de mide la prueba, las pr:ntuaciones ob- Figura 3. Ilustración gráfica del efecto del enor aleatorio (a tiene más error aleatorio que b) y del error
medida (Bunge, 1985). En medidas servadas de la disfribución (a) se dis- sistemático, (c tiene más error sistemático que d) en medidas repetidas. :

repetidas, estos errores producen in- persan más que las de Ia distribución
consistencias haciendo que el valor' (b) y en consecuencia los resultados
real se subestime algunas veces y se son menos consistentes , La prirnera
sobreestime otras, de manera que se distribución tiene más error aleatorio Las medidas que están afectadas por Ya que los errores aleatorios produ-
espera que los valores observados que la segunda. De otra parte, Ias distri- mayor error aleatorio producen re- cen varíanza no explicada, entonces
converlu^ alrededor del valor verda- buciones (c) y (d) parecen tener varian- sultados menos consistentes o menos la confiabilidad puede definirse corno
dero; en pocas palabras, se trata de za similar pero (c) no está cenfrada el confiables; mientras que las medidas la 'canüd ad' de varianza observada
errores qlre producen varianza no ex- 7,, mientras que las demás sí; el Yalor afectadas por errores sistemáticos (") que es verdadera (ol ) o no se debe
plicada en los resultados de Ia medi- esperado de la distribución (c) no producen resultados sesgados o no al error aleatorio. En términos estadís-
ción. Los errores del segundo tipo son coincide con T, luego tiene mayor error válidos. En srntesis, en este contexto, ticos suele definirse la confiabilidad
aquellos que afectan los valores obser- sistemático o sesgo que las demás. la confiabilidad es consistenciuy se ve como la proporción de varianza
afectada por efecto de los errores alea- observada qlre es verdadera; esto es
torios, mientras qlre la validez hace o1
Pr, - +, clonde P,, rePresenta Ia
rnás referenci.a a exactihld y se ve afec- o;
tada por los errores sistemáticos. confiabilidad de la prueba y los demás

304 305
Aura Nidin Herrern, Nubia Rocío Sanchez, Hugo linúnez Auila DE ureonÍ¡ ctAsrca DE Los rEsrs A rareonia DE RESp UESTA at ire¡¡

términos ya están definidos. En Sene- ítems que componen Iu Prueba. Final- prueba y sus relaciones; el procedi- prr-reba" (Herrera, Sánchez, Ex Gómez
ral, si Ia magnitud del atributo que se mente, una aproximación menos fre- miento más popular para evaluarla es Benito , 2007). Desde la TCT se han
rnide tonta valores enteros podría clrente para la estimación de confiabi- el análisis factorial. propuesto estrategias para la detec-
pensarse en obtener medidas Perfec- lidad es la Teoría de la Generalizabi- Más recientemente, como conse- ción de FDI, sin emb argo, algunas de
tamente confiables ya qLte los niveles Iidad (Cronbach, Rujaratman & Gle- cuencia de las reivindicaciones de ellas no resultan recomendables pues-
de fluctuación podrían mantenerse sser, 7963) que permite la estimación igraldad secial y los movimientos to que fallan al hacer Ia igualación ne-
por debajo del umbral necesario Para de las proporciones de varianza o de anti-discriminación de los años 60, se cesaria de los grupo-* por su magrfud
pasar de un valor a otro, haciendo que error debidas a varias fuentes identi- han generado mütiples estrategias de de atributo (Góm ezBenito & Hidalgo
Ias v arianzas fueran iguales (oÍ = oi). ficadas y sus interacciones, según el evaluación de Ia validez a través de Montesinos , 7997).
Si la magnitud del atributo toma valo- contexto particular en qtle se realice Ia estimación de Ia'cantidad'de sesgo " En general, dentro de Ia TCT se
res continuos el error al azar puede la medida. que afecta a la prueba o a los ítems cuenta con una gran cantidad de pro-
disminuirse, pero no elirninarse; siem- De otra parte, dentro de Ia TCT se que Ia componen. Estos procedimien- cedimientos para ob tener indicadores
pre habrá fluctt-taciones aleatorias distinguen formas de valide z dtferen- tos, que se engloban dentro de Io que cuantitativos de la validez y de Ia con-
=(Bunge, 1985) tes: concLlrrente, predictiva, de conte- hoy se conoce como Funcionamiento fiabilidacl (Gulliksen, 1950; Lord et al.,
La forma más frectrente d.entro de nido y de collstructo, son las común- Diferencial de los Test (FDT) o Funcio- 7966);la mayoría de ellos se encuen-
la TCT para estimar la ProPorción de mente conocidas. Las primeras hacen namiento Diferencial de los Ítems tran detalladamente descritos en la
varianza verdadera es mediante corre- referencia a la correlación entre los (FDI) (Holland & Thayer, 1988), se clásica exposición de los "métodos
Iaciones entre puntuaciorres observa- puntajes obtenidos en Lrna prueba y basan en la comparación del funciona- psicométricos" de Gtrilford (1951).
das en pruebas paralelas, en una mis- algún criterio externo de interés; así, miento de Ia prueba o del ítem, entre Revisiones más recientes son las de
ma prueba aplicada en rnomentos di- a partir de 1966 los estfurdares de la dos grupos diferentes en cuanto a Anastasi et aI. (1998), Brown (1980),
fererrtes o entre mitades de una Prue,- APA las reunieron en una única cate- género, eda d, raza, culfura, etc; pero García Cueto (1993), Martínez (1996)y
ba. De aquí se derivan los Procedi- goría denominada validez relaciona- igualados en cuanto a su magnifud de Muñiz (7998)
mientos generalrnente conocidos co- da con criterio (Paz Caballero,1996)- atributo. Por ejemplo, si en estas con-
mo 'equivalencia de formas Paralelas', La valid ez de contenido evalúa el gra- diciones un ítern resulta más difícil Parámetros de los ítems
'test-retes t' y 'dos mitades', respecti- do en que los elementos que colnPo' para un grupo que para otro se dice
vamente. Otros Procedimientos muy nen Ia prueba miden el atributo que que tiene FDI; sin embar go,la presen- Las características de los elementos
populares para Ia estimación de la ésta pretende medir en su totalid dd, cia de FDI no es evidencia suficiente (ítems) en las que centra su atención
confiabilidad son el coeficiente alfa, en otra palabras, una prueba tendrá para afirmar que éste o la pn reba no Ia TCT son su difcultad y sLl discrimi-
propuesto por Cronbach (1951) y el valid ez de contenido si es una lrlLtes- son válidos, "el análisis de sesgo im- nación (Crocker et dL.,1986). En el con-
Kr-rder-Richardson desarrollado Por tra adectrada del universo d* Posibles plica además de la identificación de texto de la psicometría, Ia noción in-
Ktrder & Richardson (1937). Realmen- manifestaciones ctel atributo clel qlle los ítems qLre presentan FDI, Ia identi- tuitiva de dificultad de un ítem se re-
te el seglrndo es Ltn caso Particr-rlar ctel hablamos antes. La validez de cons- ficación del factor o factores qlre lo fiere al grado de exigencia necesaria
coeficiente alfa, cLlando la pn-reba está tructo por su Parte, se ocuPa de eva- producen y Ia disctrsión teórica acerca para resolver el ítern correctamente.
complresta por items dicótomos y se luar las hipótesis teóricas sobre el o de Ia relevancia de tales factores en el En la TCT este rndice se define me-
basan en las ínter correlaciones de los Ios constructos qlle pre terrde rnedir la constrncto que pretende medir la diante Ia proporción de aciertos qlte
lura Nidia Herrera, Nubía Rocío sáncha, Hugo limúrc2 Auita DE I,ATEORIA CUSrcA DE LOS IESTS A LATEORIA DE RESP UESTA AL |TEM

se obtenga de los exarninados. Lo De otra parte, se entiende por discri-


anterior parece contradictorio, p uesto minación, la capacidad medida que una variable
es decir, en la respondido correctamente en propor-
que tiene el crece, así mismo la otra variable tam- ciones similares por los que puntúran
que se está definiendo Ia dirficuttadco- ítem observado para diferenciar aqlre-
mo la proporción de éxitos y no cle llos examinados que muestran bién crece. Esta correlación se obliene alto y bajo, s€ conchrye que el ítem no
mayor mediante Ia expresión Ppbis=ryrf%, tiene la capacidad de seleccionar los
fallos, que sería lo esperado. Este mdi- magnitud de atributo evaluado, de los
ce podrÍa denominarse con mayor individuos que rnuestran rnayor
que tienen menor magnitud. En prue-
precisión "úrdice de facilid ad" (Ham- bas de habilidad, por ejemplo, esto dondeX. el puntaje promedio para magnitud del atributo evaluado. Este
bleton et a1., 7991).Aquí la estimación
se aquellos "rque respondieron el ítem rndice puede variar en un rango de -
tradurce en el poder del ítem para dife-
de dificultad es la probabilidad empí- correctamente, X, es el puntaje pro- 1 a 1, doncle el valor -1 significa que
renciar a los sujetos más capaces de
medio para el grupo de examinados, el ítem es respondido únicamente por
rica de éxito para un determinado los menos capaces. En la elatoración
grupo de personas y está dado por la de pruebas y análisis de ítems s' es la desviación estándar de los pun- ^
Ios examinados ciue obtuvieron los
se han tajes para el mismo grlrpo, p es la puntaj"s más bujos; esta situación
proporción de respuestas acertadas desarrollado alrededor de 50 Índices
para cada ítem. La,dificultad en TCT de discriminación diferentes; según dificultad del ítem tal como se definió normalmente se da cuando el ítem
se define como el número de aciertos antes, y q es la proporción de exar^ri- tiene problemas con la clave o con su
sea el objetivo qlre se persiga con el
dividido en el número total de instrumento, así mismo se determina nados que fallan en el ítem (1 - fl. construcción. Los valores cercanos a
Algrrnas veces el valor del u-tdice de 0 significan que el ítem no discrimina
examinados; estq es p -+, donde p el criterio para su selección.
Algunos correlación biserial purttual es impre- y el valor 1 es un indicador de discri-
es la estimación-:de la dificultad del rndices dependen de la dificultad del
ítem, u es el númgro de personas que ciso debido a qlre el puntaje del ítem minación perfecta (Guilford, 7954).
ítern, mientras que otros pueden
acertaron el misllro, y w es el número considerado ha contribuido para el
obviar esta condición (Anastasi et al.,
total de personas que lo abordaron.. puntaje total de cada exarninado. A "-

7998); sin emb argo, los resultados a

Un ítem se supone difícil si la pro- entre los distintos métodos menos que el núrnero de ítems sea TEORTA DE RESPUESTA
son muy superior a 25, el efecto sobre las esti- ALÍrurvr
porción de examinados que fallan en similares.
su solución es alta, / viceversa, r¡rt ítem maciones es importante y esto obliga
El íncüce de discriminación ítem-prue-
es fácil si el número de individuos que
a hacer 4lgunas correcciones al restrl- En térrninos de Muñiz & Ham-
ba, es uno delos rnüces m¿ís comúnmen-
aciertan su respuesta es elevado. La te usados. Para pruebas tado obtenido (Guilford, 1954). bleton (1992), €l rnodelo de la TCT
con ítems Otro de los urdices de discrimina- asumía "con murcha enjundia y parsi-
magnitud de r:rt índice de dificultad dicótomos, es la correlación biseriar
obtenido de esta ma.nera, depende de puntual, r.rna versión de la correlación ción más comunes es la comparación rnonia " (p. 42) una relación lineal en-
las características de Ia población en la de la proporción de aciertos para cada tre las pr-rntuaciones observadas con
producto momento de Pea.rson, aclap-
qlle fue aplicado el ítem; esta depen- ítem entre sujetos con puntajes altos las verdaderas y el error; mientras qtle
tada para pnrebas de respuestas dicG
dencia hace que la esbimación sea apli y con puntajes bajos en Ia prueba. Si "el problema de Ia invarianza de las
tomas. Como cualquier coeficiente de
cable a óontextos similares a las condi- un ítem es solucionado exitosamente rnediciones y de las propiedades de
correlación su valor oscila enke -l y l.
ciones de aplicación, y a poblaciones únicamente por aquellos individuos los instrumentos cte- medida" (p. 44)
El valor de -1 indica que las variables
con características similares a la que conkastadas están inversamente que obtr-rvieron los puntajes más altos permanecía irresttelto y sin posibili-
rela- de la prueba, se concluye que este ítem dades de encontrar una solución den-
sirvió de base para la estimación de los cionadas; un coeficiente de
1 da cuenta
parámetros del ítem. tiene alto poder discriminatiyo. De tro del mismo marco de Ia TCT. La TRI
de Lrna relación perfecta y directa,
otra parte, si el ítem observado es sLlrge en parte como resPuesta a esta

308
309
Aura Nidia Herrera,N¡¿ü¡a Rocío Sánchu, Hugo limkez Avitn DE urrcn Í¡ctÁstc¿,Dr Los rEsrs A tarloRlA DE RESPLIESTA AL \TEM

deficiencia en un intento de construir respuestas a la prueba" (Anastasi y La distribución de Probabilidad (u¡+0) entonces/ (U,l e) = 7 - P ¡(q.
d 0,

un cuerpo de conocimientos, que esta- Urbin d, 1998, p. 73). En este contexto, condicional de las Puntuaciones en un La CCI es la curva que relaciona las
blezca reglas estrictas de medición con los términ os rasgo latente, uariable ítem dicótomo dado un nivel de Ia va- medias de estas distribuciones
(Lord , 7980; Wright & Linacre ,7989), lntente, factor y habilidad estamos refi- riable e, puede exPresarse en fun- conücionales (García Cueto ,1993). La
permitiendo estimaciones de la mag- riéndonos a relaciones estadísticas en- ción de la resPuesta al ítem como figura 4 muestra las CCI de tres ítems;
nitud de akibuto y de las propiedades tre variables. Este postulado es un de acuerdo, con éstas la probabilidad
.f(u,l o)= P¡(e)"(t- P¡(o))t-"' d. prr+tuar. eh eI ítem i, dad o 0 = 0 es
de los ítems, independientes de las principio de organización concepFual
características de Ia población y del que relaciona la ejecución del exami- donde P¡(il es la Probabitidad de igual '0;85,-;..es decir, P¡ @ = 0,85,
instrumento ulilizado (Wright, 7967). nado con el constructo medido y es el puntuar en eI ítem Y u¡es la Punlua-
La TRI se desarrolla a partir de dos punto de conexión entre el objeto de ción en el mismo,que solo toma valo-
ideas básicas: el concepto de rasgos medida y el referente comportamental res 1 o 0. Fácilmente puede verse que
latentes y Ia relación flrncional entre éstos que permite cuantificarlo. si Ia respuesta es acertada. (u, = L), La
y las respuestns de los examinados. De actrerdo con el segundo posfula- función (Utl 0 = P¡ (0); mientras
es f
Según el primer postulado, Ias res- do, Ia probabilidad de puntuar en un que si la puntuación en el ítem es iguaL
puestas de los examinados pueden ser ítem y la magnitud cle alributo que mi-
satisfactoriamente explicadas si se de- de el misnro, plteden relacionarse me-
finen claramente los rasgos latentes diante un rnodelo matemático, Ia Fún-
que intervienen en la mismd, y se ge- ción CaracterÍstica del Ítem (FCI), cLrya
neran procedimientos que pe'rmitan representación gráfica se conoce como 1.0
ubicar al individuo en Lrna escala que Cun¡a Característica del Item (CCD. De 0.9
represente la mag¡itud de tales ras- manera similar a lo exPuesto sobre 0.8
gos. Desde esta perspectiva, el proble- TCT, la CCI es una firnción de incre-
0.7
ma central consiste en hallar las rela- mento monotónico entre el nivel del
ciones entre las puntuaciones obsen¡a- rasgo que mide el ítem y La probabili- 0.6
E
das y lamagnitud del o los rasgos que dad de puntuar en el mismo; cuartdo ñ 0.5
mide la prueba. El significado del tér- una se incrementa, la otra tarnbién 1o =
-o
rE
-o
c.4 .. t
5.l,

mino rasgo latente tiene Llna connota- hace. Sin embar1o,la CCI es un modelo o f:.1:i
c- 0.3
ción estadística, en otras palabras, "... teórico que rePresenta la relación entre
un parámetro: nivel del rasgo, general- 0.2
no implica que existan rasgos latentes
o habilidades. subyacentes en un sen- mente notado como 0, y la probabili- 0.1
tido físico o fisiológico, ni tampoco dad de puntuar en el ítem; en este senti- o
c
que originen una conducta. Los rasgos do la CCI es diferente a Ia rePresen- Magnitud de
latentes son constructos estadísticos tación de la probabilidad empírica de
derivados matemáticamente de rela- acierto en trn íterrr en función de los
ciones empíricas observadas entre las puntajes observados en la prueba-
Figu ra 4. Curt,a Carctcterística de tres ítems
Aura Nidia Henerq Nubia Rocío Sáncha,, Hugo limeaa Avila
DE LA TEoRfA ct(srcn DE Los rEsrs A lareon Ía DE REsp UESTA at ire»t

A partir de lo expuesto hasta ahora mientras que la independencia


local nales. A*que actualmente la investi- reladvamente robustos a violaciones
claro que, a diferencia de la l-race refere-ncia al heciro de
1e¡!ta que en un gación está dirigida en gran volumen rnoderadas de este supuesto (Harvey
TCT, la TRI cenfra su atención en el niver determinado
de ra variable la_ a re.solver problemas con modelos et al., 7999). Tiatamientos más deteni-
ítem, característica fundamental que. tente, las respuestas
a *n conjunto de mul tid imensionales, la infraestructu- dos sobre Ia robustez de los modelos
permite dar un giro importante tanto ítems no estin correlacionadas
(Cro_ ra de conocimiento y tecnologa aírn TRI r-rnidimensionales a este supuesto,
en el campo de la construcción de cker ei a1.,1.9g6).
no se encuentra Io suficientemente de- pueden encontrarse en Drasgow &
pruebas como en los moderos teóricos Hemos afirmado
antes que uno de sarrollada como para que haya un cre- Parsons (1983), Cuesta & Muñiz (L994,
para la estimación de la magnitud de los pilares básicos de la
TRI es la idea cimiento significativo de aplicaciones 7995) y Cuesta (1996).
atributo y de los parámetros de los de que la respüesta a un Ítem
se rela- con modelos de varias dimensiones Ahora , pdra ser úril en aplicaciones
ítems. También hemosvisto que a par- cioni con er niver
de ra variabre laten_ (Harvey & Hammer, L999). Los mode- prácticas todo modelo matemático
tir de esta aproximación,la probabiii- te, que hemos notado
con O;si ra res- los de más de una dimensión revisten debe ajustarse a las características de
dad de responder al ítem es una fun- puesta a un Ítem
puede expricarse a mayor complejidad y desbordan el los datos que pretende representar
ción monotónica creciente de g; sin partir de N rasgos ratentes,
entonces propósito de este documento. Algu- (Andrich, 1998). EI término ajuste se
embargo, existen muchas funciones b puede represlentarse
mediante un nos trabajos en este campo se enclren- refiere al grado en el cual el modelo
que tienen esta propied.ad, En ra figu- ,r".to. de
N componentes q"";"-;; tran en Bolt (1996). seleccionado simula de manera ade-
ra 4 se mueskan tres de las muchas de notar como
b = r0r.., á,.. ej. su De otra parte, técnicamente no es cuada las relaciones entre la variable
posibles. Pues bien,lo que define cada conoce como
espacio laie.,telt espacio posible que un insLrumento de medi- medida y las respuestas a los ítems.
una de las muchas posibiJidades son definido por
ras N dimensio.,us, y ul ción psicológica evalúe un número Dependiendo de las características de
los parámetros de la CCI y el tipo de númeio áe
dimensiones de td ;ó"- exacto de dimensiones o atributos, los datos evaluados y del modelo TRI
modelo; nos ocuparemos posterior- cio, onúmero derasgosratentesnece-
puesto que la cornplejidad de los con- considerado, deberán practicarse al-
mentedeestostemas,nosinantesha-. sarios para expli.u.
ru respuesta al textos de evaluación necesariamente gunos procedimientos estadísticos
cer claridad sobre los supuestos bási-' Ítem,
define la dimensionalidad del involucran un núrnero importante de qlre ofrezcan indicios del número de
cos de la TRI. mismo. En teoría, se trata entonces de circt¡rtstSncias imponderables; asi la dimensiones y de su grado presente
supuestos n:'I'1'#I;i:;::w,:l:1*:: unidimensionalidad se refiere más
t,ien a la identificación de u.n rinico
en los datos. Así podernos efectuar
juicios con criterio cuantitativo acerca
como unpunto segúnsu nivel en cada factor "dominante" y, en este sentido, de la compatibilidad entre el modelo
Hay dos condiciones que se deben una de las N dimeisiones, y er supues- Ia unidimensionalidad no es de todo- y los datos qlre queremos explorar. Se
cumplir para que los modelos TRI to de dimensionalidad se refiere
a la nada, sino que se toma como rula cues- han desarrollado gran cantidad de
sean-aplicables;losqLreseconocenco- definición completa
de tai espacio tión de grado. Además, aunque en procedirnientos que buscan dar sopor-
mo dimensionalidad der espacio latente (Gruijter &
van áer Ka*p, 1,g}i). principio solamente podemos esperar te numérico aI grado de unidimensio-
e independencia local- De manera muy sin embargo, ros moderos de ra TRI
resumida,elprimersupuestohacere- que han tenáo rnayor resr.rltados confiables cuando haya nalidad de un conjunto de datos, algu-
cresarrolro en coherencia entre las características de nos de ellos pueden encontrarse en
ferencia a la identificación de las d¡- .u*po de psicometría son los que
"i
m.ensiones o rasgos latentes que inter- miden
los datos y el moclelo, algunos esfudios Harnbleton, Swarninathan y Rogers
sóro .* ,u.,go ratente, qr" ," empíricos han encontrado que los (7991), Lord (1980), Martínez (7995) y
vienen en la respuesta a un ítem; conocencomomodelosunidimensio-
rnodelos TRI trnidimensionales son Cuesta (7996).

312
313
Aura Nidia Herrcra, Nubia Rocío Sáncha, Hugo liméncz Aaila DE LATT,ONI¡ CIASICI DE LOS lEsrs A LArr,Oni¡ DE RESP UESTA AL ITEM

El segundo supuesto: la indepen- uno de ellos. Expresada de manera for- umbrales tolerables; por ejemplo, el para cada uno de los ítems serán
dencia local, está estrechamente rela- mal, edste independencia local para tiempo disponible para responder Ia 4t = 0.3, 4z = 0.4 Y 4s = 0.6. Las ocho
cionado con la r-uridimensionalidad ya r-rn conjunto de k ítems, si se cumple qLre prueba debe ser suficiente, las consig- combinaciones posibles de patrones
que si ésta se cumple, también se cLun- nas del evaluador deben ser claras, de respuesta de estos tres ítems se
P(, ,,...,u,,...'¿i I 0)= Pb tl 0)' ..' .4",1e)' ... ' P(rt tq=; PQ,l0)
ple Ia independencia local, pero no la entre otras. muestran en Ia Thbla 1. El I representa
inversa; puede haber independencia donde il- es Ia respuesta de un *u^i- En ur contexto d e evaluación como acierto en el ítem, mientras que el nú-
Iocal en datos de más de L¡.na dimen- nado en el ítem i, y P(Utlil e.s la el descrito, podríamos esperar qr.re eI mero 0 corresponde a error en la res-
sión (Crocker et dL.,7986; Lord, 1980; probabilidad de puntuar en el mismo acierto o desacierto ante cada ítem de- pttesta. La probabilidad conjr:nta se
Lord et al., 7966). Independencia local dado 0. pende fundarnentalmente del nivel de obtiene multiplicando las probabilida-
significa que para urrt niv el 0, que ex- Un ejemplo puede ilustrar el con¡ habilidad del evaluado; de no ser así, des individuales de los ítems compo-
plica el desempeño en la prueba, las cepto de independencia local. Supon- estarÍamos exigiendo a los evaluad.os nentes. La ind"pendencia local se
respuestas de los examinados a un par gamos que tenemos por objetivo eva- habilidades o destrezas adicionales al cumple sóIo en caso en qlre Ia proba-
de ítems cualquiera, son estadística- luar el dominio que un niño tiene del conocimiento del área objeto de medi- bilidad de respuesta para los patrones
mente independientes. En otras pala- operador matemático multiplicación ción: "dominio del operador multipli- indicados sea igtral a la probabilidad
bras, no existe relación entre las res- con los núrmeros naturales. Entrega- cación". En términos de Ia TRI habría esperada registrada en la tabla; de otra
puestas de los examinados a diferen- mos al evaluado una prueba con tres más de una ctimensión involucrada en manera, hay dependencia estadística
tes íterns, dado u,n nivel de Ia variable ítems cuya resolución exige única- la actividad. Si logramos un contexto entre los ítems y el principio de inde-
latente (Hambleton, Swaminathan y mente el dominio de "las tablas de de evaluación como el expuesto, po- pendencia local no se cumple.
Rogers, 1997). En una prueba donde multiplicar". Srpongamos que el demos suponer qlle el éxito o fracaso Si se cumplen los supuestos de uni-
sólo Lrn rasgo latente es suficiente para enunciado presentado está redactado en cada ítem depende fundamental- dimensionalidad e independencia 1o-
explicar las respuestas del examinado, de modo que todos los evaluados mente del dominio de las tablas de cal, el problema consiste en decidir el
es razonable pensar que para un nivel comprenden sin dificultad la activi- multiplicar de cada evaluado. En este tipo de modelo y hacer las estimacio-
dado 0, las respuestas a un par de dad a realizar. De esta manera, el eva- sentido, las respuestas a diferentes nes de los parámetros de interés. Has-
ítems ctralquiera serán independien- luado no necesita haber desarrollado ítems que evalúan el mismo atributo, ta el momento se han identificado cua-
tes; teóricamente, en iguales condi- habilidades especiales de compren- son independientes entre sí. tro parámetros de la CCI y tradicional-
ciones de medida, el único elemento sión de lectura diferentes a las co- Como hemos venid o haciendo, mente se han usado dos tipos de
que determina si una respuesta es co- mLu.res en todos los evaluados. Ade- notaremos la probabilidad de acertar modelos aplicables a ítems dicótomos,
rrecta o no, es el nivel de variable más debernos asegurarnos que los al ítem i como P¡= P(Ut- 7/0) y defini- lo que nos permitiría, €n teoría,
latente. niños están famili arizados con el for- remos como 4¡= P(u,= 0/0 = f - P¡ la construir ocho tipos de CCI diferentes
Estadísticamente la independencia rrrato de evalttación, por ejemplo, probabilidad de responder eqtrivoca- para este tipo de Ítems. Obviamente
local se expresa mediante el prodtrcto deben conocer con suficiencia los nú- damente el mismo ítem. Supongamos dentro de cada tipo existen un sin-
de probabilidades: Dado un nivel g, Ia rneros, el operador de murltiplicación, qlre para los tres ítems del ejemplo núrmero de posibilidades qlre de-
probabilidad de puntuar en un conjlrn- el sigrro " =" ; finalmente, la prueba tenemos: pt = 0.7, pz = 0.6 y p,s = 0.4; penden de los valores qLre tomen los
to de ítems es igual al producto de las debe resolverse en un contexto donde entonces las probabilidades de fallar parámetros.
probabilidades de puntuar en cada los niveles de estrés no excedan los
Aura Nklia Herrera, Nubia Roeío Sá¡cha, Hugo linnez Aaita DE LqrEoRIAct-AsrcaDE Los rEsrs AUrEoRrr DE RESpUESTA ALíTEM

Tabla I.
en este ítem se mantiene baja a lo largo sin embargo tanto su estimación como
lrobabilidad de re§Paesta Para los ocho patro¡tes de respuesta de un test de tres ítems en el nivel de
los valores que puede tomar son
habilldad 0. de 0 y sólo aLunenta cuando 0 > 7. A
diferencia del rndice de dificultad de diferentes. En la CCI el parámetro de
la TCT, este parámeko se expresa en discrirninación puede asimilarse aI
Patrón de respuesta probabilidad
la misma escala de la variable latente nivel de inclinación de la curva y
000 I fl zQt - 0.3* 0.4* 0.6 : de manera que mayores valores de b, corresponde a ia pendiente de Ia recta
0,072
representan ítems más difíciles; tangente a la CCI en su punto de
r00 P fl fl¡ - 0.7*0.4* 0.6 = 0,16g además, en la TCT el índice de , mayor inclinación. En Ia figura 4prle-
dificultad solamente varía entre 0 y 1, de verse que Ia curva de mayor pen-
ot0 l tP fl t :0..3* 0.6* 0.6 = 0,.1O8 diente es Ia del ítern i; si trazárarnos
mientras que en la TRI, teóricamente,
001 7 fl zP ¡ : 0.3* 0.4* 0.4 : 0,048 puede tomar valores enfr€ I - co .. una recta tangente al punto donde
Cuand o 0 tiene distribución normal cada una de las curvas muestran un
I10 ,P tPzS t = 0-7* Q.6* 0.6 = 0,252 conmedia 0 yvarianzaLy eIpará- carnbio rnás rápido ,Ia recta más ver-
r01 P tQ zP ¡ - 0.7't' 0.4* 0.4 : 0,1 I2 mefro de acierto por azaÍ (c) es igual tical sería Ia de éste ítem que es el más
a 0, una aproximación de b, a partir discriminativo de los tres. A medida
- 011 cl tP zP ¡ - 0.3 * 0.6 * 0.4 : 0,072 d"p, rndice de dificultad de Ia TCT, que Ia curva se hace más horizontal,
.:,

III ptp¿pt =0.7* 0.d*0.q 0,16g es b=-7


o' la discriminación del ítem se acerca a
rb
,donduZreselp-ésimo 0; en la figtrra cuafro el ítem de menos
percentil de la normal estan darizada, discriminación es él k.
es decir el valor Z que duja por debajo Nuevamente, bajo las condiciones
el 1,00p% de los datos, y rb es la antes descritas, es posible obtener una
Parámetros de Ios ítems El parámetro de dificultad (b) es el correlación biserial entre eI ítem y Ia aproximación del valor de a, d partir
valor de ?en el punto de máxima pen- prueb a, Así,por ejemplo, si en un ítem det índice de discriminación de la TCT
Los cuatro parámetros de la CCI diente de la CCI, que bajo normalidad puntúa el 50% de los examinados y mediante la expresión n
son: b o parámetro de dificultad del corresponde a la probabilidad igual a
=ft,con
su correlación biserial con la prueba
Ítem, a o discriminación del mism o, c 0,5; y puede expresarse corno: el nivel es 0,5; el valor aproximado de b sería r, igual a la correlación biserial entre
o probabilidad de que Lrn examinado de variable latente necesaria para el ítem y La prueba. Así, en el ítem de
0, yu que el valo r Z que deja por deba-
con ru1 bajo nivel de g puntúe en el puntuar en el Ítem. Este parámetro jo el 50% de los datos es 0 y entonces nuestro ejernplo anterior el parámetro
ítem, llarnado parárnetro de pseudo- define la posición de la CCI sobre la de discriminación sería aProximada-
,0
Ll-0.5'
9a
azar, y y o probabilidad de que un exa- escala de 0; en la figura 4 la curva
minado con alto nivel de g no puntúe corresponcliente al íterni r" ubica más
mente a=+=0.58.
Y1- o.sz
El parámetro de discriminación (a)
en el rnismo. Sin embar go, este frltimo hacia la derecha que los otros dos y es EI tercer parárnetro (c), se define co-
tiene una significación similar a la de
parámetro generalmente no se consi- el más difícil de los tres. A partir de la la TCT; esto es, la capacidad del ítem mo la probabilidad du Puntttar en un
dera en el modelo y sólo se incluyen, simple observación cle la curva puede ítern por azar y, en consecuencia, tiene
para distinguir entre examinados con
como máximo, los tres primeros. verse qLre la probabilidad de puntuar sentido cuando se trata d.e pruebas co-
altas y bajas magnitudes de atributo;

316 317
Aura Nidia Herrero,Nubra Rocío Sanchsz,, Hugo liménez Aaila DE ¿,ATEORLA CI-{,SICA DE LOS IESTS A IATEORIA DE RESPUESTA AL TTEM

nocidas como 'de ejecución máxima' 'lres parámetros'. Si se considera que El uso de lafr-rnción de distribución están formulados con base en logarit-
(rendimiento, habilidades, inteligen- Ia probabilidad de acertar un ítem de- normal acumulada o modelo de ojiva mos neperianos. La función de ojiva
cia, etc); y tiene muy Poco o ningún pencle fundarnentalmente de su difi- normal tuvo dos moLivaciones: la pri- de distribución normal está desarro-
interés para ítems de pruebas como cultad y se supone discriminación mera de corte pragmático, la segun da, llada con métodos de integración,
personalidad, intereses o valores. Este corstante y probabilidad de resPonder un interés teórico. El enfoque pragmá- característica que i^pone algunas
parámetro corresponde a la probabiU- al azar igual a 0, el modelo adecuado lico viene dado por el ajuste encon- dificultades de tipo práctico. Aunque
dad de acierto cuando 0 es mÍnimo, Y es el de r-rn parámebro. Si además de Ia trado entre el modelo y los datos; da- con Ia entrada de Ia tecnología infor-
dado que gpuede tomar valores entre dificultad, la probabilidad de acierto do que la ojiva normal es L¡.na curva mática éste no es un inconveniente
@ y -@, c corresponde a la asíntota de depende de la discriminación del ítem, continua con una asúrtota inferior y importante, desde el punto de vista
la curva cuando e Hende a -€. Sin se ele6'1rá tu1 modelo de dos paráme- otra superior, que se desplaza de iz- de Ia elegancia matemática y parsimo-
embar1o, este valor asintótico no es tros; y -.i, además, restrlta de interés quierda a derecha con crecimiento nia del modelo logístico, éste es supe-
observable en las CCI puesto que ge- estimar el parámetro c, de adivinación, conlinuo y rnonotónico, y que la fun- rior a la ojiva normal. Acturalmente las
neralmente se fija un valor mínimo de el modelo será de tres parámetros. ción tiende a cero y a uno en cada ex- aplicaciones en TRI hacen sus estima-
-3 o -4 para la escala de 0; así, el pará- tremo, parece un modelo bastante ciones con los modelos logísticos.
metro c puede verse como Ia mínima Modelos de la TRI apropiado para representar la relación Aunque los modelos logísticos
probabilidad de acertar. En la figura entre el nivel de variable latente y la fueron desarrollados en 7844 y utili-
4, elvalor nunimo de 0es -3 y Ia proba- Un segundo aspecto qLre distingue probabilidad de acertar en un ítem zados en disciplinas como Ia biología,
bilidad de acertar en ese nivel de Ia los diferentes modelos TRI es la fun- (CCD. sóIo hasta mediados del siglo XX ha
variable latente es de 0,75 Para el ítem ción matemática que se asuma Para La ecuación general del modelo de sido comprobada su aplicabilidad en
k y de 0 para los otros dos; luego Ia relacionar Ia probabilidad de acertar ojiva normal se expresa como eI campo de la teoría de los test. La
probabilidad de Puntuar Por azar es': aI ítem con g y los parámetros de los u formulación matemática básica de los
mayor para el ítem k. ítems. Aturqt á las ¡iosibiliclades Pue-
P
,( 0 =_[(z) dz, donde P t ( 0) es Ia pro- modelos logísticos es P, (g) -#,
Conceptualmente el equivalente al den ser infinitas, históricamente, la babilidad de puntuar en el ítem i dado donde P,(q) es Ia probabilidad de que
parámetro c, en Ia TCT sería Ia proba- TRI ha acogido dos modelos matemá- un nivel 0 de Ia variable latente, un examinado, responda correcta-
bilida d a priori de puntuar en un ítem, ticos para describir la forma de la dis- f (il es Ia función de probabilidad mente el ítem i, dado un nivel d.e va-
Ia cual depende del número fle alter- tribución de las resPuestas. Inicial- acurnulacla de una normaly w depen- riable latente 0;e es la base de los loga-
nativas de respuesta que tenga Ia pre- mente ,la ctistribución de puntuacio- de de los parámetros de los ítems. rilmos naturales y x es una variable
gunta; sin embar1o, numéricamente nes en forma de S achatada sugirió la Actualmente los modelos d.e ojiva arbitraria que es sustituida segÚrn el
el valor de c suele estar por debajo de función de distribución normal acu- normal tienen poco uso,- en parte modelo que se esté abordando sea de
la probabilidad a priori du puntttar. mtrlada (Lord, l. 952). Posteriormente, debido a la preferencia que se tiene uno, dos o tres paráme tros. Los
Uno de los aspectos que distinglren como producto de la evolución de los por modelos alternativos conocidos modelos logísticos son formalmente
los diferentes modelos TRI es el nír- modelos, gracias a los trabajos de con el nombre de modelos logísticos que diferentes al modelo de ojiva normal,
mero de parámetros que se inch-ryan; Rasch (1960) y Birnbaum (1968) se desde el punto de vista matemático, sin embargo si se Llsa una constante
así, se suele hablar de moclelos de 'Lm establecieron los modelos de ftrnción slrperan la sencil\ez de maniptilación de corrección (d - L,7), de manera que
parámetro', de 'dos parámeh-os' y de logística. de los datos. Los modelos logísticos 1a expresión se transforme en
Aura Nidia Herrera, Nubia Rocío Sánchn, Hugo liménez Auila DE t,¿TEOR|ACLASICA DE LOs IESTS AIATEOR1A DE RESPUEsI.A AL ITE¡,T

^dx

¡ 0)
( = obtienen resultados do y Ia dificultad del ítem son iguales, ge los valores al intervalo [0,1] y en llamente ubicamos la posición del
P
-i?*e
en consecuencia, el examinado tiene una forma srmilar a la cllrva descrita examinado en el eje x y proyectamos
rnuy similares. I-a princiPal diferencia
la rnisma probabilidad de acierto o de por el modelo de ojiva normal (Wright desde este punto una lurea paralela al
entre estos modelos radica en que ma-
fallo y cuanto mayor sea la diferencia & Stone , 1998). eje y hasta que se crllce con la curva
temáticamente los modelos logísticos
entre Ia habitidad y La dificultad, ma- De esta manera, el modelo de un del ítern (CCI). I.Juevamente, desde
son de mayor versatilidad.
yor será la cercanía de la probabilidad parámetro representa las relaciones este punto proyectamos una línea pa-
a los valores extrenros (0 o 1) segirn entre la habilidad del evaluado y la ralela alej e x en dirección aL eje y. La
Modelo logístico de un Parámetro.
corresponda. dificultad del ítem (p.opiedad del probabilidad de responder correcta-
Como se mencionó atttes, Ios mode-
La diferencia nurnérica entre la difi- ítem), para finalmente generar un mente el ítem es el valor del pr-urto de
los de un p arámetro slrPonen que la
cultad del ítem y la habilidad del exa- valor expresado en términos de pro- cru.ce entre el eje y y la última hnea pro-
solución de un ítem dePende funda-
minaclo es la base lógica y de esbima- babiliclad. La Figura 5 muestra la CCI yectada. El proceso inverso también es
mentalmente de su dificultad y del ni-
ción para el modelo logtstico de un de un ítem de una prueba de aptitud, váIido. Si conocemos Iu probabilidad
vel de variable latente del examinado
parámetro. Podemos Preguntarnos qLre ha sido analizado con el modelo que u-rr examinado tiene de responder
(Wright & Stone ,1998). EI modelo 1o-
entonces ¿cómo es que Lu.ta sustrac- TRI de Lu1 parárnetro con dificultad correctamente el ítern esfudiado, pode-
gístico de un parárnetro se conoce
ción (0 - b,) de dos valores exPresados media (b = -0.01). mos conocer rnediante inspección
también como modelo de Rasch enreco-
en Lu.ra escala que va desde un rango Como ya se mencionó, el modelo gráfrca, sll nivel de variable latente.
nocimiento al matemático danés qlle
de - @ hasta + "o produce resLlltados de un parámetro supone el grado de Otra forma de interpretar la infor-
Io desarrolló en Ia década de 1960 Y
en términos de probabilidad? Pues discriminación igr-ral para todos los mación que nos da Ia gráfica es tornar
es hoy uno de los más utilizados, Pre-
bien, es necesario exPresar esta dife- ítems de la prueba en la misma mues- el ítem en el contexto de lu población.
sumiblemente por su sencillez. EI mo-
rencia mediante alguna transforrna- tra, esto implica que todas las gráficas Si sabemos que el nivel promedio de
delo matemático de un parámetro se
ción matemática al lenguaje de la Pro- de la prueba analízada son paralelas variable latente de Ia población es
expresa como Pi(Q -ffi, babilidad. El primer Paso es redtrcir y se diferencian unas de otras por la -1.0, podría esperar que aproxima-
se
el rango original en que se Presentan localiza.ción en la escala de 0. La grá- damente el 70% acertarán el ítem de
dond e b,es el parámetro de discrimi-
las estimaciones (desde - hasta fica permite obtener inJormación con la figura 5. Y viceversa, si el ítem es
nación del ítem y los demás términos
* co ); no es graluito que como Io he- Lrna simple lectura de plano cartesia- respondido con acierto por el 70% de
ya estaban definidos.
mos hecho hasta ahora, g€neralmente no: si conocemos el nivel de variable los evaluados, podemos concluir váli-
Pr-rede verse fácilmente que si
se representen las CCI con - 3 < e < 3' Iatente de una persona, podemos ave- damente que el grupo examinado
0 = b,, es decir el nivel de rasgo latente
Esta prirnera conversión se hace riguar qué probabilidad tiene esa per- tiene un nivel promedio de 1.0 en Ia
del exarninado es igual a la dificultad
tomando la diferencia (0 - b,) como un sona de responder ese ítem. Senci- variable latente.
del ítern, Ia probabilidad de puntuar
exponente de Ia constante nafural e =
es i¡¡ral a 0,50; si Ia prirnera es mayor
que Ia dificultad, Ia probabilidad de
formación logarítmica que prodtrce
puntuar en el ítem es mayor qLle 0,50
valores entre 0 y +oo - Además, el uso
y, frnalmente, si 0 < b,, entonces P t ( 0)
< 0,5. La probabilidad 0,5 es el Punto exp (0i- bi)
de la razón res trin-
en que el nivel de rasgo del examina- 7 + exp (0i- bi)

320 321
Auro Ndrc Herrera,Nub¡¿ Rocío Sínchw,, Hugo liménez Auila DE IATEORIA CTASIUDE LOS TESTS A UTEIRÍADE REsP UESTA AL ÍTEM

7.O Z,O
o.9 0.9
o.8 o. ü
/"'
G o.7. €at
o, f
,/
(J o
tg
P
o
0..6 o
E o.6
9 o.s E
ñl
E o.5
trl
ts
9 o.4
o- D
m o. {
o.3 e
G. o. -r
o.2 o.2
o.7 - r"/'/
0.2 tt"l
a.

t"
ttttt

o o
07
"".""t""'-t"'

Escala de habilidad
-J -¿ -¿oz2J
Escsla de purru,ración

Figura 5. Curva caraclerística de un ilem con modelo logistico de un parámetro. b:-0,01 Figura 6. Curvas características para tres ítems con igual dificultad y diferentes parámetrcis de
l. . a

cl§cnmtnacrcn.

...
Modelo logístico de dos parámetros. donde e¡ es la discriminación del item Modelo logístico de tres parárnetros. modelo de Rasch son los que mayor
El modelo de dos parámetros fue y los demás términos definidos como Este modelo, además de considerar interés han despertado en la investiga-
desarrollado originalmente por hemosvenidohaciéndolohastaahora. los parámetros de los dos anteriores, ción psicométrica (Muniz, 7997).
Birnbaum (1968) y considera que.el Elefectogr;áficoqueproducelainter- da importancia al hecho de que el la ecuación general de este modelo es
acierto o el fracaso de un ítem, dado acción de los parámetros de dificultad y evaluaclo plleda puntuar en un ítem y'o¡ l0 - b¡)

un nivel de 8, está en función de la discriminación tiene dos "movi¡nien- por razones diferentes de la habilidad Pt(q = c¡+ 0. - c),
1. + d,¡(0-bi)
dificultad y de la discriminación del tos": en primer lugar, el parámeho de o a la capacidad discriminativa del
ítem. La lógica de razonamiento sobre dificuttad puede desplazarse a lo largo mismo. La adivinación o el pseudo azrff, donde ci es el parámetro de adivina-
la relación entre el parámetro dificul- de la escala de rasgo latente, y por otra como se le conoce a este parámetro, ción y los demás términos están defi-
tad y habilidad es la misma que utiliza parte, el pariámetro de discriminación son fen.ómenos que se dan en contex- nidos. Como puede observarse, estric-
el modelo de Rasch, pero, además de produce en la curva un giro tomando el tos de evaluación como en la solución tamente hablando, c.no es un paráme-
lo anterior se considera el parámetro puntodedifioütadcomocenbo.Sitrans- de pruebas objetivas, donde el exami- tro en el sentido que se le da a la discri-
de discriminación. La forma general pusiéramos gráficos de varios ítems de nado debe escoger ru.ra respuesta de minación o a la dificLrltad ,yd que no
del modelo' d e dos p arámetros es dos parámetros, con igual dificultad, en- entre cuatro o cinco posibilidades, pu- es logístico. EI modelo de tres pará-

PtA,- +edairc.bt
diendo tener éxito por problemas en metros es más bien una transforma-
t itu't - ;:Tffi:[Itrtl#'r*:'T:i:: la construcción del ítem, azar o por ción del modelo de dos parámekos
dq 1 ítems
'{,.bl igual dificultad
CCI para tres con descarte de distractores, entré otros. (Martínez, 1995). c,es una estimación
y diferente discriminación- El modelo de tres parámetros y el de la probabilidad de que el ítem
.AuraNidi¿ Herrera, Nubia Rocío Sáncha, Hugo liménez Aaita DE IATEORIA CT.ASIC¡ DE LOS TESTS A LATEORLA DE RESP UESTA AL |TEM

pueda ser respondidos Por variables control. El valor de pseudo azar aun- contrario,las estimaciones de los Pa- De otra parte, en la TRI a diferencia

áif.runtes al nivel de rasgo latente del qlte normalmente no suPera el }ímite rámefros de la TRI no tienen tal de- de lo que sucede en Ia TCT, la estirna-
áe 0 .35, tiene efecto sobre las estima- pendencia y Por tanto, son invarian- ción del nivel de rasgo latente de r:n
examinado y aladificultad o discrimi- 'tes, una propiedad que no
nación d.l mismo, que están fuera de ciones clel parárnetro de dificultad. Puede ser examinado, no depende de los instru-
'
observada sino inferida. mentos que se utilicen en su explora-
. 4' Una función de resPuesta a un ítem ción, ya qLle, siempre que los instru-
,.o puede ser vista como Ia regresión de Ia mentos hayan sido calibrados bajo el
o.9 probabilidad de puntuar en un Ítem esquema TRI, el atributo tiene una
o.a
sobre Ia magnitud del rasgo latente que magnitud que no se altera por el tipo
o,7
no 0.6 mid e, y las funciones de regresión Per- de instrumento usado en la medición,
.8 o.s
tr¡
manecen inmodificables cuando la üs- por eiernplo, el núrnero de Ítems
o o.a
ú
A
o.3
tribución de frecuencias sobre la aplicado.
o,2 'variable predictora cambia (Lord ,1980). EI concepto de inv aríanza en medi-
o.7
o
' Esta propiedad de las funciones de ción de variables psicológicas surge
regresión consü.fuye el armazón sobre como un rompimiento de las cosfum-
el que la TRI demuesba Ia invananza bres tradicionales de concephraliz ar y
ci 0'25' como una propiedad de los parámetros medir en psicologra. En este sentido,
Figu rt 7. cyrua característica de un írem con a= t.25; b,:0.56;
de los ítems. El arglunento de Lord las reglas de rnedición en psicología
(1980) continr.'ra con la siguiente pueden sufrir modificaciones e instau-
el tema de la teoría de afirmación: " ... La probabilidad de una rarse así u.na nuevá manera de cons-
La Figura 7 permite visualizar el autores inician
al ítem subrayando la enor- respuesta correcta de los exarninados a truir artefactos que nos ayuden a de-
funcionamiento de un modelo TRI de respuesta
que suPone contar con ítem i en urt nivel de habilidad e0 tectar mapitudes de los atributos psi-
tres parámetros; la asíntota inferior me ventaja
'1u1

probabilidad mí- estimaciones invariantes de


los pará- depend€ únicarnente de Ia habilidad 0, cológicos. La dinámica de la investi ga-
ffiil;;br;; no del nt'rmero de personas en 00, ni ción y sus apiicaciones juega un papel
nimaqueessuperiora0;Iaestimaciónmetrosdelmodeio'Esbienconocido
de lo dicho has- támpoco del núrnero de personas en fundamental en Ia construcción'de ese
encontrada fue c- 0.25; enotras paia- y puecle verse a partir
=
otros niveles de habilidad er, 0r, (...) conocimiento. Si logramos el paso de
bras,losexaminadosquetienenuntuuho'u'quelainformaciónobtenida
de algunas li¡nita- descripciones d"pendientes de la
,,i r"i *,ry bajo det rasio latente, tie- de Ia TCTadolece
Puesto que Ia regresión es invariante,
rr,u prof uUitau d,leO'2Sde pun- ciones' de las cuales' tal vez la de ma- su asíntota inferior, su punto de muestra a descripciones formurladas
^u^
tuar en el ítem. yor importancia radica en que los re- infle.xió^ y la pendiente en este punto, mediante un lenguaje matemático que
sultadts son dePendientes de las permanecen igualmente indiferentes de permita estirnaciones más estables;
características del gruPo de examina- la distribución de habilidad del grupo podemos esperar formular nuestro§
evaluado. Entonces, air b, y ci son Pa- problemas y esttrdios de investigacióní
CoMENTARIoSFINALESdos(Andrich,7989;CrockeryAlgina,
1986; Lord, 1980)' Indudablemente rámetros invariantes del ítem. De acuer- con mayor Precisión, construir méjor
tanto de or- res teorías, Iograr mayor rig'or en coñ1''
No creemos estar exageranclo si esto impone restricciones do con el modelo, estos parámeFros son
Por el ceptos y, obviamente,'u¡inejo'ras
afirmamos que casi Ia totaüdad de los den teórico
como tecnológico' indiferentes del grupo evaluado."

324
DE LArconl¡ ct-/.stc¡, DE Los rEsrs A LArrcnfa DE REsPuEsrA AL 1TEM
Aura Nüi¿ Herrera, Nubr¿ Roab Sáncha, Hugo limÉnez Aaita

fracciones de Ia prueba que no hayan restrictivos y no fáciles de cumplir, Andrich, D. A. (1989). In I.A. Keats,
sustanciales en los instrumentos de
sido previamente estudiadas como L¡.n mienlras que los de la TCT son débi- R. Taft, S. H. Heats, & S. H. Lovi-
medida. TamPoco creemos estar exa-
todo (Harnbleton, Swaminathan Y les, más generales y fáciles de cumplir. bond (Eds.) , Mathematical andTlteo-
gerando si afirmamos que huy con-
Rogers, 7991; Lord, 1980; Wright & Esto impone ventajas y desventajas a retical Systems (pp. 7-76). Amster-
senso en torno a este Punto
Stone , 7998). Por otro lado, Ia TRI se Ias dos aproximaciones: La TCT Paga dam: Elsevier Science Publishers.
Sin embargo, allnque el Problema
basa en el análisis de las propiedades con menos precisión su facilidad Y Andrich, D. A. (1998). Theory Prece-
de Ia dependencia de las estimaciones
de los items, sh embar1o, ajust4r un generalidad en las posibilidades de des measurement. Rasch Measure-
de los parárnetros no Parece tener
modelo TRI requiere, Por Io general y aplicación de sus Procedimientos, y la ment kansactions 72;2.
solución teórica dentro del marco de
como múümo, aplicaciones a 500 suje- TRI, por su Parte, parece estar conde- Bhattacharyya, G. & Johnson, R.
Ia TCT, los conskuctores de Pruebas
tos; si se cumPlen los suPuestos antes nada, al menos hasta los desarrollos (1977). S tatistical Concepts and
encontraron una solució. Práctica que
mencionados y se disPone de una actuales, a estar restringida a una Po- Methods. New York: John Wiley &
lleva Lrn siglo de Ltso: Estimar los
muestra de examinados de este tama- cas condiciones de aplicación,' e v?- Sons.
parámetros de los modelos a partir de
ño, tendremos información muY Pre- luando rigurosamente slls suPuestos Birnbaum, A. (1958) . Fw'thrr considera-
una muestra adecuada de Ia población
cisa a partir de unos Pocos ítems; Pero y el ajuste de los modelos. tions of elficiency in test of n mental
de interés, bien defini da, y lirnitar eI
pensemos nuevamente en el usuario Esta breve comParación muestra ability (Rep. No .17). Rabdolph Air
alcance de los resultados a esa pobla-
que debe seleccionar los 10 mejores que no hay L¡.na aProximación'buena' Force, Texas: USAF School of Avia-
ción. Ar-urqtte esta solución no satisfa-
ce los requeri¡nientos antes menciona- candidatos de una Población de 250 y una 'mala', tlna 'fuerte' y otra lblan- tion Medicine.
posibles aspirantes y necesi ta clesarro- da' sino dos aProximaciones que tie- Birnbaltm,A. (1968), In F.M.Lord & M.
dos para los avances de tipo cienfifico,
llar una prueba Para toma¡ su decisión. nen ventajut y limitaciones.Así una R. Novick (Eds.) Statistical theories
sigue siendo u.na estrategia válida y
De otra parte, algunos autores sos- responsabilidad aclual de los metodó- of mental test scores. Readit g, Mass:
respetable cuando las condiciones
tienen que ta TRI es u.n intento de aPli- logos y psicómetras es, rnás que aglu- Addison-\A/esley.
para Ia aplicación de los modelos TBI
car u.n enfoque "riguroso" aI proble- tinarse al rededor de una aProxima- Bolt, D. (1996). Differential item func-
no se cttmplen y el usuario requiere
ma de la medición en Psicología, en ción con fe religiosa, identificar las tioning: Its multidimensional mo-
de alguna información Para tomar de-
oposición a los modelos "blandos" de condiciones buio las cuales cada una det and resulting SIBTEST detec-
cisiones de tiPo práctico, Por ejemPlo
Ia TCT (Hambleton, Swaminathan Y de ellas resulta más aProPiada; ya que/ tion procedure. Behnaiormetrilcn 23
en procesos de selección du Personal.
en palabras de Muñiz (1997) Parecen (1) 67-es.
Otra limitante de la TCT es que los Rogers, 1997; Martínez, 7995; Wright
ser dos aproximaciones destinadas a Brown, Medi-
F. (1980) . Fundamentos de
íterns qlre comPonen la prueba tienen & Ston e,1998). Esto implica el estable-
cimiento de altos niveles de exigencia entenderse en favor de los usuarios. ción y Eualuación en Psicología Y
utilidad métrica si y sólo si Ia variable
a los procesos de medición ,Yd que los
Educación. México: EI Manual
medida se califica tomando como base
modelos "blandos" tienen Ia virtucl de Moderno.
el total de Íterns de Ia prueba; en otras
ser aplicables a numerosos problemas REFERBNCIAS Btrnge, M. (1985) . La inaestignción cien-
palabras, los ítems aislados cle Ia prure-
d.e medida, como una consecuencia de
tificn: slt estrategia y si filosofía. (2da
ba no pr-reden ser tomados como ins-
la adecuación de sus sLtPuestos ante Arrastasi, A. & Urbinñ, S. (1998) - Tests ed.) Barcelona: Editorial Ariel S. A.
trumentos de medid aya que sólo son
diferentes tipos de fuentes de clatos. psicológicos. (7 ed.) México: Prentice Crock er, L. & Algina, J. (1986) . Intro-
componentes de un agregado. Esta
Los supuestos de Ia TRI son fttertes, FIall. ductiott to classical Ü modern test
restricción también se aPlica a

También podría gustarte