Terminolo
Terminolo
Terminolo
Introducción
En este primer capítulo del estudio de la Estadística, pretendemos realizar una primera
aproximación a lo que es la Estadística como ciencia y, sobre todo, al importante papel que
desempeña en el campo de la investigación en educación, pues nos sirve de apoyo y ayuda para
abordar el estudio de diferentes problemas que pueden contribuir a la mejora de la educación y
de la sociedad.
Son muchas las razones que justificarían la presencia de la Estadística en los estudios
pedagógicos, desde saber interpretar algunas publicaciones científicas hasta poder llegar a diseñar
y desarrollar propuestas de trabajo en el campo educativo. Siguiendo las directrices de algunos
autores, que se han ocupado del tema, como Welkowitz, Van Dalen y Meyer, Ferguson, Kerlinger,
Fox, etc.; estas razones se pueden agrupar en los siguientes campos:
— Comprender los trabajos que se publican en revistas científicas, libros, informes, etc.; tanto
si son recogidos en papel como a través de las nuevas tecnologías de la información y
comunicación. Sin tener unos conocimientos mínimos será difícil llegar a entender muchos
de los trabajos publicados en el campo educativo.
— Entender los procesos implicados en la investigación educativa que hacen posible la
inferencia desde la muestra a la población y conocer las garantías que nos ofrecen estas
decisiones, pues desde estos trabajos se recoge una gran información que ayudará en la
elaboración de conclusiones y permitirá realizar predicciones de cara al futuro.
— Facilitar el propio desarrollo de la investigación socio-educativa. Ello exige que los futuros
graduados han de llevar a cabo trabajos empíricos en su campo de trabajo profesional, algo
que será difícil de abordar si no se tiene un conocimiento básico de la Estadística. No se
trata por tanto de formar profesionales o expertos en este campo de estudio, sino de
capacitarles para entender y aplicar esos conocimientos en la propia actividad profesional.
En resumen, entendemos que es preciso poder leer y comprender las publicaciones cien- tíficas,
así como diseñar y desarrollar estudios empíricos en el campo pedagógico y entender las
directrices que guían el método científico como medio de formación intelectual. Estamos ante tres
argumentos sólidos que apoyan el estudio de una materia de estas características en la formación
de los futuros graduados en el campo pedagógico y social.
Al término Estadística se le asignan diversas acepciones por parte de las personas vinculadas al
campo socioeducativo; así se puede entender como una serie de conjuntos de números, como
método de trabajo propio del campo empírico, como a la forma de resolver problemas educativos,
e incluso, a considerarla como una ciencia.
Entendida como conjunto de datos numéricos propia de los censos de personas que se ubican
en un determinado espacio físico, podemos reseñar las estadísticas sobre los niveles de
escolarización obligatoria, sobre el acceso a los estudios superiores de los inmigrantes, etc. Desde
el otro extremo, al considerarla como ciencia, dirige su atención al estudio de los fenómenos
aleatorios, con este enfoque se ha conseguido avanzar en el desarrollo de métodos, técnicas y
modelos que nos ayudan en la resolución de problemas pedagógicos y, sobre todo, a la toma de
decisiones. La Estadística actúa como una disciplina puente entre los modelos matemáticos y los
fenómenos reales, que, además, proporciona una metodología para evaluar las discrepancias
entre la realidad y la teoría.
Entre los autores que han definido la Estadística, quizá una de las más completas y comprensibles
nos la ofrece Kerlinger (1985) cuando la define como:
«la Estadística es la ciencia que estudia, mediante métodos cuantitativos, las poblaciones
que se obtienen como síntesis de la observación de unidades estadísticas» (p. 8).
De forma sintética, las principales funciones de la Estadística se pueden agrupar en torno a tres
grandes apartados:
a) Facilitar el manejo de datos amplios y dispersos: se trata de una función eminente- mente
simplificadora y descriptiva, pues se pretenden reducir a índices o estadísticos (media,
mediana, desviación típica, correlación) las características que identifican a un conjunto
de datos. Así se procede a la ordenación, la categorización, posición, variabilidad, simetría
y asimetría, representaciones gráficas y estudios de relaciones entre variables.
b) Inferir desde la muestra a la población: este proceso consiste en el análisis que sigue el
investigador para extrapolar los resultados obtenidos en las muestras a las poblaciones
de las que se extrajeron. Estamos hablando de la generalización de los resultados de
muestras, cuando éstas cumplen los requisitos de suficiencia y representatividad. Es decir,
desde los estadísticos (proceden de muestras) se pueden estimar los parámetros
(medidas de población).
c) Ayudar en la toma de decisiones: tanto desde los meros análisis descriptivos de grupos
como el análisis de los valores críticos que ponen de relieve la existencia de diferencias
significativas entre los grupos de tratamiento. En ambos supuestos se trata de incorporar
cambios en las actuaciones educativas que redunden en mejoras de las formas de
actuación en el campo socioeducativo.
Tipos de Estadística
Teniendo en cuenta las funciones y cometidos de la Estadística parece desprenderse que nos
encontramos ante dos tipos diferenciados de la misma. Ahora bien, debemos ser conscientes que
su presencia no nos asegura la calidad de la investigación, pero sí se acepta como lenguaje
universal, aunque su significado se deriva del propio diseño de la investigación.
En el ámbito de la Estadística entendida como método de aplicación de los principios científicos
para la resolución de problemas socioeducativos y la toma de decisiones, podemos identificar dos
grandes tipos, según las tareas a las que debe enfrentarse, la descriptiva y la inferencial.
Estadística descriptiva
A esta modalidad de Estadística se le asocian los procesos de análisis que se llevan a cabo con los
datos empíricos recogidos en las muestras, en líneas generales este proceso concluye con la
obtención de unos valores numéricos que reciben la denominación de estadísticos, cada uno de
ellos pone de relieve una característica representativa del grupo de sujetos que se analiza. En
realidad, transforma un conjunto de números u observaciones en índices que sirven para describir
o caracterizar esos datos dentro de los grupos de sujetos.
La podemos considerar como una parte de la Estadística que se ocupa del estudio de los
métodos y técnicas necesarios para la descripción gráfica y numérica de los conjuntos de datos
numerosos. Ello nos ofrece una visión global del grupo de sujetos que es objeto de estudio.
Esta propuesta tiene limitaciones en la interpretación de los estadísticos, pues en muchas
ocasiones nos debemos centrar en una comparación entre el valor de la muestra y otros que
procedan de muestras similares, por lo que no aporta suficientes argumentos científicos al
investigador en la toma de decisiones sobre los grupos.
Por lo tanto, podemos afirmar que la Estadística descriptiva es aquella parte de la Esta- dística que
utiliza estadísticos procedentes de muestras o de poblaciones con una finalidad eminentemente
descriptiva o informativa de las mismas. Así pues, realiza una tarea de síntesis y descripción de las
características de uno o más conjuntos de datos, lo que refleja su propia naturaleza. El uso de la
misma es la forma más adecuada para resumir los datos y resulta indispensable para interpretar
los resultados de los trabajos empíricos.
En esta línea de análisis sobre la Estadística descriptiva, Fox (1981) señala cinco funciones
principales:
— Conocer los estadísticos o características esenciales de un conjunto de datos.
— Interpretar lo que nos dicen los estadísticos muestrales sobre los parámetros o medidas de
población de la que se extrajo la muestra.
— Conocer la existencia, el sentido y la magnitud de la relación entre dos variables.
— Explorar las relaciones, manifiestas o no, en la estructura que define la relación de más de
dos variables.
— Utilizar los estadísticos procedentes de muestras para conocer las tendencias en el
comportamiento de nuevos grupos de sujetos.
Según la naturaleza o características de las muestras y los datos se puede diferenciar entre: la
Estadística descriptiva univariada, que cubre la más simple de las funciones, pues intenta descubrir
y analizar una distribución de datos que provienen de la medición de una variable en una muestra
y la Estadística descriptiva bivariada, que recoge y analiza datos de dos variables, es el campo
propio de las correlaciones. Cuando intervienen más de dos variables se habla de la multivariada.
Estadística inferencial
La Estadística inferencial tiene por finalidad la obtención de una serie de conclusiones sobre
algún aspecto o variable presente en una población a partir de las observaciones de
comportamientos en una o varias muestras. Es decir, los valores de la población (parámetros) nos
permiten conocer el fenómeno o hecho socioeducativo en muestras amplias, además de resolver
y fijar las hipótesis, plantear leyes y tomar decisiones con rigor científico, valorando en estos casos
los márgenes de error con los que realizamos nuestras afirmaciones (nivel de confianza).
Hablar de nivel de confianza nos permite abordar un tema crucial, pues hemos de tener en
cuenta que en el marco de la investigación socioeducativa, las decisiones que se toman no se
pueden realizar en términos de certeza, sino de probabilidad, por lo que en esas estimaciones
debemos fijar los márgenes de error en nuestras afirmaciones que suelen ser de 0,05 y 0,01
(en términos de porcentajes, del 5% y del 1% respectivamente); que llevan asociados los
correspondientes niveles de confianza, complementarios a los anteriores, generalmente
expresados en porcentajes: 95% y 99% respectivamente.
La inferencia nos ayuda en la toma de decisiones sobre la aceptación o el rechazo de las
relaciones previstas en la hipótesis (posible solución del problema), aunque estas decisiones suelen
matizarse con la fijación del margen de error. En cualquier caso, debemos ser prudentes en el
momento de llevar a la práctica los cambios o modificaciones que propugnaban las hipótesis, pues
en el campo educativo se presentan otros factores o condiciones no suficientemente planificadas
que pueden distorsionar los resultados finales.
Entendemos que son dos los grandes campos que forman la Estadística inferencial: la
estimación de parámetros y el contraste de hipótesis. La estimación se puede llevar a cabo
mediante la elección de un solo valor de la muestra que se transforma en parámetro (estimación
puntual) o a través de unos límites entre los cuales se espera se encuentre el verdadero valor del
parámetro (estimación por intervalos), en este caso debemos ser conscientes de que esos límites
vienen influenciados por los errores aleatorios y los sistemáticos.
El contraste de hipótesis consiste en probar mediante datos empíricos las hipótesis que se
plantean en el proceso de investigación, de tal forma que son los datos los que deben ofrecer una
respuesta a los planteamientos iniciales del investigador y no al revés, pues se violaría el sentido
de la ciencia. Como decía Kerlinger, demos oportunidad a los datos de mostrar que los cambios
en los comportamientos son achacables a las tesis iniciales.
En el problema de investigación
Cuando el investigador formula su hipótesis o enumera sus objetivos se le exige que las hipótesis
sean contrastables y los objetivos comprobables. Ello será posible si disponemos de una serie de
instrumentos de recogida de datos que nos ofrezcan una información nítida y detallada sobre ese
problema que nos ocupa y cuya solución se adelanta en la hipótesis.
Referido al tipo de hipótesis nos permite conocer qué estadísticos deben ser calculados, qué
análisis son necesarios en ese problema. También nos ayuda a determinar si la hipótesis que se
plantea ha de ser unilateral o bilateral, es decir, el sentido de la hipótesis de investigación. Además
nos ofrece argumentos para seleccionar la modalidad de análisis estadístico que es el más
adecuado para la validación o comprobación empírica de esa hipótesis.
En síntesis garantizar el control en los procesos de investigación empírica supone que se aíslan
o minimizan los efectos de las covariaciones y la influencia de las variables extrañas que pudieran
llegar a ofrecer explicaciones alternativas a las buscadas por el investigador. El hecho de poder
cuantificar estos pesos relativos nos permitirá realizar afirmaciones con la suficiente validez y rigor
en el campo socioeducativo.
Recordemos que, en ocasiones, las variables son constructos que no admiten una medida
directa, por lo que es preciso definir conductas operativas y medibles que nos indiquen el valor
real de las mismas en el contexto de la investigación socioeducativa. Esta operación se conoce
como la definición operativa de las variables y en ella la Estadística desempeña un cometido
fundamental.
En el proceso de medida de las variables debemos ser conscientes que cuando estamos
obteniendo un determinado valor para la variable en cuestión, éste puede venir influenciado por
los errores asociados al acto de medir la variable y a la estimación indirecta que se realiza en no
pocas ocasiones. Dado que no podemos hablar en términos de certeza, es conveniente reflejar en
los trabajos empíricos que los datos obtenidos de la medida de la variable pueden estar sujetos a
variaciones provocadas por múltiples factores y que, en determinados supuestos, puede tener
unas repercusiones sobre la investigación y las aplicaciones de los resultados a la práctica real.
En síntesis, nos encontramos ante una fase eminentemente estadística, pero ello no quiere
decir que las aportaciones en otras partes no sean tenidas en cuenta o sean de poca entidad, pues
los procesos lógicos y los estadísticos están íntimamente ligados y mutuamente condicionados en
el campo de la investigación socioeducativa. La utilización de una prueba u otra debe quedar en
manos del investigador, no del informático, éste nos puede ayudar y facilitar las herramientas de
cálculo, mientras que los investigadores debemos conocer estas pruebas y, sobre todo, ser
capaces de interpretar las salidas del ordenador.
En la decisión estadística
La fase anterior concluye con la obtención del denominado valor empírico del estadístico
correspondiente, que será diferente según la prueba estadística que se haya seleccionado («t»,
«z», «F», «U», «T», «H», etc.), y que ha de ser interpretado, de tal forma que el investigador pueda
concluir que las diferencias entre los grupos son diferencias reales y no mera- mente aleatorias, o
sea que esas diferencias no son explicables por efecto del azar.
Esa interpretación consiste en decidir si la hipótesis de nulidad (H0) se rechaza y, por
consiguiente, se acepta la hipótesis alternativa o hipótesis del investigador (H1); esta decisión se
hace fijando unos niveles de confianza o unos márgenes de error. Recordemos que la investigación
no puede realizar afirmaciones en términos de certeza. En esta última fase del proceso de
investigación la Estadística, se pone de manifiesto al ofrecernos los valores teóricos o críticos de
distribución de cada uno de los estadísticos y que vienen recogidos en tablas o bien se determinan
mediante el empleo de una serie de ecuaciones. La cuantía de los estadísticos depende de muchos
factores, como los tamaños de las muestras que se han utilizado, el número de grupos, los grados
de libertad, el nivel de confianza, el margen de error, etc. Estas condiciones particulares asociadas
a las pruebas estadísticas se recogen de forma más explícita en los capítulos finales de esta obra.
La regla general asociada al contraste de hipótesis y la decisión estadística nos dice que: cuando
el valor empírico del estadístico es mayor que el valor teórico o crítico se rechaza H 0, ello supone
aceptar que las diferencias encontradas son estadísticamente significativas. Naturalmente, esta
regla general tiene sus excepciones que se irán analizando en sucesivos capítulos. En este
momento debemos entender que esta fase es fundamental en el desarrollo de la investigación
pedagógica empírica en el campo socioeducativo, pues nos permite garantizar que los cambios
producidos por la intervención del investigador sobre la variable independiente (VI) ha producido
sus frutos y podrá ser recomendada en el futuro en contextos o situaciones similares a la estudiada.
h) Ciencias Jurídicas: quizá uno de los campos del derecho en que nos encontramos alguna
de las aplicaciones de la Estadística es el de la Criminología, en los estudios de prevención
de delitos. En muchos juicios civiles se precisa el concurso de peritos estadísticos para
testificar y valorar algunos datos de interés para la justicia.
En las páginas anteriores hemos puesto de relieve el importante papel que ha de desempeñar la
Estadística, como ciencia instrumental de apoyo a la investigación, en el campo social y educativo.
Ello no lleva consigo que servirá para resolver todos los problemas que aquejan al campo de
estudio que nos ocupa. Recordemos que nos permite el manejo de datos y nos facilita su análisis
e interpretación, pero si la calidad de éstos no es la adecuada se puede cuestionar la validez de las
conclusiones. También debemos recordar que la tarea del diseño y elección de pruebas
estadísticas es tarea del educador, pues no todos los análisis son pertinentes en todas las
ocasiones, como pondremos de manifiesto en páginas posteriores.
Así, la Estadística nos ayudará en la decisión de rechazar las hipótesis de nulidad (H0), pero las
garantías que han conducido a este punto deben ser revisadas y controladas, es decir, no
podemos olvidar que sin un buen control sobre las variables extrañas, podemos estar
considerando que los cambios generados son achacables a una variable independiente (VI), cuando
en realidad han sido otros factores o variables no controladas las que han generado los cambios.
Debemos ser conscientes que la elección de las pruebas de contraste va asociada al
cumplimiento de una serie de requisitos por parte del modelo estadístico generado por los datos
de la investigación. Aunque la Estadística no permitiría usar diferentes pruebas esta- dísticas, la
decisión sobre la más adecuada y la que cumple mejor los cometidos del trabajo y respeta los
requisitos del modelo, es del responsable del trabajo. En suma que la Estadística a través de los
paquetes de análisis de datos es ciega y puede emplear diferente procedimientos de cálculo, pero
el investigador es el que debe tomar la decisión en elegir unas y descartar otras, para que los
resultados finales de los trabajos empíricos sean válidos en la toma de decisiones.