Location via proxy:   [ UP ]  
[Report a bug]   [Manage cookies]                

Tema 71 Estadística

Descargar como docx, pdf o txt
Descargar como docx, pdf o txt
Está en la página 1de 20

Tema 71: Estadística

TEMA 71: ESTADÍSTICA


ESTADÍSTICA: CONCEPTO Y CAMPO DE APLICACIÓN.

CONCEPTO

Según la RAE, en su tercera acepción podemos encontrar que define a la estadística como: "Estudio
de los datos cuantitativos de la población, de los recursos naturales e industriales, del tráfico o de
cualquier otra manifestación de las sociedades humanas".

En su quinta acepción, nos dice que: "es una rama de la matemática que utiliza grandes conjuntos
de datos numéricos para obtener inferencias basadas en el cálculo de probabilidades".

Según el padre de la estadística española, Sixto Ríos, como la ciencia cuyo objetivo es tratar la
información de una serie de datos que provienen de la observación.

Según Spiegel: "La estadística estudia los métodos científicos para recoger, organizar, resumir y
analizar datos, así como para sacar conclusiones válidas y tomar decisiones razonables basadas en
un análisis".

Según Kendall y Buckland definen la estadística como un valor resumido, calculado, basado en
observaciones que generalmente, son parámetros de una determinada población; es decir, una
función de valores de muestra.

Según Gini: "La estadística es una técnica para el estudio cuantitativo de los fenómenos de masa o
colectivo, cuya mediación requiere una cantidad de observaciones de otros fenómenos más
simples llamados individuales o particulares".

Según Chacón: "Es la ciencia que tiene por objeto el estudio cuantitativo de los colectivos".

Teniendo en cuenta las funciones de la estadística, podemos considerar dos grandes áreas:

1. Estadística Descriptiva: En este tipo de estadística se organizan y se hacen resúmenes de


conjuntos de observaciones procedentes de una muestra o población total de una forma
cuantitativa. Este resumen puede hacerse mediante tablas, gráficos o valores numéricos. Según
el número de variables:
• 1 variable: índices de los valores más habituales de esa variable (índices de tendencia
central), hasta qué punto esos valores son similares o diferentes entre sí (estadísticos de
variabilidad) y en qué grado se reparten equilibradamente por encima y por debajo de la
tendencia central (estadísticos de asimetría).
• 2 variables: índices que nos indiquen hasta qué punto están ambas variables relacionadas
entre sí (coeficiente de correlación), así como procedimientos que nos permitirán predecir
el valor de una variable en función de otra (ecuación de regresión).
2. Estadística lnferencial: En este tipo de estadística se realizan inferencias acerca de una
población basándose en los datos obtenidos a partir de una muestra. Para realizar estas
generalizaciones de la muestra a la población total se utiliza el cálculo de probabilidad o
inferencia estadística.

Funciones Generales (KRUSKAL):

- Resumen de los datos y extracción de información relevante.

1
Tema 71: Estadística

- Búsqueda y evaluación de los modelos y pautas que ofrecen en los datos.


- Contribuir al diseño eficiente de investigadores y encuestas.
- Facilitar comunicación de los investigadores y estudiosos en una materia.

VARIABLE

Característica o cualidad; magnitud o cantidad, que puede sufrir cambios, y que es objeto de
análisis, medición, manipulación o control en una investigación. Los tipos de variables son los
siguientes:

• Cuantitativas. Son aquellas que se expresan en valores o datos numéricos. Pueden ser:
o Discretas: son las que asumen valores o cifras enteras.
o Continuas: son aquellas que adoptan números fraccionados o decimales.
• Cualitativas. Son características o atributos que se expresan de forma verbal (no numérica), es
decir, mediante palabras. Estas pueden ser:
o Dicotómicas: sólo dos clases o categorías. Ejemplos: masculino o femenino.
o Policotómicas: más de dos categorías. Ejemplo: marcas de ordenadores.

MÉTODOS FUNDAMENTALES DE SELECCIÓN DE LA MUESTRA.

En una investigación, es normal que conozca un parámetro de los elementos de una población, sin
embargo, la población suele ser demasiado extensa para estudiarla al completo. Por este motivo,
se realiza un muestro con el que se obtiene una muestra de elementos que representan a la
población y se estudia la característica deseada en la muestra mediante estadísticos que se usaran
para estimar los parámetros de la población.

Conviene destacar las siguientes definiciones:

• Población o universo: conjunto de todos los elementos que cumplen una determinada
característica objeto de estudio.
• Muestra: subconjunto de cualquier población.
• Muestreo: Selección de un conjunto de personas o cosas que se consideran representativas del
grupo al que pertenecen.
• Parámetro: propiedad descriptiva de la población.
• Estadístico: propiedad descriptiva de la muestra.
• Unidad estadística o individuo: cada elemento que compone una determinada población.

Aunque cualquier subconjunto de una población recibe el nombre de muestra, las conclusiones
obtenidas en una muestra, solo servirán para el total de la población si la muestra es
representativa.

MOTIVOS PARA LA REALIZACIÓN DE UN MUESTREO. CONSIDERACIONES NECESARIAS:

En muchos casos es conveniente el uso de muestras, pero para que podamos extraer conclusiones,
es importante que elijamos bien las muestras para nuestros estudios. Por ejemplo, para el caso del
acceso a internet de los españoles. elegir a 10 personas de 40 millones es insuficiente, no es
representativo. Tampoco lo sería preguntarle, por ejemplo, a 100 personas de Madrid, o elegir a
todos tus amigos y tu familia. A la hora de elegir una muestra:

1. El método de selección de los individuos de la población (tipo de muestreo a usar).


2. El tamaño de la muestra.

2
Tema 71: Estadística

3. El grado de fiabilidad de las conclusiones que vamos a presentar, es decir, una estimación del
error que vamos a cometer (en términos de probabilidad).

La selección no adecuada de los elementos de la muestra provoca errores posteriores a la hora de


estimar las correspondientes medidas en la población. Pero podemos encontrar más errores: el
entrevistador podría no ser imparcial, es decir, favorecer que se den unas respuestas más que
otras. Puede ocurrir también que, por ejemplo, la persona que vayamos a entrevistar no quiera
contestar a ciertas preguntas (o no sepa contestar). Clasificamos todos estos posibles errores:

1. Error de sesgo o de selección: si alguno de los miembros de la población tiene más


probabilidad que otros de ser seleccionados. Imagina que queremos conocer el grado de
satisfacción de los clientes de un gimnasio y para ello vamos a entrevistar a algunos de 10 a 12
de la mañana. Esto quiere decir que las personas que vayan por la tarde no se verán
representadas por lo que la muestra no representará a todos los clientes del gimnasio. Una
forma de evitar este tipo de error es tomar la muestra de manera que todos los clientes tengan
la misma probabilidad de ser seleccionados.
2. Error o sesgo por no respuesta : es posible que algunos elementos de la población no quieran o
no puedan responder a determinadas cuestiones. O también puede ocurrir, cuando tenemos
cuestionarios de tipo personal, que algunos miembros de la población no contesten
sinceramente.

Estos errores son, en general, difíciles de evitar, pero en el caso de la sinceridad, se suelen
incorporar cuestiones (preguntas filtro) para detectar si se está contestando sinceramente.
Podemos decir que una muestra es sesgada cuando no es representativa de la población.

TIPOS DE MUESTREO

MUESTREO PROBABILÍSTICO:

Los métodos de muestreo probabilísticos son aquellos que se basan en el principio de


equiprobabilidad. Es decir, aquellos en los que todos los individuos tienen la misma probabilidad
de ser elegidos para formar parte de una muestra y, consiguientemente, todas las posibles
muestras de tamaño n tienen la misma probabilidad de ser seleccionadas. Sólo estos métodos de
muestreo probabilísticos nos aseguran la representatividad de la muestra extraída. Tipos:

• Muestreo aleatorio simple: Este procedimiento. atractivo por su simpleza, tiene poca o nula
utilidad práctica cuando la población que estamos manejando es muy grande.El procedimiento
empleado es el siguiente:
1. Se asigna un número a cada individuo de la población, y
2. A través de algún medio mecánico (bolas dentro de una bolsa, tablas de números
aleatorios, etc.) se eligen tantos sujetos como sea necesario para completar el tamaño de
muestra.
3. Todos los individuos de la población tienen la misma posibilidad de ser elegidos.

Existen dos tipos de muestreo aleatorio simple:

1. Con reintegro: el individuo seleccionado vuelve a formar parte de la población a elegir.


P.ej. la bola con su número vuelve a introducirse en la bolsa.
2. Sin reintegro: el individuo seleccionado no vuelve a formar parte de la población a elegir.
P.ej. la bola con su número no vuelve a introducirse en la bolsa.

3
Tema 71: Estadística

• Muestreo aleatorio sistemático: Este procedimiento exige, como el anterior. numerar todos
los elementos de la población, pero en lugar de extraer n números aleatorios solo se extrae
uno.

Se parte de ese número aleatorio i, que es un número elegido al azar, y los elementos que
integran la muestra son los que ocupa los lugares i, i+k, i+2k, i+3k, .. .,i+(n-1)k, es decir se
toman los individuos de k en k, siendo k el resultado de dividir el tamaño de la población entre
el tamaño de la muestra: k= Nin. El número i que empleamos como punto de partida será un
número al azar entre 1 y k.

El riesgo este tipo de muestreo está en los casos en que se dan periodicidades en la población
ya que al elegir a los miembros de la muestra con una periodicidad constante (k) podemos
introducir una homogeneidad que no se da en la población.

Imaginemos que estamos seleccionando una muestra sobre listas de 10 individuos en los que
los 5 primeros son varones y los 5 últimos, mujeres, si empleamos un muestreo aleatorio
sistemático con k=10 siempre seleccionaríamos o sólo hombres o sólo mujeres, no podría
haber una representación de los dos sexos.

• Muestreo aleatorio estratificado: Trata de obviar las dificultades que presentan los anteriores
ya que simplifican los procesos y suelen reducir el error muestral para un tamaño dado de la
muestra. Consiste en considerar categorías típicas diferentes entre sí (estratos) que poseen
gran homogeneidad respecto a alguna característica (se puede estratificar, por ejemplo, según
la profesión, el municipio de residencia, el sexo, el estado civil, etc.). Lo que se pretende con
este tipo de muestreo es asegurarse de que todos los estratos de interés estarán
representados adecuadamente en la muestra. Cada estrato funciona independientemente,
pudiendo aplicarse dentro de ellos el muestreo aleatorio simple o el estratificado para elegir
los elementos concretos.

La distribución de la muestra en función de los diferentes estratos se denomina afijación, y puede


ser de diferentes tipos:

o Afijación Simple: A cada estrato le corresponde igual número de elementos muéstrales.


o Afijación Proporcional: De acuerdo con el peso (tamaño) de la población en cada estrato.
o Afijación Optima: Se tiene en cuenta la previsible dispersión de los resultados, de modo que se
considera la proporción y la desviación típica. Tiene poca aplicación.

• Muestreo aleatorio por conglomerados: Los métodos presentados hasta ahora están
pensados para seleccionar directamente los elementos de la población, es decir, que las
unidades muéstrales son los elementos de la población. En el muestreo por conglomerados la
unidad muestral es un grupo de elementos de la población, a la que llamamos conglomerado.
Las unidades hospitalarias, los departamentos universitarios, una caja de determinado
producto, etc., son conglomerados naturales. Cuando los conglomerados son áreas geográficas
suele hablarse de "muestreo por áreas·.
• Muestreo polietápico: se desarrolla en dos etapas:
1. Primero, se seleccionan los conglomerados de manera aleatoria (como en el muestreo
aleatorio por conglomerados).

4
Tema 71: Estadística

2. Después, se seleccionan, de manera aleatoria, una parte de los individuos que conforman
cada conglomerado (y no todos, como en el muestreo aleatorio por conglomerados).

MÉTODOS DE MUESTREO NO PROBABILÍSTICOS:

A veces. para estudios exploratorios, el muestreo probabilístico resulta excesivamente costoso y se


acude a métodos no probabilísticos, aun siendo conscientes de que no sirven para realizar
generalizaciones (estimaciones inferenciales sobre la población), pues no se tiene certeza de que la
muestra extraída sea representativa, ya que no todos los sujetos de la población tienen la misma
probabilidad de ser elegidos. En general se seleccionan a los sujetos siguiendo determinados
criterios procurando, en la medida de lo posible, que la muestra sea representativa.

Entre los métodos de muestreo no probabilísticos más utilizados:

• Muestreo por cuotas ("accidental"): Se asienta generalmente sobre la base de un buen


conocimiento de los estratos de la población y/o de los individuos más "representativos" o
"adecuados" para los fines de la investigación. Mantiene, por tanto, semejanzas con el
muestreo aleatorio estratificado, pero no tiene el carácter de aleatoriedad de aquél. En este
tipo de muestreo se fijan unas "cuotas" que consisten en un número de individuos que reúnen
unas determinadas condiciones (20 individuos de 25 a 40 años). Una vez determinada la cuota
se eligen los primeros que se encuentren que cumplan esas características. Este método se
utiliza mucho en las encuestas de opinión.
• Muestreo intencional o de conveniencia: Este tipo de muestreo se caracteriza por un esfuerzo
deliberado de obtener muestras "representativas" mediante la inclusión en la muestra de
grupos supuestamente típicos. Es muy frecuente su utilización en sondeos preelectorales de
zonas que en anteriores votaciones han marcado tendencias de voto.
• Bola de nieve: Se localiza a algunos individuos, los cuales conducen a otros, y estos a otros, y
así hasta conseguir una muestra suficiente. Este tipo se emplea frecuentemente en estudios
con poblaciones "marginales", delincuentes, sectas, determinados tipos de enfermos, etc.
• Muestreo Discrecional. A criterio del investigador los elementos son elegidos sobre lo que él
cree que pueden aportar al estudio.

MEDIDAS DE TENDENCIA CENTRAL Y MEDIDAS DE DISPERSIÓN.

MEDIDAS DE TENDENCIA CENTRAL

En la tendencia central de la distribución, nos interesa calcular un valor central que actúe como
resumen numérico para representar al conjunto de datos. Estos valores centrales son las medidas
o índices de tendencia central. Las medidas de tendencia central sirven para representar
globalmente el comportamiento de los datos observados y localizar la distribución de frecuencias.

TIPOS DE MEDIDA DE TENDENCIA CENTRAL:

Media aritmética

Resulta ser el conjunto finito de números que es igual a la suma de todos los valores dividido entre
el número de sumandos que intervienen. También es conocida como centro de gravedad de la
distribución. Se utiliza la letra X con una barra horizontal sobre el símbolo para representar a

5
Tema 71: Estadística

media de una muestra, mientras que la letra μ (mu) se usa para la media aritmética de una
población, es decir, el valor esperado de una variable.

En otras palabras, es la suma de n valores de la variable y luego dividido por n, donde n es el


número de sumandos, o en el caso de estadística el número de datos se da el resultado.

Por ejemplo, la media aritmética de 8, 5 y -1 es igual a:

Propiedades de la media aritmética:

- La suma de las desviaciones de todas las variables respecto de su media es igual a cero.
- Si se suma una constante a los datos de la muestra, la media queda aumentada en esa
constante.
- Si se multiplica por una constante los datos de la muestra, la media queda multiplicada por esa
constante.

Media aritmética ponderada

Cuando en un conjunto de datos cada uno de ellos tiene una importancia relativa (o peso)
respecto de los demás datos. Se obtiene multiplicando cada uno de los datos por su ponderación
(peso) para luego sumarlos, obteniendo así una suma ponderada; después se divide esta entre la
suma de los pesos, dando como resultado la media ponderada.

Se puede usar una media ponderada para calcular la nota final de un curso escolar, en donde se
asigna distinta importancia (peso) a los distintos exámenes que se realicen. Por ejemplo, los dos
primeros exámenes tienen un peso o valor de
30% y 20% respectivamente, y el último del
50%; las calificaciones respectivas son de 6.4,
9.2 y 8.1, entonces la nota final corresponde
a la siguiente media ponderada.

Media aritmética geométrica

La media geométrica de una cantidad arbitraria de números (por decir n números) es la raíz n-
ésima del producto de todos los números, es recomendada para datos de progresión geométrica,
para promediar razones, interés compuesto y números índices. Viene dada por la siguiente
fórmula:

6
Tema 71: Estadística

Por ejemplo, la media geométrica de 2 y 18 es:

Media aritmética armónica

La media armónica (designada usualmente mediante H) de una cantidad finita de números es igual
al recíproco, o inverso, de la media aritmética de los recíprocos de dichos valores y es
recomendada para promediar velocidades. Viene determinada por la siguiente fórmula:

Mediana

La mediana de una variable X, representada por Md, se define como el valor que divide la
distribución de frecuencias en dos partes iguales, conteniendo cada una el 50% de las
observaciones.

Supongamos que obtenemos la puntuación den sujetos en una variable de interés. Para el cálculo
de la mediana se procedería de la siguiente manera:

1. Se ordenan las puntuaciones de menor a mayor.


2. Se observa si el número de observaciones n es par o impar:
• Si n es impar, mediana es el que ocupa la posición central, enese conjunto de
observaciones ya ordenadas.
• Si n es par, la mediana será la media aritmética de los dos valores centrales.

Ejemplo: n impar: 115, 120, 122, 125, 133, Md=122 o n par:18, 16, 24, 20, 28, 30, los 2 valores
centrales son 20 y 24, a los cuales se realizaría la media aritmética y resultado Md=22.

Moda

La moda de una distribución, es representada por Mo y se define como el valor o categorías de la


variable que aparece con mayor frecuencia.

La distribución que tiene una sola moda, se llama unimodal, la que tiene dos modas, bimodal y la
que tienen más de dos modas multimodal. Ejemplos:

• 1,1,1,1,3,3,4,4,4,6,2,2 Mo=1 (unimodal).


• 1,1,1,1,3,3,4,4,4,4,6,2 Mo= 1,4 (bimoda/J.
• 1,2,3,4,5,6,7,8,9,0 Mo= (no existe).

MEDIDAS DE TENDENCIA NO CENTRAL

PERCENTILES: También denominados centiles, son los 99 valores de variables que dividen en 100
partes iguales la distribución de la frecuencia. Se denomina como Pi.

7
Tema 71: Estadística

CUARTILES: Son 3 valores de la distribución que dividen en 4 partes de igual frecuencia a la


distribución.

- El primer cuartil (Q1), deja por debajo de sí al 25% de los sujetos y por encima al 75% restante.
Se corresponde al percentil 25. 01=P25.
- El segundo cuartil (Q2), deja por debajo de sí al 50% de los sujetos y por encima al otro 50%,
suele coincidir con la mediana de la distribución, por tanto, Q2=P50=Md.
- El tercer cuartil (Q3), deja por debajo de sí al 75% de los sujetos y por encima al 25% restante.
Se corresponde al percentil 75. Q3=P75.

DECILES:

Son nueve valores que dividen en diez partes iguales a la distribución, cada una de ellas
corresponde a un 10%. Es representado por Di.

MEDIDAS DE DISPERSIÓN

Estas medidas nos informan de la mayor o menor representatividad de las medidas de tendencia
central, pues cuando más concentrados se encuentren los valores alrededor de un promedio mejor
resumirá éste le comportamiento de la variable y cuanto más dispersos se encuentren los valores

peor será la representatividad. Las medidas de dispersión variable se pueden agrupar en dispersión
absoluta y dispersión relativa.

MEDIDAS DE DISPERSIÓN ABSOLUTA:

Miden la variabilidad en la misma unidad de la variable en estudio, por lo que no es posible hacer
comparaciones en cuanto a mayor o menor heterogeneidad de dos distribuciones o a la
representatividad de sus promedios (¿3kg=3€?).

Amplitud total, Rango o Recorrido

Se trata de la diferencia que hay en la escala numérica entre los valores que representan la
puntuación máxima y la puntuación mínima.

Desviación media

Se define respecto a un valor alpha, como la media aritmética de las


desviaciones de un valor absoluto entre los valores de la variable y
alpha. Actualmente está en desuso por lo poco manejable
matemáticamente.

Varianza

Se define como el promedio de los cuadrados de las desviaciones de las puntuaciones con
respecto a la media aritmética. Es importante darse cuenta de que, para el cálculo de la varianza,
primero se elevan al cuadrado las diferencias y después se obtiene el
promedio de esas desviaciones. Viene reflejada por la siguiente
fórmula matemática:

Desviación típica

8
Tema 71: Estadística

La desviación típica de un conjunto de n puntuaciones, que se


representan por s, es la raíz cuadrada de la varianza, y su fórmula
viene dada de la siguiente forma:

Amplitud o rango semi-intercuantil

Se trata de la distancia media entre el tercer y el primer cuartil. Debido a la asimetría de la


distribución, hay que buscar una opción y es cuando aparece esta amplitud. La variabilidad va
comprendida entre el percentil 25 y el percentil 75.

DQ = RQ/2= (Q3 - Q1)/2

MEDIDAS DE DISPERSIÓN RELATIVA

Son valores sin dimensión por ser cocientes de magnitudes medidas en las mismas unidades. Con
estas medidas podremos comparar la variabilidad de distintas muestras y la representatividad de
sus promedios.

Coeficiente de apertura

Se define como el cociente entre el mayor y el menor valor de la de la variable. Si los datos se han
agrupado en intervalos, no se refiere a las marcas de clase sino a los valores extremos del primer y
último intervalo. Se suele aplicar en el estudio de la dispersión de salarios y otras variables de este
tipo.

Recorrido relativo

Se trata del cociente entre el recorrido y la media aritmética.

Coeficiente de variación o coeficiente de variación de Pearson

Se trata del cociente entre la desviación típica y la media aritmética. Se trata como
el número de veces que la media está contenida en la desviación típica. Se suele
multiplicar por 100, para que el resultado aparezca en tanto por ciento.

REPRESENTACIONES GRÁFICAS.

La representación gráfica de datos estadísticos tiene como objetivo ofrecer una visión de conjunto
del hecho sometido a investigación, de una manera más directa y perceptible que la mera
presentación de los datos numéricos. Pero no dejan de ser un método auxiliar, ya que la
interpretación de un diagrama siempre es subjetiva.

El sistema de representación más usual es el cartesiano. En el eje horizontal de abscisas, por


convenio, se representan los valores positivos de la escala a la derecha y a la izquierda los
negativos. En el eje vertical de ordenadas, los valores positivos se representan hacia arriba y los
negativos hacia abajo.

GRÁFICOS DE VARIABLE CUALITATIVA

Si el resultado de observación de un elemento de la muestra no es una medida, sino una cualidad o


atributo no medible, la variable de estudio es una variable cualitativa.

9
Tema 71: Estadística

DIAGRAMA DE RECTÁNGULOS: Es una


representación cartesiana, en la que en el eje de
abscisas figuran las distintas modalidades o
atributos y en el eje de ordenadas los valores de
las correspondientes frecuencias, levantando
rectángulos de áreas proporcionales a las
frecuencias absolutas. Los rectángulos tendrán de
base la unidad y de altura la frecuencia absoluta
de cada valor. Los rectángulos no tienen por qué
ir solapados.

Ejemplo: Supongamos que en una determinada


zona de muestreo se anotan el número de especies distintas encontradas de anfibios, reptiles, aves
y mamíferos.

DIAGRAMA DE SECTORES: Es la representación en un círculo, mediante sectores circulares de las


distintas modalidades de un carácter. Para construirlo, las áreas de los sectores han de ser
proporcionales a las frecuencias de cada modalidad. Para ello hay que hacer corresponder 360º a la
suma de todas las frecuencias. efectuando luego la
correspondiente proporcionalidad.

Ejemplo: Con los datos del ejercicio anterior. construir el


correspondiente diagrama de sectores.

El procedimiento consiste en hacer corresponder los 360º del


círculo a la suma total de las frecuencias. En este caso, se haría
corresponder los 360º con 41 que es la suma total. Una simple
regla de 3 nos indicaría cuantos grados corresponderían al
número de anfibios y así con cada una de las otras modalidades:

PICTOGRAMAS: Son una representación gráfica que utiliza un dibujo alusivo a la distribución
estudiada. La altura del dibujo ha de ser proporcional a la frecuencia.

Otra forma de representación es tomar un dibujo estándar, repitiéndolo un número de veces


proporcional a la frecuencia.

Los pictogramas deben comparar magnitudes


relativas, ya que un aumento no proporcional en el
tamaño del objeto puede dar una impresión no
correcta. Por ejemplo, queremos representar que
el ganadero A tiene una vaca y el ganadero B tiene
dos. Si ponemos en el ganadero A una vaca y en el
ganadero B dos estaría bien representado, pero si
ponemos en el ganadero A una vaca y en el
ganadero B una vaca con el doble de altura, no
estaríamos representando 2 vacas sino 4. Por
tanto, hay que ser cautos en este sentido.

10
Tema 71: Estadística

PERFIL ORTOGONAL: Es una representación utilizada frecuentemente en Pedagogía y Psicología. Se


representan en abscisas las distintas modalidades y en ordenadas los valores de esas modalidades.

Ejemplo: Las calificaciones de un alumno


de Ciencias Ambientales han sido las
siguientes: 5 en Geología, 4 en Química, 3
en Física, 8 en Estadística, 7 en Botánica y
6 en Zoología. Representar su perfil
ortogonal.

CARTOGRAMAS: Se usan. entre otros, en


estudios geográficos y ecológicos. Es una representación del carácter estudiado
sobre mapas. Las distintas modalidades que adopta el carácter se representan
sobre el mapa con distintos colores o colores de distinta intensidad, o con
distintos punteados.

PERFIL RADIAL: Consiste en tomar un punto cualquiera como punto de partida y a partir de él
trazar tantos radios como modalidades se tengan, todos
ellos formando ángulos de la misma amplitud. Sobre
estos resultados se toma una distancia al centro
proporcional a la frecuencia de cada modalidad. Uniendo
los puntos extremos obtenidos. se obtiene un polígono
cerrado que es el perfil radial.

Ejemplo: Dibujar el perfil radial correspondiente al


anterior ejercicio (calificaciones de un alumno de Ciencias
Ambientales).

DIAGRAMAS DE PUNTOS: Los diagramas de puntos son útiles para mostrar datos cuantitativos de
una forma organizada. Estos diagramas usan varios puntos para trazar datos a lo largo de un eje.
Por lo que:

• En el eje de abscisas (X) se colocan los valores de la


variable.
• Sobre cada valor, se dibujan x puntos que se
corresponden con la frecuencia del valor de la
variable.

Ejemplo: el valor cinco se repetiría


3 veces, el seis se repetiría 6 veces,
el siete 2 veces, etc.

GRÁFICOS DE VARIABLE
CUANTITATIVA DISCRETA

DIAGRAMA DE BARRAS: Se dibujan


un par de ejes cartesianos. En el

11
Tema 71: Estadística

eje de abscisas se toman los distintos valores de la variable y en el de ordenadas las frecuencias.
Cada valor de la variable y su correspondiente frecuencia, constituye una pareja de números, a los
que corresponde en el plano un punto, habiendo tantos puntos como valores tome la variable. Para
dar mayor visibilidad al gráfico se acostumbra a representar la ordenada de cada punto mediante
una línea gruesa o barra, de ahí su nombre.

Como las frecuencias son siempre positivas, el gráfico sólo requiere los cuadrantes I y II del plano.
Habitualmente el gráfico de barras aparece en el primer cuadrante.

Según se utilicen frecuencias absolutas o frecuencias relativas, se obtendrá el diagrama de barras


absoluto o relativo.

POLÍGONO DE FRECUENCIAS: Uniendo los extremos superiores de las barras en el diagrama de


barras, se obtiene una línea quebrada abierta que recibe el nombre de polígono de frecuencias.

Si el polígono se ha construido sobre un diagrama en el que se han utilizado frecuencias absolutas,


lo llamaremos polígono de frecuencias absolutas. Si se trabajó con frecuencias relativas
obtendremos el polígono de frecuencias relativas.

DIAGRAMA DE BARRAS ACUMULATIVO: La representación de las frecuencias acumuladas


correspondiente a una variable discreta, se efectúa de la siguiente manera:

Sobre el eje de abscisas se llevan los valores de la variable y sobre el eje de las ordenadas, los
valores de las frecuencias acumuladas (absolutas o relativas). Se levantan barras de altura igual a la
frecuencia y por el extremo superior de cada barra se trazan paralelas al eje de abscisas, hasta
cortar a la barra siguiente. Se obtiene así una representación escalonada, cuya justificación se debe
a que entre cada dos valores consecutivos de la variable, las frecuencias acumuladas permanecen
invariables. A este gráfico se le conoce como diagrama de barras acumulativo.

GRÁFICOS PARA VARIABLES AGRUPADAS EN INTERVALOS DE CLASE

Cuando la variable aleatoria toma muchos valores distintos y hay muchas observaciones, es
conveniente agrupar los valores de la variable en intervalos de clase.

HISTOGRAMA: Consideramos el caso en que la variable viene dada en intervalos de clase. Ahora
una frecuencia cualquiera no corresponde a un solo valor de la variable, sino a todo un intervalo,
por tanto, no existen parejas de puntos a las que corresponderían puntos en el plano, en el gráfico.
Entonces se recurre a otro criterio de representación, el de representación por áreas.

12
Tema 71: Estadística

Los histogramas son representaciones


gráficas por áreas. Sobre el eje de abscisas se
marcan los extremos de los intervalos de
clase de la variable y se levantan rectángulos
cuya base tiene como medida la amplitud de
los intervalos de clase y su altura es tal que el
área del rectángulo es igual a la frecuencia,
absoluta o relativa, según que el histograma
sea de frecuencias absolutas o relativas. Esta
representación gráfica es la más utilizada
cuando se trata de una variable continua.

Se han de distinguir con claridad dos casos:

1. Cuando los intervalos de clase son de amplitud constante: como la base de los rectángulos
que se van a construir es siempre de igual magnitud, puede tomarse dicha base como
unidad de medida de la variable.
2. Cuando los intervalos de clase son de amplitud variable: las frecuencias no pueden
tomarse como alturas. La representación gráfica correcta exige el cálculo de las alturas,
cosa muy fácil ya que la tabla estadística nos da las bases (amplitudes de los intervalos) y
las áreas (frecuencias). La altura será la frecuencia partida por la amplitud del intervalo.

POLÍGONO DE FRECUENCIAS: A partir del histograma, obtenemos otra representación muy usual:
el polígono de frecuencias que se obtiene uniendo los puntos medios de los lados superiores de los
rectángulos levantados en el histograma de frecuencias, dando como resultado una línea
quebrada.

POLÍGONO ACUMULATIVO DE FRECUENCIAS: Al agrupar los valores de la variable en intervalos de


clase, se supone que los valores se distribuyen uniformemente en dicho intervalo. Este supuesto de
repartición uniforme hace que, en la acumulación, a medida que se recorren los intervalos de la
variable X dentro de un intervalo, la frecuencia acumulada va creciendo de un modo lineal o
rectilíneo. Se obtiene así una lineal poligonal que empieza en 0 y acaba en n.

Para facilitar la representación podemos fijarnos en que si los intervalos tienen la misma amplitud,
uniendo los extremos derechos de los rectángulos que componen el histograma de frecuencias
acumuladas, se obtiene el polígono acumulativo.

13
Tema 71: Estadística

En caso de que los intervalos no tengan la misma amplitud, seleccionamos los puntos en el plano
haciendo corresponder al extremo superior de cada intervalo la frecuencia acumulada
correspondiente a ese intervalo. Obtenemos así una línea poligonal que partirá de cero a la que
llamaremos polígono acumulativo de frecuencias.

FENÓMENOS ALEATORIOS.

Un fenómeno aleatorio es un fenómeno cuyo resultado no es posible prever con certeza absoluta.
Los ejemplos más típicos son el lanzamiento de un dado o de una moneda al aire. En experimentos
aleatorios es conveniente identificar y distinguir claramente los resultados posibles.

Lo que caracteriza un fenómeno aleatorio es que cada resultado particular es impredecible. Es


decir, no es posible determinar de antemano cuál de todos los resultados posibles es el que se dará
en cada caso particular.

El estudio de procesos aleatorios se limita a aquellas situaciones en que cada caso se puede repetir
tantas veces como se quiera en condiciones iguales o equivalentes. Si se repite varias veces un
mismo proceso aleatorio, cada resultado posible se dará un cierto número de veces entre 0 y el
número total de veces que se efectuó en proceso.

En estadística llamamos frecuencia absoluta al número de veces que aparece un determinado


valor.

Por su parte, el cociente entre la frecuencia absoluta y el número total de casos recibe el nombre
de frecuencia relativa. La frecuencia relativa puede expresarse como fracción, como número
decimal o como porcentaje.

Las características más significativas son:

• Si los resultados se pueden contar se le llama experimento aleatorio numerable; y si no se


pueden contar, se le llama experimento aleatorio no numerable.
• Si es posible conocer previamente todos los posibles resultados (el espacio muestral) o por lo
menos nombrar al último resultado se le llama experimento aleatorio finito y si no se puede
nombrar al último resultado, se le llama experimento aleatorio infinito.
• Es imposible predecir el resultado exacto del mismo antes de realizarlo.
• A cada realización de un experimento se le llama experiencia o prueba.

PROBABILIDAD

La probabilidad se refiere a la posibilidad de ocurrencia de un fenómeno.

Unas probabilidades se deducen de otras probabilidades de acuerdo a teoremas matemáticos, sin


justificación para sus valores numéricos en ninguna aplicación.

Para Kolmogorov (1976), la teoría de la probabilidad puede y debe ser desarrollada desde los
axiomas, exactamente igual que la geometría y el álgebra.

Según Barnett (1973), este enfoque estructural no clarifica la naturaleza de la probabilidad aunque
los teoremas deducidos son un indicador de posibles interpretaciones. Sin embargo, puede servir
como una estructura teórica para las dos principales concepciones de la probabilidad, la objetivista
y la subjetivista. La posición objetivista abarca los enfoques clásico y frecuencialista.

14
Tema 71: Estadística

DEFINICIÓN DE PROBABILIDAD

LAPLACE: "La probabilidad de un suceso es igual al cociente entre el número de casos favorables de
que ocurra ese suceso y el número de casos posibles en el supuesto de que todos los casos tengan
la misma oportunidad de ocurrir (es decir. que sean igualmente probables). La probabilidad de un
suceso es igual al cociente del número de casos favorables sobre el total de los casos posibles".

Esta definición de probabilidad, y su aplicación, requiere que los sucesos sean equiprobables (cosa
que no siempre ocurre) y, en muchos casos, puede resultar difícil la clasificación de los sucesos
como favorables y posibles. Si repetimos un experimento aleatorio (por ejemplo. lanzar un dado al
aire) muchas veces, y anotamos las frecuencias relativas de un suceso, podemos observar que
tienden a estabilizarse en un valor comprendido entre 0 y 1. A este valor se le denomina
probabilidad del suceso. Por tanto, podemos definir la probabilidad de un suceso A como: "el límite
al que tiende la frecuencia relativa de aparición de un suceso A cuando el número de ensayos, n,
tiende a infinito".

Siendo N el número de veces que se ha repetido una acción y observación y nA el número de veces
que observa A en todas las observaciones.

A esta definición se le llama definición estadística, aunque presenta un grave problema: muchas
veces no es posible repetir un experimento aleatorio un gran número de veces o no es práctico.

DEFINICIÓN AXIOMÁTICA: Los graves problemas con las definiciones de probabilidad llevaron a los
matemáticos a establecer una nueva definición llamada axiomática. Dado un espacio muestral E,
llamamos probabilidad de un suceso A definido en el espacio muestral E y que designamos por
P(A), a un número real que asignamos al suceso A cumpliendo las siguientes propiedades:

• 0  p(S)  1
• P (U) = 1
• P (A) = 1 - P(Á)

Las dos primeras propiedades indican que la probabilidad es cuantificable numéricamente con un
número comprendido entre cero y uno. Asignamos un cero a un suceso que no puede ocurrir
nunca y un uno al suceso que se produce con seguridad.

La tercera propiedad indica que la probabilidad de un suceso A puede obtenerse también restando
de uno la probabilidad de su complementario, A. puesto que ambos son exhaustivos y mutuamente
excluyentes.

A estas propiedades. podemos añadir el Teorema de la Suma, que establece que la probabilidad de
que ocurra el suceso A o el suceso B, es igual a la probabilidad de que ocurra A más la probabilidad
de que ocurra B, menos la probabilidad de que ocurran ambos. A y B. Es decir:

P (AuB) = P (A) + P (8) - P (An)

Cuando los sucesos A y B son incompatibles, es decir, no pueden ocurrir simultáneamente o la


ocurrencia de uno implica la no ocurrencia del otro, la regla de la suma se simplifica a:

15
Tema 71: Estadística

P (AuB) = P (A) + P (8)

PROBABILIDAD CONDICIONADA: Hay situaciones donde la aparición de un suceso A depende de la


aparición de otro suceso B. En estos casos, diremos que el suceso A y B son dependientes, porque
la probabilidad de A depende o está condicionada al suceso B. La probabilidad de A condicionada a
B o dependiente de la aparición de B. se escribe P (A n B) donde B es la condición requerida.

LA REGLA DEL PRODUCTO Y EL TEOREMA DE BAYES

Podemos extender lo dicho hasta ahora en los casos en que realizamos varios experimentos
simultáneamente, (por ejemplo, lanzar una moneda y un dado al aire) o también en caso en que
realicemos un proceso varias veces (por ejemplo, extraer de una a una varias bolas de una urna).

A esta fórmula se la conoce como "regla o Teorema del Producto":

P (AnB)= P(A) · P (B n A)

La probabilidad de ocurrencia de A y B es igual a la probabilidad de ocurrencia de A por la


probabilidad de ocurrencia de B, dado que A ha ocurrido previamente. Es decir:

Donde P (B I A) se lee como "la probabilidad de que ocurra B dado que ha ocurrido A

En la aplicación de la regla del producto, debemos tener en cuenta que cuando los sucesos A y B
son independientes (la aparición de uno de ellos no depende de la aparición o no del otro), la regla
del producto queda reducida a:

P (AnB)= P(A) · P (B)

EL TEOREMA DE BAYES: Expresa la probabilidad condicional de un


evento aleatorio. El Teorema de Bayes vincula la probabilidad de A
dado B con la probabilidad de B dado A.

ESPERANZA Y VARIANZA.

ESPERANZA

La esperanza matemática es igual a la media. Se conoce también como valor esperado, media
poblacional o media (X).

Se trata de la suma de la probabilidad de cada posible suceso aleatorio multiplicado por el valor
de dicho suceso.

La esperanza es un operador lineal y representa la cantidad de "media" que se espera como


resultado de un experimento aleatorio cuando la probabilidad de cada suceso se mantiene
constante y el experimento se repite un elevado número de veces. El valor que toma la esperanza
matemática en algunos casos puede no ser "esperado" en el sentido más general de la palabra (el
valor de la esperanza puede ser improbable o incluso imposible).

PROPIEDADES DE LA ESPERANZA:

16
Tema 71: Estadística

• Si X es siempre positiva, entonces siempre lo es E(X).


• La esperanza matemática de una constante es igual a esa misma constante, es decir, si c es una
constante, entonces: E [c] = c
• Si X está delimitada por dos números reales, a y b, tal que: a< X< b, entonces también lo está su
media: a < E(X) > b

VARIANZA

La medida de variabilidad también se puede basar en la distancia observada entre las


puntuaciones y un valor central de la distribución.

De este modo, una distribución con poca variabilidad es aquella en la que la mayoría de las
puntuaciones están muy próximas a la media, mientras que en una distribución con mucha variabi
lidad, las puntuaciones están alejadas o muy alejadas del valor medio de la variable.

La varianza es una medida de dispersión definida como la esperanza del cuadrado de la


desviación de dicha variable respecto a su media. Su unidad de medida corresponde al cuadrado
de la unidad, teniendo como valor mínimo 0.

El conjunto de n puntuaciones en una variable X, denotada por Sx2 se define como el promedio de
los cuadrados de las desviaciones de las puntuaciones con respecto a la media. Matemáticamente
se expresa de la siguiente manera (Sx2 es igual que on2):

Siendo Xi (cada dato), x (media de los datos) y n (número de datos).

La fórmula simplificada de la varianza es la siguiente:

Es importante darse cuenta de que, para el cálculo de la varianza, primero se elevan al cuadrado las
diferencias y después se obtiene el promedio de esas desviaciones al cuadrado.

Tanto la varianza como la desviación típica son índices de dispersión muy útiles en el desarrollo
posterior de la estadística inferencial.

Propiedades:

- El cálculo de la varianza y la desviación típica, a diferencia de otros índices de dispersión,


requieren el uso de todas las puntuaciones observadas en la distribución.
- La varianza y la desviación típica miden la variabilidad de los datos con respecto a la media
aritmética, por lo que solo deben aplicarse si se usa la media como medida de tendencia
central.
- La varianza y la desviación típicas siempre son no negativas (iguales o mayores que cero). Son
iguales que cero únicamente si todas las puntuaciones son iguales entre sí.

17
Tema 71: Estadística

COEFICIENTE DE CORRELACIÓN DE PEARSON

La covariación es el grado de concordancia de las posiciones relativas de los datos de dos


variables. En consecuencia, el coeficiente de correlación de Pearson opera
con puntuaciones tipificadas (que miden posiciones relativas).

Cuanto más intensa sea la concordancia (en sentido directo o inverso) de las posiciones relativas de
los datos en las dos variables, el producto del numerador toma mayor valor (en sent ido absoluto).
Si la concordancia es exacta, el numerador es igual a N (o a -N), y el índice toma un valor igual a 1 (o
- 1).

Características del Coeficiente de Correlación de Pearson:

• El coeficiente de correlación de Pearson puede tomar valores entre -1 y 1.


• La correlación de una variable con ella misma siempre es igual a 1.
• El valor O indica ausencia de covariación lineal, pero NO si la covariación es de tipo no lineal.

ESTUDIOS ESTADÍSTICOS SOBRE LA PREVENCIÓN DE LA DELINCUENCIA.

LEGISLACIÓN A TENER EN CUENTA

• Artículo 149.1.31 CE, tendrán la consideración de estadísticas para fines estatales todas las
estadísticas incluidas en el Plan Estadístico Nacional.
• Ley 12/1989, de 9 de mayo, de la Función Estadística Pública.
• Plan Estadístico Nacional, creado al amparo de la anterior ley cada 4 años (Actual 2021-24).
• Estadística Nacional de Criminalidad (Instrucción SES 1/2013).
• SISTEMA ESTADÍSTICO DE CRIMINALIDAD (SEC). Orden INT/1202/2011, de 4 de mayo, por la
que se regulan los ficheros de datos de carácter personal del MIR.

PLAN ESTADÍSTICO NACIONAL

OBJETIVO:

El Plan Estadístico Nacional es el principal instrumento ordenador de la actividad estadística de la


Administración del Estado y tiene una vigencia de cuatro años.

. Todas las estadísticas incluidas en el Plan tienen la consideración de estadísticas para fines
estatales y son de cumplimentación obligatoria. El Plan se aprueba por RD y, una vez aprobado, su
actualización se realiza a través de los programas anuales que lo desarrollan.

La principal misión de la Estadística Nacional de Criminalidad, es la prevención de la delincuencia


y la adecuación de recursos a la actividad delictiva.

PLANIFICACIÓN DE LA ESTADÍSTICA NACIONAL:

El Programa anual contiene las actuaciones que han de desarrollarse en el año en ejecución del
Plan Estadístico Nacional y las previsiones que, a tal efecto, hayan de incorporarse a los
Presupuestos Generales del Estado.

Actualmente, está regulado por el Real Decreto 150/2021, de 9 de marzo, por el que se aprueba el
Programa anual 2021 del Plan Estadístico Nacional, vigente hasta el 2024.

18
Tema 71: Estadística

Los tipos de estadística a tener en cuenta en la prevención de la delincuencia

1. Estadística de Seguridad: Actuaciones Policiales : información estadística sobre seguridad


ciudadana recabada por los distintos órganos competentes (Guardia Civil, CNP, CCAA con
policía propia y cuerpos de la Policía Local). Organismo que interviene: MIR.
2. Estadística de Seguridad: Responsables : información estadística sobre seguridad
ciudadana recabada por los distintos órganos competentes (Guardia Civil, CNP, CCAA con
policía propia y cuerpos de la Policía Local). Organismo que interviene: MIR.
3. Estadística de la Población Reclusa : Conocimiento cuantitativo de la población reclusa y
número de ingresos en el año. Organismos que intervienen: MIR y la D.G. de Servicios
Penitenciarios.
4. Estadística de Condenados Adultos : Estudio sociodemográfico y criminológico de los
condenados por sentencia firme. Organismos: INE y Ministerio de Justicia.
5. Estadística de Condenados Menores: Estudio sociodemográfico y criminológico de los
menores condenados por sentencia firme. Organismos: INE y Ministerio de Justicia.
6. Estadística de Violencia Doméstica y VG: Estudio de la violencia doméstica en general y,
en particular, de la violencia de género. Organismos: INE y Ministerio de Justicia.

ESTADÍSTICA EN EL MIR:

Dependiente de la SES, y con rango de Subdirección General, tenemos el Centro de Inteligencia


contra el Terrorismo y Crimen Organizado, conocido como CITCO, al que corresponde la
elaboración de la inteligencia estratégica en la lucha contra todo tipo de delincuencia organizada,
así como, en su caso, el establecimiento de criterios de coordinación operativa de los servicios
actuantes en los supuestos de coincidencia o concurrencia en las investigaciones.

Por otro lado, en materia de acción formativa y estudios en el ámbito de la seguridad, está la
Dirección General de Coordinación y Estudios que tiene como función apoyar, mediante la
elaboración de estudios e investigaciones sobre la situación y tendencias de la seguridad, a los
órganos superiores y directivos del Ministerio del Interior en la elaboración de las políticas de
seguridad, así como el desarrollo e impulso de acciones formativas específicas y de la
especialización de los altos responsables de los Cuerpos Policiales.

UNIDAD DE
PLANIFICACIÓN ÁREA DE SEGUIM IENTO Y
HIPEST
ESTRATÉGICA Y COORDINACIÓN
COORDINACIÓN

De esta Dirección depende el fichero conocido como "Sistema Estadístico de Criminalidad" (SEC),
cuya finalidad es "tener un conocimiento más profundo de los factores que inciden en la seguridad
ciudadana, derivado del caudal de información que genera la actividad delictiva e infractora, así
como estructurar, de acuerdo con criterios rigurosos y técnicos, la obtención, explotación y
difusión de datos estadísticos relacionados con las infracciones penales y contra las leyes de
seguridad ciudadana".

En relación con el SEC, la DGCE coordina los servicios de estadística de la DGP impartiendo
criterios, recabando información y evacuando las consultas que aquellas formulen.

FICHEROS SEC:

19
Tema 71: Estadística

La herramienta que sirve para el estudio estadístico de criminalidad, son los ficheros SEC.
Regulados por Orden INT/1202/2011, de 4 de mayo, por la que se regulan los ficheros de datos de
carácter personal del MIR.

Finalidad: Tener un conocimiento más profundo de los factores que inciden en la seguridad
ciudadana, derivado del caudal de información que genera la actividad delictiva e infractora, así
como estructurar, de acuerdo con criterios rigurosos y técnicos, la obtención, explotación y
difusión de datos estadísticos relacionados con las infracciones penales y contra las leyes de
seguridad ciudadana.

20

También podría gustarte