Impresora PDF
Impresora PDF
Impresora PDF
de estadística aplicada
a las ciencias sociales
Pablo Juan Verdoy
Modesto Joaquín Beltrán
María José Peris
Departament de Matemàtiques
P. Juan Verdoy / M. J. Beltrán / M. J. Peris - ISBN: 978-84-15444-38-1 Problemas resueltos de estadística aplicada a las ciencias sociales - UJI - DOI: http://dx.doi.org/10.6035/Sapientia100
Edita: Publicacions de la Universitat Jaume I. Servei de Comunicació i Publicacions
Campus del Riu Sec. Edifici Rectorat i Serveis Centrals. 12071 Castelló de la Plana
http://www.tenda.uji.es e-mail: publicacions@uji.es
ISBN: 978-84-15444-38-1
P. Juan Verdoy / M. J. Beltrán / M. J. Peris - ISBN: 978-84-15444-38-1 Problemas resueltos de estadística aplicada a las ciencias sociales - UJI - DOI: http://dx.doi.org/10.6035/Sapientia100
ÍNDICE
Prólogo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
Introducción . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9
Bibliografía . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 303
P. Juan Verdoy / M. J. Beltrán / M. J. Peris - ISBN: 978-84-15444-38-1 3 Problemas resueltos de estadística aplicada a las ciencias sociales - UJI - DOI: http://dx.doi.org/10.6035/Sapientia100
Prólogo
La estadística es una ciencia con base matemática referente a la recogida, análisis
e interpretación de datos que busca explicar condiciones regulares en fenómenos
de tipo aleatorio. Es transversal a una amplia variedad de disciplinas, desde la
física hasta las ciencias sociales, desde las ciencias de la salud hasta el control de
calidad, y es usada para la toma de decisiones en áreas de negocios e instituciones
gubernamentales.
En su origen, por lo tanto, la estadística estuvo asociada a datos para ser utilizados
por el gobierno y cuerpos administrativos (a menudo centralizados). La colección
de datos sobre estados y localidades continúa ampliamente a través de los servi-
cios de estadística nacionales e internacionales. En particular, los censos suminis-
tran información regular sobre la población.
P. Juan Verdoy / M. J. Beltrán / M. J. Peris - ISBN: 978-84-15444-38-1 5 Problemas resueltos de estadística aplicada a las ciencias sociales - UJI - DOI: http://dx.doi.org/10.6035/Sapientia100
como una rama de las matemáticas. En la era moderna, el trabajo de Kolmogorov
ha sido un pilar en la formulación del modelo fundamental de la Teoría de Proba-
bilidades, el cual es usado a través de la estadística. La teoría de errores se puede
remontar a la Opera Miscellanea (póstuma, 1722) de Roger Cotes y al trabajo
preparado por Thomas Simpson en 1755 (impreso en 1756) que aplica por primera
vez la teoría de la discusión de errores de observación. La reimpresión (1757) de
esta obra incluye el axioma de que errores positivos y negativos son igualmente
probables y que hay unos ciertos límites asignables dentro de los cuales se encuen-
tran todos los errores, se describen errores continuos y una curva de probabilidad.
Pierre-Simon Laplace (1774) hace el primer intento de deducir una regla para la
combinación de observaciones desde los principios de la teoría de probabilidades.
Laplace representó la ley de probabilidades de errores mediante una curva y de-
dujo una fórmula para la media de tres observaciones. También, en 1871, obtiene
la fórmula para la ley de facilidad del error (término introducido por Lagrange,
1744) pero con ecuaciones inmanejables. Daniel Bernoulli (1778) introduce el
principio del máximo producto de las probabilidades de un sistema de errores
concurrentes. El método de mínimos cuadrados, el cual fue usado para minimizar
los errores en mediciones, fue publicado independientemente por Adrien-Marie
Legendre (1805), Robert Adrain (1808) y Carl Friedrich Gauss (1809). Gauss ha-
bía usado el método en su famosa predicción de la localización del planeta ena-
no Ceres en 1801. Pruebas adicionales fueron escritas por Laplace (1810, 1812),
Gauss (1823), James Ivory (1825, 1826), Hagen (1837) , Friedrich Bessel (1838),
WF Donkin (1844, 1856), John Herschel (1850) y Morgan Crofton (1870). Otros,
Col van Ellis (1844), Augustus De Morgan (1864), Glaisher (1872) y Giovanni
Schiaparelli (1875).
El siglo xix incluye autores como Laplace, Silvestre Lacroix (1816), Littrow
(1833), Richard Dedekind (1860), Helmert (1872), Hermann Laurent (1873), Lia-
gre, Didion y Karl Pearson. Augustus De Morgan y George Boole mejoran la pre-
sentación de la teoría. Adolphe Quetelet (1796-1874) fue otro importante fundador
de la estadística y quien introdujo la noción del «hombre promedio» (l’homme
moyen) como un medio de entender los fenómenos sociales complejos como tasas
de criminalidad, tasas de matrimonio o tasas de suicidios. Durante el siglo xx, la
creación de instrumentos necesarios para asuntos de salud pública (epidemiología,
estadística, etc.) y propósitos económicos y sociales (tasa de desempleo, econome-
tría, etc.) necesitó de avances sustanciales en las prácticas estadísticas.
Hoy el uso de la estadística se ha extendido más allá de sus orígenes como un servicio
al Estado o al gobierno. Personas y organizaciones usan la estadística para entender
datos y tomar decisiones en ciencias naturales y sociales, medicina, negocios y otras
áreas. La estadística es entendida generalmente no como un subárea de las mate-
máticas sino como una ciencia diferente «aliada». Muchas universidades tienen
departamentos académicos de matemáticas y estadística separadamente. La es-
tadística se enseña en departamentos tan diversos como psicología, educación y
salud pública.
P. Juan Verdoy / M. J. Beltrán / M. J. Peris - ISBN: 978-84-15444-38-1 6 Problemas resueltos de estadística aplicada a las ciencias sociales - UJI - DOI: http://dx.doi.org/10.6035/Sapientia100
Al aplicar la estadística a un problema científico, industrial o social se comienza
con un proceso o población a ser estudiado. Esta puede ser la población de un
país, la de grandes cristalizados en una roca o la de bienes manufacturados por
una fábrica en particular durante un período dado. También podría ser un proceso
observado en varios instantes y los datos recogidos de esta manera constituyen una
serie de tiempo.
Este libro de problemas con ayudas es la primera parte de un conjunto de dos que
comprenderá todas las fases del proceso estadístico. En este volumen se estudian
mediante problemas los principales rasgos de la estadística descriptiva de una va-
riable, de dos variables, los números índices y series temporales.
La novedad que presenta este manual es que todos los ejercicios tienen dos tipos
de ayudas que aportan «pistas» de cómo resolver los ejercicios y los problemas.
Así pues, el alumno puede consultarlas siempre que no sepa por dónde continuar
mientras está resolviendo un ejercicio. De esta manera el estudiante evitará la des-
agradable sensación que una persona tiene cuando abandona la resolución de un
ejercicio. Además, también se incluyen las soluciones completas de los ejercicios,
muchos de ellos comentados con profundidad.
P. Juan Verdoy / M. J. Beltrán / M. J. Peris - ISBN: 978-84-15444-38-1 7 Problemas resueltos de estadística aplicada a las ciencias sociales - UJI - DOI: http://dx.doi.org/10.6035/Sapientia100
es más, concluir que la estadística es lo que hacen los estadísticos. Aunque estas
dos ideas no son desacertadas, tampoco permiten tener una visión completa de
lo que es la estadística. La segunda es que nuestras decisiones se basan, cada vez
más, en un flujo creciente de información que necesitamos sintetizar para evitar
aquello de los árboles que impiden ver el bosque. Nuestras decisiones son de tipo
condicionado, ya que las mismas se toman en función de algún tipo de informa-
ción, tanto pasada como presente.
En definitiva, nuestra humilde pretensión es que este texto sirva de ayuda com-
plementaria a todos aquellos estudiantes que se enfrentan (muchas veces con poco
éxito) a la resolución de problemas de estadística descriptiva.
Los autores
P. Juan Verdoy / M. J. Beltrán / M. J. Peris - ISBN: 978-84-15444-38-1 8 Problemas resueltos de estadística aplicada a las ciencias sociales - UJI - DOI: http://dx.doi.org/10.6035/Sapientia100
Introducción
El presente libro de problemas se puede considerar como el primero de los dos
complementos del manual Introducción a la estadística aplicada a las ciencias
sociales de la Col·lecció Sapientia de Publicacions de la Universitat Jaume I, el
cual consta fundamentalmente de contenidos teóricos, quedando el apartado de
problemas en un segundo plano. Con este nuevo texto, basado casi exclusivamente
en problemas resueltos, se completa parte del manual teórico y se facilita al estu-
diante una herramienta excelente para consolidar el aprendizaje de sus contenidos.
Además, los problemas están clasificados por objetivos, ya que de esta manera el
estudiante sabe en cada momento qué contenidos se están trabajando y, por tanto,
puede consultar el manual teórico para revisar aquellas cuestiones en las que pre-
sente dificultades.
Por otra parte, este manual está dividido en cuatro unidades que hacen referencia
a la estadítica descriptiva univariante, la estadística descriptiva bivariante, los nú-
meros índices y, finalmente, las series temporales. Cada unidad está dividida en
cuatro bloques: en el primero se proponen los enunciados de los problemas clasi-
ficados por objetivos. La segunda parte proporciona únicamente las ayudas de tipo
1 En el tercer bloque las ayudas son del tipo 2. El hecho de que para un mismo
problema no se encuentren los dos tipos de ayudas conjuntamente tiene la preten-
sión de que el estudiante realice la consulta detallada de las ayudas, reforzando la
idea de pensar antes de consultar. En la última parte se muestran las resoluciones
completas de los problemas, las cuales están repletas de comentarios, gráficos y
diagramas que facilitan su comprensión.
P. Juan Verdoy / M. J. Beltrán / M. J. Peris - ISBN: 978-84-15444-38-1 9 Problemas resueltos de estadística aplicada a las ciencias sociales - UJI - DOI: http://dx.doi.org/10.6035/Sapientia100
UNIdAd 1
Estadística descriptiva
univariante
P. Juan Verdoy / M. J. Beltrán / M. J. Peris - ISBN: 978-84-15444-38-1 11 Problemas resueltos de estadística aplicada a las ciencias sociales - UJI - DOI: http://dx.doi.org/10.6035/Sapientia100
Introducción teórica
Como elementos introductorios de este capítulo, es conveniente recordar defini-
ciones de elementos importantes, ya desarrolladas en diferentes materiales como
los libros referenciados 1, 2 y 3, tales como:
Una variable discreta está limitada para ciertos valores, generalmente números ente-
ros. Se diferencian de las continuas en que, dadas dos observaciones suficientemente
P. Juan Verdoy / M. J. Beltrán / M. J. Peris - ISBN: 978-84-15444-38-1 13 Problemas resueltos de estadística aplicada a las ciencias sociales - UJI - DOI: http://dx.doi.org/10.6035/Sapientia100
próximas, no se puede encontrar ninguna observación de la variable entre ellas.
Son ejemplos el número de hijos de las familias, el número de vehículos que tienen
las empresas, el número de turistas que visitan un país, etc.
Tablas de frecuencia
Antes de construir las tablas de frecuencias, hay que realizar una serie de definiciones:
Se llama frecuencia absoluta del valor xi al número de veces que aparece repetida
la observación en la recopilación de datos. Se representa por ni .
Las frecuencias acumuladas también cumplen dos propiedades triviales como con-
secuencia de sus definiciones: suponiendo que se dispusiera de k datos diferentes,
se cumple que N k = n y Fk = 1.
P. Juan Verdoy / M. J. Beltrán / M. J. Peris - ISBN: 978-84-15444-38-1 14 Problemas resueltos de estadística aplicada a las ciencias sociales - UJI - DOI: http://dx.doi.org/10.6035/Sapientia100
Estas definiciones permiten resumir los datos. Sin embargo, la manera más
adecuada para sintetizar los datos es mediante lo que se denomina tabla de
frecuencias. En ella aparecen distribuidas los datos según las frecuencias.
Al mismo tiempo refleja todos los conceptos mencionados con anterioridad.
Un intervalo se suele representar por [Li-1, Li) y se define como el conjunto for-
mado por todos los valores reales que son mayores o iguales que Li-1 (Extremo
inferior) y menores que Li (Extremo superior).
Se llama marca de clase a la media aritmética de los dos extremos del intervalo. Es
evidentemente el valor central del intervalo ya que equidista de los extremos. Se
L +L
denota por ci . Se calcula ci = i−1 i .
2
Se llama amplitud de un intervalo a la distancia que hay entre los extremos. Se
denota por ai y se calcula ai = Li – Li-1.
P. Juan Verdoy / M. J. Beltrán / M. J. Peris - ISBN: 978-84-15444-38-1 15 Problemas resueltos de estadística aplicada a las ciencias sociales - UJI - DOI: http://dx.doi.org/10.6035/Sapientia100
En consecuencia, para averiguar la amplitud de la clase calculamos:
Amplitud =
Gráficos estadísticos
Los gráficos también son muy útiles para describir los conjuntos de datos (referen-
cias 15, 20 y 23). De hecho, un gráfico estadístico permite formarse una primera
idea de la distribución de los datos tan solo con una observación. No obstante, hay
que tener cuidado pues en algunas ocasiones los gráficos presentan «tendencias»
no atribuibles al quehacer matemático.
Para calcular el ángulo asociado a cada frecuencia se aplica una simple propor-
n
ción: el ángulo asociado a una frecuencia absoluta ni es igual a f i · 360º ( f i = i ).
Para la frecuencia absoluta acumulada se razona de la misma manera. n
Diagrama de barras: Se utiliza para representar los datos que no están agrupados.
Consiste en colocar sobre un eje horizontal los distintos valores que toma la va-
riable estadística, y sobre cada uno de ellos levantar un rectángulo de altura igual
a la frecuencia (del tipo que se esté representando). Todos los rectángulos deben
tener la misma amplitud.
P. Juan Verdoy / M. J. Beltrán / M. J. Peris - ISBN: 978-84-15444-38-1 16 Problemas resueltos de estadística aplicada a las ciencias sociales - UJI - DOI: http://dx.doi.org/10.6035/Sapientia100
Medidas de posición
Son coeficientes que tratan de representar una determinada distribución; pueden
ser de dos tipos, centrales y no centrales.
Medidas Centrales
Media aritmética
Si se considera una variable estadística X que tiene k valores diferentes, que se re-
presentan por xi y sus frecuencias para ni , entonces la media aritmética se calcula:
n1 x1 + n2 x2 + ....... + nk xk
Media aritmética:
n
P. Juan Verdoy / M. J. Beltrán / M. J. Peris - ISBN: 978-84-15444-38-1 17 Problemas resueltos de estadística aplicada a las ciencias sociales - UJI - DOI: http://dx.doi.org/10.6035/Sapientia100
Media aritmética ponderada
A veces, no todos los valores de la variable tienen el mismo peso. Es decir, cada
uno de los valores que toma la variable tiene asignado un número que indica su
importancia, el cual es independiente de la propia frecuencia absoluta.
∑x w n i i i
X wi = i=1
k
∑w n i i
i=1
Media geométrica
Puede utilizarse para mostrar cambios porcentuales en una serie de números posi-
tivos. Por lo tanto, tiene una amplia aplicación en los negocios y en la economía.
La media geométrica proporciona una medida precisa de un cambio porcentual
medio en una serie de números. Se representa por G y su cálculo –efectuando la
notación habitual– sigue la siguiente expresión.
Media harmónica
P. Juan Verdoy / M. J. Beltrán / M. J. Peris - ISBN: 978-84-15444-38-1 18 Problemas resueltos de estadística aplicada a las ciencias sociales - UJI - DOI: http://dx.doi.org/10.6035/Sapientia100
Mediana
Datos no agrupados
Datos agrupados
n
− N i−1
Me = Li−1 + 2 ai donde,
ni
P. Juan Verdoy / M. J. Beltrán / M. J. Peris - ISBN: 978-84-15444-38-1 19 Problemas resueltos de estadística aplicada a las ciencias sociales - UJI - DOI: http://dx.doi.org/10.6035/Sapientia100
Li-1 Límite inferior
Ni-1 Es la frecuencia absoluta acumulada de la clase «anterior» a la clase mediana
ni Es la frecuencia de la clase mediana
ai Es la amplitud de la clase mediana
En esta fórmula en primer lugar se considera el supuesto de que los datos es-
tán uniformemente distribuidos dentro de cada intervalo. Teniendo este hecho en
cuenta, se puede observar que la fórmula es una relación de proporcionalidad entre
las posiciones que ocupan los valores de la variable y la amplitud de los intervalos.
Moda
Es el valor de la variable que más veces se repite, es decir, el valor que tiene mayor
frecuencia absoluta.
Pueden existir distribuciones con más de una moda: bimodales, trimodal, etc.
Datos no agrupados
Datos agrupados
P. Juan Verdoy / M. J. Beltrán / M. J. Peris - ISBN: 978-84-15444-38-1 20 Problemas resueltos de estadística aplicada a las ciencias sociales - UJI - DOI: http://dx.doi.org/10.6035/Sapientia100
Donde:
Del mismo modo que la mediana, la fórmula tiene el supuesto de que los datos
están uniformemente repartidas dentro de cada intervalo. Además, siguiendo este
criterio se puede observar que la moda estará más cerca de aquel intervalo adya-
cente con mayor frecuencia absoluta.
Medidas no Centrales
Percentiles o cuantiles
Podemos decir que los cuantiles son unas medidas de posición que dividen la dis-
tribución en un cierto número de partes.
P. Juan Verdoy / M. J. Beltrán / M. J. Peris - ISBN: 978-84-15444-38-1 21 Problemas resueltos de estadística aplicada a las ciencias sociales - UJI - DOI: http://dx.doi.org/10.6035/Sapientia100
Datos no agrupados
Primero se calcula la posición que ocupa el cuantil que se está estimando. Así, si
Qa representa el cuantil que deja por debajo de él un a (%) de los datos:
a
·n ≤ N i → Qa = xi
si N i−1 ≤
100
a x +x
en el supuesto que ·n = N i → Q = i i+1
100 2
Datos agrupados
a
·n − N i−1
Me = Li−1 + 100 ai donde,
ni
Medidas de dispersión
Son complementarias de las de posición, en el sentido que señalan la dispersión
del conjunto de todos los datos de la distribución, respecto de la medida o medidas
de localización adoptadas.
Recorrido
Se define como la diferencia entre el mayor y menor valor de las variables de una
distribución de datos, es decir:
Re = max(xi ) − min(xi )
Recorrido intercuartílico
Se define como la distancia que hay entre el tercer y el primer cuartil, es decir:
Re = C3 − C1
P. Juan Verdoy / M. J. Beltrán / M. J. Peris - ISBN: 978-84-15444-38-1 22 Problemas resueltos de estadística aplicada a las ciencias sociales - UJI - DOI: http://dx.doi.org/10.6035/Sapientia100
Desviación media respecto de la mediana
∑ x − Me ·n i i
D Me = i=1
n
Varianza
Por otra parte, una de las principales dificultades que presenta la varianza es la
unidad, ya que viene dada en unidades al cuadrado (h2, m2, etc.). La manera de
solucionar esta circunstancia es estimando la raíz cuadrada.
∑(x − X) ·n i
2
i
s = s2 = i=1
n
Por otra parte, se pueden definir dos estadísticos de dispersión más, llamados qua-
sivariancia y cuasidesviación típica como:
n 2 n
s n−1
2
= s yi s n−1 = ·s
n −1 n −1
P. Juan Verdoy / M. J. Beltrán / M. J. Peris - ISBN: 978-84-15444-38-1 23 Problemas resueltos de estadística aplicada a las ciencias sociales - UJI - DOI: http://dx.doi.org/10.6035/Sapientia100
Estos estadísticos tienen mucho interés en la Estadística Inferencial como se verá
en capítulos posteriores.
Las medidas de dispersión absolutas son unos indicadores que presentan dificulta-
des a la hora de comparar la representatividad de las medidas de tendencia central
entre dos distrubucions de datos diferentes. Por ello, a veces se recurre a medidas
de dispersión relativas.
Medidas de forma
Las medidas de asimetría permiten determinar, sin que sea necesario hacer las
representaciones gráficas, el grado de simetría que presentan los datos respecto a
un valor central de la variable estadística, normalmente la media aritmética. Por
tanto, esta medida debe reflejar dos aspectos: la distancia de cada observación
respecto a la media aritmética (es decir, la diferencia entre cada valor y la media
P. Juan Verdoy / M. J. Beltrán / M. J. Peris - ISBN: 978-84-15444-38-1 24 Problemas resueltos de estadística aplicada a las ciencias sociales - UJI - DOI: http://dx.doi.org/10.6035/Sapientia100
aritmética: xi − x y la frecuencia de cada una de estas distancias (la que coincidi-
( )
rá, evidentemente, con la frecuencia de cada observación). De esta manera, intuiti-
vamente, si «predominan» las distancias negativas sobre las positivas (por ser más
frecuentes o ser distancias muy grandes), entonces la distribución es asimétrica a
izquierdas. Si por el contrario, se da la situación opuesta entonces la distribución
es asimétrica a derechas. Para finalizar, si las distancias negativas y las positivas
se «compensan», entonces la distribución es simétrica.
Ahora pues, lo que hay que encontrar es el estadístico que determine la asimetría
de la distribución de datos. Como la asimetría está directamente relacionada con
las desviaciones respecto a la media aritmética, una primera aproximación puede
k
∑(x − X)n i i
i=1
ser la media de las desviaciones, es decir, . Sin embargo, ya es cono-
n
cido que esta suma es cero (propiedades de la media aritmética).
Por otra parte, como lo que nos interesa es conocer el signo de las desviaciones,
tampoco podemos emplear el cuadrado de las desviaciones. Así pues, parece co-
herente tomar una potencia de grado tres de las desviaciones y calcular la media.
Así, si llamamos
k
∑(x − X) n i
3
i
i=1
m= ,
n
por lo que se cumple:
∑(x − X) n i
3
i
i=1
m n
g1 = =
s 3 ⎛ k ⎞
3
⎜
⎜
∑(xi − X)2 ni ⎟⎟
i=1
⎜ n ⎟
⎜ ⎟
⎜ ⎟
⎝ ⎠
P. Juan Verdoy / M. J. Beltrán / M. J. Peris - ISBN: 978-84-15444-38-1 25 Problemas resueltos de estadística aplicada a las ciencias sociales - UJI - DOI: http://dx.doi.org/10.6035/Sapientia100
Curtosis
Para estudiar el grado de curtosis de una distribución hay que tomar un modelo teóri-
co como referencia, la representación gráfica tenga forma de campana simétrica. No
es extraño pues, que se tome el modelo normal, ya que, como ya se ha mencionado
con anterioridad, se puede decir que es el modelo campaniforme por antonomasia.
De esta manera, tomando este modelo como referencia, se dice que una distribu-
ción es leptocúrtica si es más apuntada que la distribución normal. Si es menos
apuntada se le llama platicúrtica. Finalmente, si tiene el mismo apuntamiento que
una distribución normal se le llama mesocúrtica.
Del mismo modo que en el caso del estudio de la asimetría, hay un coeficiente que
permite clasificar los datos según la curtosis. En este caso, el coeficiente no es tan
intuitivo, por lo que únicamente se dará la definición y su interpetación. Como en
el caso de la otra medida de forma, este indicador tampoco tiene dimensión.
∑(x − X) ni
4
i
i=1
g2 = n −3
2
⎛ k ⎞
⎜ ∑ (xi − X)2 ni ⎟
⎜ i=1 ⎟
⎜ n ⎟
⎜ ⎟
⎝ ⎠
∑(x − X) n i
4
i
i=1
P. Juan Verdoy / M. J. Beltrán / M. J. Peris - ISBN: 978-84-15444-38-1 26 Problemas resueltos de estadística aplicada a las ciencias sociales - UJI - DOI: http://dx.doi.org/10.6035/Sapientia100
Cajas y bigotes (Box-plot)
Un diagrama de cajas y bigote (conocido también como Box and whisker plot
en inglés), es una representación gráfica de los datos que permite determinar con
mucha facilidad y de una manera visual la tendencia central, la variabilidad, la
asimetría y la existencia de valores anómalos de un conjunto de observaciones
(outliers). De alguna manera, se puede decir que es uno de los gráficos que más y
mejor resumen los conjuntos de datos.
Medidas de concentración
Las infinitas posibilidades que pueden adoptar los valores se encuentran entre los
dos extremos:
el que recibe x1 = el que recibe x 2 = ....... = el que recibe x k−1 = 0 y el que recibe x k = el total
el que recibe x1 = el que recibe x 2 = ....... = el que recibe x k−1 = el que recibe x k
Se supone que hay una distribución de rentas ( xi · ni) donde i toma los valores de 1
hasta k (por ejemplo, xi son los sueldos y n el número de personas que cobran ese
sueldo) de la que se formará una tabla con las columnas siguientes:
P. Juan Verdoy / M. J. Beltrán / M. J. Peris - ISBN: 978-84-15444-38-1 27 Problemas resueltos de estadística aplicada a las ciencias sociales - UJI - DOI: http://dx.doi.org/10.6035/Sapientia100
u=x n
1 1 1
u =x n +x n
2 1 1 2 2
u =x n +x n +x n
3 1 1 2 2 3 3
u =x n +x n +x n +x n
4 1 1 2 2 3 3 4 4
.....................................................
u = x n + x n + x n + x n + …………. + x n
k 1 1 2 2 3 3 4 4 k k
j
u j = ∑ xi ·ni para cualquier valor de j desde 1 hasta k.
i=1
Ni
pi =
n
ui
qi =
uk
Ni ui
pi = qi = pi - qi
xi ni xi ni Ni u
i
n uk
x n x n N u p q p -q
1 1 1 1 1 1 1 1 1 1
x n x n N u p q p -q
2 2 2 2 2 2 2 2 2 2
x n x n Nk uk 100 100 0
k k k k
P. Juan Verdoy / M. J. Beltrán / M. J. Peris - ISBN: 978-84-15444-38-1 28 Problemas resueltos de estadística aplicada a las ciencias sociales - UJI - DOI: http://dx.doi.org/10.6035/Sapientia100
Como se puede ver, la última columna es la diferencia entre las dos penúltimas;
esta diferencia sería 0 para la concentración mínima en la que se cumple pi = qi
para cualquier i, por tanto su diferencia sería cero.
k−1
∑( p − q ) i i
∑p i
j=1
P. Juan Verdoy / M. J. Beltrán / M. J. Peris - ISBN: 978-84-15444-38-1 29 Problemas resueltos de estadística aplicada a las ciencias sociales - UJI - DOI: http://dx.doi.org/10.6035/Sapientia100
Objetivos
Los problemas deben permitir que los alumnos alcanzan los objetivos didácticos:
La tabla siguiente nos muestra cómo están distribuidos los objetivos según los
ejercicios:
Objetivos 1a 1b 1c 1d 1e 1f 1g 1h
Ejercicio
1 x x
2 x x x
3 x x x
4 x x x
5 x x x
6 x x x x
7 x x
8 x
9 x x x
P. Juan Verdoy / M. J. Beltrán / M. J. Peris - ISBN: 978-84-15444-38-1 30 Problemas resueltos de estadística aplicada a las ciencias sociales - UJI - DOI: http://dx.doi.org/10.6035/Sapientia100
Enunciados
1a) Conocer los conceptos básicos de
las variables estadísticas.
1b) Saber clasificar las variables esta-
dísticas.
Ejercicio 1
Clasifica las siguientes variables, justificando el por qué de la elección:
Ejercicio 2
Actualmente, se está estudiando en las distintas comunidades autónomas el núme-
ro de hijos por familia para estudiar la natalidad. Uno de los trabajadores que está
haciendo las encuestas, recoge los datos de su barrio donde hay 100 familias. Ha
obtenido los siguientes datos que aparecen en la tabla sguiente:
1 3 3 0 4 3 1 4 0 0
2 1 0 3 1 2 1 4 1 2
3 3 4 2 0 4 3 0 2 3
1 3 4 2 2 4 4 4 2 1
4 2 1 1 0 1 1 2 3 0
3 3 3 1 1 3 3 0 2 3
4 3 0 3 1 2 2 1 2 3
3 2 1 3 1 3 4 4 4 1
3 0 3 1 0 4 3 2 3 2
1 2 0 2 0 0 2 2 3 4
P. Juan Verdoy / M. J. Beltrán / M. J. Peris - ISBN: 978-84-15444-38-1 31 Problemas resueltos de estadística aplicada a las ciencias sociales - UJI - DOI: http://dx.doi.org/10.6035/Sapientia100
a) Construye el gráfico que consideres más adecuado con las frecuencias acu-
muladas.
b) Construye el polígono de frecuencias con las frecuencias acumuladas.
Ejercicio 3
Los sueldos, en miles de euros mensuales de 40 empresarios del sector de la cons-
trucción del año 2007 son:
3,9 4,7 3,7 5,6 4,3 4,9 5,0 6,1 5,1 4,5
5,3 3,9 4,3 5,0 6,0 4,7 5,1 4,2 4,4 5,8
3,3 4,3 4,1 5,8 4,4 4,8 6,1 4,3 5,3 4,5
4,0 5,4 3,9 4,7 3,3 4,5 4,7 4,2 4,5 4,8
Ejercicio 4
La recopilación de 20 datos correspondientes al número de llamadas de teléfono
registradas en una empresa durante los días de preparación de material para una
feria de muestras durante el período de 9 a 12 horas.
15,5, 10, 5, 5, 6, 5, 6, 5, 6, 7, 10, 10, 12, 11, 11, 12, 15, 12, 15
P. Juan Verdoy / M. J. Beltrán / M. J. Peris - ISBN: 978-84-15444-38-1 32 Problemas resueltos de estadística aplicada a las ciencias sociales - UJI - DOI: http://dx.doi.org/10.6035/Sapientia100
Se quiere estudiar si realmente hay variación a lo largo de los días de las llamadas
que se reciben. Por este motivo se pide confeccionar una tabla de frecuencias que
recoja esta información.
Ejercicio 5
Una empresa está haciendo el estudio del dinero que se gasta la gente para com-
prar una segunda casa como complemento de la primera vivienda. Reducir los da-
tos de los euros y en número de familias que han comprado este tipo de vivienda.
A continuación se puede ver los datos:
Euros Familias
0-50000 2145
50000-75000 1520
75000-100000 840
100000-115000 955
115000-135000 1110
135000-140000 2342
140000-150000 610
150000-200000 328
>200000 150
Se pide:
P. Juan Verdoy / M. J. Beltrán / M. J. Peris - ISBN: 978-84-15444-38-1 33 Problemas resueltos de estadística aplicada a las ciencias sociales - UJI - DOI: http://dx.doi.org/10.6035/Sapientia100
1b) Saber clasificar las variables esta-
dísticas.
1c) Saber analizar y realizar tablas de
frecuencias de un conjunto de datos.
1e) Saber interpretar y construir los
principales gráficos estadísticos.
1f) Conocer los conceptos y saber rea-
lizar los cálculos de las medidas
de tendencia central y de disper-
sión. Concretar con la aplicación
del coeficiente de variación de
Pearson en aquellas situaciones
que lo requieran.
Ejercicio 6
En el siguiente histograma se representa la distribución del dinero que durante el
último mes se han gastado los trabajadores de una empresa en dietas:
P. Juan Verdoy / M. J. Beltrán / M. J. Peris - ISBN: 978-84-15444-38-1 34 Problemas resueltos de estadística aplicada a las ciencias sociales - UJI - DOI: http://dx.doi.org/10.6035/Sapientia100
h) De las dietas de otra empresa, que pertenece al mismo sector, se sabe que la
media aritmética de sus trabajadores es de 120 euros, con una varianza de
2,5 euros. ¿Qué empresa tiene una dieta media más representativa? Razona
la respuesta.
Ejercicio 7
Se quiere lanzar al mercado un nuevo producto cerámico y la empresa que lo crea
estudia el tiempo de publicidad, en segundos, que otras empresas han utilizado
para promocionar un producto similar. A continuación se puede ver para cada em-
presa la duración y los anuncios realizados:
Empresa 1
Duración Número de anuncios
0-20 3
20-25 17
25-30 13
30-40 9
40-60 8
Empresa 2
0-20 1
20-25 5
25-30 13
30-40 5
40-60 2
P. Juan Verdoy / M. J. Beltrán / M. J. Peris - ISBN: 978-84-15444-38-1 35 Problemas resueltos de estadística aplicada a las ciencias sociales - UJI - DOI: http://dx.doi.org/10.6035/Sapientia100
Empresa 3
Duración Número de anuncios
0-20 4
20-25 6
25-30 7
30-40 5
40-60 3
Empresa 4
Duración Número de anuncios
0-20 3
20-25 17
25-30 13
30-40 9
40-60 8
P. Juan Verdoy / M. J. Beltrán / M. J. Peris - ISBN: 978-84-15444-38-1 36 Problemas resueltos de estadística aplicada a las ciencias sociales - UJI - DOI: http://dx.doi.org/10.6035/Sapientia100
1h) Saber calcular e interpretar el índi-
ce de Gini, así como saber realizar
la curva de Lorenz para medir la
equidad de un reparto.
Ejercicio 8
Dos compañías de venta de coches tienen maneras diferentes de pagar a sus traba-
jadores. La compañía A lo hace mediante un sueldo fijo mensual y la compañía B
mediante un porcentaje sobre las ventas efectuadas. La distribución de los salarios
por categorías es la siguiente:
compañia a compañia B
26 10 4 10
39 10 5 10
52 40 6 40
247 20 7 20
260 10 26 10
273 10 27 10
P. Juan Verdoy / M. J. Beltrán / M. J. Peris - ISBN: 978-84-15444-38-1 37 Problemas resueltos de estadística aplicada a las ciencias sociales - UJI - DOI: http://dx.doi.org/10.6035/Sapientia100
1a) Conocer los conceptos básicos de
las variables estadísticas.
1e) Saber interpretar y construir los
principales gráficos estadísticos.
1f) Conocer los conceptos y saber rea-
lizar los cálculos de las medidas
de tendencia central y de disper-
sión. Concretar con la aplicación
del coeficiente de variación de
Pearson en aquellas situaciones
que lo requieran.
Ejercicio 9
La distribución de edades del Censo Electoral de Residentes a 1 de enero de 1999
para las comunidades autónomas de Aragón y Canarias, en tantos por ciento, es la
siguiente:
P. Juan Verdoy / M. J. Beltrán / M. J. Peris - ISBN: 978-84-15444-38-1 38 Problemas resueltos de estadística aplicada a las ciencias sociales - UJI - DOI: http://dx.doi.org/10.6035/Sapientia100
Ayudas
En este apartado se presentarán las ayudas a emplear en caso de ser necesario a
la hora de realizar los ejercicios y problemas. Es conveniente no hacer un abuso
excesivo de estas ayudas, es decir, antes de emplear la ayuda hay que pensar el
problema al menos durante unos 10-15 minutos. Después se consultará la ayuda
de tipo 1 y se intentará resolver el ejercicio con esta ayuda. Si no es posible resol-
verlo, entonces se consultará la ayuda de tipo 2; y en último término la solución.
Ayudas Tipo 1
Exercicio 1
Lo que se necesita para resolver este ejercicio, es primeramente conocer los tipos
de variables que existen. A continuación puedes ver una clasificación de los tipo de
variables.
Las variables cualitativas son aquellas que no se pueden medir, es decir, aquellas
que toman valores a los que no se puede asignar ningún número. Expresan cuali-
dades o categorías. Además pueden ser:
Las variables cuantitativas, por el contrario, son medibles, es decir, los valores
que se observan pueden expresarse de forma numérica. Estas variables pueden
clasificarse en:
Exercicio 2
Lo que se necesita para resolver este ejercicio, es conocer primeramente los tipos
de variables que existen para elegir la correcta y el tipo de gráfico correspondiente.
La clasificación del tipo de variables, como ya se conoce del ejercicio anterior es:
P. Juan Verdoy / M. J. Beltrán / M. J. Peris - ISBN: 978-84-15444-38-1 39 Problemas resueltos de estadística aplicada a las ciencias sociales - UJI - DOI: http://dx.doi.org/10.6035/Sapientia100
Según el tipo de variable, el gráfico correspondiente será:
Los primeros pasos serán saber qué tipo de variable es, ya que este elemento afec-
tará a la elección tanto del tipo de tabla de frecuencias como la elección del tipo
de gráfico.
Queda claro que es una variable numérica. Por lo tanto, puede ser continua o
discreta. En este caso, como los datos hacen referencia al número de hijos será
cuantitativa discreta.
Ejercicio 3
Lo que se necesita para resolver este ejercicio, de la misma forma que el anterior,
es conocer los tipos de variables que existen para elegir la correcta y el tipo de
gráfico correspondiente. En este caso, los que aparecen son datos numéricos conti-
nuos. Por este motivo, lo que se trabaja es la creación de representaciones gráficas
como son los histogramas en los dos apartados.
Por otra parte, hay que pensar cómo crear las clases para hacer este tipo de proble-
mas y se puede hacer con el conocimiento de los siguientes elementos:
Se llama marca de clase a la media aritmética de los dos extremos del intervalo.
Es evidentemente el valor central del intervalo ya que equidista de los extremos.
L +L
Se denota por ci . Se calcula ci = i−1 i .
2
Se llama amplitud de un intervalo o recorrido a la distancia que hay entre los ex-
tremos.
Método de la raíz: Según este método el número de clases es igual a la raíz cua-
drada del número de datos:
Número de clases = .
P. Juan Verdoy / M. J. Beltrán / M. J. Peris - ISBN: 978-84-15444-38-1 40 Problemas resueltos de estadística aplicada a las ciencias sociales - UJI - DOI: http://dx.doi.org/10.6035/Sapientia100
Por lo que, la amplitud .
Con esta información, se puede empezar sin problemas la solución del problema.
Ejercicio 4
Hay que recordar, sin embargo, que los diferentes valores que puede tomar la va-
riable estadística se denotan mediante xi . En este caso, ordenándolos de menor a
mayor, x1 = 5, x2 = 6, x3 = 7, x4 = 10, x5 = 11, x5 = 12, x6 = 15 .
Se llama frecuencia absoluta del valor xi al número de veces que aparece repetida
la observación en la recopilación de datos. Se representa por ni . La frecuencia ab-
soluta del valor x 2 es 2 ( n2 = 2), pues el dato 6 se repite dos veces en el conjunto
de los datos de la muestra.
Es importante remarcar que para calcular frecuencias acumuladas, a las que lla-
maremos Fi como frecuencia relativa acumulada y Ni como frecuencia absoluta
acumulada, es necesario que las variables a estudiar sean ordenables, es decir,
debe ser posible establecer una relación de orden entre las variables. Sin embargo,
no tiene ningún sentido realizar dichos cálculos.
Estas definiciones permiten resumir los datos. Sin embargo, la manera más ade-
cuada para sintetizar los datos es mediante lo que se denomina tabla de frecuen-
cias. En ella aparecen distribuidas los datos según las frecuencias. Al mismo tiem-
po refleja todos los conceptos mencionados con anterioridad.
Ejercicio 5
P. Juan Verdoy / M. J. Beltrán / M. J. Peris - ISBN: 978-84-15444-38-1 41 Problemas resueltos de estadística aplicada a las ciencias sociales - UJI - DOI: http://dx.doi.org/10.6035/Sapientia100
c) Para completar la tabla de frecuencias debemos conocer:
– Saber crear la tabla de datos continuos. En este caso, los intervalos ya los
tenemos, solo tenemos que añadir la marca de clase.
– Completar la tabla con las diversas frecuencias n, f, N y F.
– Además, hay que conocer los pasos para crear la tabla si no conocemos
los intervalos, pero esto es un problema que no tenemos en este caso.
Ejercicio 6
– Hay que saber el tipo de variable. En este caso es una variable cuantitativa
continua, ya que se muestra un gráfico con formato de histograma.
– Además, recuerda que en el eje de las ordenadas, lo que aparece es la fre-
cuencia relativa, ni la absoluta ni ninguna de las acumuladas. Esta suposi-
ción se basa en que el gráfico no está en todo momento aumentando.
– El formato de la tabla de frecuencias tendrá la forma:
[Li-1, Li) ni Ni fi Fi
Ejercicio 7
a) Por lo que respecta al cálculo de la media aritmética, hay que tener en cuenta que
es una variable continua y que hay que utilizar la marca de clase en cada caso.
P. Juan Verdoy / M. J. Beltrán / M. J. Peris - ISBN: 978-84-15444-38-1 42 Problemas resueltos de estadística aplicada a las ciencias sociales - UJI - DOI: http://dx.doi.org/10.6035/Sapientia100
La forma de los gráficos puede ser respecto a la simetría:
Respecto al apuntamiento:
Ejercicio 8
P. Juan Verdoy / M. J. Beltrán / M. J. Peris - ISBN: 978-84-15444-38-1 43 Problemas resueltos de estadística aplicada a las ciencias sociales - UJI - DOI: http://dx.doi.org/10.6035/Sapientia100
1) Los productos, xi · ni indicarán la renta total percibida por los ni rentistas de
renta individual xi .
u=x n
1 1 1
u =x n +x n
2 1 1 2 2
u =x n +x n +x n
3 1 1 2 2 3 3
u =x n +x n +x n +x n
4 1 1 2 2 3 3 4 4
.....................................................
u = x n + x n + x n + x n + …………. + x n
k 1 1 2 2 3 3 4 4 k k
j
u j = ∑ xi ·ni para cualquier valor de j desde 1 hasta k.
i=1
Ni ui
u pi = qi = pi - qi
xi ni xi ni Ni i n uk
x n x n N u p q p -q
1 1 1 1 1 1 1 1 1 1
x n x n N u p q p -q
2 2 2 2 2 2 2 2 2 2
x n x n Nk uk 100 100 0
k k k k
P. Juan Verdoy / M. J. Beltrán / M. J. Peris - ISBN: 978-84-15444-38-1 44 Problemas resueltos de estadística aplicada a las ciencias sociales - UJI - DOI: http://dx.doi.org/10.6035/Sapientia100
Ejercicio 9
a) Los datos en este caso son muy importantes, ya que se puede ver que se
muestran los datos agrupados pero en diferente amplitud. Por este motivo,
se ha de representar la densidad de los datos, no directamente los datos que
se nos presentan.
b) Para obtener los datos de la media aritmética, hay que tener en cuenta el
mismo elemento que se ha comentado con anterioridad, que son datos agru-
pados. Si la variable está agrupada en intervalos el concepto no cambia. En
este caso, se asignan las frecuencias a las marcas de clase y se procede de la
misma manera que en el caso de no agrupados.
Ayudas Tipo 2
En este apartado se presentarán las ayudas para emplear en caso de ser necesario
a la hora de realizar los ejercicios y problemas, y tras consultar la ayuda de tipo 1.
Ejercicio 1
P. Juan Verdoy / M. J. Beltrán / M. J. Peris - ISBN: 978-84-15444-38-1 45 Problemas resueltos de estadística aplicada a las ciencias sociales - UJI - DOI: http://dx.doi.org/10.6035/Sapientia100
Ejercicio 2
Ya conoces qué tipo de gráficos se debe utilizar en cada caso. Ahora tienes que
seguir los siguientes pasos para hacer los gráficos:
Primeramente, crearemos la tabla de frecuencias para poder crear los gráficos co-
rrespondientes:
xi ni Ni fi Fi
0 15 15 0,15 0,15
1 21 36 0,21 0,36
2 21 57 0,21 0,57
3 27 84 0,27 0,84
4 16 100 0,16 1,00
Total 100 1
Ejercicio 3
El siguiente paso, con los datos agrupados en intervalos, será crear la tabla de fre-
cuencias agrupada como queda a continuación:
[Li-1, Li) ni Ni fi Fi
[3,25–3,75) 3 3 0,075 0,075
[3,75–4,25) 8 11 0,2 0,275
[4,25–4,75) 14 25 0,35 0,625
[4,75–5,25) 6 31 0,15 0,775
[5,25–5,75) 4 35 0,1 0,875
[5,75–6,25) 5 40 0,125 1
N = 40
P. Juan Verdoy / M. J. Beltrán / M. J. Peris - ISBN: 978-84-15444-38-1 46 Problemas resueltos de estadística aplicada a las ciencias sociales - UJI - DOI: http://dx.doi.org/10.6035/Sapientia100
En cada apartado debemos:
Ejercicio 4
xi ni Ni fi Fi
Total
Y una forma de saber si los datos se mantienen a lo largo del tiempo o varían sería
el crear un gráfico de barras, por ser una variable numérica discreta.
Ejercicio 5
P. Juan Verdoy / M. J. Beltrán / M. J. Peris - ISBN: 978-84-15444-38-1 47 Problemas resueltos de estadística aplicada a las ciencias sociales - UJI - DOI: http://dx.doi.org/10.6035/Sapientia100
c) Se puede utilizar la frecuencia relativa acumulada y restar a 1 el valor del Fi
anterior.
a
·n − N i−1
Cuartil = Li−1 + 100
Quantil ai donde,
ni
Ejercicio 6
P. Juan Verdoy / M. J. Beltrán / M. J. Peris - ISBN: 978-84-15444-38-1 48 Problemas resueltos de estadística aplicada a las ciencias sociales - UJI - DOI: http://dx.doi.org/10.6035/Sapientia100
Ejercicio 7
∑(x − X) n i
3
i
i=1
m n
g1 = =
s 3 ⎛ k ⎞
3
⎜
⎜
∑(xi − X) ni ⎟⎟ 2
i=1
⎜ n ⎟
⎜ ⎟
⎜ ⎟
⎝ ⎠
Hay que notar que como la desviación típica es positiva, el signo del coeficiente de
Fisher será el mismo que el de m. Y por lo tanto:
Así pues, cuando g1< 0, se dice que la distribución presenta asimetría a la izquierda
(o negativa) y entonces, de las dos ramas de la curva que separa la ordenada que
pasa por la media aritmética, la de la izquierda es más larga que la de la derecha.
Lo opuesto ocurre si g1> 0.
Del mismo modo que en el caso del estudio de la asimetría, hay un coeficiente que
permite clasificar los datos según la curtosis. En este caso, el coeficiente no es tan
intuitivo, por lo que únicamente se dará la definición y su interpretación. Como en
el caso de la otra medida de forma, este indicador tampoco tiene dimensión.
∑(x − X) n i
4
i
i=1
g2 = n −3
2
⎛ k ⎞
⎜ ∑ (xi − X)2 ni ⎟
⎜ i=1 ⎟
⎜ n ⎟
⎜ ⎟
⎝ ⎠
P. Juan Verdoy / M. J. Beltrán / M. J. Peris - ISBN: 978-84-15444-38-1 49 Problemas resueltos de estadística aplicada a las ciencias sociales - UJI - DOI: http://dx.doi.org/10.6035/Sapientia100
valores centrales en un modelo teórico normal que tenga la misma media y la mis-
ma desviación típica que la distribución que se está estudiando.
k
∑(x − X) n i
4
i
i=1
mesocúrtica (normal) si g 2 = 0
leptocúrtica si g 2 > 0
platicúrtica si g 2 < 0
Ejercicio 8
La línea central es la línea de equidad de los datos, que nos marcará el nivel de
concentración.
P. Juan Verdoy / M. J. Beltrán / M. J. Peris - ISBN: 978-84-15444-38-1 50 Problemas resueltos de estadística aplicada a las ciencias sociales - UJI - DOI: http://dx.doi.org/10.6035/Sapientia100
Ejercicio 9
Una caja (box) central que representa las observaciones comprendidas entre el
primer y el tercer cuartil. Los dos extremos de la caja son los cuartiles, y una línea
interior y vertical que parte la caja en dos partes, corresponde a la mediana. Es
obvio, pues, que la caja comprende el 50 % de las observaciones.
Bigotes (whiskers): El gráfico se completa en esta versión del Box plot, con dos lí-
neas a ambos lados de la caja que unen el primer cuartil con la menor observación,
y el tercer cuartil con la observación mayor.
P. Juan Verdoy / M. J. Beltrán / M. J. Peris - ISBN: 978-84-15444-38-1 51 Problemas resueltos de estadística aplicada a las ciencias sociales - UJI - DOI: http://dx.doi.org/10.6035/Sapientia100
Soluciones
Ejercicio 1
Solución
Ejercicio 2
1 3 3 0 4 3 1 4 0 0
2 1 0 3 1 2 1 4 1 2
3 3 4 2 0 4 3 0 2 3
1 3 4 2 2 4 4 4 2 1
4 2 1 1 0 1 1 2 3 0
P. Juan Verdoy / M. J. Beltrán / M. J. Peris - ISBN: 978-84-15444-38-1 52 Problemas resueltos de estadística aplicada a las ciencias sociales - UJI - DOI: http://dx.doi.org/10.6035/Sapientia100
3 3 3 1 1 3 3 0 2 3
4 3 0 3 1 2 2 1 2 3
3 2 1 3 1 3 4 4 4 1
3 0 3 1 0 4 3 2 3 2
1 2 0 2 0 0 2 2 3 4
a) Construye el gráfico que consideres más adecuado con las frecuencias acu-
muladas.
b) Construye el polígono de frecuencias con las frecuencias acumuladas.
Solución
El primer paso será saber qué tipo de variable es, ya que este elemento afectará a
la elección tanto del tipo de tabla de frecuencias como del tipo de gráfico.
Queda claro que es una variable numérica. Por lo tanto, puede ser continua o
discreta. En este caso, ya que los datos hacen referencia a número de hijos será
cuantitativa discreta.
Primeramente, crearemos la tabla de frecuencias para poder crear los gráficos co-
rrespondientes:
xi ni Ni fi Fi
0 15 15 0,15 0,15
1 21 36 0,21 0,36
2 21 57 0,21 0,57
3 27 84 0,27 0,84
4 16 100 0,16 1,00
Total 100 1
P. Juan Verdoy / M. J. Beltrán / M. J. Peris - ISBN: 978-84-15444-38-1 53 Problemas resueltos de estadística aplicada a las ciencias sociales - UJI - DOI: http://dx.doi.org/10.6035/Sapientia100
El resultado de representar la frecuencia absoluta en un diagrama de barras es el
siguiente:
Ejercicio 3
3,9 4,7 3,7 5,6 4,3 4,9 5,0 6,1 5,1 4,5
5,3 3,9 4,3 5,0 6,0 4,7 5,1 4,2 4,4 5,8
3,3 4,3 4,1 5,8 4,4 4,8 6,1 4,3 5,3 4,5
4,0 5,4 3,9 4,7 3,3 4,5 4,7 4,2 4,5 4,8
P. Juan Verdoy / M. J. Beltrán / M. J. Peris - ISBN: 978-84-15444-38-1 54 Problemas resueltos de estadística aplicada a las ciencias sociales - UJI - DOI: http://dx.doi.org/10.6035/Sapientia100
Se quiere estudiar si realmente son bastante altos y cuál es su distribución. Para
conseguirlo:
Solución
El primer paso será saber qué tipo de variable es, ya que este elemento afectará a
la elección tanto del tipo de tabla de frecuencias como del tipo de gráfico. Queda
claro que es una variable numérica continua.
[Li-1, Li) ni Ni fi Fi
[3,25–3,75) 3 3 0,075 0,075
[3,75–4,25) 8 11 0,2 0,275
[4,25–4,75) 14 25 0,35 0,625
[4,75–5,25) 6 31 0,15 0,775
[5,25–5,75) 4 35 0,1 0,875
[5,75–6,25) 5 40 0,125 1
N = 40
a) Un posible resultado, será el siguiente histograma:
P. Juan Verdoy / M. J. Beltrán / M. J. Peris - ISBN: 978-84-15444-38-1 55 Problemas resueltos de estadística aplicada a las ciencias sociales - UJI - DOI: http://dx.doi.org/10.6035/Sapientia100
b) Como se pidn cuatro clases, el histograma pasará a ser el siguiente:
Ejercicio 4
15,5, 10, 5, 5, 6, 5, 6, 5, 6, 7, 10, 10, 12, 11, 11, 12, 15, 12, 15
Se quiere estudiar si realmente hay variación a lo largo de los días de las llamadas
que se reciben. Por este motivo se pide confeccionar una tabla de frecuencias que
recoja esta información.
Solución
Hay que recordar, sin embargo, que los diferentes valores que puede tomar la va-
riable estadística se denotan mediante xi . En este caso, ordenándolos de menor a
mayor, x1 = 5, x2 = 6, x3 = 7, x4 = 10, x5 = 11, x5 = 12, x6 = 15 .
P. Juan Verdoy / M. J. Beltrán / M. J. Peris - ISBN: 978-84-15444-38-1 56 Problemas resueltos de estadística aplicada a las ciencias sociales - UJI - DOI: http://dx.doi.org/10.6035/Sapientia100
Se llama frecuencia absoluta del valor xi al número de veces que aparece repetida
la observación en la recopilación de datos. Se representa por ni . La frecuencia ab-
soluta del valor x 2 es 2 ( n2 = 2), pues el dato 6 se repite dos veces en el conjunto
de los datos de la muestra.
Es importante remarcar que para calcular frecuencias acumuladas, a las que lla-
maremos Fi como frecuencia relativa acumulada y Ni como frecuencia absoluta
acumulada, es necesario que las variables a estudiar sean ordenables, es decir,
debe ser posible establecer una relación de orden entre los valores de las variables.
En otros casos, no tiene ningún sentido realizar dichos cálculos.
Estas definiciones permiten resumir los datos. Sin embargo, la manera más ade-
cuada para sintetizar los datos es mediante lo que se denomina tabla de frecuen-
cias. En ella aparecen distribuidas los datos según las frecuencias. Al mismo tiem-
po refleja todos los conceptos mencionados con anterioridad.
xi ni Ni fi Fi
5 5 5 0,25 0,25
6 3 8 0,15 0,4
7 1 9 0,05 0,45
10 3 12 0,15 0,6
11 2 14 0,1 0,7
12 3 17 0,15 0,85
15 3 20 0,15 1
Total 20 1
Si además, representamos la frecuencia absoluta, podemos ver que realmente no
aumenta el número de llamadas, se mantiene bastante estable.
P. Juan Verdoy / M. J. Beltrán / M. J. Peris - ISBN: 978-84-15444-38-1 57 Problemas resueltos de estadística aplicada a las ciencias sociales - UJI - DOI: http://dx.doi.org/10.6035/Sapientia100
Ejercicio 5
Una empresa está haciendo el estudio del dinero que se gasta la gente para com-
prar una segunda casa como complemento de la primera vivienda. Se anotan los
datos de los euros y el número de familias que han comprado este tipo de vivienda.
A continuación se pueden ver los datos:
Euros Familias
0-50000 2145
50000-75000 1520
75000-100000 840
100000-115000 955
115000-135000 1110
135000-140000 2342
140000-150000 610
150000-200000 328
>200000 150
Se pide:
P. Juan Verdoy / M. J. Beltrán / M. J. Peris - ISBN: 978-84-15444-38-1 58 Problemas resueltos de estadística aplicada a las ciencias sociales - UJI - DOI: http://dx.doi.org/10.6035/Sapientia100
Solución
c) Con la ayuda de la tabla, y con los datos de los intervalos, podemos ver cuá-
les son los casos superiores a 150.000. En este caso, por ejemplo, podemos
utilizar la frecuencia relativa acumulada:
P. Juan Verdoy / M. J. Beltrán / M. J. Peris - ISBN: 978-84-15444-38-1 59 Problemas resueltos de estadística aplicada a las ciencias sociales - UJI - DOI: http://dx.doi.org/10.6035/Sapientia100
Una vez se tiene el intervalo [Li-1, Li), el cuantil se calcula:
Cuantil donde,
Ejercicio 6
P. Juan Verdoy / M. J. Beltrán / M. J. Peris - ISBN: 978-84-15444-38-1 60 Problemas resueltos de estadística aplicada a las ciencias sociales - UJI - DOI: http://dx.doi.org/10.6035/Sapientia100
g) En el mes siguiente, la empresa decidió aumentar las dietas de todos los
trabajadores un 5 %. Además, les dio una prima de 50 euros en concepto de
productividad. Calcula el salario medio, el salario más frecuente y el salario
que tenían como máximo el 50 % de los trabajadores que menos cobran.
h) De las dietas de otra empresa, que pertenece al mismo sector, se sabe que la
media aritmética de sus trabajadores es de 120 euros, con una varianza de
2.5 euros. ¿Qué empresa tiene una dieta media más representativa? Razona
la respuesta.
Solución
[Li-1, Li) ni Ni fi Fi
[70-90) 16 16 0,08 0,08
[90-110) 12 28 0,06 0,14
[110-130) 8 36 0,04 0,18
[130-150) 14 50 0,07 0,25
[150-170) 20 70 0,10 0,35
[170-190) 24 94 0,12 0,47
[190-210) 32 126 0,16 0,63
[210-230) 34 160 0,17 0,80
[230-250) 40 200 0,20 1
N = 200 1
c) Rango = 250 – 70 = 180. Para calcular el rango intercuartílico, hay que cal-
cular primero el primer y tercer cuartil: C3 = 224,11 C1 = 150 Ri = 74,11
P. Juan Verdoy / M. J. Beltrán / M. J. Peris - ISBN: 978-84-15444-38-1 61 Problemas resueltos de estadística aplicada a las ciencias sociales - UJI - DOI: http://dx.doi.org/10.6035/Sapientia100
Ejercicio 7
Empresa 1
Duración Número de anuncios
0-20 3
20-25 17
25-30 13
30-40 9
40-60 8
Empresa 2
Duración Número de anuncios
0-20 1
20-25 5
25-30 13
30-40 5
40-60 2
Empresa 3
Duración Número de anuncios
0-20 4
20-25 6
25-30 7
30-40 5
40-60 3
P. Juan Verdoy / M. J. Beltrán / M. J. Peris - ISBN: 978-84-15444-38-1 62 Problemas resueltos de estadística aplicada a las ciencias sociales - UJI - DOI: http://dx.doi.org/10.6035/Sapientia100
Empresa 4
Duración Número de anuncios
0-20 3
20-25 17
25-30 13
30-40 9
40-60 8
Solución
E mpr es a 1
18
16
14
12
10
0
0-20 20-25 25-30 30-40 40-60
P. Juan Verdoy / M. J. Beltrán / M. J. Peris - ISBN: 978-84-15444-38-1 63 Problemas resueltos de estadística aplicada a las ciencias sociales - UJI - DOI: http://dx.doi.org/10.6035/Sapientia100
E mpr es a 2
14
12
10
Empr esa 3
14
12
10
0
0- 20 20- 25 25- 30 30- 40 40- 60
E mpr es a 4
14
12
10
0
0-20 20-25 25-30 30-40 40-60
P. Juan Verdoy / M. J. Beltrán / M. J. Peris - ISBN: 978-84-15444-38-1 64 Problemas resueltos de estadística aplicada a las ciencias sociales - UJI - DOI: http://dx.doi.org/10.6035/Sapientia100
– La empresa 2 es leptocúrtica.
– La empresa 3 es platicúrtica.
– La empresa 4 es asimétrica a izquierdas.
Ejercicio 8
Dos compañías de venta de coches tienen maneras diferentes de pagar a sus traba-
jadores. La compañía A lo hace mediante un sueldo fijo mensual y la compañía B
mediante un porcentaje sobre las ventas efectuadas. La distribución de los salarios
por categorías es la siguiente:
compañia a compañia B
26 10 4 10
39 10 5 10
52 40 6 40
247 20 7 20
260 10 26 10
273 10 27 10
Solución
a) El sueldo medio de la compañía A es de 130 y el coeficiente de variación es de
83.2. El sueldo medio de la compañía B es de 10 y el coeficiente de variación
P. Juan Verdoy / M. J. Beltrán / M. J. Peris - ISBN: 978-84-15444-38-1 65 Problemas resueltos de estadística aplicada a las ciencias sociales - UJI - DOI: http://dx.doi.org/10.6035/Sapientia100
es de 6.88. Es decir, en la compañía A el sueldo medio es el menos represen-
tativo de los datos.
b) Las dos distribuciones de datos tienen el mismo índice de Gini: 0.361538. Por
tanto, en las dos hay igual concentración.
A continuación se puede ver la representación de la curva de Lorenz para los dos casos:
Como se puede observar en el gráfico, las dos curvas de Lorenz se cruzan, por lo
que, pese a tener distribuciones diferentes la concentración es la misma.
Ejercicio 9
P. Juan Verdoy / M. J. Beltrán / M. J. Peris - ISBN: 978-84-15444-38-1 66 Problemas resueltos de estadística aplicada a las ciencias sociales - UJI - DOI: http://dx.doi.org/10.6035/Sapientia100
a) Representa sobre los mismos ejes de coordenadas los datos de la distribu-
ción de la edad para las dos comunidades autónomas (emplea distinto trazo
o distintos colores). ¿Qué conclusiones obtienes a la vista del gráfico?
b) Calcula la edad media para las dos comunidades. Compáralas. ¿Qué indican
estos resultados?
c) ¿En qué comunidad las observaciones son más dispersas?
d) Si los datos de edades fueron: Aragón: 10, 10, 10, 10, 20, 30, 40, 30, 40, 50,
60, 40, 40, 40, 60, 70, 80, 70, 80, 90 , 70, 50, 40, 90. Canarias: 20, 30, 40,
40, 140, 50, 40, 30, 40, 30, 50, 60, 40, 30, 30, 40, 30, 40, 30, 40 , 30, 50, 60,
70. Obten un gráfico que muestre la dispersión de los datos.
Solución
a) Se representan los dos conjuntos de datos teniendo en cuenta que los interva-
los no tienen la misma amplitud y, por tanto, hay que calcular las densidades.
Podemos ver la diferencia representándolos, tal y como aparecen los datos y
la densidad, que será lo correcto:
P. Juan Verdoy / M. J. Beltrán / M. J. Peris - ISBN: 978-84-15444-38-1 67 Problemas resueltos de estadística aplicada a las ciencias sociales - UJI - DOI: http://dx.doi.org/10.6035/Sapientia100
Claramente tenemos diferencias utilizando la densidad y aumenta la propor-
ción en la comunidad de Aragón respecto a la de Canarias de gente de mayor
edad.
c) Para saberlo, hay que calcular los coeficientes de variación en ambos con-
juntos de observaciones: CV Aragón = 40,75 %, CV Canarias = 42,56 %.
c) Lo que deberemos obtener es el gráfico de cajas y bigotes para las dos varia-
bles, siendo 1 = Aragón y 2 = Canarias:
La dispersión es major en Aragón que en Canarias.
P. Juan Verdoy / M. J. Beltrán / M. J. Peris - ISBN: 978-84-15444-38-1 68 Problemas resueltos de estadística aplicada a las ciencias sociales - UJI - DOI: http://dx.doi.org/10.6035/Sapientia100
Unidad 2
Estadística descriptiva
bivariante
P. Juan Verdoy / M. J. Beltrán / M. J. Peris - ISBN: 978-84-15444-38-1 69 Problemas resueltos de estadística aplicada a las ciencias sociales - UJI - DOI: http://dx.doi.org/10.6035/Sapientia100
Introdución teórica
Normalmente, en cualquier investigación no se estudia una única variable de los
individuos que forman la muestra (referencias bibliográficas 1, 5, 9, 12 y 16), sino
que en muchas ocasiones son más. Así, si se desea estudiar el rendimiento de los
trabajadores de una empresa, de cada trabajador puede ser útil conocer la edad, el
sueldo, el nivel de estudios, las horas que trabaja, el número de personas que tiene
a su cargo, etc. Es decir, para cada individuo de la muestra se obtiene un vector
o registro en el que cada componente es el valor de una de las variables sujetas a
estudio; en el ejemplo que se está considerando un vector asociado a un individuo
sería:
Este hecho origina que el investigador se plantee, además del estudio individuali-
zado de cada una de las variables, el estudio conjunto de todas o de algunas ellas.
De esta manera es posible conocer si existe algún tipo de relación funcional o es-
tadística entre las variables. Así, las observaciones pueden manifestar que aquellas
personas con más titulación tienen más personas a su cargo, o que a medida que
va aumentando la edad de los trabajadores también lo hace el sueldo. Además, si
esta relación existe puede que se pueda encontrar una «fórmula matemática» que
relacione formalmente las variables.
{(x1, y1), (x1, y1),..., (x2, y1), (x2, y1),..., (xi, yj),..., (xi, yj),..., (xh, yk),..., (xh, yk)}
P. Juan Verdoy / M. J. Beltrán / M. J. Peris - ISBN: 978-84-15444-38-1 71 Problemas resueltos de estadística aplicada a las ciencias sociales - UJI - DOI: http://dx.doi.org/10.6035/Sapientia100
En los datos, cada observación se repite un número de veces determinado. Así, una
primera manera de representar el conjunto de datos es mediante la terna siguiente:
en la que:
Por otra parte, es evidente que tener trescientos pares ordenados de observaciones
aclara bien poco la información. No es posible observar casi nada. En consecuen-
cia, es necesario representar los datos de manera que sean más comprensibles y fa-
cilitan el estudio. La manera de hacerlo es mediante tablas (tabla 1).
Tabla 1
X Y nij
x1 y1 n11
... … …
xi yj nij
. . .
. xh yk nhk
Para construir esta tabla ordenamos una de las variables, por ejemplo X, y vamos
asociándole el valor correspondiente de la variable Y, así como su frecuencia ab-
soluta conjunta. Si los datos fueran agrupados en intervalos, entonces la represen-
tación mediante esta tabla se realiza de forma similar. En ocasiones se utilizará la
marca de la clase como representación del intervalo.
Esta tabla presenta y ordena los datos, sin embargo, en algunas ocasiones no es la
tabla más adecuada y hay que construir la tabla de doble entrada o de contingencia.
Ejemplo 1
P. Juan Verdoy / M. J. Beltrán / M. J. Peris - ISBN: 978-84-15444-38-1 72 Problemas resueltos de estadística aplicada a las ciencias sociales - UJI - DOI: http://dx.doi.org/10.6035/Sapientia100
En 1999, los residentes de un pequeño pueblo estaban preocupados por el incre-
mento del coste de la vivienda en la zona. El alcalde consideraba que los precios
de la vivienda fluctuaban con los precios de los solares. Los costes de los terrenos
y los de las viviendas (en miles de euros) sobre los que se construyeron las casas
son los siguientes:
X Y ni,j
3,7 54 3
3,8 36 4
5,5 60 2
5,9 58 2
6,9 63 2
7 67 2
7 67,15 1
8,9 76 4
9,6 87 4
9,9 89 3
10 92 2
Como se puede apreciar, los datos recogidos en la tabla anterior aportan poca in-
formación Se construyó, ya que no hay muchos pares diferentes, la tabla con las
tres columnas. Se supondrá:
P. Juan Verdoy / M. J. Beltrán / M. J. Peris - ISBN: 978-84-15444-38-1 73 Problemas resueltos de estadística aplicada a las ciencias sociales - UJI - DOI: http://dx.doi.org/10.6035/Sapientia100
Tabla 2
Y
y1 y2 ..... yj ….. yk ni.
X
.. . . . .
n. j n. 1 n. 2 n. j … n. k n
En la primera fila se sitúan las diferentes categorías o valores que toma una de las
componentes, y en la primera columna los valores o las categorías relativas a la
segunda (si es posible, ordenadas tanto la fila como la columna). De esta forma,
cualquier número que aparece en una celda interior de la tabla de doble entrada
es la frecuencia absoluta conjunta del dato bivariante, formado por los valores
correspondientes ubicados en las correspondientes fila y columna. En algunas oca-
siones también se suele representar en cada celda la frecuencia relativa conjunta,
además de la absoluta.
Por otra parte, los valores que aparecen en la última columna y la última fila co-
rresponden a las frecuencias absolutas de los valores de las variables de la primera
columna y la primera fila respectivamente. Así, ni. representa la frecuencia abso-
luta del valor de la variable X, xi.
P. Juan Verdoy / M. J. Beltrán / M. J. Peris - ISBN: 978-84-15444-38-1 74 Problemas resueltos de estadística aplicada a las ciencias sociales - UJI - DOI: http://dx.doi.org/10.6035/Sapientia100
Ejemplo 2
Con los mismos datos que en el ejemplo 1 anterior, la tabla de doble entrada queda:
Y
36 54 58 60 63 67 67,15 76 87 89 92 ni.
X
3,7 3 3
3,8 4 4
5,5 2 2
5,9 2 2
6,9 2 2
7 2 1 3
8,9 4 4
9,6 4 4
9,9 3 3
10 2 2
n. j 4 3 2 2 2 2 1 4 4 3 2 29
Las celdas vacías representan unas frecuencias absolutas conjuntas iguales a cero.
Del mismo modo que ocurría con las distribuciones de datos unidimensionales, las
representaciones gráficas facilitan la comprensión de la distribución con tan solo
un vistazo.
P. Juan Verdoy / M. J. Beltrán / M. J. Peris - ISBN: 978-84-15444-38-1 75 Problemas resueltos de estadística aplicada a las ciencias sociales - UJI - DOI: http://dx.doi.org/10.6035/Sapientia100
Ejemplo 3
Con los datos del ejemplo 1 que se está considerando relativo al valor del terreno
y el costo de la vivienda, la nube de puntos es:
Distribuciones marginales
Si las variables X y Y son no agrupadas o cualitativas, la distribución marginal
de X se obtiene de la tabla de doble entrada adjuntando a cada uno de los valores
x1 , x 2 ,......., x h de la variable estadística X, sus frecuencias absolutas, que vienen
dadas en el ultima columna de la tabla. Asimismo, se obtiene la distribución mar-
ginal de Y. En este caso los valores de la variable y1 , y 2 ,......., y k y sus frecuencias
absolutas aparecen en la primera y la última fila respectivamente. Si las variables
fueran agrupadas en intervalos, se realiza el mismo procedimiento tomando la
marca de la clase como representante del intervalo, y por tanto, como valor de la va-
riable estadística. Hay que decir que cada distribución marginal puede ser tratada
estadísticamente como una variable unidimensional.
P. Juan Verdoy / M. J. Beltrán / M. J. Peris - ISBN: 978-84-15444-38-1 76 Problemas resueltos de estadística aplicada a las ciencias sociales - UJI - DOI: http://dx.doi.org/10.6035/Sapientia100
Ejemplo 4
36 4 3,7 3
54 3 3,8 4
58 2 5,5 2
60 2 5,9 2
63 2 6,9 2
67 2 7 3
67,15 1 8,9 4
76 4 9,6 4
87 4 9,9 3
89 3 10 2
92 2 29
29
Distribuciones condicionadas
De la tabla de doble entrada, también es posible obtener, además de las distribu-
ciones marginales, otras distribuciones. Si se asocia a los valores de Y las frecuen-
cias correspondientes a la fila en la que está ubicado el valor xi de X, resulta la
distribución condicionada de Y a xi (distribución de la variable Y ). Análo-
X = xi
gamente, pero teniendo presente las columnas en lugar de las filas, se obtendría la
distribución de X condicionada a yj de Y, (distribución de la variable X ).
Y = yj
Ejemplo 5
P. Juan Verdoy / M. J. Beltrán / M. J. Peris - ISBN: 978-84-15444-38-1 77 Problemas resueltos de estadística aplicada a las ciencias sociales - UJI - DOI: http://dx.doi.org/10.6035/Sapientia100
Distribución condicionada: Precio solar 7000 €
Y n. j
X =7
67 2
67,15 1
Correlación lineal
Cuando se estudian dos variables estadísticas conjuntamente, es importante saber
si hay algún tipo de relación entre ellas. Así, si se recogieran trescientos datos en
que la primera variable fuera la altura de una persona y la segunda, el resultado
de lanzar un dado, seguramente la intuición diría que las dos variables no tienen
ningún tipo de relación entre sí. Si por el contrario, se consideraran las variables
horas extra que trabaja una persona y el sueldo que cobra mensualmente, la rela-
ción cambiaría hasta el punto de conocer el sueldo de un individuo si se supiera
las horas extras que hace. Se podría decir que las dos variables están ligadas por
una relación funcional. Sin embargo, si se consideran las variables horas de pre-
paración de un examen y nota obtenida, la intuición establecería que sí hay alguna
relación entre ambas variables, siendo mucho más fuerte en el primer caso, pero
más débil que en el segundo.
Como es evidente, las relaciones funcionales gozan de una fórmula que demues-
tra el tipo de relación. Por el contrario, para el resto de pares de variables no hay
ninguna fórmula absoluta, a pesar de los lazos que existen en algunos casos. Para
evidenciarlo surge el concepto de correlación, y el coeficiente de correlación rxy.
Así, si dos variables tienen un relación muy fuerte, el valor absoluto de la correla-
ción será muy próximo a 1 y en caso contrario será próximo al cero. Los casos 0 y
1 equivalen a no tener ningún tipo de relación y a tener una relación funcional. El
vector siguiente lo resume:
Cuando el tipo de relación funcional que se estudia entre las variables es una fun-
ción lineal (una función del tipo y = ax + b), se habla de correlación lineal. A lo
largo de la unidad, cuando se mencione el término correlación se considerará la
correlación lineal, si no se explicita otra cosa.
Una primera manera de observar la relación existente entre las variables X y Y son
los gráficos de dispersión. Así, teniendo en cuenta lo expuesto al comienzo de este
punto sobre la correlación:
P. Juan Verdoy / M. J. Beltrán / M. J. Peris - ISBN: 978-84-15444-38-1 78 Problemas resueltos de estadística aplicada a las ciencias sociales - UJI - DOI: http://dx.doi.org/10.6035/Sapientia100
núvol
nube dedepuntos
punts núvoldedepuntos
nube punts
10 30
8 25
Variable Y
Variable YY
Variable Y
20
Variable
6
15
4
10
2 5
0 0
0 10 20 30 40 0 2 4 6 8 10
Variable
Variable XX Variable
Variable XX
a) No existe correlación b) Correlación lineal positiva marcada
nube dedepuntos
núvol punts nube
núvoldedepuntos
punts
26 26
21 21
Y
Variable Y
Variable Y
Variable Y
16 16
Variable
11 11
6 6
1 1
-4 -4
0 2 4 6 8 10 0 2 4 6 8 10
Variable
Variable XX Variable
Variable XX
c) Correlación lineal positiva perfecta d) Correlación lineal negativa marcada
nube de depuntos
núvol punts nube Núvol
dedepuntos
punts
27 1,004
24 1
Variable Y
Variable Y
Variable Y
Variable Y
21 0,996
18 0,992
15 0,988
12 0,984
9 0,98
0 2 4 6 8 10 -10 -6 -2 2 6 10
Variable
Variable XX Variable
Variable X X
e) Correlación lineal negativa perfecta f) Correlación no lineal entre X i Y
Como se puede observar, en el ejemplo e) se detecta una relación entre las varia-
bles X y Y. Sin embargo, es evidente que no se trata de una relación lineal; pues
estos tipos de relaciones determinan una nube de puntos similares a una línea rec-
ta. (Ejemplos b, c, d y e). En el ejemplo a), no se distingue ningún tipo de vínculo
entre ambas variables; los puntos están muy dispersos.
P. Juan Verdoy / M. J. Beltrán / M. J. Peris - ISBN: 978-84-15444-38-1 79 Problemas resueltos de estadística aplicada a las ciencias sociales - UJI - DOI: http://dx.doi.org/10.6035/Sapientia100
Covarianza
El gráfico es una primera aproximación al estudio de la relación que existe entre
las variables, pero únicamente aporta información de tipo intuitivo. El concepto
que es necesario definir para poder decidir si hay o no relación lineal entre dos va-
riables es el de correlación lineal. En primer lugar, debemos introducir el concepto
de covarianza.
h k
(xi − X)(y j −Y )·ni j
SXY = ∑∑
i=1 j=1 n
• Si SXY > 0 ==> dependencia lineal directa (positiva), es decir a grandes valo-
res de X corresponden grandes valores de Y (ejemplos b) y c).
• Si SXY > 0 ==> incorrelacionadas, es decir no hay relación lineal (ejemplos
a) y f).
• Si SXY > 0 ==> dependencia lineal inversa o negativa, es decir a grandes va-
lores de X corresponden pequeños valores de Y (ejemplos d) y e).
Ejemplo 6
h k
(xi − X)(y j −Y )·ni j 10 11
(xi − 7,1586)(y j − 68,0052)·ni j
SXY = ∑∑ = ∑∑ = 42,1527 €
i=1 j=1 n i=1 j=1 29
P. Juan Verdoy / M. J. Beltrán / M. J. Peris - ISBN: 978-84-15444-38-1 80 Problemas resueltos de estadística aplicada a las ciencias sociales - UJI - DOI: http://dx.doi.org/10.6035/Sapientia100
Propiedades de la covarianza
S a · X b · Y = a · b Sxy
Cálculo de la covarianza
Ejemplo 7
60 2 1 0 3
70 2 4 2 8
80 1 1 4 6
90 0 2 1 3
5 8 7 20
P. Juan Verdoy / M. J. Beltrán / M. J. Peris - ISBN: 978-84-15444-38-1 81 Problemas resueltos de estadística aplicada a las ciencias sociales - UJI - DOI: http://dx.doi.org/10.6035/Sapientia100
En primer lugar se calculará la media aritmética de cada variable marginal:
X = 74,5 y Y = 1,71
h k
xi y j ·ni j
En segundo lugar, hay que calcular el primer sumando deSXY,
n
. Por ∑∑
i=1 j=1
ello, es necesario calcular primero los productos, sumarlos todos y luego dividir el
resultado por el número total de datos:
70 * 1,8 * 2 = 252 h k
xi y j ·ni j 2554
80 * 1,6 * 1 = 128 ∑∑ n
=
i=1 j=1 20
80 * 1,7 * 1 = 136 h k
xi y j ·ni j
80 * 1,8 * 4 = 576 Sxy = ∑∑ – X·Y=
i=1 j=1 n
90 * 1,7 * 2 = 306
90 * 1,8 * 1 = 162 2554
= – 74,5 · 1,71 =
20
TOTAL SUMA = 2554
= 127,7 – 127,395 = 0,305
Correlación lineal
La covarianza permite discernir si dos variables X y Y tienen una relación positi-
va, negativa o cero, pero no aporta información del grado de dependencia de una
variable respecto a la otra (referencias bibliográficas 6, 10 y 17). Además, la cova-
rianza depende de las unidades de medida empleadas para X y Y –si, por ejemplo,
X se mide en m3 y Y en mm3, cada desviación de X aumenta Sxy 109 veces–. Para
hacer frente a estas dos dificultades se define el concepto ya introducido anterior-
mente de correlación lineal rxy:
S XY
rxy = siendo Sx y Sy las desviaciones típicas de X y Y.
S X · SY
Es evidente que, por definición, el coeficiente de correlación lineal informa de las
mismas cosas que lo hace la covarianza. Además, cumple una propiedad muy im-
portante, está acotado por 1 y por –1. Así pues rxy , se caracteriza por:
P. Juan Verdoy / M. J. Beltrán / M. J. Peris - ISBN: 978-84-15444-38-1 82 Problemas resueltos de estadística aplicada a las ciencias sociales - UJI - DOI: http://dx.doi.org/10.6035/Sapientia100
Ejemplo 8
nube
núvoldedepuntos
punts
nube
núvolde
de puntos
punts
30
10
25
Variable Y
8
Variable Y
20
6
15
4 10
2 5
0 0
0 10 20 30 40 0 2 4 6 8 10
Variable X Variable X
En los diagramas anteriores se puede observar como en el de la derecha, una línea rec-
ta puede aproximarse a casi todos los puntos, mientras que en el otro, cualquier recta
deja muchos puntos alejados de ella. Así, hacer un análisis de regresión lineal solo
estaría justificado en el ejemplo de la derecha.
Como se puede ver en ambos diagramas, ninguna recta es capaz de pasar por to-
dos los puntos. De todas las rectas posibles, la recta de regresión de Y sobre X es
aquella que minimiza «el error de aproximación», considerando X como variable
explicativa o independiente y Y como la explicada o dependiente. Pero ¿cómo se
calcula la recta y se minimiza el error?
P. Juan Verdoy / M. J. Beltrán / M. J. Peris - ISBN: 978-84-15444-38-1 83 Problemas resueltos de estadística aplicada a las ciencias sociales - UJI - DOI: http://dx.doi.org/10.6035/Sapientia100
nube de puntos
Valor
estimado
Valor
real
s xy s xy
a y x b
s x2 y s x2
NOTA: No hay que olvidar que si se conocen los datos también se conocen los
términos:
y , x , S xy , S x2
, y por tanto a y b serán números reales en el momento
que se produzcan las sustituciones.
P. Juan Verdoy / M. J. Beltrán / M. J. Peris - ISBN: 978-84-15444-38-1 84 Problemas resueltos de estadística aplicada a las ciencias sociales - UJI - DOI: http://dx.doi.org/10.6035/Sapientia100
Si se hubiera tomado Y como variable independiente o explicativa, y X como
dependiente o explicada, la recta de regresión que se necesita es la que minimiza
errores de la X. Se llama recta de regresión de X sobre Y y se calcula fácilmente
permutando los puestos de x e y, obteniéndose:
s xy
xx y y
s 2y
Ejemplo 9
Por los estudios realizados a lo largo de la unidad se sabe que la relación es directa,
pues la covarianza es positiva. Como la correlación obtenida ha sido un número
cercano a 1, la relación lineal entre las dos variables es importante. Por tanto, el
cálculo de la recta de regresión tiene sentido. Para calcularla, se utilizará la última
expresión:
SXY S 42,1527
y −Y = ·(x − X) . Así, XY2 = y la recta será:
SX2
SX 5,8768
42,1527
y – 7,1586 = (x – 68,0052), y aislando la variable y, la recta y = 16,6583 +
7,17274 x. 5,8768
Por lo tanto:
P. Juan Verdoy / M. J. Beltrán / M. J. Peris - ISBN: 978-84-15444-38-1 85 Problemas resueltos de estadística aplicada a las ciencias sociales - UJI - DOI: http://dx.doi.org/10.6035/Sapientia100
Así:
h k
nij 2 h k * * 2 nij h k
* 2 nij 2
h k
n
Sr2 = ∑∑ (y*j − y* )2 Sr = ∑∑ (y j − y i) S 2
y e ∑∑ j
= (y i − y j ) Se = ∑ ∑ (y j − y*j )2 ij
i=1 j=1 n i=1 j=1 n i=1 j=1 n i=1 j=1 n
S Y2 = S r2 + S e2
Así pues, de la relación se deduce que cuanto mayor sea la varianza explicada por
la regresión lineal ( S r2 ) respecto de la varianza total, menor será la variabilidad del
error de ajuste ( S e2 ) y mejor será la bondad del ajuste.
S r2 S e2
Si ahora se divide la expresión anterior para S , se obtiene: 1 = 2 + 2 2
Y
SY SY
Sr2 Se2
R2= = 1− (En tanto por uno)
SY2 SY2
SR2 SXY 2
Por otra parte, en una regresión lineal se puede demostrar que R2 = =
Sy2 Sx2 Sy2
que evidentemente coincide con el cuadrado del coeficiente de correlación lineal y
justifica todas las propiedades antes mencionadas de ambos coeficientes.
rxy2 = R2
P. Juan Verdoy / M. J. Beltrán / M. J. Peris - ISBN: 978-84-15444-38-1 86 Problemas resueltos de estadística aplicada a las ciencias sociales - UJI - DOI: http://dx.doi.org/10.6035/Sapientia100
Predicciones. Usos y abusos
El primer objetivo de la regresión lineal era poner de manifiesto la relación exis-
tente entre dos variables estadísticas. Una vez se constata que la hay, y se calcula la
recta de regresión apropiada, esta se puede usar para obtener valores de la variable
explicada, a partir de valores de la variable explicativa.
Por ejemplo, si se comprueba una buena correlación lineal entre las variables X =
«horas de estudio semanal» y Y = «nota del examen», con una recta de regresión
(de Y sobre X) igual a Y = 0.9 + 0.6 x se puede plantear la siguiente pregunta:
¿Qué nota puede obtener (según los datos) un alumno que estudia 10 horas sema-
nales?
P. Juan Verdoy / M. J. Beltrán / M. J. Peris - ISBN: 978-84-15444-38-1 87 Problemas resueltos de estadística aplicada a las ciencias sociales - UJI - DOI: http://dx.doi.org/10.6035/Sapientia100
Objetivos
Los problemas deben permitir que los alumnos alcancen los objetivos didácticos:
La tabla siguiente nos muestra cómo están distribuidos los objetivos según los
Ejercicios:
EJERCICIOS
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19
2a X X X X
2b X X X X
2c X X X
2d X X
2e X X X X X X X X X X X X
OBJETIVOS
2f X X X X X X X X X
2g X X X X X X X X X
P. Juan Verdoy / M. J. Beltrán / M. J. Peris - ISBN: 978-84-15444-38-1 88 Problemas resueltos de estadística aplicada a las ciencias sociales - UJI - DOI: http://dx.doi.org/10.6035/Sapientia100
Enunciados
Ejercicio 1
Formación 8 9 4 5 6 7 7 9 10 7 5 6 7
Idiomas 8 8 3 5 7 7 8 10 10 7 6 7 8
Formación 8 5 8 9 8 8 7 7 9 9 8 7
Idiomas 7 5 8 8 7 8 7 7 8 10 8 8
P. Juan Verdoy / M. J. Beltrán / M. J. Peris - ISBN: 978-84-15444-38-1 89 Problemas resueltos de estadística aplicada a las ciencias sociales - UJI - DOI: http://dx.doi.org/10.6035/Sapientia100
Ejercicio 2
Una empresa quiere abrir un punto de venta en un barrio de una gran ciudad de
la Comunidad Valenciana. Como el segmento de población al que va dirigido el
producto es a personas de edades comprendidas entre 45 y 55 años, ha decidido
encuestar a una muestra de 50 vecinos del barrio cuya edad está en esta franja. La
tabla siguiente muestra dos de las preguntas que aparecían en la encuesta: edad e
ingresos mensuales en miles de euros.
Edad 50 51 53 50 51 48 50 49 52 52 49 50 52 51 52 49 50
Ingresos
3.2 4.1 4.5 3 3.6 2.9 3.8 3.8 3.6 3.9 3 3.8 4.1 3.5 4.0 3.1 3.1
mensuales
Edad 51 50 51 52 53 52 52 51 50 51 54 50 51 51 51 52 51
Ingresos
4.3 3.3 3.9 3.7 4.1 4.2 3.5 3.8 3.6 3.4 4.6 3.5 3.6 3.1 4 3.8 4.2
mensuales
Edad 52 51 50 51 49 51 48 50 52 53 52 50 52 51 51 51
Ingresos
4 4.4 3.9 3.7 3.4 3.3 2.7 3.4 3.6 4.4 4.3 3.3 4.2 4.2 3.3 3.7
mensuales
P. Juan Verdoy / M. J. Beltrán / M. J. Peris - ISBN: 978-84-15444-38-1 90 Problemas resueltos de estadística aplicada a las ciencias sociales - UJI - DOI: http://dx.doi.org/10.6035/Sapientia100
Ejercicio 3
El Departamento de Recursos Humanos de una empresa ha decidido realizar dos
tests para seleccionar a las personas que deberán hacerse cargo de un proyecto de
innovación. Las notas obtenidas por los aspirantes se muestran en la siguiente tabla:
TEST 1 7 6 5 4 5 8 7 8 9 6 5 8 6 8 7 8 7 6 6 9
TEST 2 8 7 6 6 7 10 9 9 10 8 6 10 8 9 8 8 7 8 6 8
Ejercicio 4
La siguiente tabla muestra el número de personas ocupadas distribuidas atendiendo
al sueldo neto de la actividad principal que desarrollan (en centenas de euro) y la edad
en el año 2010, según datos recogidos del Ministerio de Trabajo y de Inmigración.12
SUELDO
P. Juan Verdoy / M. J. Beltrán / M. J. Peris - ISBN: 978-84-15444-38-1 91 Problemas resueltos de estadística aplicada a las ciencias sociales - UJI - DOI: http://dx.doi.org/10.6035/Sapientia100
2c) Distinguir gráfica y analíticamente
si las dos variables de una distri-
bución de datos bidimensional tie-
nen relación lineal.
Ejercicio 5
La siguiente tabla muestra la población en edad de trabajar analfabeta en la Comu-
nidad Valenciana, Madrid, Andalucía y el País Vasco a lo largo de los años 2000-
2010 en miles de personas.
2000 2001 2002 2003 2004 2005 2006 2007 2008 2009 2010
Andalucía 332,28 280,99 342,14 307,41 294,91 247,90 262,25 278,03 294,34 290,37 279,91
Madrid 73,15 58,88 74,06 83,33 71,83 47,35 43,35 40,34 46,68 56,98 72,21
País Vasco 17,69 13,77 14,67 12,56 13,27 9,37 11,34 12,50 13,66 14,23 11,10
C. Valenciana 128,01 96,83 110,81 117,30 114,73 69,46 79,91 79,01 92,45 99,06 85,76
Fuente: ine
a) Representa la nube de puntos entre las variables: Población analfabeta en
edad de trabajar en Andalucía y Población en edad de trabajar en la Comuni-
dad Valenciana. ¿Qué observas en cuanto a la existencia o no de la relación
lineal entre las dos variables?
b) Representa la nube de puntos entre las variables: Población analfabeta en edad
de trabajar en la Comunidad de Madrid y en el País Vasco. ¿Qué observas en
cuanto a la existencia o no de la relación lineal entre las dos variables?
c) Calcula el estadístico adecuado para confirmar las suposiciones que has he-
cho en los dos apartados anteriores.
Ejercicio 6
Se recogieron los valores mensuales de los gastos en publicidad de una compañía
ferroviaria y el número de pasajeros a lo largo de 15 meses. Los datos los muestra
la tabla:
Publicidad
10 12 8 17 10 15 10 14 19 10 11 13 16 10 12
(en miles )
Pasajeros
15 17 13 23 16 21 14 20 24 17 16 18 23 15 16
(en miles)
P. Juan Verdoy / M. J. Beltrán / M. J. Peris - ISBN: 978-84-15444-38-1 92 Problemas resueltos de estadística aplicada a las ciencias sociales - UJI - DOI: http://dx.doi.org/10.6035/Sapientia100
a) Calcula el gasto medio y el número medio de pasajeros.
b) Haz la nube de puntos y calcula la covarianza. ¿Es coherente el valor del
estadístico con la nube de puntos?
c) Si para los 15 meses posteriores se prevé que la inversión en publicidad de
cada mes aumente un 10 % respecto al mismo mes del período anterior, y
también se prevé que este hecho provocará un aumento del 8 % en el número
de pasajeros cada mes, ¿cuál será la covarianza en este segundo período?
Ejercicio 7
Una empresa ha realizado dos tests psicotécnicos a los 9 trabajadores de un depar-
tamento como parte del proceso de selección del nuevo director del departamento.
La siguiente tabla muestra los resultados obtenidos por los aspirantes:
TEST 1 5 7 6 9 3 1 2 4 6
TEST 2 6 5 8 6 4 2 1 3 7
a) Calcula la covarianza. ¿Existe algún tipo de relación lineal entre las dos
variables?
b) Ha habido un error en una pregunta de cada test y el tribunal decide aumentar
un 5 % la puntuación de cada participante. Calcula nuevamente la covarianza.
Ejercicio 8
Dados las siguientes nubes de puntos, contesta:
P. Juan Verdoy / M. J. Beltrán / M. J. Peris - ISBN: 978-84-15444-38-1 93 Problemas resueltos de estadística aplicada a las ciencias sociales - UJI - DOI: http://dx.doi.org/10.6035/Sapientia100
a) Asocia cada nube de puntos con el valor del coeficiente de correlación que
le corresponde entre estos valores: –0,9; 0,4; 0,95: –0,65; 0,1; 0,6. Razona
la respuesta.
b) Indica para cada nube de puntos el signo de la covarianza y di cuál es su
significado.
Ejercicio 9
La siguiente tabla muestra el gasto total promedio, el gasto medio en alimentos y
bebidas no alcohólicas y el gasto en vivienda, agua, electricidad, gas y otros com-
bustibles en euros, por número de personas que forman la unidad familiar en el año
2009,3 según datos del ine.
Número de miembros
1 2 3 4 5 6 o más
de la familia
Gastos
en vivienda, agua,
7493,88 8990,72 9205,13 9645,19 10114,49 9272,18
electricidad, gas y
otros combustibles
a) ¿Existe una fuerte relación lineal entre el número de miembros que viven en
un hogar y el gasto medio total? Razona la respuesta.
b) ¿Y entre el número de miembros que viven en un hogar y el gasto en vivien-
da, agua, electricidad, gas y otros combustibles? Razona la respuesta.
P. Juan Verdoy / M. J. Beltrán / M. J. Peris - ISBN: 978-84-15444-38-1 94 Problemas resueltos de estadística aplicada a las ciencias sociales - UJI - DOI: http://dx.doi.org/10.6035/Sapientia100
Ejercicio 10
El director de Recursos Humanos de una empresa ha realizado dos tests psicotéc-
nicos para seleccionar a las personas que deben trabajar en el Departamento de
Marketing. Se han presentado 9 personas y los resultados obtenidos en cada uno
de los tests han sido los siguientes:
TEST 1 175 181 192 211 235 255 275 286 292
TEST 2 169 185 202 219 240 266 295 329 357
Teniendo en cuenta los resultados de los tests, ¿crees que el director podría haber
eliminado uno de los dos tests para decidir los candidatos? Razona la respuesta.
Ejercicio 11
En una muestra de 150 empresas del sector de servicios se recogen datos sobre el
número de trabajadores de la empresa (X) y la facturación (Y) anual en millones
de euros. Los resultados se muestran resumidos en los siguientes estadísticos:
P. Juan Verdoy / M. J. Beltrán / M. J. Peris - ISBN: 978-84-15444-38-1 95 Problemas resueltos de estadística aplicada a las ciencias sociales - UJI - DOI: http://dx.doi.org/10.6035/Sapientia100
Ejercicio 12
Las dos tablas siguientes muestran el grado medio de satisfacción de los ocupados
según el trabajo que realizan por edad y por el nivel de estudios en 2010. Los datos
han sido extraídos del Ministerio de Trabajo e Inmigración.4
Hay que decir que la variable nivel de estudios ha sido convertida a numérica
discreta para ser graduable. Así, la equivalencia es: 1 = menos que Primarios;
2 = Primarios; 3 = Secundarios; 4 = Bachillerato; 5 = Formación Profesional y 6 =
Universitarios. Esta conversión se ha hecho a efectos didácticos:
a) Calcula el coeficiente de relación lineal de ambos pares de variables. ¿En
cuál de las dos convendría calcular la recta de regresión?
b) Calcula la recta de regresión del grado de satisfacción en función del nivel
de estudios.
Ejercicio 13
El grado medio de satisfacción medio de los ocupados, según el trabajo que reali-
zan por nivel de ingresos y por sexo en el año 2010, se muestra en la tabla siguien-
te. Los datos han sido extraídos del Ministerio de Trabajo e Inmigración.5
GRADO GRADO
NIVEL
DE SATISFACIÓN DE SATISFACIÓN
DE INGRESOS
HOMBRES MUJERES
[0,600) 6,19 7,253
[600,1000) 6,83 7,234
[1000,1200) 7,28 7,339
[1200,1600) 7,39 7,61
[1600,2100) 7,60 7,768
[2100,3000) 7,82 7,682
[3000,4000)5 7,925 7,499
4. En la tabla original el últímo intervalo es 55 años o más. Se ha cerrado el intervalo para poder hacer el ejercicio.
5. En la tabla original el últímo intervalo es 3000 euros o más. Se ha cerrado el intervalo para poder hacer el ejercicio.
P. Juan Verdoy / M. J. Beltrán / M. J. Peris - ISBN: 978-84-15444-38-1 96 Problemas resueltos de estadística aplicada a las ciencias sociales - UJI - DOI: http://dx.doi.org/10.6035/Sapientia100
a) Calcula el coeficiente de correlación lineal entre las variables Nivel de in-
gresos y Grado de satisfacción en los hombres y entre las variables Nivel
de ingresos y Grado de satisfacción en las mujeres. ¿Qué conclusiones se
pueden obtener?
b) Calcula la recta de regresión que explique el grado de satisfacción medio en
el trabajo de los hombres en función del nivel de ingresos.
Ejercicio 14
El número total de expedientes de regulación del trabajo a lo largo de los años
2001-2010, según los datos extraídos del Ministerio de Trabajo e Inmigración, son
los que se muestran en la tabla.
2001 2002 2003 2004 2005 2006 2007 2008 2009 2010
Alicante 139 169 224 268 292 180 164 393 939 679
Castellón 49 59 55 76 88 59 58 291 939 777
a) ¿Existe algún tipo de relación lineal entre las variables? ¿Es fuerte esta rela-
ción? Razona las respuestas.
b) Calcula la recta de regresión lineal que relaciona el número de expedientes
totales en Castellón en función de los de Alicante.
Ejercicio 15
La siguiente tabla muestra el número total de hipotecas firmadas, así como la tasa
de paro en España en el período 2004-2010, según datos extraídos del ine.
a) ¿Existe algún tipode relación lineal entre las variables? ¿Es fuerte esta rela-
ción? Razona las respuestas.
b) Calcula la recta de regresión lineal que relaciona el número hipotecas firma-
das en función de la tasa de desempleo.
P. Juan Verdoy / M. J. Beltrán / M. J. Peris - ISBN: 978-84-15444-38-1 97 Problemas resueltos de estadística aplicada a las ciencias sociales - UJI - DOI: http://dx.doi.org/10.6035/Sapientia100
Ejercicio 16
La siguiente tabla muestra el número de horas extraordinarias totales en miles
(remuneradas y no remuneradas) realizadas en el conjunto de España, así como
las tasas de paro desde el primer trimestre de 2008 hasta el último trimeste del año
2010. Los datos han sido extraídos del ine.
a) Halla, en su caso, las recta de regresión que explica el número de horas ex-
tras en función de la tasa de desempleo.
b) En el primer trimestre de 2009 la tasa de paro era del 17,36 %. Da una esti-
mación del número de horas extras en este trimestre, así como una medida
de su fiabilidad.
Ejercicio 17
El número total de expedientes de regulación del trabajo a lo largo de los años
2001-2010 en Cataluña y la Comunidad Valenciana, extraídos del Ministerio de
Trabajo e Inmigración, son las que se muestran en la tabla, a excepción de los da-
tos del año 2005 que se han omitido.
P. Juan Verdoy / M. J. Beltrán / M. J. Peris - ISBN: 978-84-15444-38-1 98 Problemas resueltos de estadística aplicada a las ciencias sociales - UJI - DOI: http://dx.doi.org/10.6035/Sapientia100
Comunidad
Año Cataluña
Valenciana
Se sabe que el número de expedientes en 2005 en Cataluña fue 512. Da una esti-
mación, si es conveniente, del número de expedientes en la Comunidad Valencia-
na así como una medida del ajuste.
Ejercicio 18
En un museo se desea estudiar la repercusión que tienen las quejas realizadas por los
visitantes y los ingresos. Para realizarlo, se observaron las dos variables a lo largo
de las últimas diez semanas. Las visitas están expresadas en decenas de asistentes.
Quejas 18 26 30 33 38 39 42 44 46 49
Visitas 107 105,5 105 104,4 104,3 104 103,7 103,4 103,1 103
Si la entrada al museo tiene un coste de 3,6 euros, estima los ingresos del museo si
en una semana se hubieran producido 43 quejas.
Ejercicio 19
La siguiente tabla muestra el número de personas ocupadas distribuidas atendiendo el
sueldo neto de la actividad principal que desarrollan (en centenas de euro) y el nivel
de estudios que tenían en 2010, según datos recogidos del Ministerio de Trabajo y de
Inmigración. Hay que decir, sin embargo, que la variable nivel de estudios ha sido
convertida a numérica discreta para ser graduable. Así, la equivalencia es: 1 = menos
que Primarios; 2 = Primarios; 3 = Secundarios; 4 = Bachillerato; 5 = Formación Pro-
fesional y 6 = Universitarios. Esta conversión se ha hecho a efectos didácticos.
P. Juan Verdoy / M. J. Beltrán / M. J. Peris - ISBN: 978-84-15444-38-1 99 Problemas resueltos de estadística aplicada a las ciencias sociales - UJI - DOI: http://dx.doi.org/10.6035/Sapientia100
SUELDO
Nivel de
[0, 6) [ 6,10) [10,12) [12,16) [16,21) [21,30) [30, 40)
estudios
1 8,75 21,67 15,00 7,93 5,65 0,74 1,56
2 293,18 790,92 601,61 472,64 92,82 56,30 3,77
3 538,08 1551,52 1226,20 1098,34 340,72 74,78 13,56
4 323,39 670,29 607,31 709,62 313,35 142,00 53,20
5 303,28 801,87 843,80 982,42 444,90 183,90 50,73
6 164,47 439,26 619,51 1155,75 1230,07 919,40 282,14
Ayudas
En este apartado se presentarán las ayudas para emplear en caso de ser necesario
a la hora de realizar los ejercicios y problemas. Es conveniente no hacer un abuso
excesivo de estas ayudas, es decir, antes de emplearlas hay que pensar el problema
al menos durante unos 10-15 minutos. Después se consultará la ayuda de tipo 1 y
se intentará resolver el ejercicio con esta ayuda. Si no es posible resolverlo, enton-
ces se consultará la ayuda de tipo 2, y en último término la solución.
Ayudas Tipo 1
Ejercicio 1
Consulta la introducción teórica.
Ejercicio 2
Consultar la introducción teórica. En el apartado e) nota que pide el porcentaje de
las personas encuestadas que tienen más de 51 años o unos ingresos de 4000 euros
o más. Hay que contar pues el número de personas que cumplen una condición o
la otra.
P. Juan Verdoy / M. J. Beltrán / M. J. Peris - ISBN: 978-84-15444-38-1 100 Problemas resueltos de estadística aplicada a las ciencias sociales - UJI - DOI: http://dx.doi.org/10.6035/Sapientia100
Ejercicio 3
Consulta la introducción teórica.
Ejercicio 4
Consulta la introducción teórica.
En el apartado c) debes tener presente que la variable que condiciona, en este caso
la edad, incluye más de un intervalo. Entonces hay que agrupar las frecuencias
conjuntas adecuadamente.
Ejercicio 5
Consulta la introducción teórica.
Ejercicio 6
Para hacer el gráfico tienes que seguir las indicaciones del ejercicio 5. Para afirmar
que el gráfico es coherente con el resultado de la covarianza debes fijarte en el
signo del estadístico.
Ejercicio 7
Consulta la introducción teórica.
Ejercicio 8
El coeficiente de correlación lineal informa de las mismas cosas que lo hace la
covarianza. Puedes consultar la introducción teórica para saber las propiedades.
P. Juan Verdoy / M. J. Beltrán / M. J. Peris - ISBN: 978-84-15444-38-1 101 Problemas resueltos de estadística aplicada a las ciencias sociales - UJI - DOI: http://dx.doi.org/10.6035/Sapientia100
Ejercicio 9
Hay que calcular un estadístico que mida el grado de relación lineal entre dos variables.
Ejercicio 10
El director podría haber eliminado una de las dos pruebas siempre y cuando las
dos discriminen a las mismas personas.
Ejercicio 11
El apartado a) es directo y para el resto de apartados hay que construir las funcio-
nes lineales que mejoran el ajuste. Para hacer las predicciones hay que sustituir las
valores de las variables explicativas en las fórmulas.
Ejercicio 12
Hay que hacer lo mismo que en el ejercicio 11 pero en este caso tienes que calcu-
lar los estadísticos a partir de los datos. Únicamente habrá que calcular la recta de
regresión que tenga un coeficiente de correlación superior a 0,8.
Ejercicio 13
Véase la ayuda del ejercicio 12.
Ejercicio 14
Para contestar la pregunta a) tienes que calcular el estadístico que informa sobre el
grado de relación lineal entre dos variables.
Ejercicio 15
Para contestar la pregunta a) tienes que calcular el estadístico que informa sobre el
grado de relación lineal entre dos variables.
P. Juan Verdoy / M. J. Beltrán / M. J. Peris - ISBN: 978-84-15444-38-1 102 Problemas resueltos de estadística aplicada a las ciencias sociales - UJI - DOI: http://dx.doi.org/10.6035/Sapientia100
Ejercicio 16
Únicamente cuando sea pertinente convendrá calcular la recta y hacer la predicción.
Ejercicio 17
Únicamente cuando sea pertinente convendrá calcular la recta y hacer la predicción.
Ejercicio 18
Debes tener en cuenta que los ingresos dependen completamente del número de
visitas. Es decir, si sabes un estimación de las visitas sabrás una estimación de los
ingresos.
Ejercicio 19
Para contestar la pregunta del apartado a) tienes que calcular el coeficiente de co-
rrelación. Utiliza la tabla para hacer los cálculos de los estadísticos y los productos
que se necesitan para calcular la covarianza.
Ayudas Tipo 2
Ejercicio 1
Para contestar la pregunta b) hay que construir la tabla de la distribución marginal,
y para la pregunta c), la tabla de la distribución condicionada:
Cursos de
formación
ni x i · ni X/(Y = 7) ni x i · ni
4 1 4 6 2 12
5 3 15 7 4 28
6 2 12 8 2 16
7 7 49 8 56
8 6 48
9 5 45
10 1 10
25 183
P. Juan Verdoy / M. J. Beltrán / M. J. Peris - ISBN: 978-84-15444-38-1 103 Problemas resueltos de estadística aplicada a las ciencias sociales - UJI - DOI: http://dx.doi.org/10.6035/Sapientia100
Para hacer los recuentos puedes ayudarte de la tabla de doble entrada:
Y = cursos de idiomas
3 5 6 7 8 10 ni.
4 1 1
5 2 1 3
X = cursos de formación
6 2 2
7 4 3 7
8 2 4 6
9 3 2 5
10 1 1
n.j 1 2 1 8 10 3 25
Ejercicio 2
En el apartado e) nota que pide el porcentaje de las personas encuestadas que tienen
más de 51 años o unos ingresos de 4000 € o más. Observa que este número pedido
es igual a: (encuestados que ingresan más de 4000) + (encuestados que tienen más
de 51 años) – (encuestados que tienen más de 51 años e ingresan más de 4000 €).
Ejercicio 3
Como es muy similar al ejercicio 1, consúltalo en sus ayudas.
Ejercicio 4
Muy similar al ejercicio 1. Consulta en las ayudas de este ejercicio. Calcula pre-
viamente las marcas de las clases de cada variable. En el apartado c) puedes utili-
zar la siguiente tabla:
P. Juan Verdoy / M. J. Beltrán / M. J. Peris - ISBN: 978-84-15444-38-1 104 Problemas resueltos de estadística aplicada a las ciencias sociales - UJI - DOI: http://dx.doi.org/10.6035/Sapientia100
Ejercicio 5
En el apartado c) has de calcular la covarianza.
Ejercicio 6
Para responder en el apartado c) debes aplicar la propiedad de la covarianza, te-
niendo en cuenta que hay que definir dos variables nuevas a partir de las dos ante-
riores: X’ = gastos en el segundo período y Y’ = número de pasajeros en el segundo
período. Según el enunciado X’ = 1,1 · X y Y’ = 1,08 · Y.
Ejercicio 7
Misma ayuda que en el ejercicio 6. En este caso las nuevas variables son: X’ = nota
del test 1 tras el aumento y Y’ = nota del test 2 después del aumento.
Según el enunciado X’ = 1,05 · X y Y’ = 1,058 · Y.
Ejercicio 8
Se remite a la ayuda de tipo 1 por ser lo suficientemente aclaratoria.
Ejercicio 9
Hay que calcular el coeficiente de correlación lineal.
Ejercicio 10
Hay una relación casi funcional entre las dos variables. El director podría haber
eliminado una de las dos pruebas siempre y cuando exista.
Ejercicio 11
Las funciones lineales que hay que calcular son las rectas de regresión. Para saber
la fiabilidad de las predicciones busca el coeficiente de determinación.
P. Juan Verdoy / M. J. Beltrán / M. J. Peris - ISBN: 978-84-15444-38-1 105 Problemas resueltos de estadística aplicada a las ciencias sociales - UJI - DOI: http://dx.doi.org/10.6035/Sapientia100
Ejercicio 12
Se remite a la ayuda de tipo 1 por ser lo suficientemente aclaratoria.
Ejercicio 13
Véase la ayuda del ejercicio 12.
Ejercicio 14
Para contestar la pregunta del apartado a) tienes que calcular el coeficiente de
correlación.
Ejercicio 15
Para contestar la pregunta del apartado a) tienes que calcular el coeficiente de co-
rrelación.
Ejercicio 16
Únicamente si el coeficiente de correlación es cercano a 1 o a –1 es pertinente
calcular la recta y hacer la predicción.
Ejercicio 17
Únicamente si el coeficiente de correlación es cercano a 1 o a –1 es pertinente
calcular la recta y hacer la predicción.
Ejercicio 18
Si existe tipo de relación lineal entre el número de quejas y el número de visitas,
entonces podremos encontrar la recta de regresión entre el número de visitas y el
de quejas y, con posterioridad, se podrán estimar los ingresos.
Ejercicio 19
Se remite a la ayuda de tipo 1 por ser lo suficientemente aclaratoria.
P. Juan Verdoy / M. J. Beltrán / M. J. Peris - ISBN: 978-84-15444-38-1 106 Problemas resueltos de estadística aplicada a las ciencias sociales - UJI - DOI: http://dx.doi.org/10.6035/Sapientia100
Soluciones
Ejercicio 1
Una empresa ha entrevistado a veinte y cinco de sus trabajadores con tareas ad-
ministrativas para conocer el grado de implicación en su formación profesional.
A cada uno se le preguntó el número de cursos de formación de más de 30 horas
y el número de cursos de perfeccionamiento de idiomas que había realizado en
los últimos tres años. Los resultados son los que se muestran en la tabla siguiente:
Formación
8 9 4 5 6 7 7 9 10 7 5 6 7
est
Idiomas
8 8 3 5 7 7 8 10 10 7 6 7 8
eco
Formación
8 5 8 9 8 8 7 7 9 9 8 7
est
Idiomas
7 5 8 8 7 8 7 7 8 10 8 8
eco
Solución
Para construir la tabla de doble entrada, en primer lugar, hay que ordenar los datos
de las dos variables de menor a mayor y construir una cuadrícula, por lo que en la
primera fila se sitúan las diferentes categorías o valores que toma una de las varia-
bles, y en la primera columna los valores o las categorías relativas a la segunda.
Así, el número que hay que asociar a cada celda de la tabla de doble entrada es la
frecuencia absoluta conjunta del dato bivariante, formada por los valores corres-
pondientes ubicados en la primera fila y en la primera columna.
P. Juan Verdoy / M. J. Beltrán / M. J. Peris - ISBN: 978-84-15444-38-1 107 Problemas resueltos de estadística aplicada a las ciencias sociales - UJI - DOI: http://dx.doi.org/10.6035/Sapientia100
En nuestro caso podemos representar en las filas la variable Cursos de formación
y en las columnas la variable Cursos de idiomas. Así pues:
Y = Cursos de idiomas
3 5 6 7 8 10 ni.
4 1 1
5 2 1 3
X = Cursos de formación
6 2 2
7 4 3 7
8 2 4 6
9 3 2 5
10 1 1
n.j 1 2 1 8 10 3 25
Para contestar estas preguntas hay que estudiar las dos distribuciones marginales;
X = Cursos de formación y Y = Cursos de idiomas. Es decir: variable Cursos de
formación en las filas y en las columnas la variable Cursos de idiomas. Así pues:
Cursos de Cursos de
ni x i · ni ni y i · ni
formación idiomas
4 1 4 3 1 3
5 3 15 5 2 10
6 2 12 6 1 6
7 7 49 7 8 56
8 6 48 8 10 80
9 5 45 10 3 30
10 1 10 25 185
25 183
183 185
x = = 7,32 cursos
cursos y= = 7, 4 cursos
cursos
25 25
P. Juan Verdoy / M. J. Beltrán / M. J. Peris - ISBN: 978-84-15444-38-1 108 Problemas resueltos de estadística aplicada a las ciencias sociales - UJI - DOI: http://dx.doi.org/10.6035/Sapientia100
En primer lugar, en este apartado, hay que construir la variable cursos de forma-
ción condicionada a que el valor de la variable cursos de idiomas es 7. Es decir,
hay que construir la variable X / (Y = 7). Extrayendo de la tabla este distribución
marginal:
X/(Y = 7) ni x i · ni
6 2 12 En consecuencia:
7 4 28
X 56
8 2 16 = = 7cursos
cursos
(Y = 7) 8
8 56
Y = Cursos de idiomas
3 5 6 7 8 10 ni.
4 1 1
5 2 1 3
X = Cursos de formación
6 2 2
7 4 3 7
8 2 4 6
9 3 2 5
10 1 1
n.j 1 2 1 8 10 3 25
17 0,68 68
Así pues, como hay 17, el porcentaje solicitado es = = , un 68 %.
25 1 100
De esta forma, se cuenta el número de personas que ha hecho más de 5 cursos de
formación, que son 17, lo que representa un 68 %. También podemos calcular fá-
cilmente el número de trabajadores que ha hecho más de 5 cursos de idiomas, que
son 18; los cuales representan un 72 %.
P. Juan Verdoy / M. J. Beltrán / M. J. Peris - ISBN: 978-84-15444-38-1 109 Problemas resueltos de estadística aplicada a las ciencias sociales - UJI - DOI: http://dx.doi.org/10.6035/Sapientia100
En este apartado hay que contar el número de trabajadores que cumplen ambas
condiciones. En este caso son 3 (las que aparecen en amarillo en el apartado d)).
Por tanto, el porcentaje es de 3 de 25, un 12 %.
f) ¿Qué porcentaje de los trabajadores que ha hecho cinco cursos o más de for-
mación, ha hecho siete o más cursos de idiomas?
En este apartado hay que observar que cambia la cantidad total sobre la que te-
nemos que hacer el porcentaje. Es decir, no se nos pide el porcentaje sobre los 25
datos, sino sobre los que han hecho cinco o más cursos de formación que son 24.
De estos hay 21 que han hecho 7 cursos o más de idiomas. En consecuencia, hay
un 87,5 %.
Ejercicio 2
Una empresa quiere abrir un punto de venta en un barrio de una gran ciudad de
la Comunidad Valenciana. Como el segmento de población al que va dirigido el
producto es a personas de edades comprendidas entre 45 y 55 años, ha decidido
encuestar a una muestra de 50 vecinos del barrio cuya edad está en esta franja. La
tabla siguiente muestra dos de las preguntas que aparecían en la encuesta: edad e
ingresos mensuales en miles de euros.
Edad 50 51 53 50 51 48 50 49 52 52 49 50 52 51 52 49 50
Ingresos
3.2 4.1 4.5 3 3.6 2.9 3.8 3.8 3.6 3.9 3 3.8 4.1 3.5 4.0 3.1 3.1
mensuales
Edad 51 50 51 52 53 52 52 51 50 51 54 50 51 51 51 52 51
Ingresos
4.3 3.3 3.9 3.7 4.1 4.2 3.5 3.8 3.6 3.4 4.6 3.5 3.6 3.1 4 3.8 4.2
mensuales
Edad 52 51 50 51 49 51 48 50 52 53 52 50 52 51 51 51
Ingresos
4 4.4 3.9 3.7 3.4 3.3 2.7 3.4 3.6 4.4 4.3 3.3 4.2 4.2 3.3 3.7
mensuales
P. Juan Verdoy / M. J. Beltrán / M. J. Peris - ISBN: 978-84-15444-38-1 110 Problemas resueltos de estadística aplicada a las ciencias sociales - UJI - DOI: http://dx.doi.org/10.6035/Sapientia100
d) ¿Qué porcentaje de los clientes ingresan mensualmente 4000 euros o más y
tienen más de 50 años?
e) ¿Qué porcentaje de las personas encuestadas tienen más de 51 años o unos
ingresos de 4000 euros o más?
Solución
En primer lugar, hay que construir los intervalos de la variable que debe estar agrupa-
da; en este caso los ingresos mensuales. Así pues, siguiendo las indicaciones que da
el enunciado, los intervalos son [2,5, 3); [2,5, 3); [3, 3,5); [3,5, 4,); [4, 4,5); [4,5, 5).
Siguiendo ahora las indicaciones del ejercicio anterior apartado a), podemos cons-
truir la tabla de doble entrada con las variables X = Ingresos mensuales y Y = Edad.
Y = Edad
48 49 50 51 52 53 54 ni.
X = Ingresos mensuales
[2,5 , 3) 2 2
[ 3, 3,5) 3 6 4 13
[3,5 , 4) 1 5 7 6 19
[4 , 4,5) 6 6 2 14
[ 4,5 , 5) 1 1 2
n.j 2 4 11 17 12 3 1 50
Hay que construir la variable Ingresos condicionada a que la edad sea de 51 años.
Es decir X / Y = 51. Además, como que la variable X está agrupada en intervalos
es necesario calcular las marcas de clase para obtener la media pedida. Así, la tabla
de frecuencias de esta variable es:
P. Juan Verdoy / M. J. Beltrán / M. J. Peris - ISBN: 978-84-15444-38-1 111 Problemas resueltos de estadística aplicada a las ciencias sociales - UJI - DOI: http://dx.doi.org/10.6035/Sapientia100
c) ¿Cuál es la media de edad de los encuestados que tienen unos ingresos entre
3500 y 4000 euros? ¿Qué porcentaje de estos tienen 50 o 51 años?
Ahora hay que construir la variable Edad condicionada a unos ingresos de entre 3500
y 4000 euros. Es decir, Y / (X = [3,5, 4)). La tabla de frecuencias de la variable es:
Y/X=[3,5 , 4) ni xi · ni
En consecuencia, la media será:
49 1 49
Y 968
= años
=50,95anys
50 5 250 (X = [3,5 , 4) 19
51 7 357
Por otra parte, hay 12 que tienen 50 o
52 6 312 51 años, lo que representa un 63,16 %.
n.j 19 968
Hay que hacer el recuento de las personas encuestadas que cumplen las dos con-
diciones que cita el enunciado. Las que se traducen en que deben ingresar más de
4000 euros (X > 4) y tener más de 50 años (Y > 50).
Revisando la tabla se observa que hay 16, los cuales representan el 32 % de los 50
encuestados.
Y = Edad
48 49 50 51 52 53 54 ni.
X = Ingresos mensuales
[2,5 , 3) 2 2
[ 3, 3,5) 3 6 4 13
[3,5 , 4) 1 5 7 6 19
[4 , 4,5) 6 6 2 14
[ 4,5 , 5) 1 1 2
n.j 2 4 11 17 12 3 1 50
P. Juan Verdoy / M. J. Beltrán / M. J. Peris - ISBN: 978-84-15444-38-1 112 Problemas resueltos de estadística aplicada a las ciencias sociales - UJI - DOI: http://dx.doi.org/10.6035/Sapientia100
Por tanto, el número de encuestados pedidos son: (encuestados que ingresan más
de 4000) + (encuestados que tienen más de 51 años) – (encuestados que tienen
más de 51 años e ingresan más de 4000 euros) = 16 + 16 – 10 = 22. Por lo tanto,
el porcentaje que representan respecto a 50 es el 44 %.
Ejercicio 3
TEST 1 7 6 5 4 5 8 7 8 9 6 5 8 6 8 7 8 7 6 6 9
TEST 2 8 7 6 6 7 10 9 9 10 8 6 10 8 9 8 8 7 8 6 8
Solución
Y = Test 1
X = Test 2 4 5 6 7 8 9 ni.
6 1 2 1 4
7 1 1 1 3
8 3 2 1 1 7
9 1 2 0 3
10 2 1 3
n.j 1 3 5 4 5 2 20
P. Juan Verdoy / M. J. Beltrán / M. J. Peris - ISBN: 978-84-15444-38-1 113 Problemas resueltos de estadística aplicada a las ciencias sociales - UJI - DOI: http://dx.doi.org/10.6035/Sapientia100
Y/X = 6 ni xi · ni
En consecuencia, la media será:
6 1 6
X 37
= 7, 4 punts.
puntos
=
7 1 7 (Y = 6) 5
8 3 24
n.j 5 37
Ejercicio 4
La siguiente tabla muestra el número de personas ocupadas distribuidas atendien-
do al sueldo neto de la actividad principal que desarrollan (en centenas de euro)
y la edad en el año 2010, según datos recogidos del Ministerio de Trabajo y de
Inmigración.67
SUELDO
6. En la tabla original el último intervalo es 3000 euros o más. Se ha cerrado el intervalo para hacer el ejercicio.
7. En la tabla original el último intervalo es 55 años o más. Se ha cerrado el intervalo para hacer el ejercicio.
P. Juan Verdoy / M. J. Beltrán / M. J. Peris - ISBN: 978-84-15444-38-1 114 Problemas resueltos de estadística aplicada a las ciencias sociales - UJI - DOI: http://dx.doi.org/10.6035/Sapientia100
e) ¿Qué porcentaje de personas ocupadas tiene años 45 o más o cobra 1600
euros o más?
f) ¿Qué porcentaje de ocupados tiene menos de 30 años de aquellos que cobran
1200 euros o más?
Solución
Edad ci ni c i · ni Sueldo ci ni c i · ni
[16,25) 20,5 1195,51 24507,955 [0, 6) 3 1597,37 4792,11
[25,30) 27,5 2132,91 58655,025 [ 6,10) 8 4168,89 33351,12
[30,45) 37,5 8345,88 312970,5 [10,12) 11 3878,42 42662,62
[45,55) 50 4438,96 221948 [12,16) 14 4439,03 62146,42
[55,65) 60 2343,11 140586,6 [16,21) 18,5 2510,89 46451,47
n.j 18456,37 758668,08 [21,30) 25,5 1433,18 36546,09
[30,40) 35 428,59 15000,65
18456,37 240950,5
758668,08 240950,5
x= = 41,12 años
anys y= = 13,06 milers€
miles €
18456,37 18456,37
P. Juan Verdoy / M. J. Beltrán / M. J. Peris - ISBN: 978-84-15444-38-1 115 Problemas resueltos de estadística aplicada a las ciencias sociales - UJI - DOI: http://dx.doi.org/10.6035/Sapientia100
X/(Y =
ci ni c i · ni
[1200,1600))
[16,25) 20,5 126,47 2592,635
Nótese que la variable que condiciona, en este caso la edad, incluye más de un
intervalo. Entonces hay que agrupar las frecuencias conjuntas adecuadamente:
Y/(X ≥ 30) ci ni c i · ni
[0, 6) 3 1075,03 3225,09
[ 6,10) 8 3004,77 24038,16 Y, por lo tanto, la media
[10,12) 11 3057,49 33632,39 aritmética será:
[12,16) 14 3882,4 54353,6
Y 208016,88
[16,21) 18,5 2280 42180 = =13, 751milers
miles €€
[21,30) 25,5 1410,68 35972,34
(X > 30 15127,95
[30,40) 35 417,58 14615,3
15127,95 208016,88
Hay que buscar el número de ocupados que cumpla las dos variables. Así, hay
–observando la tabla y sumando los números adecuados– 1967,56 miles. Lo que
representa un 10,66 %.
P. Juan Verdoy / M. J. Beltrán / M. J. Peris - ISBN: 978-84-15444-38-1 116 Problemas resueltos de estadística aplicada a las ciencias sociales - UJI - DOI: http://dx.doi.org/10.6035/Sapientia100
e) ¿Qué porcentaje de personas ocupadas tiene 45 años o más o cobra 1600
euros o más?
De la misma manera que en el apartado f ) del ejercicio 2, hay que contar los ocu-
pados que tienen 45 años o más (celdas con mayor tamaño) o cobran 1600 euros
o más (celdas rojas).
SUELDO
Del mismo modo que el ejercicio 2, el número de ocupados que cumplen las dos
condiciones son:
(45 años o más) + (1600 euros o más) – (45 años o más y 1600 euros o más)
En primer lugar, hay que saber cuántos ocupados cobran 1200 euros o más. Su-
mando los valores de la tabla se obtienen 8811,69 miles de personas (recuadro
rojo). De este defecto 821,03 (sombreado amarillo) tienen menos de 30 años. Por
lo tanto, el porcentaje pedido es el 9,32 %.
SUELDO
P. Juan Verdoy / M. J. Beltrán / M. J. Peris - ISBN: 978-84-15444-38-1 117 Problemas resueltos de estadística aplicada a las ciencias sociales - UJI - DOI: http://dx.doi.org/10.6035/Sapientia100
Ejercicio 5
La siguiente tabla muestra la población en edad de trabajar analfabeta en las co-
munidades Valenciana, Madrid, Andalucía y el País Vasco a lo largo de los años
2000-2010 en miles de personas.
2000 2001 2002 2003 2004 2005 2006 2007 2008 2009 2010
Andalucía 332,28 280,99 342,14 307,41 294,91 247,90 262,25 278,03 294,34 290,37 279,91
Madrid 73,15 58,88 74,06 83,33 71,83 47,35 43,35 40,34 46,68 56,98 72,21
País Vasco 17,69 13,77 14,67 12,56 13,27 9,37 11,34 12,50 13,66 14,23 11,10
C. Valenciana 128,01 96,83 110,81 117,30 114,73 69,46 79,91 79,01 92,45 99,06 85,76
Fuente: ine
Solución
P. Juan Verdoy / M. J. Beltrán / M. J. Peris - ISBN: 978-84-15444-38-1 118 Problemas resueltos de estadística aplicada a las ciencias sociales - UJI - DOI: http://dx.doi.org/10.6035/Sapientia100
Con lo que observa visualmente, parece haber una relación lineal positiva entre
las dos variables.
Se observa que también existe una relación lineal positiva, aunque en este caso no
parece tan claro porque la nube de puntos es más «ancha». Es decir, parece que
los datos no siguen un línea recta creciente con tanta claridad como en el apartado
anterior.
c) Calcula el estadístico adecuado para confirmar las suposiciones que has he-
cho en los dos apartados anteriores.
En los dos apartados anteriores hemos observado a partir del gráfico que existe una
relación lineal positiva entre las dos variables. El estadístico que permite contrastar
P. Juan Verdoy / M. J. Beltrán / M. J. Peris - ISBN: 978-84-15444-38-1 119 Problemas resueltos de estadística aplicada a las ciencias sociales - UJI - DOI: http://dx.doi.org/10.6035/Sapientia100
esta hipótesis es la covarianza. Si este estadístico tiene signo positivo entonces
existe relación lineal entre las dos variables y esta es positiva. Si por el contrario,
tiene signo negativo entonces también existe relación lineal, pero en este caso es
negativa. Si la covarianza es cero, entonces las dos variables no tienen relación
lineal.
h k
(xi − X)(y j −Y )·ni j
La expresión de la covarianza será: SXY = ∑∑ . Sin embargo,
n i=1 j=1
h k
xi y j ·ni j
SXY = ∑∑ − X ·Y
i=1 j=1 n
Así pues, hay que calcular las covarianzas de ambos pares de variables.
Como se observa en la fórmula, en primer lugar hay que calcular para cada varia-
ble sus medias aritméticas. Haciendo estos cálculos de la misma manera que en la
unidad 1 se obtienen los valores: X = 291,866 y Y = 60, 742 .
h k
xi y j ·ni j
En segundo lugar debemos calcular los sumatorios
n
. Como se ob- ∑∑
i=1 j=1
serva lo que hace falta es multiplicar cada valor de la variable X por su correspon-
diente de la variable Y y por su frecuencia conjunta. Luego hay que sumar todos
estos productos y dividirlos entre el número total de datos.
X 332,28 280,99 342,14 307,41 294,91 247,9 262,25 278,03 294,34 290,37 279,91
Y 73,15 58,88 74,06 83,33 71,83 47,35 43,35 40,34 46,68 56,98 72,21
xi · y j 24306,28 16544,69 25338,89 25616,48 21183,39 11738,07 11368,54 11215,73 13739,79 16545,28 20212,30
P. Juan Verdoy / M. J. Beltrán / M. J. Peris - ISBN: 978-84-15444-38-1 120 Problemas resueltos de estadística aplicada a las ciencias sociales - UJI - DOI: http://dx.doi.org/10.6035/Sapientia100
Así, sustituyendo la expresión anterior:
h k
xi y j ·ni j 24306,28 + 16544,69 + 25338,89 + 25616,48 + ...+ 16545,28 + 20212,30
∑∑ n
=
11
i=1 j=1
197809,430
= = 17982,675
11
Y por tanto:
h k
xi y j ·ni j
SXY = ∑∑ − X · Y = 17982,675 – 291,866 · 60,742 = 332,954.
i=1 j=1 n
Como la covarianza nos queda positiva, también existe relación lineal positiva. Se
concluye pues que el gráfico y el estadístico están en concordancia.
Hay que hacer exactamente lo mismo, pero ahora considerando X = activos y anal-
fabetos en el País Vasco y para Y = activos y analfabetos en Madrid. Calculado las
medias para cada variable: X = 13,105 y Y = 60, 742 .
h k
xi y j ·ni j
Calculamos ahora ∑∑ n
tal y como está hecho con anterioridad:
i=1 j=1
X 17,69 13,77 14,67 12,56 13,27 9,37 11,34 12,5 13,66 14,23 11,1
Y 73,15 58,88 74,06 83,33 71,83 47,35 43,35 40,34 46,68 56,98 72,21
xi · y j
1294,024 810,778 1086,460 1046,625 953,184 443,670 491,589 504,250 637,649 810,825 801,53
h k
xi y j ·ni j
1294,024 + 810,778 + 1086,460 + 1046,625 + ...+ 810,825 + 801,53
∑∑ n
=
11
i=1 j=1
8880,594
= = 807,236
11
Y por lo tanto:
h k
xi y j ·ni j
SXY = ∑∑ − X · Y = 807,236 – 13,105 · 60,742 = 11,212 .
i=1 j=1 n
Como la covarianza nos queda positiva, también existe relación lineal positiva. Se
concluye pues que el gráfico y el estadístico están en concordancia.
P. Juan Verdoy / M. J. Beltrán / M. J. Peris - ISBN: 978-84-15444-38-1 121 Problemas resueltos de estadística aplicada a las ciencias sociales - UJI - DOI: http://dx.doi.org/10.6035/Sapientia100
Hay que notar, sin embargo, que con la covarianza todavía no podemos saber el
grado de esta relación lineal entre ambas variables. Hay que calcular otro estadís-
tico para estudiarlo: el coeficiente de correlación lineal.
Ejercicio 6
Se recolectaron los valores mensuales de los gastos en publicidad de una com-
pañía ferroviaria y el número de pasajeros a lo largo de 15 meses. Los datos los
muestra la tabla:
Publicidad
10 12 8 17 10 15 10 14 19 10 11 13 16 10 12
(en miles )
Pasajeros
15 17 13 23 16 21 14 20 24 17 16 18 23 15 16
(en miles)
Solución
Para calcular el gasto medio y el número medio de pasajeros hay que estudiar las
distribuciones marginales de las dos variables. Si llamamos X = Gastos en publici-
dad y Y = Número de pasajeros, entonces las distribuciones marginales son:
P. Juan Verdoy / M. J. Beltrán / M. J. Peris - ISBN: 978-84-15444-38-1 122 Problemas resueltos de estadística aplicada a las ciencias sociales - UJI - DOI: http://dx.doi.org/10.6035/Sapientia100
b) Haz la nube de puntos y calcula la covarianza. ¿Es coherente el valor del
estadístico con la nube de puntos?
Para determinar la covarianza hay que hacer lo mismo que en el ejercicio 5. Como
las medias las hemos calculado ya en el apartado anterior, ahora es necesario en-
contrar otros elementos componentes de la expresión de la covarianza. Así:
X 10 12 8 17 10 15 10 14 19 10 11 13 16 10 12
Y 15 17 13 23 16 21 14 20 24 17 16 18 23 15 16
xi · y j 150 204 104 391 160 315 140 280 456 170 176 234 368 150 192
h k
xi y j ·ni j 150 + 204 + .......+150 +192
∑∑ = = 233 , por lo tanto la covarianza es:
i=1 j=1 n 15
h k
xi y j ·ni j
SXY = ∑∑ − X · Y = 233 – 12,467· 17,867 = 10,252.
i=1 j=1 n
Como se comprueba, la nube de puntos concuerda con el valor de la varianza.
c) Si para los 15 meses posteriores se prevé que la inversión en publicidad de
cada mes aumente un 10 % respecto al mismo mes del período anterior, y
también se prevé que este hecho provocará un aumento del 8 % en el número
de pasajeros cada mes, ¿cuál será la covarianza en este segundo período?
8. Si todos los valores de una variable x se multiplican por una constante a y todos los valores de la variable Y por una cons-
tante b, la covarianza queda multiplicada por el producto de las constantes. Es decir: = a · b S XY
P. Juan Verdoy / M. J. Beltrán / M. J. Peris - ISBN: 978-84-15444-38-1 123 Problemas resueltos de estadística aplicada a las ciencias sociales - UJI - DOI: http://dx.doi.org/10.6035/Sapientia100
Ejercicio 7
Una empresa ha realizado dos tests psicotécnicos a los 9 trabajadores de un depar-
tamento como parte del proceso de selección del nuevo director del departamento.
La siguiente tabla muestra los resultados obtenidos por los aspirantes:
TEST 1 5 7 6 9 3 1 2 4 6
TEST 2 6 5 8 6 4 2 1 3 7
a) Calcula la covarianza. ¿Existe algún tipo de relación lineal entre las dos
variables?
b) Ha habido un error en una pregunta de cada test y el tribunal decide aumentar
un 5 % la puntuación de cada participante. Calcula nuevamente la covarianza.
Solución
a) Calcula la covarianza. ¿Existe algún tipo de relación lineal entre las dos
variables?
Del mismo modo que en los problemas anteriores, hay que encontrar cada uno de
los componentes. Llamamos X = Notas del Test 1 y para Y = Notas del Test 2 y
obtenemos las medias de cada variable: X = 4,778 y Y = 4,667.
h k
xi y j ·ni j
Buscamos ahora
n
∑∑
. Para hacerlo, hay que calcular los productos co-
i=1 j=1
rrespondientes y hacer la suma.
X 5 7 6 9 3 1 2 4 6
Y 6 5 8 6 4 2 1 3 7
xi · y j 30 35 48 54 12 2 2 12 42
Y por lo tanto,
h k
xi y j ·ni j 30 + 35 + 48 + .....+ 2 +12 + 42
∑∑ n
=
9
=26 y consecuentemente la cova-
i=1 j=1
h k
xi y j ·ni j
rianza es: SXY = ∑∑ − X · Y = 26 –4,778· 4,667 = 3,701
i=1 j=1 n
P. Juan Verdoy / M. J. Beltrán / M. J. Peris - ISBN: 978-84-15444-38-1 124 Problemas resueltos de estadística aplicada a las ciencias sociales - UJI - DOI: http://dx.doi.org/10.6035/Sapientia100
De la misma manera que en el apartado c) del ejercicio 6, hay que definir unas nue-
vas variables y aplicar la misma propiedad. Definimos pues estas dos nuevas varia-
bles: X’ = Nota del test 1 tras el aumento y Y’ = Nota del test 2 después del aumento.
Entonces: SX 'Y ' = 1,1 · 1,08 SXY = 1,1 · 1,08 · 3,701 = 4,397.
Ejercicio 8
Dadas las siguientes nubes de puntos, contesta:
a) Asocia cada nube de puntos con el valor del coeficiente de correlación que le
corresponde entre estos: –0,9; 0,4; 0,95: –0,65; 0,1; 0,6. Razona la respuesta.
b) Indica para cada nube de puntos el signo de la covarianza y di cuál es su
significado.
Solución
a) Asocia cada nube de puntos con el valor del coeficiente de correlación que le
corresponde entre estos: –0,9; 0,4; 0,95: –0,65; 0,1; 0,6. Razona la respuesta.
P. Juan Verdoy / M. J. Beltrán / M. J. Peris - ISBN: 978-84-15444-38-1 125 Problemas resueltos de estadística aplicada a las ciencias sociales - UJI - DOI: http://dx.doi.org/10.6035/Sapientia100
cero, pero no aporta información del grado de dependencia de una variable respec-
to a la otra. Además, la covarianza depende de las unidades de medida empleadas
para X y Y. Si por ejemplo X se mide en m3 y Y en mm3, cada desviación de X
aumenta SXY 109 veces. Para hacer frente a estas dos dificultades se define el con-
cepto de correlación lineal rXY :
SXY
rXY = siendo Sx y Sy las desviaciones típicas de X y Y.
SX ·SY
En nuestro ejercicio hay que asociar cada nube de puntos con el coeficiente de
correlación adecuada. Teniendo en cuenta lo que acabamos de comentar, las aso-
ciaciones serán:
P. Juan Verdoy / M. J. Beltrán / M. J. Peris - ISBN: 978-84-15444-38-1 126 Problemas resueltos de estadística aplicada a las ciencias sociales - UJI - DOI: http://dx.doi.org/10.6035/Sapientia100
Teniendo presente lo que hemos dicho en el apartado a), el signo del coeficiente
de correlación es el mismo que el de la covarianza. Por lo tanto, las nubes de los
gráficos A, B, C y D tendrán una covarianza positiva (relación lineal positiva) y
las nubes E y F tendrán una covarianza negativa (relación lineal negativa). Hay
que notar que el gráfico F tiene una correlación de 0,1. Es decir, a pesar de tener
signo positivo la relación lineal de ambas variables es muy débil para ser rXY muy
cerca de 0.
Ejercicio 9
La siguiente tabla muestra el gasto total promedio, el gasto medio en alimentos y
bebidas no alcohólicas y el gasto en vivienda, agua electricidad, gas y otros com-
bustibles en euros, por número de personas que forman la unidad familiar en el año
2009,9 según datos del ine.
Número de miembros
1 2 3 4 5 6 o más
de la familia
Gastos en vivienda,
agua, electriciad, gas 7493,88 8990,72 9205,13 9645,19 10114,49 9272,18
y otros combustibles
a) ¿Existe una fuerte relación lineal entre el número de miembros que viven en
un hogar y el gasto medio total? Razona la respuesta.
b) ¿Y entre el número de miembros que viven en un hogar y el gasto en vivien-
da, agua, electricidad, gas y otros combustibles? Razona la respuesta.
Solución
a) ¿Existe una fuerte relación lineal entre el número de miembros que viven en
un hogar y el gasto medio total? Razona la respuesta.
P. Juan Verdoy / M. J. Beltrán / M. J. Peris - ISBN: 978-84-15444-38-1 127 Problemas resueltos de estadística aplicada a las ciencias sociales - UJI - DOI: http://dx.doi.org/10.6035/Sapientia100
h k
xi y j ·ni j
Tenemos ∑∑
n
. Para hacerlo es necesario calcular los productos corres-
i=1 j=1
pondientes y hacer la suma.
X 1 2 3 4 5 7
Y 18355,25 27755,08 33414,09 38576,14 40699,09 41562,31
Y por lo tanto:
h k
xi y j ·ni j 18355,25 + 55510,16 + .....+ 203495, 45 + 290936,17
∑∑ n
=
6
=137140,643
i=1 j=1
h k
xi y j ·ni j
SXY = ∑∑ − X · Y = 137140,643 –3,667· 33363,93 =14795,112.
i=1 j=1 n
SXY 14795,112
Así pues, rXY = = = 0,913, lo que significa que la relación
SX ·SY 1,972 · 8214,845
lineal entre las variables Gasto medio total y Miembros que forman un hogar es lo
suficientemente fuerte, cuestión perfectamente lógica para otra parte.
En este apartado hay que hacer exactamente lo mismo que en el anterior. Llama-
mos X = Número de miembros del hogar y Y = Gasto en vivienda, agua, electrici-
dad, gas y otros combustibles y hacemos los cálculos necesarios. X = 3,667; SSXX == 1,972
1,972 y Y = 9120,265;SSYY == 812
812,016.
,016
h k
xi y j ·ni j
Tenemos ahora ∑∑ . Para hacerlo, calculamos los productos correspon-
i=1 j=1 n
dientes y la suma.
X 1 2 3 4 5 7
Y 7493,88 8990,72 9205,13 9645,19 10114,49 9272,18
Y por lo tanto:
h k
xi y j ·ni j 7493,88 +17981, 44 + .....+ 64905,26
∑∑ n
=
6
=34524,8633
i=1 j=1
P. Juan Verdoy / M. J. Beltrán / M. J. Peris - ISBN: 978-84-15444-38-1 128 Problemas resueltos de estadística aplicada a las ciencias sociales - UJI - DOI: http://dx.doi.org/10.6035/Sapientia100
Y la covarianza será:
h k
xi y j ·ni j
SXY = ∑∑ − X · Y = 34524,863 –3,667· 9120,265 =1080,851.
i=1 j=1 n
SXY 1080,851
De modo que, rXY = = = 0,675, lo que significa que la re-
SX ·SY 1,972 · 812,016
lación lineal entre las variables Gasto en vivienda, agua, electricidad, gas y otros
combustibles y Miembros que forman un hogar es bastante débil.
Ejercicio 10
El director de Recursos Humanos de una empresa ha realizado dos tests psicotéc-
nicos para seleccionar a las personas que deben trabajar en el Departamento de
Marketing. Se han presentado 9 personas y los resultados obtenidos en cada uno
de los tests han sido los siguientes:
TEST 1 175 181 192 211 235 255 275 286 292
TEST 2 169 185 202 219 240 266 295 329 357
Teniendo en cuenta los resultados de los tests, ¿crees que el director podría haber
eliminado uno de los dos tests para decidir los candidatos? Razona la respuesta.
Solución
El director podría haber eliminado una de las dos pruebas siempre y cuando las
dos discriminen a las mismas personas. Es decir, si existe una relación casi fun-
cional entre las dos variables. Así pues, para contestar a la pregunta habrá que
calcular el coeficiente de correlación lineal y, si este es cercano a 1 o –1, entonces
la relación lineal entre las dos variables será fuerte y, por tanto, un test no aportará
información adicional y se podría eliminar.
h k
xi y j ·ni j
Buscamos
n
∑∑ . Para hacerlo hay que calcular los productos correspon-
i=1 j=1
dientes y hacer la suma.
P. Juan Verdoy / M. J. Beltrán / M. J. Peris - ISBN: 978-84-15444-38-1 129 Problemas resueltos de estadística aplicada a las ciencias sociales - UJI - DOI: http://dx.doi.org/10.6035/Sapientia100
Y por lo tanto,
h k
x y ·n 175 · 169 + .....+ 292 · 357 551746
∑∑ i nj i j = 9
=
9
= 61305,111
i=1 j=1
SXY 2604,781
De ahí que, rXY = = = 0,980.
SX ·SY 43,169 · 61,560
Como el coeficiente rXY es tan cercano a 1, las dos pruebas permiten escoger a las
mismas personas, y por tanto una de las dos podría eliminarse.
Ejercicio 11
En una muestra de 150 empresas del sector de servicios se recogen datos sobre el
número de trabajadores de la empresa (X) y la facturación (Y) anual en millones
de euros. Los resultados se muestran resumidos en los siguientes estadísticos:
Solución
En este caso hay que únicamente sustituir en la expresión del coeficiente de corre-
lación:
SXY 45
rXY = = = 0,9.
SX ·SY 25 · 2
P. Juan Verdoy / M. J. Beltrán / M. J. Peris - ISBN: 978-84-15444-38-1 130 Problemas resueltos de estadística aplicada a las ciencias sociales - UJI - DOI: http://dx.doi.org/10.6035/Sapientia100
Como está bastante cerca de 1, podemos decir que la relación lineal es bastante
fuerte.
s xy s xy
a y x y b
s x2 s x2
⎛ S ⎞ S
Y = ⎜ y − XY2 ⋅ x ⎟ + XY2 ·X
⎝ SX ⎠ SX
Recolocándo
los términos, tenemos:
SXY
Y −Y = ·(X − X).
SX2
SXY
X−X = ·(Y −Y ).
SY2
En este caso pide la recta que cuenta la facturación en función del número de tra-
bajadores. Por lo tanto, nos pide la recta Y sobre X. Para calcularla, tan solo hay
que hacer las sustituciones correspondientes, ya que el ejercicio nos da todos los
estadísticos necesarios.
P. Juan Verdoy / M. J. Beltrán / M. J. Peris - ISBN: 978-84-15444-38-1 131 Problemas resueltos de estadística aplicada a las ciencias sociales - UJI - DOI: http://dx.doi.org/10.6035/Sapientia100
Sustituyendo:
SXY 45
y −Y = ·(x − X) g y −100 = ·(x −14) g aislando la variable y mediante ma-
SX2
4
temáticas elementales, obtenemos: Y = 11,25 X – 57,5.
Es decir:
La facturación = 11,25 · Número de trabajadores – 57,5.
Para hacer la predicción únicamente hay que sustituir X por 15, ya que de esta
manera obtendremos la estimación de la facturación para una empresa que tuviera
15 trabajadores. Así pues:
Sustituyendo:
SXY 45
X−X = ·(Y −Y ) g X −14 = ·(Y −100 g aislando la variable y mediante
SY
2
625
matemáticas elementales, obtenemos: X = 0,072 Y + 6,8.
Es decir,
Número de trabajadores = 0,072 · la facturación + 6,8.
P. Juan Verdoy / M. J. Beltrán / M. J. Peris - ISBN: 978-84-15444-38-1 132 Problemas resueltos de estadística aplicada a las ciencias sociales - UJI - DOI: http://dx.doi.org/10.6035/Sapientia100
c) En función de este ajuste calcula de forma aproximada el número de traba-
jadores que se espera que tenga una empresa que facture 105 millones. ¿Es
fiable esta predicción? Razona la respuesta.
Para hacer la predicción únicamente hay que sustituir Y por 105, ya que de esta
manera obtendremos la estimación del número de trabajadores para una empresa
que tuviera 105 millones de facturación. Así pues:
Ejercicio 12
Las dos tablas siguientes muestran el grado medio de satisfacción de los ocupados
según el trabajo que realizan por edad y por el nivel de estudios en 2010. Los datos
han sido extraídos del Ministerio de Trabajo e Inmigración.10
NIVEL
GRADO DE SATISFACCIÓN EDAD GRADO DE SATISFACCIÓN
ESTUDIOS
1 7,05 [16,25) 7,33
2 7,09 [25,30) 7,39
3 7,21 [30,45) 7,37
4 7,23 [45,55) 7,30
5 7,50 [55,65) 10
7,43
6 7,55
Hay que decir que la variable Nivel de estudios ha sido convertida a numérica
discreta para ser graduable. Así la equivalencia es: 1 = menos que Primarios; 2 =
Primarios; 3 = Secundarios; 4 = Bachillerato; 5 = Formación Profesional y 6 =
Universitarios. Esta conversión se ha hecho a efectos didácticos.
Solución
10. En la tabla original el últímo intervalo es 55 años o más. Se ha cerrado el intervalo para poder hacer el ejercicio.
P. Juan Verdoy / M. J. Beltrán / M. J. Peris - ISBN: 978-84-15444-38-1 133 Problemas resueltos de estadística aplicada a las ciencias sociales - UJI - DOI: http://dx.doi.org/10.6035/Sapientia100
Edad y grado de satisfacción
Para calcular el coeficiente de correlación hay que hacer lo mismo que en los ejer-
cicios anteriores. Sin embargo, la variable Edad está agrupada y, por tanto, hay que
obtener previamente las marcas de clase.
Así, la tabla de la variable X en la que aparecen los intervalos y las clases, y donde
se muestran también los productos de los valores de cada variable, así como el
sumatorio es:
X ci Y xi · y j
[16,25) 20,5 7,33 150,265
[25,30) 27,5 7,39 203,225
[30,45) 37,5 7,37 276,375
[45,55) 50 7,3 365
[55,65) 60 7,43 445,8
1440,665
h k
xi y j ·ni j
Tenemos ∑∑n
. Para hacerlo hay que calcular los productos correspon-
i=1 j=1
dientes y hacer la suma.
Por lo tanto:
h k
xi y j ·ni j 20,5 · 7,33+ .....+ 60 · 7, 43 1440,665
∑∑ n
=
5
=
5
= 288,133
i=1 j=1
SXY 0,2006
De modo que rXY = = = 0,309
SX ·SY 14, 413 · 0,045
Como el coeficient rXY es tan cercano a 0, la relación lineal entre las dos variables
es débil.
P. Juan Verdoy / M. J. Beltrán / M. J. Peris - ISBN: 978-84-15444-38-1 134 Problemas resueltos de estadística aplicada a las ciencias sociales - UJI - DOI: http://dx.doi.org/10.6035/Sapientia100
Nivel de estudios y grado de satisfacción
h k
xi y j ·ni j
Tenemos ∑∑ n
. Para hacerlo hay que calcular los productos correspon-
i=1 j=1
Y por lo tanto,
h k
x y ·n 1 · 7,05 + .....+ 6 · 7,55 154,58
∑∑ i nj i j = 6
=
6
= 25,763
i=1 j=1
SXY 0,311
Por consiguiente, rXY = = = 0,96.
SX ·SY 1, 708 · 0,190
Como el coeficiente rXY es tan cercano a 1, la relación lineal entre las dos variables
es fuerte y tiene perfecto sentido calcular la recta de regresión.
SXY 0,311
y −Y = ·(x − X) g y − 7,271 = ·(x − 3,5) g aislando la variable y me-
SX2
2,917
diante matemáticas elementales, obtenemos: Y= 0,107 X + 6,898.
Es decir,
P. Juan Verdoy / M. J. Beltrán / M. J. Peris - ISBN: 978-84-15444-38-1 135 Problemas resueltos de estadística aplicada a las ciencias sociales - UJI - DOI: http://dx.doi.org/10.6035/Sapientia100
Ejercicio 13
El grado medio de satisfacción medio de los ocupados según el trabajo que reali-
zan por nivel de ingresos y por sexo en el año 2010 se muestra en la tabla siguien-
te. Los datos han sido extraídos del Ministerio de Trabajo e Inmigración.11
GRADO GRADO
NIVEL
DE SATISFACCIÓN DE SATISFACCIÓN
DE INGRESOS
HOMBRES MUJERES
[0,600) 6,19 7,253
[600,1000) 6,83 7,234
[1000,1200) 7,28 7,339
[1200,1600) 7,39 7,61
[1600,2100) 7,60 7,768
[2100,3000) 7,82 7,682
[3000,4000)10 7,925 7,499
Solución
11. En la tabla original el últímo intervalo es 3000 o más edad. Se ha cerrado el intervalo para poder hacer el ejercicio.
P. Juan Verdoy / M. J. Beltrán / M. J. Peris - ISBN: 978-84-15444-38-1 136 Problemas resueltos de estadística aplicada a las ciencias sociales - UJI - DOI: http://dx.doi.org/10.6035/Sapientia100
X ci Y Z
h k
xi y j ·ni j
Ahora buscamos
n
∑∑ . Para hacerlo hay que calcular los productos co-
i=1 j=1
rrespondientes y hacer la suma.
Y por lo tanto,
h k
x y ·n 300 · 6,19 + .....+ 3000 · 7,925 83451
∑∑ i nj i j = 7
=
7
= 11921,571
i=1 j=1
SXY 464,283
Así que rXY = = = 0,93.
SX ·SY 889,565 · 0,562
Como el coeficiente rXY es tan cercano a 1, la relación lineal entre las dos variables
es fuerte.
P. Juan Verdoy / M. J. Beltrán / M. J. Peris - ISBN: 978-84-15444-38-1 137 Problemas resueltos de estadística aplicada a las ciencias sociales - UJI - DOI: http://dx.doi.org/10.6035/Sapientia100
Nivel de ingresos y grado de satisfación en las mujeres
En este caso los valores de los estadísticos son: X = 1571,429 ;SSXX ==889,565
889,565
h k
xi y j ·ni j 83146,9
Z = 7,484;SSZz == 0,197
0,197 y ∑∑ = = 11878,129
i=1 j=1 n 7
SXY 117,554
Y por lo tanto, rXY = = = 0,67.
SX ·SY 889,565· 0,197
Como el coeficiente rXY es menor que el anterior, se puede decir que el grado de
satisfacción medio en el trabajo está más relacionado con el sueldo para los hom-
bres que para las mujeres.
SXY 464,283
y −Y = ·(x − X) g y − 7,291 = ·(x −1571, 429) g aislando la va-
SX2
791325,889
riable y mediante matemáticas elementales, obtenemos: Y = 0,000587 X + 6,369.
Es decir:
Ejercicio 14
El número total de expedientes de regulación del trabajo a lo largo de los años
2001-2010, según los datos han sido extraídos del Ministerio de Trabajo e Inmi-
gración, son las que se muestran en la tabla.
2001 2002 2003 2004 2005 2006 2007 2008 2009 2010
Alicante 139 169 224 268 292 180 164 393 939 679
Castellón 49 59 55 76 88 59 58 291 939 777
P. Juan Verdoy / M. J. Beltrán / M. J. Peris - ISBN: 978-84-15444-38-1 138 Problemas resueltos de estadística aplicada a las ciencias sociales - UJI - DOI: http://dx.doi.org/10.6035/Sapientia100
a) ¿Existe algún tipo de relación lineal entre las variables? ¿Es fuerte esta rela-
ción? Razona las respuestas.
b) Calcula la recta de regresión lineal que relaciona el número de expedientes
totales en Castellón en función de los de Alicante.
Solución
a) ¿Existe algún tipo de relación lineal entre las variables? ¿Es fuerte esta rela-
ción? Razona las respuestas.
h k
xi y j ·ni j 1618965
∑∑ n
=
10
= 161896,5
i=1 j=1
h k
xi y j ·ni j
SXY = ∑∑ − X · Y = 161896,5 – 344,7 · 245,1 = 77410,53.
i=1 j=1 n
SXY 77410,53
Y por lo tanto, rXY = = = 0,981.
SX ·SY 249,694 · 316,02
Como el coeficiente rXY es muy cercano a 1, existe una correlación lineal muy
fuerte entre ambas variables, aunque, como se puede observar, las dos distribu-
ciones marginales tienen mucha dispersión. Es decir, a pesar de que en las dos
variables las medias no sean representativas de los datos (valores muy altos de
la desviación típica) los datos en conjunto sí que se «amontonan» alrededor de
una recta. Este hecho se puede observar en el gráfico de dispersión que aparece a
continuación:
P. Juan Verdoy / M. J. Beltrán / M. J. Peris - ISBN: 978-84-15444-38-1 139 Problemas resueltos de estadística aplicada a las ciencias sociales - UJI - DOI: http://dx.doi.org/10.6035/Sapientia100
b) Calcula la recta de regresión lineal que relaciona el número de expedientes
totales en Castellón en función de los de Alicante.
Manteniendo la notación del apartado anterior, de Y sobre X. Hay que sustituir los
estadísticos calculados en el apartado anterior a la ecuación de la recta:
SXY
y −Y = ·(x − X) g g aislando la varia-
SX2
ble y mediante matemáticas elementales, obtenemos: Y = 0,775 X + 154,713.
Es decir:
Ejercicio 15
La siguiente tabla muestra el número total de hipotecas firmadas, así como la tasa
de paro en España en el período 2004-2010, según datos extraídos del ine.
P. Juan Verdoy / M. J. Beltrán / M. J. Peris - ISBN: 978-84-15444-38-1 140 Problemas resueltos de estadística aplicada a las ciencias sociales - UJI - DOI: http://dx.doi.org/10.6035/Sapientia100
a) ¿Existe algún tipo de relación lineal entre las variables? ¿Es fuerte esta rela-
ción? Razona las respuestas.
b) Calcula la recta de regresión lineal que relaciona el número de hipotecas
firmadas en función de la tasa de desempleo.
Solución
a) ¿Existe algún tipo de relación lineal entre las variables? ¿Es fuerte esta rela-
ción? Razona las respuestas.
h k
xi y j ·ni j 118134800,26
∑∑ n
=
7
= 16876400,037.
i=1 j=1
h k
xi y j ·ni j
SXY = ∑∑ − X · Y = 16876400,037 – 12,426 · 1487404,429 = -1606087,405.
i=1 j=1 n
SXY - 1606087,405
Y por lo tanto, rXY = = = 0,960.
SX ·SY 4,812 · 347819,845
Entre estas dos variables existe una relación lineal negativa, ya que la covarianza
es menor que cero. Además, como el coeficiente de correlación está muy cerca de
–1, la relación lineal es fuerte.
Manteniendo la notación del apartado anterior, de Y sobre X. Hay que sustituir los
estadísticos calculados en el apartado anterior a la ecuación de la recta:
SXY -1606087,405.
y −Y = ·(x − X) g y −1487404, 429 = ·(x −12, 426) g aislan-
SX2
23,155
do la variable y mediante matemáticas elementales, obtenemos:
P. Juan Verdoy / M. J. Beltrán / M. J. Peris - ISBN: 978-84-15444-38-1 141 Problemas resueltos de estadística aplicada a las ciencias sociales - UJI - DOI: http://dx.doi.org/10.6035/Sapientia100
Ejercicio 16
La siguiente tabla muestra el número de horas extraordinarias totales en miles
(remuneradas y no remuneradas) realizadas en el conjunto de España, así como
las tasas de paro desde el primer trimestre de 2008 hasta el último trimeste del año
2010. Los datos han sido extraídos del ine.
Solución
P. Juan Verdoy / M. J. Beltrán / M. J. Peris - ISBN: 978-84-15444-38-1 142 Problemas resueltos de estadística aplicada a las ciencias sociales - UJI - DOI: http://dx.doi.org/10.6035/Sapientia100
Para hallar el coeficiente de correlación hay que calcular algunos estadísticos, tan-
to de las distribuciones marginales como de la conjunta. así:
X = 16,386 ;SSX X==4,019
4,019; Y = 7223,536;SSYY = 1664
1664,837
,837 y
h k
xi y j ·ni j 1230502,401
∑∑ n
=
11
= 111863,855
i=1 j=1
h k
xi y j ·ni j
SXY = ∑∑ − X · Y = 111863,855 – 16,386 · 7223,563 = –6501,448.
i=1 j=1 n
SXY
Y por lo tanto, rXY = = = 0,972.
SX ·SY
Como el coeficiente de correlación está muy cerca de –1, la relación lineal es fuer-
te y tiene sentido calcular la recta de regresión Y sobre X.
Calculamos:
SXY
y −Y = ·(x − X) g g aislando la va-
SX2
riable y mediante matemáticas elementales, obtenemos:
b) En el primer trimestre de 2009 la tasa de paro era del 17,36 %. Da una esti-
mación del número de horas extras en este trimestre, así como una medida
de su fiabilidad.
P. Juan Verdoy / M. J. Beltrán / M. J. Peris - ISBN: 978-84-15444-38-1 143 Problemas resueltos de estadística aplicada a las ciencias sociales - UJI - DOI: http://dx.doi.org/10.6035/Sapientia100
Ejercicio 17
El número total de expedientes de regulación del trabajo a lo largo de los años
2001-2010 en Cataluña y la Comunidad Valenciana, extraídos del Ministerio de
Trabajo e Inmigración son las que se muestran en la tabla, a excepción de los datos
del año 2005 que se han omitido.
Comunidad
AÑO Cataluña
Valenciana
Se sabe que el número de expedientes en 2005 en Cataluña fue de 512. Haz una
estimación, si conviene, del número de expedientes en la Comunidad Valenciana,
así como una medida del ajuste.
Solución
Para hallar el coeficiente de correlación hay que calcular algunos estadísticos, tan-
to de las distribuciones marginales como de la conjunta. Así:
P. Juan Verdoy / M. J. Beltrán / M. J. Peris - ISBN: 978-84-15444-38-1 144 Problemas resueltos de estadística aplicada a las ciencias sociales - UJI - DOI: http://dx.doi.org/10.6035/Sapientia100
h k
xi y j ·ni j
SXY = ∑∑ − X · Y = 2897179,67 – 1293,22 · 1184,22 = 1365722,682.
i=1 j=1 n
SXY 1365722,682
Y por lo tanto, rXY = = = 0,986.
SX ·SY 1269,838 · 1091,001
Como el coeficiente de correlación está muy cerca de 1, la relación lineal es fuerte
y tiene sentido calcular la recta de regresión Y sobre X.
Calculamos:
SXY 1365722,682.
y −Y = ·(x − X) g y −1184,22 = ·(x −1293,22) g aislando la
SX2
1269,8382
variable y mediante matemáticas elementales, obtenemos:
Y = 0,847 X + 88,907
Ejercicio 18
En un museo se desea estudiar la repercusión que tienen las quejas realizadas
por los visitantes y los ingresos. Para realizarlo, se observaron las dos variables a
lo largo de las últimas diez semanas. Las visitas están expresadas en decenas de
asistentes.
Quejas 18 26 30 33 38 39 42 44 46 49
Visitas 107 105,5 105 104,4 104,3 104 103,7 103,4 103,1 103
Si la entrada al museo tiene un coste de 3,6 euros, estima los ingresos del museo si
en una semana se hubieran producido 43 quejas.
P. Juan Verdoy / M. J. Beltrán / M. J. Peris - ISBN: 978-84-15444-38-1 145 Problemas resueltos de estadística aplicada a las ciencias sociales - UJI - DOI: http://dx.doi.org/10.6035/Sapientia100
Solución
El ejercicio pide que estimemos los ingresos según las quejas. Pero es evidente que
los ingresos dependen del número de visitas, por lo tanto, lo que tenemos que averi-
guar es si existe algún tipo de relación lineal entre el número de quejas y el número
de visitas. Si efectivamente esta se produce, entonces podremos encontrar la
recta de regresión entre el número de visitas y el de quejas y, con posterioridad, se
podrán estimar los ingresos.
Así pues, en primer lugar hay que calcular el coeficiente de correlación entre las dos
variables X = Número de quejas y Y = Visitas para saber si están correlacionadas.
h k
xi y j ·ni j
SXY = ∑∑ − X · Y = 3797,82 – 36,5 · 104,34 = –10,59.
i=1 j=1 n
SXY
Y por tanto, rXY = = = – 0,986.
SX ·SY
Como el coeficiente de correlación está muy cerca a –1, la relación lineal es fuerte
y tiene sentido calcular la recta de regresión Y sobre X.
Calculamos:
SXY
y −Y = ·(x − X) g g aislando la variable y
SX2
mediante matemáticas elementales, obtenemos:
Y = 0,125 X + 108,866.
Para estimar el número de visitas cuando cuando se producen 43 quejas hay úni-
camente sustituir X por 43. De esta manera obtenemos Y = 0,125 · 43 + 108,866 =
114,241.
Finalmente, los ingresos estimados son 3,6 euros multiplicado por el número de
visitas estimadas. Es decir, 3,6 · 1088,66 = 3919,176 euros.
P. Juan Verdoy / M. J. Beltrán / M. J. Peris - ISBN: 978-84-15444-38-1 146 Problemas resueltos de estadística aplicada a las ciencias sociales - UJI - DOI: http://dx.doi.org/10.6035/Sapientia100
Ejercicio 19
La siguiente tabla muestra el número de personas ocupadas distribuidas atendien-
do el sueldo neto de la actividad principal que desarrollan (en centenas de euro) y
el nivel de estudios que tenían en 2010, según datos recogidos del Ministerio de
Trabajo y de Inmigración. Hay que decir, sin embargo, que la variable nivel de
estudios ha sido convertida a numérica discreta para ser graduable. Así, la equiva-
lencia es: 1 = menos que Primarios; 2 = Primarios; 3 = Secundarios; 4 = Bachi-
llerato; 5 = Formación Profesional y 6 = Universitarios. Esta conversión se ha
hecho a efectos didácticos.
SUELDO
Nivel de
[0, 6) [ 6,10) [10,12) [12,16) [16,21) [21,30) [30, 40)
estudios
1 8,75 21,67 15,00 7,93 5,65 0,74 1,56
2 293,18 790,92 601,61 472,64 92,82 56,30 3,77
3 538,08 1551,52 1226,20 1098,34 340,72 74,78 13,56
4 323,39 670,29 607,31 709,62 313,35 142,00 53,20
5 303,28 801,87 843,80 982,42 444,90 183,90 50,73
6 164,47 439,26 619,51 1155,75 1230,07 919,40 282,14
Solución
Para hacer estos cálculos hay que tener presente que la variable Y está agrupada en
intervalos y necesitamos las marcas de clase, y que cada dato bivariante tiene una
frecuencia absoluta superior a 1. Este último hecho puede complicar los cálculos,
por eso es conveniente seguir un criterio a la hora de hacerlos. Nosotros lo hare-
mos en la tabla de doble entrada:
P. Juan Verdoy / M. J. Beltrán / M. J. Peris - ISBN: 978-84-15444-38-1 147 Problemas resueltos de estadística aplicada a las ciencias sociales - UJI - DOI: http://dx.doi.org/10.6035/Sapientia100
- UJI - DOI: http://dx.doi.org/10.6035/Sapientia100
Y
X [0, 6) [ 6,10) [10,12) [12,16) [16,21) [21,30) [30, 40)
Marcas--> 3 8 11 14 18,5 25,5 35 n.j
SXY 3,465
Y por lo tanto, rXY = = = 0,38, el cual es muy bajo, y por eso
SX ·SY 1,412 · 6,478
la relación es muy débil y no tendría mucho sentido hacer la recta de regresión.
b) Calcula una estimación del sueldo que cobraría una persona ocupada que
tuviera un nivel de estudios equivalente a 4,5, así como de su fiablidad.
g g aislando la variable y
Y = 1,738 X + 5,622.
Para estimar el sueldo de una persona con un nivel de estudios de 4,5: Y = 1,738 ·
4,5 + 5,622 = 13,443 miles de euros.
P. Juan Verdoy / M. J. Beltrán / M. J. Peris - ISBN: 978-84-15444-38-1 149 Problemas resueltos de estadística aplicada a las ciencias sociales - UJI - DOI: http://dx.doi.org/10.6035/Sapientia100
UNIDad 3
Números índice
P. Juan Verdoy / M. J. Beltrán / M. J. Peris - ISBN: 978-84-15444-38-1 151 Problemas resueltos de estadística aplicada a las ciencias sociales - UJI - DOI: http://dx.doi.org/10.6035/Sapientia100
Introducción teórica
Como elementos introductorios de este capítulo, es conveniente recordar defini-
ciones de conceptos que necesitaremos para alcanzar los objetivos de esta unidad
(referencias bibliográficas 7, 11 y 18).
Índice simple
Los índices, calculados a partir de una serie de datos de una magnitud y en un
período t que denotaremos por xit, nos permitirán evaluar, en términos relativos o
porcentajes, la evolución de los datos de la serie por períodos. Así:
xit
I it−1
t
=
xit−1
Índice complejo
Hablaremos de índice complejo cuando queramos estudiar la evolución de una
magnitud compleja, porque nos interesa aglutinar en una sola, la diversidad de dis-
tintas magnitudes simples. En un ejemplo para analizar la producción de cereales
en cierta comunidad (magnitud compleja) necesitamos los datos de maíz, trigo,
avena, etc. (que serían las magnitudes simples).
Dentro de los índices complejos, nosotros trabajaremos con índices ponderados. Ve-
remos en los ejercicios las fórmulas de los índices de precios y cantidades de Laspe-
yres y Paasche, con la intención de analizar las razones que justifican la utilización
del índice de Laspeyres de precios en el cálculo oficial del ipc en Europa. Así:
Para calcular estos índices, empezaremos por conocer y deducir la fórmula que se
empleará. Hemos reducido su cálculo a tres artículos, pero no olvidemos que este
cálculo se extiende a la totalidad de artículos representativos del consumo de las
familias en un país (Véase ecpf).
donde t es el año actual y 0 será el año que tomaremos como referencia en la com-
paración. Si se trata de índices encadenados podríamos decir años t-1 y t.
P. Juan Verdoy / M. J. Beltrán / M. J. Peris - ISBN: 978-84-15444-38-1 153 Problemas resueltos de estadística aplicada a las ciencias sociales - UJI - DOI: http://dx.doi.org/10.6035/Sapientia100
pit será el precio del artículo y el año t
pi 0 será el precio del artículo y el año 0
qit será la cantidad del artículo y el año t
qi 0 será la cantidad del artículo y el año 0
es una media ponderada donde el «peso» de cada artículo, ppi0i0 ⋅⋅qqi0i0 , es el valor del
artículo en la «cesta de la compra» del año de referencia y permanecerá constante
a lo largo del período, mientras no se cambia la base. Un inconveniente de este
método es que si la importancia de los artículos en los hábitos de consumo cambia
mucho, estos coeficientes quedan desfasados.
es una media ponderada donde el «peso» de cada artículo, pi0 ⋅ qit , intenta mejorar
la propuesta de Laspeyres, evitando en cierto modo el desfase, ya que recoge la
importancia del artículo al considerar la cantidad en el período por comparar. Pre-
senta otros inconvenientes.
P. Juan Verdoy / M. J. Beltrán / M. J. Peris - ISBN: 978-84-15444-38-1 154 Problemas resueltos de estadística aplicada a las ciencias sociales - UJI - DOI: http://dx.doi.org/10.6035/Sapientia100
Índices encadenados
Para calcular el incremento de una serie en un período más largo, podemos utilizar
los índices previamente conocidos de los períodos que internamente conforman el
período total. Así:
Incremento medio
En cierto período largo que incluye varios períodos menores internamente, pode-
mos conocer los incrementos de los períodos menores, uno a uno, consecutiva-
mente y observar entre ellos acusadas diferencias en signos (aumentos y disminu-
ciones) o en magnitud. Para calcular el incremento medio de todos ellos podemos
hacer la raíz del producto de estos índices, teniendo en cuenta que el índice de la
raíz coincide con el número de índices considerados. Así:
Por razones que habrá que profundizar en la teoría, en ciertos momentos había que
hacer un cambio en el año de referencia del cálculo oficial del ipc y se empezaba a
obtener la nueva serie de este índice, comenzado de nuevo con el valor 100. Dire-
mos que se hacía un «cambio de base».
Para obtener los valores del ipc del año «y» en base B hemos multiplicado el ipc
IPC BB
del año «y» en base A por la fracción B
el valor de la que se lo que denomi-
naremos «enlace técnico». IPC A
Sería interesante profundizar en los mecanismos del cálculo del ipc por el ine y
los cambios metodológicos introducidos en los últimos años a partir del 2000 y el
proceso de armonización con Europa.
http://www.ine.es/daco/daco43/metoipc06.pdf
P. Juan Verdoy / M. J. Beltrán / M. J. Peris - ISBN: 978-84-15444-38-1 155 Problemas resueltos de estadística aplicada a las ciencias sociales - UJI - DOI: http://dx.doi.org/10.6035/Sapientia100
Actualización de un valor
Utilizando los valores del ipc, podemos conocer el valor actualizado de una renta,
de un alquiler, de un sueldo, de un bien, etc. Tan solo hemos considerado que esta
operación la podremos hacer siempre y cuando los períodos iniciales y finales por
considerar estén ambos antes o después de enero de 2002. En otro caso, habrá que
recurrir a un índice lau que se puede encontrar en el ine:
El incremento de estos precios está reflejado en el ipc que publica el ine cada mes.
Nosotros tomaremos la media anual general de este índice que podremos encon-
trar fácilmente en la web de este organismo.
= =
A tal fin, comenzaremos por calcular los índices «encadenados» de los salarios,
que nos permitirán averiguar los incrementos salariales anuales, y a partir de los
valores del ipc publicados en el ine podremos hacer lo mismo.
P. Juan Verdoy / M. J. Beltrán / M. J. Peris - ISBN: 978-84-15444-38-1 156 Problemas resueltos de estadística aplicada a las ciencias sociales - UJI - DOI: http://dx.doi.org/10.6035/Sapientia100
Deflactar una serie o pasarla a temas reales
P. Juan Verdoy / M. J. Beltrán / M. J. Peris - ISBN: 978-84-15444-38-1 157 Problemas resueltos de estadística aplicada a las ciencias sociales - UJI - DOI: http://dx.doi.org/10.6035/Sapientia100
Objetivos
Los problemas deben permitir que los alumnos alcancen los objetivos didácticos:
3a) Saber calcular los números índices simples de una serie de valores para
estudiar la evolución de una magnitud a lo largo del tiempo.
3b) Interpretar el valor del índice para conocer el incremento porcentual de la
magnitud en el período indicado y viceversa.
3c) Saber calcular índices con la misma base de referencia y también índices
encadenados.
3d ) Calcular el incremento total y medio de una serie en cierto período, así
como los índices correspondientes, tanto si conocemos los términos de una
serie como si conocemos sus incrementos porcentuales por períodos.
3e) Conocer y calcular el enlace para cambiar de base los índices.
3f ) Conocer las fórmulas de Laspeyres y Paasche como índices complejos.
3g) Actualizar el valor de un bien utilizando los valores del ipc.
3h) Deflactar una serie utilizando el ipc.
3i) Conocer el concepto de términos monetarios nominales (moneda corriente)
y términos reales (moneda constante) en una serie económica para evaluar
su evolución.
3j) Hacer previsiones de los valores de una serie para datos inmediatos.
3k) Saber calcular las variaciones del poder adquisitivo de un salario, en fun-
ción de las variaciones del salario y del ipc.
La tabla siguiente nos muestra cómo están distribuidos los objetivos según los
ejercicios:
Objetivos
3a 3b 3c 3d 3e 3f 3g 3h 3i 3j 3k
Ejercicio
1 x x x x x
2 x x x x x
3 x x x x x
4 x
5 x
6 x
7 x x x x
8 x
9 x
10 x x x x x x x x
P. Juan Verdoy / M. J. Beltrán / M. J. Peris - ISBN: 978-84-15444-38-1 158 Problemas resueltos de estadística aplicada a las ciencias sociales - UJI - DOI: http://dx.doi.org/10.6035/Sapientia100
Enunciados
3a) Saber calcular los números índi-
ces simples de una serie de valores
para estudiar la evolución de una
magnitud a lo largo del tiempo.
3b) Interpretar el valor del índice para
conocer el incremento porcentual
de la magnitud en el período indi-
cado y viceversa.
3c) Saber calcular índices con la mis-
ma base de referencia y también
índices encadenados.
3d) Calcular el incremento total y me-
dio de una serie en cierto período,
así como los índices correspon-
dientes, tanto si conocemos los
términos de una serie como si co-
nocemos sus incrementos porcen-
tuales por períodos.
3j) Hacer previsiones de los valores de
una serie para datos inmediatos.
Ejercicio 1
A continuación presentamos el volumen total de alumnos matriculados en la Uni-
versitat Jaume I en los últimos años.
a) Calcula los índices para cada año, tomando como año de referencia el 2005
(hará referencia al curso 2005-2006). Interpreta el resultado.
b) Calcula los índices encadenados de esta serie. Interpreta los resultados.
c) Calcula el incremento total e incremento medio anual de este período, a par-
tir de las cantidades originales y de los índices encadenados.
d) Haz previsiones para la matrícula del curso 2011/2012 y 2012/2013 si con-
sideramos que no habrán cambios significativos en su comportamiento.
P. Juan Verdoy / M. J. Beltrán / M. J. Peris - ISBN: 978-84-15444-38-1 159 Problemas resueltos de estadística aplicada a las ciencias sociales - UJI - DOI: http://dx.doi.org/10.6035/Sapientia100
3a) Saber calcular los números índices
simples de una serie de valores
para estudiar la evolución de una
magnitud a lo largo del tiempo.
3b) Interpretar el valor del índice para
conocer el incremento porcentual
de la magnitud en el período indi-
cado y viceversa.
3c) Saber calcular índices con la mis-
ma base de referencia y también
índices encadenados.
3d) Calcular el incremento total y me-
dio de una serie en cierto período,
así como los índices correspon-
dientes, tanto si conocemos los
términos de una serie como si co-
nocemos sus incrementos porcen-
tuales por períodos.
3j) Hacer previsiones de los valores de
una serie para datos inmediatos.
Ejercicio 2
En la siguiente tabla se muestran los datos del ini que hacen referencia al total de
visitantes a los parques nacionales de España, en los años que hacemos referencia.
Naturaleza y biodiversidad
Zonas protegidas
Número de visitantes por nacionalidades y período
Unidades: número de personas
Total
2000 10252799
2001 10002517
2002 9661493
2003 10296382
2004 11134880
2005 10743480
2006 10979470
2007 10864738
2008 10222818
2009 9952606
Fuente: Ministerio de Medio Ambiente y Medio Rural y Marino.
Red de parques Naturales.
Copyright ine 2011
P. Juan Verdoy / M. J. Beltrán / M. J. Peris - ISBN: 978-84-15444-38-1 160 Problemas resueltos de estadística aplicada a las ciencias sociales - UJI - DOI: http://dx.doi.org/10.6035/Sapientia100
a) Calcula los índices para cada año, tomando como año de referencia el 2000
e interpreta el resultado.
b) Calcula los índices encadenados de esta serie. Interpreta los resultados.
c) Calcula el incremento total e incremento medio anual de este período, a par-
tir de las cantidades originales y de los índices encadenados.
d) Haz previsiones del número de visitantes de los parques considerados para
los años 2010, 2011 y 2012, si consideramos que no hubiera cambios signi-
ficativos en el comportamiento de la afluencia.
Fuente: ine
Ejercicio 3
A continuación presentamos las variaciones porcentuales del volumen de ventas
de cierta superficie comercial, en los últimos años.
P. Juan Verdoy / M. J. Beltrán / M. J. Peris - ISBN: 978-84-15444-38-1 161 Problemas resueltos de estadística aplicada a las ciencias sociales - UJI - DOI: http://dx.doi.org/10.6035/Sapientia100
a) Calcula los índices de las ventas de cada año, tomando como referencia el
año 2005 y los índices encadenados.
b) Calcula la variación o incremento medio anual y total de las ventas en este
período.
c) Estima las ventas de los dos años siguientes si suponemos que no hay cam-
bios significativos en el comportamiento de las ventas en estos años.
Ejercicio 4
A continuación presentamos los valores del índice de precios al consumo, ipc, que
podemos consultar en la página del ine, y que hace referencia a los datos en base
a 2001 y 2006.
Por razones que habrá que estudiar en la teoría, en ciertos momentos hay que hacer
un cambio en el año de referencia y se empieza a obtener la nueva serie del ipc, co-
menzado de nuevo con el valor 100. Diremos que ha habido un «cambio de base».
A menudo, como podrás ver en ejercicios posteriores, hay que utilizar en un mis-
mo cálculo el valor del ipc de años que corresponden a períodos de bases diferen-
tes y necesitaremos trabajar con todos los valores del ipc referidos a una misma
base. Estos datos los podrás encontrar fácilmente en la página web del ine, pero
en este ejercicio vamos a ver cómo se calculan los valores de las casillas que están
sombreadas en gris.
En primer lugar, presentamos la tabla de los valores del ipc desde el año 2002 al
2006 en base 2001.
General
Media anual
2006 117,624
2005 113,63
2004 109,927
2003 106,684
2002 103,538
P. Juan Verdoy / M. J. Beltrán / M. J. Peris - ISBN: 978-84-15444-38-1 162 Problemas resueltos de estadística aplicada a las ciencias sociales - UJI - DOI: http://dx.doi.org/10.6035/Sapientia100
Y a continuación, los datos de los valores del ipc desde el año 2006 al 2010 en base
2006, aunque están añadidos los valores de las casillas grises que corresponden a
los valores obtenidos «a posteriori» para facilitar los trabajos de cálculo referidos
a períodos de diferentes bases.
General
Media anual
2010 108,588
2009 106,668
2008 106,976
2007 102,787
2006 100
2005 96,604
2004 93,456
2003 90,699
2002 88,024
Explica cómo se han obtenido los datos de las casillas sombreadas en gris, averi-
guando el valor del enlace.
Fuente: ine
Ejercicio 5
Calcular los índices de precios y cantidades de los artículos A, B y C mediante la
fórmula de Laspeyres y Paasche, de los años 2008, 2009 y 2010 en función del
año 2008, utilizando los datos de las siguientes tablas donde están indicadas las
cantidades qi y precios pi que hay que conocer.
P. Juan Verdoy / M. J. Beltrán / M. J. Peris - ISBN: 978-84-15444-38-1 163 Problemas resueltos de estadística aplicada a las ciencias sociales - UJI - DOI: http://dx.doi.org/10.6035/Sapientia100
2008 2009 2010
Art. B 10 50 8 65 7 72
Art.
5 20 10 10 15 5
C
Ejercicio 6
Supongamos que compramos una vivienda por 16.125.000 ptas. en diciembre de
1998 y la hemos vendido en diciembre de 2006 por un valor de 240.000 euros.
Averigua el porcentaje de beneficios o pérdidas que hemos tenido en la operación.
Nota: Para realizar las operaciones consultaremos los valores del ipc que necesi-
tamos en la página web del ine. www.ine.es (sería interesante calcular este incre-
mento con el ipc general y con el ipc del grupo de la vivienda).
Ejercicio 7
En la siguiente tabla mostramos los datos de los impuestos municipales de cierta
vivienda en los últimos años.
P. Juan Verdoy / M. J. Beltrán / M. J. Peris - ISBN: 978-84-15444-38-1 164 Problemas resueltos de estadística aplicada a las ciencias sociales - UJI - DOI: http://dx.doi.org/10.6035/Sapientia100
Importe impuesto municipal
Año
(términos nominales)
2006 503,24
2007 515,65
2008 536,73
2009 578,84
2010 584,42
Nota: Para resolver este ejercicio utilizaremos los valores de la media anual del ipc
general que necesitamos, obteniéndose de la página web del ine. www.ine.es
Ejercicio 8
En la tabla siguiente se indica el valor de la nómina mensual de un trabajador en
los últimos años.
2007 2034,75
2008 2062,13
2009 2218,61
2010 2253,67
2011 2181,75
P. Juan Verdoy / M. J. Beltrán / M. J. Peris - ISBN: 978-84-15444-38-1 165 Problemas resueltos de estadística aplicada a las ciencias sociales - UJI - DOI: http://dx.doi.org/10.6035/Sapientia100
3k) Saber calcular las variaciones del
poder adquisitivo de un salario, en
función de las variaciones del sa-
lario y del ipc.
Ejercicio 9
En las tablas siguientes se presentan los valores del ipc y el incremento salarial de
un trabajador en los años que se indica en cierta comunidad.
P. Juan Verdoy / M. J. Beltrán / M. J. Peris - ISBN: 978-84-15444-38-1 166 Problemas resueltos de estadística aplicada a las ciencias sociales - UJI - DOI: http://dx.doi.org/10.6035/Sapientia100
3a) Saber calcular los números índices
simples de una serie de valores para
estudiar la evolución de una magni-
tud a lo largo del tiempo.
3b) Interpretar el valor del índice para
conocer el incremento porcentual de
la magnitud en el período indicado y
viceversa.
3c) Saber calcular índices con la misma
base de referencia y también índices
encadenados.
3d) Calcular el incremento total y medio de
una serie en cierto período, así como
los índices correspondientes, tanto si
conocemos los términos de una serie
como si conocemos sus incrementos
porcentuales por períodos.
3e) Conocer y calcular el enlace para
cambiar de base los índices.
3h) Deflactar una serie utilizando el ipc.
3i) Conocer el concepto de términos mo-
netarios nominales (moneda corrien-
te) y términos reales (moneda cons-
tante) en una serie económica para
evaluar su evolución.
3j) Hacer previsiones de los valores de
una serie para datos inmediatos.
Ejercicio 10
Para hacer un estudio de la evolución del precio de cierto modelo de ordenador en
términos reales, disponemos de los datos que presentamos en la tabla siguiente:
a) Calcula el incremento anual, medio y total del precio del ordenador en tér-
minos reales.
b) Si seguimos esta evolución, estima el precio que podría tener el ordenador
en 2008.
c)
2000 2001 2002 2003 2004
ipc base 1992 131 135 139
ipc base 2002 103 106 109
1300 1275 1250 1100 950
Nota: Debemos recurrir a períodos y valores muy antiguos o imaginados para tra-
bajar el objetivo del cambio de base del ipc, debido a que con la nueva metodología
del cálculo del ipc por el ine esta circunstancia se ha superado, pero es importante
que el alumno conozca este contenido para advertir la necesidad de no trabajar en
series de ipc no adecuadas en un mismo ejercicio.
P. Juan Verdoy / M. J. Beltrán / M. J. Peris - ISBN: 978-84-15444-38-1 167 Problemas resueltos de estadística aplicada a las ciencias sociales - UJI - DOI: http://dx.doi.org/10.6035/Sapientia100
Ayudas
En este apartado se presentarán las ayudas para emplear en caso de ser necesario
a la hora de realizar los ejercicios y problemas. Es conveniente no hacer un abuso
excesivo de estas ayudas, es decir, antes de emplearlas hay que pensar el problema
al menos durante unos 10-15 minutos. Después se consultará la ayuda de tipo 1 y
se intentará resolver el ejercicio con esta ayuda. Si no es posible resolverlo, enton-
ces se consultará la ayuda de tipo 2; y en último término la solución.
Ayudas Tipo 1
Ejercicio 1
En el apartado a) hay que calcular los índices en base 2005, comparando de mane-
ra porcentual cada valor de la lista con 12.676.
En el apartado b) hay que hacer lo mismo que en el apartado anterior pero compa-
rando cada valor de la lista con la anterior, utilizando e interpretando los índices
correspondientes.
Hay que decidir el índice de esta raíz, en función del número de años que consi-
deramos en el período.
Ejercicio 2
Todos los apartados de este ejercicio son iguales que los del ejercicio anterior
excepto en un aspecto: el primer ejercicio, los valores de la magnitud siempre cre-
cían, mientras que en este segundo ejercicio algunos valores aumentan y en otros
disminuyen a lo largo del período considerado.
P. Juan Verdoy / M. J. Beltrán / M. J. Peris - ISBN: 978-84-15444-38-1 168 Problemas resueltos de estadística aplicada a las ciencias sociales - UJI - DOI: http://dx.doi.org/10.6035/Sapientia100
Ejercicio 3
En este ejercicio, a diferencia de los dos anteriores, no conocen los valores de la
magnitud que queremos estudiar. En el enunciado nos dan los porcentajes de creci-
miento o decrecimiento directamente. Es necesario que convirtamos esta informa-
ción directamente en índice. Por ejemplo, puedes rellenar la siguiente tabla para
hacer el apartado a) y resolver el resto de apartados como lo has aprendido los
ejercicios 1 y 2.
Es interesante aprender a calcular los índices en base 2005 a partir de los índices
encadenados de la tabla anterior. Por ejemplo:
I 2005
2007
= I 2005
2006
⋅ I 2006
2007
= 0,9687 · 0,9785 = 0,9479
Y así sucesivamente...
I 2005
2008
= I 2005
2006
⋅ I 2006
2007
⋅ I 2007
2008
= ...
I 2005
2009
= I 2005
2006
⋅ I 2006
2007
⋅ I 2007
2008
⋅ I 2008
2009
= ...
I 2005
2010
= I 2005
2006
⋅ I 2006
2007
⋅ I 2007
2008
⋅ I 2008
2009
⋅ I 2009
2010
= ...
I 2005
2011
= I 2005
2006
⋅ I 2006
2007
⋅ I 2007
2008
⋅ I 2008
2009
⋅ I 2009
2010
⋅ I 2010
2011
= ...
En el apartado c) hay que hacer una reflexión. Explicar por qué no es posible hacer
la previsión que nos piden.
P. Juan Verdoy / M. J. Beltrán / M. J. Peris - ISBN: 978-84-15444-38-1 169 Problemas resueltos de estadística aplicada a las ciencias sociales - UJI - DOI: http://dx.doi.org/10.6035/Sapientia100
Ejercicio 4
En este ejercicio nos piden un estudio de cómo se hace un cambio de base en la se-
cuencia de valores del ipc. Recordar que este cálculo es necesario hacerlo siempre
que necesitamos utilizar en una misma operación valores del ipc que corresponden
a años que se han calculado con diferentes bases. También hablaremos del enlace
técnico que permite hacer directamente esta transformación.
Hay que comprender que tan solo se plantea una proporcionalidad (regla de tres)
que se mantiene entre la secuencia de valores de la serie de una base y la serie
obtenida con la base nueva. También hay que considerar que en el año que se
hace el cambio de base, se calcula el ipc con la vieja y nueva base y se plantea la
equivalencia.
2002 2002
IPC2001 = 103,538 g IPC2006 = x
2006 2006
IPC2001 = 117,624 g IPC2006 = 100
Los datos marcados en rojo serán los términos necesarios para definir el enlace
técnico.
Ejercicio 5
Para resolver este ejercicio es necesario conocer las fórmulas que hay que emplear,
y que puedes consultar en un manual de teoría sobre los índices de precios y can-
tidades.
P. Juan Verdoy / M. J. Beltrán / M. J. Peris - ISBN: 978-84-15444-38-1 170 Problemas resueltos de estadística aplicada a las ciencias sociales - UJI - DOI: http://dx.doi.org/10.6035/Sapientia100
Índice de cantidades de Paasche
donde t es el año actual y 0 será el año que tomaremos como referencia en la com-
paración. Si se trata de índices encadenados podríamos decir años t-1 y t.
Ejercicio 6
En este ejercicio en primer lugar, es necesario actualizar la moneda. Nosotros lo
hemos resuelto aplicando el cambio y convirtiendo la cantidad de compra en euros.
Para actualizar el valor, es necesario conocer el valor del ipc del momento de com-
pra y venta en la misma base y operar convenientemente.
Ejercicio 7
En este ejercicio aprenderemos a estudiar el análisis de una magnitud económica
en términos reales.
En el apartado a) hay que transformar los valores originales mediante el ipc para
convertir todos los valores en los equivalentes del año 2006. Esta operación se
llama deflactación de la serie.
Hay que hacer las previsiones de los impuestos en términos reales, multiplicando
la última fecha conocida en términos reales y multiplicándola por el incremento
medio anual tantas veces como años pasen.
P. Juan Verdoy / M. J. Beltrán / M. J. Peris - ISBN: 978-84-15444-38-1 171 Problemas resueltos de estadística aplicada a las ciencias sociales - UJI - DOI: http://dx.doi.org/10.6035/Sapientia100
Hay que hacer también las previsiones del ipc de los años venideros, aplicando a la
última fecha publicada el incremento medio anual obtenido de los ipc de los años
considerados.
Ejercicio 8
En este ejercicio vamos a calcular la pérdida o ganancia de poder adquisitivo de un
salario del que conocemos los valores.
También hay que obtener los valores del ipc de los mismos años de la web del ine.
Con las dos listas hay que calcular los incrementos anuales mediante los índices
encadenados.
Recuerda que para calcular las variaciones del poder adquisitivo es necesario ha-
cer esta operación:
Luego se completa la tabla con la columna equivalente, calculada con los datos
inicial y final del período.
Acabaremos con esta tabla completada, donde ya hemos indicado los incrementos
anuales antes mencionados:
Ejercicio 9
Para hacer este ejercicio solo tienes que hacer el mismo esquema del ejercicio 8.
P. Juan Verdoy / M. J. Beltrán / M. J. Peris - ISBN: 978-84-15444-38-1 172 Problemas resueltos de estadística aplicada a las ciencias sociales - UJI - DOI: http://dx.doi.org/10.6035/Sapientia100
Ejercicio 10
Para empezar hay que hacer un cambio de base y encontrar todos los valores del
ipc en la misma base. Llenaremos la tabla con los nuevos valores encontrados, tal
como se hizo en el ejercicio 4.
a) Calcula el incremento anual, medio y total del precio del ordenador en tér-
minos reales.
Dado que el análisis del precio del ordenador nos lo piden en términos reales,
primero es necesario hacer la conversión del precio de la computadora en moneda
constante del año 2000 (deflactación de la serie de precios de la computadora).
Podemos ayudarnos de las siguientes tablas para dar los resultados de cada año
con más claridad.
IPC1992
2000
2003 1100
2004 950
Para calcular el incremento anual del precio del ordenador en términos reales,
operamos en la tabla siguiente mediante índices encadenados.
P. Juan Verdoy / M. J. Beltrán / M. J. Peris - ISBN: 978-84-15444-38-1 173 Problemas resueltos de estadística aplicada a las ciencias sociales - UJI - DOI: http://dx.doi.org/10.6035/Sapientia100
Precio ordenador Precio ordenador
Interpretación:
Año (términos (términos reales Índice
Incremento anual
nominales) 2000)
....... Ha disminuido un
2001 1275 1237,2
.........%
Para hacer este apartado, consideremos que nos piden la estimación en términos
corrientes del precio, suponiendo que no varía el comportamiento del ipc ni la evo-
lución del precio del ordenador en términos reales, que hemos analizado en el
apartado anterior.
Para hacer estas estimaciones necesitamos el incremento medio de las dos series y
con estos datos, podremos estimar el valor del ipc el año 2008.
Haremos las mismas operaciones con la serie de los precios de los ordenadores
en términos reales y, por último, hay que pasar el resultado a términos corrientes en
moneda del año 2008.
P. Juan Verdoy / M. J. Beltrán / M. J. Peris - ISBN: 978-84-15444-38-1 174 Problemas resueltos de estadística aplicada a las ciencias sociales - UJI - DOI: http://dx.doi.org/10.6035/Sapientia100
Ayudas Tipo 2
Ejercicio 1
En el apartado a), para calcular los índices, proponemos llenar esta tabla:
2006 12928
Curso 2006/2007 12928 I 2005 = = 1,01988009
12676
2007 13159
Curso 2007/2008 13159 I 2005 = =
12676
2008 13210
Curso 2008/2009 13210 I 2005 = =
12676
2009
Curso 2009/2010 13904 I 2005 =
2010
Curso 2010/2011 14702 I 2005 =
Número total
Índices encadenados
alumnos matriculados
Curso 2005/2006 12676 ---
2006 12928
Curso 2006/2007 12928 I 2005 = = 1,01988009
12676
2007 13159
Curso 2007/2008 13159 I 2006 = =
12928
2008
Curso 2008/2009 13210 I 2007 =
2009
Curso 2009/2010 13904 I 2008 =
2010
Curso 2010/2011 14702 I 2009 =
P. Juan Verdoy / M. J. Beltrán / M. J. Peris - ISBN: 978-84-15444-38-1 175 Problemas resueltos de estadística aplicada a las ciencias sociales - UJI - DOI: http://dx.doi.org/10.6035/Sapientia100
Interpretaremos también los resultados de la columna de la derecha. Como los
índices son todos mayores que 1, indica que la serie siempre aumenta pero a dife-
rente ritmo, según el año que analicemos.
2010 14702
En el apartado c) nos piden el incremento total del período I 2005 = = 1,16.
12676
Y el incremento medio anual con la raíz quinta de este cociente.
Así, para estimar la cantidad de alumnos que podemos esperar que se matricule en
el curso 2011/2012, será de 14.702 · 1,03 = 15.143 alumnos.
Ejercicio 2
Este ejercicio es igual que el ejercicio 1, pero obtendremos algunos índices por
encima de1 y otros por debajo. Dejemos la interpretación para los lectores.
2001 10002517
2001 10002517 I 2000 = =
10252799
2002 9661493
2002 9661493 I 2000 = = 0,94232736
10252799
2003 10296382
2003 10296382 I 2000 = = 1,00425084
10252799
2004 11134880
2004 11134880 I 2000 = =
10252799
2005 10743480
2005 10743480 I 2000 = = 1,04785825
10252799
P. Juan Verdoy / M. J. Beltrán / M. J. Peris - ISBN: 978-84-15444-38-1 176 Problemas resueltos de estadística aplicada a las ciencias sociales - UJI - DOI: http://dx.doi.org/10.6035/Sapientia100
2006 10979470
2006 10979470 I 2000 = =
10252799
2007
2007 10864738 I 2000 =
2008
2008 10222818 I 2000 =
2009
2009 9952606 I 2000 =
Para calcular los índices encadenados del apartado b) también sugerimos los cál-
culos por realizar en la última columna de la siguiente tabla:
Número total
Índices encadenados
visitantes
2000 10252799
2001 10002517
2001 10002517 I 2000 = = 0,97558891
10252799
2002 9661493
2002 9661493 I 2001 = =
10002517
2003 10296382
2003 10296382 I 2002 = =
9661493
2004
2004 11134880 I 2003 = = 1,08143618
10296382
2005 10743480
2005 10743480 I 2004 = = 0,96484919
2006
2006 10979470 I 2005 = = 1,02196588
2007
2007 10864738 I 2006 =
2008
2008 10222818 I 2007 =
2009
2009 9952606 I 2008 =
En el apartado c) nos piden el incremento total. Hay que obtener el siguiente índice
2009
I 2000 y con el resultado hacer la raíz que nos permita averiguar el valor del incre-
mento medio anual del –0,33 %.
P. Juan Verdoy / M. J. Beltrán / M. J. Peris - ISBN: 978-84-15444-38-1 177 Problemas resueltos de estadística aplicada a las ciencias sociales - UJI - DOI: http://dx.doi.org/10.6035/Sapientia100
En el apartado d) nos piden previsiones que calcularemos a partir del últim dato
conocido (9.952.606) y aplicando reiteradamente el factor correspondiente al in-
cremento medio anual del –0,33 % (0,9967).
Ejercicio 3
Este ejercicio trabaja los mismos conceptos que los anteriores, pero empezando por
incrementos porcentuales que permiten convertirlos en índice encadenados directa-
mente. En la tabla siguiente se indican algunos valores y os invitamos a completarla:
Para calcular los índices de base 2005, multiplicaremos los índices anteriores (aquí
tienes calculados algunos de ellos. Calcula tú el resto).
I 2005
2007
= I 2005
2006
⋅ I 2006
2007
= 0,9687 · 0,9785 = 0,9479
I 2005
2008
= I 2005
2006
⋅ I 2006
2007
⋅ I 2007
2008
= 0,9687 · 0,9785 · 1,0212 = 0,9680
I 2005
2009
= I 2005
2006
⋅ I 2006
2007
⋅ I 2007
2008
⋅ I 2008
2009
=
I 2005
2010
= I 2005
2006
⋅ I 2006
2007
⋅ I 2007
2008
⋅ I 2008
2009
⋅ I 2009
2010
=
I 2005
2011
= I 2005
2006
⋅ I 2006
2007
⋅ I 2007
2008
⋅ I 2008
2009
⋅ I 2009
2010
⋅ I 2010
2011
=
= 0,9687 · 0,9785 · 1,0212 · 1,0315 · 1,0412 · 1,0431 = 1,0844
En el apartado b) nos piden el incremento total a partir de los factores de los índi-
ces, que es el último cálculo que hemos visto y así, el incremento medio anual es:
P. Juan Verdoy / M. J. Beltrán / M. J. Peris - ISBN: 978-84-15444-38-1 178 Problemas resueltos de estadística aplicada a las ciencias sociales - UJI - DOI: http://dx.doi.org/10.6035/Sapientia100
Ejercicio 4
En este ejercicio nos presentan el proceso de cálculo de un cambio de base de los
índices de precios (ipc).
A tal fin hay que considerar los datos que presentamos en esta tabla y plantear
proporcionalidades como las que mostramos a continuación para llenar las casillas
sombreadas en gris.
2002 2002
IPC2001 = 103,538 g IPC2006 = x
2006 2006
IPC2001 = 117,624 g IPC2006 = 100
IPC2001
2002
⋅ IPC2006
2006
103,538·100 100
IPC2006
2002
= = = 103,538 =
IPC20012006
117,624 117,624
= 103,538 · 0,8502 = 88,025
IPC2001
2003
⋅ IPC2006
2006
106,684·100 100
IPC2006
2003
= = = 106,684 =
IPC20012006
117,624 117,624
= 106,684 · 0,8502 = 90,699
Es evidente, que para obtener los valores del ipc del año «y» en base 2006 hemos
2006
IPC 2006
multiplicado el ipc del año «y» en base 2001 por la fracción 2006
el valor de la
IPC 2001
que hemos reseñado en rojo y es lo que denominaremos «enlace técnico».
P. Juan Verdoy / M. J. Beltrán / M. J. Peris - ISBN: 978-84-15444-38-1 179 Problemas resueltos de estadística aplicada a las ciencias sociales - UJI - DOI: http://dx.doi.org/10.6035/Sapientia100
Ejercicio 5
Como en las ayudas de tipo 1 ya hemos presentado las fórmulas por emplear en
cada uno de los casos y el significado de la notación, pondremos un ejemplo hecho
de cada una de ellas:
P. Juan Verdoy / M. J. Beltrán / M. J. Peris - ISBN: 978-84-15444-38-1 180 Problemas resueltos de estadística aplicada a las ciencias sociales - UJI - DOI: http://dx.doi.org/10.6035/Sapientia100
Ejercicio 6
La primera operación permitirá hacer el cambio a euros de la cantidad de compra:
96.913,20 euros en moneda corriente del año 1998, y para transformarla en mone-
da del año 2006, haremos la siguiente operación:
IPC2001
2006
117,624
96913,20 ⋅ = 96913,20 ⋅ = 124961,01€
IPC2001
1998
91,223
Los valores del ipc se encuentran en la web del ine con el consecuente cambio de
base, como aprendimos en el ejercicio 4.
Como en el enunciado se dice que la hemos vendido por 240.000 euros, vamos a cal-
240000
cular los beneficios en términos relativos, a partir del concepto de índice: .
Interpreta el resultado. 124961,01
Ejercicio 7
Para deflactar la serie (pasarla a términos reales del año 2006) hay que hacer las
operaciones que se reflejan en la siguiente tabla. A tal fin, es necesario que con-
sultemos los valores del ipc de estos años. Tomaremos las medias anuales del ipc
general.
IPC2006
2006
100
2007 515,65 515,65 ⋅ = 515,65 ⋅ = 501,67
IPC2006
2007
102, 787
IPC2006
2006
100
2008 536,73 536,73 ⋅ = 536,73 ⋅ =
IPC2006
2008
106,976
IPC2006
2006
100
2009 578,84 578,84 ⋅ = 578,84 ⋅ =
IPC2006
2009
106,668
IPC2006
2006
100
2010 584,42 584,42 ⋅ = 584,42 ⋅ =
IPC2006
2010
108,588
En el apartado b) nos piden los índices encadenados con los valores en términos
reales que presentamos en la siguiente tabla.
P. Juan Verdoy / M. J. Beltrán / M. J. Peris - ISBN: 978-84-15444-38-1 181 Problemas resueltos de estadística aplicada a las ciencias sociales - UJI - DOI: http://dx.doi.org/10.6035/Sapientia100
Importe impuesto Importe impuesto
municipal municipal
Año Índice
(términos (términos reales
nominales) 2006)
2006 503,24 503,24 -----
501,67
2007 515,65 501,67 I 2006
2007
= = 0,997 Ha disminuido un
503,24 0,3 %
501, 73 Podemos
2008 536,73 501,73 I 2007
2008
= considerar
501,67 que es constante
2009
2009 578,84 542,66 I 2008 =
2010 Ha disminuido
2010 584,42 538,20 I 2009 =
un ...%
538,20
I 2006
2010
=
503,24
y para calcular el incremento medio anual, calcularemos la raíz cuarta del resulta-
do anterior.
Calcularemos, en primer lugar, lo que corresponde a los ipc de los años 2006 al 2010
con los datos de la web del ine. Hemos obtenido un incremento del 2,08 % anual y
con este dato y el ipc del año 2010 calcularemos los ipc de los años 2011, 2012 y 2013.
Como estos resultados están expresados en términos reales del año 2006, hay que con-
vertirlos a términos nominales, utilizando los ipc que acabamos de estimar también.
IPC2006
2011
110,847
Año 2011 → 547,25⋅ = 547,25 ⋅ = 606,61
IPC2006
2006
100
Y el resto lo calculamos de la misma manera.
P. Juan Verdoy / M. J. Beltrán / M. J. Peris - ISBN: 978-84-15444-38-1 182 Problemas resueltos de estadística aplicada a las ciencias sociales - UJI - DOI: http://dx.doi.org/10.6035/Sapientia100
Ejercicio 8
En este ejercicio se trata de estudiar la pérdida o ganancia de poder adquisitivo de
un salario.
Habrá que calcular los incrementos anuales de los salarios como se indica en la
siguiente tabla:
2062,13
2008 2062,13 I 2007
2008
= = 1,014 Ha aumentado 1,4 %
2034, 75
2253,67
2010 2253,67 I 2009
2010
= = Ha aumentado 1,6 %
2011
2011 2181,75 I 2010 = = 0,968 Ha disminuido ...%
También calcularemos los incrementos anuales del ipc de los años correspondientes:
ipc
Año Índice
Base 2006
2007 2007 ------ -------
IPC2006 = 102,787
2008 106,976
2008 2008 I 2007 = = 1,041 Ha aumentado 4,1 %
IPC2006 = 106,976 102,787
2009 106,668
2009 2009 I 2008 = = Ha aumentado ...%
IPC2006 = 106,668 106,976
2010 108,588
2010 2010 I 2009 = = Ha aumentado 1,8 %
IPC2006 = 108,588
2011
2011 2011 I 2010 = = Ha disminuido ...%
IPC2006 = 110,847 108,588
Con estos resultados hay que rellenar las casillas en gris de la siguiente tabla:
P. Juan Verdoy / M. J. Beltrán / M. J. Peris - ISBN: 978-84-15444-38-1 183 Problemas resueltos de estadística aplicada a las ciencias sociales - UJI - DOI: http://dx.doi.org/10.6035/Sapientia100
Indicamos cómo obtener el resultado que hemos puesto en la tabla.
1,014
Año 2008 g = 0,974 , de la misma manera podemos llenar el resto de casillas.
1,041
Con los valores de los ipc y los salarios podemos obtener el incremento total del
período de cada una de las magnitudes. Asimismo, añadir los resultados en la co-
lumna de la derecha de la tabla:
Ejercicio 9
Para hacer este ejercicio tienes que seguir las pautas del ejercicio 8.
Ejercicio 10
Para empezar, hay que hacer un cambio de base y encontrar todos los valores del
ipc en la misma base. Llenaremos la tabla con los nuevos valores encontrados,
como se hizo en el ejercicio 4.
Pueden plantearse por proporcionalidad, como aquí se puede ver para el año 2003:
103 g 106
a) Calcula el incremento anual, medio y total del precio del ordenador en tér-
minos reales.
P. Juan Verdoy / M. J. Beltrán / M. J. Peris - ISBN: 978-84-15444-38-1 184 Problemas resueltos de estadística aplicada a las ciencias sociales - UJI - DOI: http://dx.doi.org/10.6035/Sapientia100
Dado que el análisis del precio del ordenador nos lo piden en términos reales, es
necesario primero hacer la conversión de su precio en moneda constante del año
2000 (deflactación de la serie de precios del ordenador) como hemos empezado en
la tabla siguiente;
Precio ordenador
Precio ordenador
Año (términos
(términos reales 2000)
nominales)
2000 1300 1300
IPC1992
2000
IPC1992
2000
IPC1992
2000
Para calcular el incremento anual del precio del ordenador en términos reales,
operamos en la tabla siguiente mediante índices encadenados (intenta acabarla).
1237,2 Ha disminuido
2001 1275 1237,2 I 2000
2001
= = 0,9517
1300 un 4,83 %
Ha disminuido
2002 1250 1178,06
un 4,78 %
1007,34
2003 1100 1007,34 I 2002
2003
= = 0,8551
1178,06
2004 950 846,02
P. Juan Verdoy / M. J. Beltrán / M. J. Peris - ISBN: 978-84-15444-38-1 185 Problemas resueltos de estadística aplicada a las ciencias sociales - UJI - DOI: http://dx.doi.org/10.6035/Sapientia100
Para hacer este apartado, consideremos que nos piden la estimación en términos
corrientes del precio, suponiendo que no varía el comportamiento del ipc ni la
evolución del precio del ordenador en términos reales que hemos analizado en el
apartado anterior.
Para hacer estas estimaciones necesitamos el incremento medio de las dos series y,
con estos datos, podemos calcular el valor del ipc en el año 2008:
IPC
IPC
IPC
2008
==IPC
2008
1992
2008
1992
1992 =IPC
IPC
2004
·1,0294
2004
1992 · ·1,0294
2004
1992
1992 ·1,0294==147,10·1,0294
4 4 4
=147,10·1,0294
147,10·1,0294
· ==165,18
4 4 4
=165,18
165,18
Haremos las mismas operaciones con la serie de los precios de los ordenadores en
términos reales.
Precio ordenador para el año 2008 en términos reales del 2000 = 846,02 · 0,89824
= 550,65 euros.
P. Juan Verdoy / M. J. Beltrán / M. J. Peris - ISBN: 978-84-15444-38-1 186 Problemas resueltos de estadística aplicada a las ciencias sociales - UJI - DOI: http://dx.doi.org/10.6035/Sapientia100
Soluciones
Ejercicio 1
A continuación presentamos el volumen total de alumnos matriculados en la Uni-
versitat Jaume I en los últimos años.
a) Calcula los índices para cada año, tomando como año de referencia el 2005
(hará referencia al curso 2005/2006). Interpreta el resultado.
b) Calcula los índices encadenados de esta serie. Interpreta los resultados.
c) Calcula el incremento total e incremento medio anual de este período, a par-
tir de las cantidades originales y a partir de los índices encadenados.
d) Haz previsiones para la matrícula de los cursos 2011/2012 y 2012/2013, si
consideramos que no habrá cambios significativos en su comportamiento.
Solución
a) Calcula los índices para cada año, tomando como año de referencia el 2005
(hará referencia al curso 2005/2006). Interpreta el resultado.
P. Juan Verdoy / M. J. Beltrán / M. J. Peris - ISBN: 978-84-15444-38-1 187 Problemas resueltos de estadística aplicada a las ciencias sociales - UJI - DOI: http://dx.doi.org/10.6035/Sapientia100
Número total Índice
alumnos matriculados Base 2005
2005
Curso 2005/2006 12676 I 2005 =1
12928
Curso 2006/2007 12928 2006
I 2005 = 12676 = 1,01988009
13159
Curso 2007/2008 13159 2007
I 2005 = 12676 = 1,0381035
13210
Curso 2008/2009 13210 2008
I 2005 = 12676 = 1,04212685
13904
Curso 2009/2010 13904 2009
I 2005 = 12676 = 1,09687599
14702
Curso 2010/2011 14702 2010
I 2005 = 12676 = 1,1598296
Para interpretar estos datos consideraremos que estos cocientes comparan dos
magnitudes en términos relativos y son cantidades que no vienen expresadas en
ninguna unidad, sino que podemos interpretarlas como porcentajes. Así, si redon-
deamos los resultados con dos cifras decimales podremos decir:
2006
I 2005 = 1,02 nos indica que el número de alumnos del curso 2006 es un 2 % superior
2006 12928
al del año 2005. También podríamos expresarlos así I 2005 = ⋅100 = 102 %.
12676
2007
I 2005 = 1,04 nos indica que el número de alumnos del curso 2007 es un 4 % supe-
rior al del 2005.
2008
I 2005 = 1,04 nos indica que el número de alumnos del curso 2008 es un 4 % su-
perior al del año 2005. Indica un cierto estacionamiento en el aumento del número
de alumnos.
2009
I 2005 = 1,10 nos indica que el número de alumnos del curso 2009 es un 10% su-
perior al del 2005.
2010
I 2005 = 1,16 nos indica que el número de alumnos del curso 2010 es un 16 % su-
perior al del 2005.
Estos índices dan idea del aumento del número total de alumnos de la uji, conside-
rando siempre como referencia el número de alumnos del curso 2005 que podre-
mos considerar que sería del 100 %.
P. Juan Verdoy / M. J. Beltrán / M. J. Peris - ISBN: 978-84-15444-38-1 188 Problemas resueltos de estadística aplicada a las ciencias sociales - UJI - DOI: http://dx.doi.org/10.6035/Sapientia100
b) Calcula los índices encadenados de esta serie. Interpreta los resultados.
Para calcular estos índices utilizaremos la siguiente tabla, que podremos comparar
con la tabla del apartado anterior:
Número total
Índice encadenado
alumnos matriculados
Curso 2005/2006 12676
2006 12928
Curso 2006/2007 12928 I 2005 = = 1,01988009
12676
2007 13159
Curso 2007/2008 13159 I 2006 = = 1,01786819
12928
2008 13210
Curso 2008/2009 13210 I 2007 = = 1,00387567
13159
2009 13904
Curso 2009/2010 13904 I 2008 = = 1,05253596
13210
2010 14702
Curso 2010/2011 14702 I 2009 = = 1,05739356
13904
Como se puede ver en estos índices, la cantidad que tomamos como referencia es
el número de alumnos matriculados en el año anterior, por lo que podemos deno-
minarlos «índices encadenados» y nos permitirá ver el crecimiento año tras año.
2006
I 2005 = 1,02 nos indica que el número de alumnos del curso 2006 es un 2 % supe-
rior al del 2005.
2007
I 2006 = 1,02 nos indica que el número de alumnos del curso 2007 es un 2 % supe-
rior al del año 2006.
2008
I 2007 = 1,004 nos indica que el número de alumnos del curso 2008 es un 0,4 %
superior al del año 2007.
2009
I 2008 = 1,05 nos indica que el número de alumnos del curso 2009 es un 5 % supe-
rior al del año 2008.
2010
I 2009 = 1,06 nos indica que el número de alumnos del curso 2010 es un 6 % supe-
rior al del año 2009.
Estos índices dan idea del aumento del número total de alumnos de la uji, pero
detallando la evolución por años.
P. Juan Verdoy / M. J. Beltrán / M. J. Peris - ISBN: 978-84-15444-38-1 189 Problemas resueltos de estadística aplicada a las ciencias sociales - UJI - DOI: http://dx.doi.org/10.6035/Sapientia100
c) Calcula el incremento total e incremento medio anual de este período, a par-
tir de las cantidades originales y a partir de los índices encadenados.
Para calcular el incremento total basándonos en las cantidades originales, tan solo
hay que considerar el número de alumnos de los primeros y últimos cursos, para com-
pararlos. Este concepto corresponde al último índice calculado en el apartado a). Así:
2010 14702
I 2005 = = 1,16 que ya hemos comentado que nos indica que el número de
12676
alumnos se ha incrementado en un 16 % en el período estudiado.
Para obtener el incremento medio anual, habrá que considerar la raíz con un índice
que viene dado por el número de incrementos que contiene el período estudiado.
Notamos que corresponde al número de años menos uno. Así, en nuestro ejercicio:
14702 5
5 = 1,1598296 = 1,03
12676
y podremos interpretar que este crecimiento total del 16 % sería equivalente a un
crecimiento constante anual del 3 %.
I 2005
2010
= I 2005
2006
⋅ I 2006
2007
⋅ I 2007
2008
⋅ I 2008
2009
⋅ I 2009
2010
=
Para calcular el incremento medio, calcularemos pues la raíz quinta del producto
de los índices (el índice de la raíz coincide con el número de índices que forman
el producto).
P. Juan Verdoy / M. J. Beltrán / M. J. Peris - ISBN: 978-84-15444-38-1 190 Problemas resueltos de estadística aplicada a las ciencias sociales - UJI - DOI: http://dx.doi.org/10.6035/Sapientia100
d ) Haz previsiones para la matrícula de los cursos 2011/2012 y 2012/2013, si
consideramos que no habrá cambios significativos en su comportamiento.
Para hacer previsiones hay que partir de la hipótesis de que el incremento medio
anual que hemos obtenido en el apartado anterior, podría ser una estimación del
incremento anual de los años que están por venir y que, a partir del último dato
conocid, calcularemos las cantidades de alumnos que podremos esperar.
Así, para estimar la cantidad de alumnos que podemos esperar que se matricule en
el curso 2011/2012, será de 14.702 · 1,03 = 15.143 alumnos.
Notamos que por previsiones o estimaciones partiremos del último dato real y lo
multiplicaremos por el incremento medio anual que hemos calculado previamente,
y elevándolo al número de años o períodos que están por venir.
Ejercicio 2
En la siguiente tabla se muestran los datos del ini que hacen referencia al total de
visitantes a los parques nacionales de España, en los años indicados.
Naturaleza y biodiversidad
Zonas protegidas
Número de visitantes por nacionalidades y período
Unidades: número de personas
Total
2000 10252799
2001 10002517
2002 9661493
2003 10296382
2004 11134880
2005 10743480
2006 10979470
2007 10864738
2008 10222818
2009 9952606
Fuente: Ministerio de Medio Ambiente y Medio Rural y Marino. Red de
Parques Naturales
Copyright ine 2011
P. Juan Verdoy / M. J. Beltrán / M. J. Peris - ISBN: 978-84-15444-38-1 191 Problemas resueltos de estadística aplicada a las ciencias sociales - UJI - DOI: http://dx.doi.org/10.6035/Sapientia100
a) Calcula los índices para cada año, tomando como año de referencia el 2000
e interpreta los resultados.
b) Calcula los índices encadenados de esta serie. Interpreta los resultados.
c) Calcula el incremento total e incremento medio anual de este período, a par-
tir de las cantidades originales y a partir de los índices encadenados.
d) Haz previsiones del número de visitantes de los parques considerados para
los años 2010, 2011 y 2012, si consideramos que no hubiera cambios signi-
ficativos en el comportamiento de la afluencia.
Fuente: ine
Solución
a) Calcula los índices para cada año, tomando como año de referencia el 2000
e interpreta los resultados.
Tomaremos como fecha de referencia, los 10.252.799 visitantes que recorrieron los
parques naturales de España en su totalidad en el año 2000 y en la siguiente tabla
indicaremos los cocientes correspondientes a los índices que queremos calcular:
2001 10002517
2001 10002517 I 2000 = = 0,97558891
10252799
2002 9661493
2002 9661493 I 2000 = = 0,94232736
10252799
2003 10296382
2003 10296382 I 2000 = = 1,00425084
10252799
2004 11134880
2004 11134880 I 2000 = = 1,08603319
10252799
2005 10743480
2005 10743480 I 2000 = = 1,04785825
10252799
10979470
2006 10979470 2006
I 2000 = 10252799 = 1,07087538
10864738
2007 10864738 2007
I 2000 = 10252799 = 1,05968507
10222818
2008 10222818 2008
I 2000 = 10252799 = 0,99707582
9952606
2009 9952606 2009
I 2000 = 10252799 = 0,97072087
P. Juan Verdoy / M. J. Beltrán / M. J. Peris - ISBN: 978-84-15444-38-1 192 Problemas resueltos de estadística aplicada a las ciencias sociales - UJI - DOI: http://dx.doi.org/10.6035/Sapientia100
Para interpretar estos datos consideraremos que estos cocientes comparan dos
magnitudes en términos relativos y podemos interpretarlas como porcentajes. A
diferencia del apartado anterior, esta magnitud disminuye y crece según de qué
período sean los datos. Así, si redondeamos los resultados con dos cifras decima-
les podremos decir:
2001
I 2000 = 0,98 nos indica que el número de visitantes ha disminuido un 2 % del año
2000 al 2001.
2002
I 2000 = 0,94 nos indica que el número de visitantes ha disminuido un 6 % del año
2000 al 2002.
2003
I 2000 = 1,004 nos indica que el número de visitantes ha aumentado un 0,4 % del
año 2000 al 2003.
2004
I 2000 = 1,09 nos indica que el número de visitantes ha aumentado un 9 % del año
2000 al 2004.
2005
I 2000 = 1,05 nos indica que el número de visitantes ha aumentado un 5 % del año
2000 al 2005.
2006
I 2000 = 1,07 nos indica que el número de visitantes ha aumentado un 7 % del año
2000 al 2006.
2007
I 2000 = 1,06 nos indica que el número de visitantes ha aumentado un 6 % del año
2000 al 2007.
2008
I 2000 = 0,997 nos indica que el número de visitantes ha aumentado un 0,3 % del
año 2000 al 2008.
2009
I 2000 = 0,97 nos indica que el número de visitantes ha aumentado un 5 % del año
2000 al 2009.
Estos índices dan idea de las variaciones en el número de visitantes a los parques
de España, a pesar de que tan solo consideran los valores del comienzo y la fina-
lización del período referido y no se reflejan las fluctuaciones dentro del período.
Para calcular estos índices, utilizaremos la siguiente tabla, que podremos compa-
rarla con la del apartado anterior:
P. Juan Verdoy / M. J. Beltrán / M. J. Peris - ISBN: 978-84-15444-38-1 193 Problemas resueltos de estadística aplicada a las ciencias sociales - UJI - DOI: http://dx.doi.org/10.6035/Sapientia100
Número total
Índice encadenados
visitantes
2000 10252799
2001 10002517
2001 10002517 I 2000 = = 0,97558891
10252799
2002 9661493
2002 9661493 I 2001 = = 0,96590618
10002517
2003 10296382
2003 10296382 I 2002 = = 1,06571334
9661493
2004 11134880
2004 11134880 I 2003 = = 1,08143618
10296382
2005 10743480
2005 10743480 I 2004 = = 0,96484919
11134880
10979470
2006 10979470 2006
I 2005 = 10743480 = 1,02196588
10864738
2007 10864738 2007
I 2006 = 10979470 = 0,98955032
10222818
2008 10222818 2008
I 2007 = 10864738 = 0,94091712
9952606
2009 9952606 2009
I 2008 = 10222818 = 0,97356776
Como se puede ver en estos índices, la cantidad que tomamos como referencia es
el número de visitantes de los parques del año anterior, por lo que podemos deno-
minarlos «índices encadenados» y nos permitirá ver el crecimiento año tras año.
2001
I 2000 = 0,98 nos indica que el número de visitantes ha disminuido un 2 % del año
2000 al 2001.
2002
I 2001 = 0,97 nos indica que el número de visitantes ha disminuido un 3 % del año
2001 al 2002.
2003
I 2002 = 1,07 nos indica que el número de visitantes ha disminuido un 7 % del año
2002 al 2003.
2004
I 2003 = 1,08 nos indica que el número de visitantes ha disminuido un 8 % del año
2003 al 2004.
P. Juan Verdoy / M. J. Beltrán / M. J. Peris - ISBN: 978-84-15444-38-1 194 Problemas resueltos de estadística aplicada a las ciencias sociales - UJI - DOI: http://dx.doi.org/10.6035/Sapientia100
2005
I 2004 = 0,96 nos indica que el número de visitantes ha disminuido un 4 % en 2004
a 2005.
2006
I 2005 = 1,02 nos indica que el número de visitantes ha disminuido un 2 % en 2005
a 2006.
2007
I 2006 = 0,99 nos indica que el número de visitantes ha disminuido un 1 % del año
2006 al 2007.
2008
I 2007 = 0,94 nos indica que el número de visitantes ha disminuido un 6 % del año
2007 al 2008.
2009
I 2008 = 0,97 nos indica que el número de visitantes ha disminuido un 3 % del año
2008 al 2009.
Estos índices dan idea del aumento del número total de visitantes en todo el perío-
do detallando la evolución por años, por lo que podemos diferenciar los años en
que el número ha aumentado y en los que ha disminuido.
Para calcular el incremento total basándonos en las cantidades originales, tan solo
hay que considerar el número de visitantes del primer y último año del período por
analizar. Este concepto corresponde al último índice calculado en el apartado a). Así:
0,97 nos indica que si comparamos las visitas del año 2009 con las del año 2000,
veremos que han disminuido un 3 %.
Para obtener el incremento medio anual, habrá que considerar la raíz con un índice
9 que viene dado por el número de incrementos que contiene el período estudiado.
Notamos que corresponde al número de años o datos menos uno. Así, con los datos
del ejercicio:
9952606 9
9 = 0,97072087 = 0,9967
10252799
Reseñamos que en estos cálculos que hemos hecho, tan solo hemos utilizado el
número de visitantes de los parques de los años 2000 y 2009.
P. Juan Verdoy / M. J. Beltrán / M. J. Peris - ISBN: 978-84-15444-38-1 195 Problemas resueltos de estadística aplicada a las ciencias sociales - UJI - DOI: http://dx.doi.org/10.6035/Sapientia100
Veamos también cómo se pueden calcular estos mismos incrementos totales y me-
dio, basándonos en los índices encadenados que hemos obtenido en el apartado b).
I 2000
2009
= I 2000
2001
⋅ I 2001
2002
⋅ I 2002
2003
⋅ I 2003
2004
⋅ I 2004
2005
⋅ I 2005
2006
⋅ I 2006
2007
⋅ I 2007
2008
⋅ I 2008
2009
=
Para conocer el incremento medio, calcularemos pues la raíz novena del producto
de los índices (el índice de la raíz coincide con el número de índices que forman
el producto).
9 I 2000
2001
⋅ I 2001
2002
⋅ I 2002
2003
⋅ I 2003
2004
⋅ I 2004
2005
⋅ I 2005
2006
⋅ I 2006
2007
⋅ I 2007
2008
⋅ I 2008
2009
=
9
0,9756 · 0,9660· 1,0657 · 1,0814 · 0,9648 · 1,0220 · 0,9896 · 0,9409 · 0,9736 =
9
0,9707 = 0,9967
Para hacer previsiones hay que partir de la hipótesis de que el incremento medio
anual que hemos obtenido en el apartado anterior, podría ser una estimación del
incremento anual de los años que están por venir y que, a partir del último dato
conocido, calcularemos las cantidades de visitantes que podremos esperar para los
años 2010, 2011 y 2012:
Notamos que por previsiones o estimaciones partiremos del último dato real y lo
multiplicaremos por el incremento medio anual que hemos calculado previamente,
y elevándolo al número de años o períodos que están por venir.
P. Juan Verdoy / M. J. Beltrán / M. J. Peris - ISBN: 978-84-15444-38-1 196 Problemas resueltos de estadística aplicada a las ciencias sociales - UJI - DOI: http://dx.doi.org/10.6035/Sapientia100
Ejercicio 3
A continuación presentamos las variaciones porcentuales del volumen de ventas
de cierta superficie comercial, en los últimos años.
a) Calcula los índices de las ventas de cada año, tomando como referencia el
año 2005 y los índices encadenados.
b) Calcula la variación o incremento medio anual y total de las ventas en este
período.
c) Estima las ventas de los dos años siguientes si suponemos que no hay cam-
bios significativos en el comportamiento de las ventas en estos años.
Solución
a) Calcula los índices de las ventas de cada año, tomando como referencia el
año 2005 y los índices encadenados.
Hay que ver que los datos de este ejercicio se diferencian de los dos anteriores, ya
que en este caso los datos son incrementos porcentuales anuales, por lo que los da-
tos de la tabla se podrán «traducir» y convertirse en índice encadenados, tal como
se indica en la siguiente tabla:
P. Juan Verdoy / M. J. Beltrán / M. J. Peris - ISBN: 978-84-15444-38-1 197 Problemas resueltos de estadística aplicada a las ciencias sociales - UJI - DOI: http://dx.doi.org/10.6035/Sapientia100
Podemos ver cómo calculamos estos índices. A tal fin, le sumamos o restamos a 1
el incremento, y así convertiremos el tanto por ciento en tanto por uno:
2006
I 2005 = 1 – 0.0313 = 0,9687
2007
I 2006 = 1 – 0,0215 = 0,9785
2008
I 2007 = 1 + 0,0212 = 1,0212
2009
I 2008 = 1 + 0,0315 = 1,0315
Para calcular los índices de base 2005, multiplicaremos los índices anteriores:
2007
I 2005 = I 2005
2006
⋅ I 2006
2007
= 0,9687 · 0,9785 = 0,9479
2008
I 2005 = I 2005
2006
⋅ I 2006
2007
⋅ I 2007
2008
= 0,9687 · 0,9785 · 1,0212 = 0,9680
2009
I 2005 = I 2005
2006
⋅ I 2006
2007
⋅ I 2007
2008
⋅ I 2008
2009
= 0,9687 · 0,9785 · 1,0212 · 1,0315 = 0,9985
2010
I 2005 = I 2005
2006
⋅ I 2006
2007
⋅ I 2007
2008
⋅ I 2008
2009
⋅ I 2009
2010
=
= 0,9687 · 0,9785 · 1,0212 · 1,0315 · 1,0412 =1,0396
2011
I 2005 = I 2005
2006
⋅ I 2006
2007
⋅ I 2007
2008
⋅ I 2008
2009
⋅ I 2009
2010
⋅ I 2010
2011
=
= 0,9687 · 0,9785 · 1,0212 · 1,0315 · 1,0412 · 1,0431= 1,0844
P. Juan Verdoy / M. J. Beltrán / M. J. Peris - ISBN: 978-84-15444-38-1 198 Problemas resueltos de estadística aplicada a las ciencias sociales - UJI - DOI: http://dx.doi.org/10.6035/Sapientia100
Para calcular el incremento total de las ventas tan solo hay que interpretar el índice
2011
I 2005 = 1.0844, el cual nos indica que las ventas han aumentado un 8,44 % en el
período analizado.
Podemos recordar que este índice lo hemos calculado multiplicando los índices en-
cadenados que hemos «construido» con los datos de los porcentajes del enunciado.
c) Estima las ventas de los dos años siguientes si suponemos que no hay cam-
bios significativos en el comportamiento de las ventas en estos años.
Ejercicio 4
A continuación presentamos los valores del índice de precios al consumo, ipc, que
podemos consultar en la página del ine y que hace referencia a los datos en base a
2001 y 2006.
Por razones que habrá que estudiar en la teoría, en ciertos momentos hay que hacer
un cambio en el año de referencia y se empieza a obtener la nueva serie del ipc, co-
menzado de nuevo con el valor 100. Diremos que ha habido un «cambio de base».
A menudo, como podrás ver en ejercicios posteriores, hay que utilizar en un mis-
mo cálculo el valor del ipc de años que corresponden a períodos de bases diferen-
tes, y necesitaremos trabajar con todos los valores del ipc referidos a una misma
base. Estos datos los podrás encontrar fácilmente en la página web del ine, pero
en este ejercicio vamos a ver cómo se calculan los valores de las casillas que están
sombreadas en gris.
En primer lugar, presentamos la tabla de los valores del ipc desde el año 2002 al
2006 en base 2001.
P. Juan Verdoy / M. J. Beltrán / M. J. Peris - ISBN: 978-84-15444-38-1 199 Problemas resueltos de estadística aplicada a las ciencias sociales - UJI - DOI: http://dx.doi.org/10.6035/Sapientia100
Índice de precios al consumo
Medias anuales. Base 2001
General
Media anual
2006 117,624
2005 113,63
2004 109,927
2003 106,684
2002 103,538
Y a continuación, los datos de los valores del ipc desde el año 2006 al 2010 en base
2006, aunque están añadidos los valores de las casillas gris que corresponden a los
valores obtenidos «a posteriori» para facilitar los trabajos de cálculo referidos a
períodos de diferentes bases.
General
Media anual
2010 108,588
2009 106,668
2008 106,976
2007 102,787
2006 100
2005 96,604
2004 93,456
2003 90,699
2002 88,024
Explica cómo se han obtenido los datos de las casillas sombreadas en gris, averi-
guando el valor del enlace.
Fuente: ine
P. Juan Verdoy / M. J. Beltrán / M. J. Peris - ISBN: 978-84-15444-38-1 200 Problemas resueltos de estadística aplicada a las ciencias sociales - UJI - DOI: http://dx.doi.org/10.6035/Sapientia100
Solución
En la primera tabla tenemos los valores del ipc correspondientes al período 2002-
2006 en base 2001. Pero llegado el año 2006 se decide un cambio de base y como
se puede ver en la segunda tabla, tenemos una nueva serie de datos que comienza
en el año 2006 con un 100. En alguna situación que veremos en ejercicios pos-
teriores necesitamos utilizar el ipc de los dos períodos, por lo que es necesario
conocer todos los datos referidos a la misma base para no romper la continuidad
de la secuencia que refleja el comportamiento de los precios al consumo y, por
consiguiente, se convierte en uno de los principales indicadores de la inflación y
de los devenires económicos de un país.
Veamos, pues, cómo se calculan los valores de las casillas sombreadas en gris.
Son los valores de los antiguos ipc en la nueva base. Para su cálculo, tan solo hay
que plantear los datos implicados para asegurarnos la proporcionalidad real en la
evolución de los precios.
IPC2001
2002
⋅ IPC2006
2006
103,538·100 100
IPC2006
2002
= = = 103,538 = 103,538 · 0,8502 =
IPC20012006
117,624 117,624
= 88,025
IPC2001
2003
⋅ IPC2006
2006
106,684·100 100
IPC2006
2003
= = = 106,684 = 106,684 · 0,8502 =
IPC20012006
117,624 117,624
= 90,699
IPC2001
2004
⋅ IPC2006
2006
109,927·100 100
IPC2006
2004
= = = 109,927 = 109,927 · 0,8502 =
IPC20012006
117,624 117,624
= 93,456
IPC2001
2005
⋅ IPC2006
2006
113,63·100
IPC2006
2005
= = = 113,63 · 0,8502 =
IPC20012006
117,624
P. Juan Verdoy / M. J. Beltrán / M. J. Peris - ISBN: 978-84-15444-38-1 201 Problemas resueltos de estadística aplicada a las ciencias sociales - UJI - DOI: http://dx.doi.org/10.6035/Sapientia100
96,604
Es evidente que para obtener los valores del ipc del año «y» en base 2006 hemos
2006
IPC2006
multiplicado el ipc del año «y» en base 2001 por la fracción 2006
el valor de la
IPC2001
que hemos reseñado en rojo y es lo que denominaremos «enlace técnico».
Ejercicio 5
Calcula los índices de precios y cantidades de los artículos A, B y C mediante las
fórmulas de Laspeyres y Paasche, de los años 2008, 2009 y 2010 en función del
año 2008, utilizando los datos de las siguientes tablas donde están indicadas las
cantidades qi y precios pi que hay que conocer.
Art. B 10 50 8 65 7 72
Art. C 5 20 10 10 15 5
Solución
Para calcular estos índices, empezaremos por conocer y deducir la fórmula que
emplearemos. Hemos reducido su cálculo a tres artículos pero no olvidemos que este
cálculo se extiende a la totalidad de artículos representativos del consumo de las
familias en un país (véase ecpf).
P. Juan Verdoy / M. J. Beltrán / M. J. Peris - ISBN: 978-84-15444-38-1 202 Problemas resueltos de estadística aplicada a las ciencias sociales - UJI - DOI: http://dx.doi.org/10.6035/Sapientia100
donde t es el año actual y 0 será el año que tomaremos como referencia en la com-
paración. Si se trata de índice encadenados podríamos decir años t-1 y t.
es una media ponderada donde el «peso» de cada artículo pi0 · qi0 es el valor del
artículo en la «cesta de la compra» del año de referencia y permanecerá constante
a lo largo del período mientras no se cambie la base. Un inconveniente de este
método es que si la importancia de los artículos en los hábitos de consumo cambia
mucho, estos coeficientes quedan desfasados.
Así:
Se puede comprobar que el denominador no varía y tan solo hay que actualizar los
precios de los artículos en el período nuevo por comparar. Esto es una gran ventaja
de esta fórmula.
P. Juan Verdoy / M. J. Beltrán / M. J. Peris - ISBN: 978-84-15444-38-1 203 Problemas resueltos de estadística aplicada a las ciencias sociales - UJI - DOI: http://dx.doi.org/10.6035/Sapientia100
Así:
es una media ponderada donde el «peso» de cada artículo pi0 · qit intenta mejorar
la propuesta de Laspeyres, evitando en cierto modo el desfase, ya que recoge la
importancia del artículo al considerar la cantidad en el período comparar.
Así:
P. Juan Verdoy / M. J. Beltrán / M. J. Peris - ISBN: 978-84-15444-38-1 204 Problemas resueltos de estadística aplicada a las ciencias sociales - UJI - DOI: http://dx.doi.org/10.6035/Sapientia100
Índice de catidades de Paasche
Esta propuesta, como que analiza la evolución de las cantidades, considera como
coeficiente qi 0 pit que indica el «peso» de cada artículo, el precio del año t para
actualizar la importancia del artículo.
Así:
Como se puede ver en estos índices, en cada uno calculado por las fórmulas de
Paasche, hay que determinar siempre tanto el numerador como el denominador
de cada fracción. Esta diferencia que nos puede parecer irrelevante para tres artícu-
los, no lo parece igual para la gran cantidad de datos que hay que trabajar para el
cálculo del ipc y con los recursos tecnológicos de tiempo atrás.
Ejercicio 6
Supongamos que compramos una vivienda por 16.125.000 ptas. en diciembre de
1998 y la hemos vendido en diciembre de 2006 por un valor de 240.000 euros.
Averigua el porcentaje de beneficios o pérdidas que hemos tenido en la operación.
Nota: Para realizar las operaciones consultaremos los valores del ipc que necesi-
tamos en la página web del ine. www.ine.es (sería interesante calcular este incre-
mento con el ipc general y con el ipc del grupo de la vivienda).
P. Juan Verdoy / M. J. Beltrán / M. J. Peris - ISBN: 978-84-15444-38-1 205 Problemas resueltos de estadística aplicada a las ciencias sociales - UJI - DOI: http://dx.doi.org/10.6035/Sapientia100
Solución
Para empezar a comparar habrá que trabajar en una única moneda. Decidimos
trabajar en euros. Es obvio que el resultado en términos relativos o porcentajes no
varía si trabajamos en pesetas.
2006
IPC 2001 117,624
96913,20 1998
96913,20 124961,01€€
IPC 2001 91,223
i
1998 2001
IPC1992 = 123,791 IPC2001 = 100
2001 2006
IPC1992 = 135,702 IPC2001 = 117,624
1998
Y como necesitaban averiguar el valor de IPC2001 , hemos procedido como se ex-
plica en el ejercicio 4:
IPC1992
1998
⋅ IPC2001
2001
123,791·100
IPC2001
1998
= = = 91,223
IPC1992
2001
135,702
Como en el enunciado se dice que la hemos vendido por 240.000 euros, vamos a
calcular los beneficios en términos relativos a partir del concepto de índice:
240000
= 1,92
124961,01
Este cociente nos permite interpretar que tenemos un beneficio del 92 %, es decir,
casi se ha duplicado el valor de la vivienda en el período de 8 años que hemos
contemplado.
Nota: Para realizar los cálculos hemos utilizado las medias anuales del ipc, pero
se podría hacer también con los valores del ipc exactamente los meses de compra
y venta, así como elegir los ipc del grupo de vivienda en lugar de la ipc general.
Dejemos estas variantes para el trabajo del lector.
P. Juan Verdoy / M. J. Beltrán / M. J. Peris - ISBN: 978-84-15444-38-1 206 Problemas resueltos de estadística aplicada a las ciencias sociales - UJI - DOI: http://dx.doi.org/10.6035/Sapientia100
Ejercicio 7
En la siguiente tabla mostramos los datos de los impuestos municipales de cierta
vivienda en los últimos años.
2007 515,65
2008 536,73
2009 578,84
2010 584,42
Nota: Para resolver este ejercicio, utilizaremos los valores de la media anual del
ipc general que necesitamos, obteniéndose los de la página web del ine. www.ine.es.
Solución
A tal fin, es necesario que consultemos los valores del ipc de estos años. To-
maremos las medias anuales del ipc general. Hay que insistir en que todos los
índices que trabajamos en el mismo ejercicio deben estar en la misma base; de
lo contrario, hay que hacer el cambio de base que proceda, tal y como se explicó
en el ejercicio 4.
P. Juan Verdoy / M. J. Beltrán / M. J. Peris - ISBN: 978-84-15444-38-1 207 Problemas resueltos de estadística aplicada a las ciencias sociales - UJI - DOI: http://dx.doi.org/10.6035/Sapientia100
Presentamos los resultados en la siguiente tabla:
Importe impuesto
Importe impuesto municipal
Año municipal
(términos reales 2006)
(términos nominales)
2006 503,24 503,24
IPC2006
2006
100
2007 515,65 515,65 ⋅ = 515,65 ⋅ = 501,67
IPC2006
2007
102, 787
IPC2006
2006
100
2008 536,73 536,73 ⋅ = 536,73 ⋅ = 501,73
IPC2006
2008
106,976
IPC2006
2006
100
2009 578,84 578,84 ⋅ = 578,84 ⋅ = 542,66
IPC2006
2009
106,668
IPC2006
2006
100
2010 584,42 584,42 ⋅ = 584,42 ⋅ = 538,20
IPC2006
2010
108,588
Nos piden los índices encadenados con los valores de la última columna de la tabla
anterior:
Importe Importe
impuesto impuesto
Año municipal municipal Índice Interpretación
(términos (términos
nominales) reales 2006)
2006 503,24 503,24 -----
P. Juan Verdoy / M. J. Beltrán / M. J. Peris - ISBN: 978-84-15444-38-1 208 Problemas resueltos de estadística aplicada a las ciencias sociales - UJI - DOI: http://dx.doi.org/10.6035/Sapientia100
En general, vemos que en términos reales era un importe que permanece estable
en el período analizado, ya que la evolución del importe es paralela a la evolución
del ipc, excepto en el año 2009 que de manera puntual hace un aumento del 8,2 %.
Podemos ver con más claridad esta evolución, cuando hemos «borrado» el efecto
de la inflación.
Para calcular los incrementos que nos planteamos, es más cómodo partir de los da-
tos de la magnitud. En este caso, nos referimos al importe del impuesto municipal
en términos reales del 2006.
538,20
I 2006
2010
= = 1,069
503,24
que nos permite afirmar que el importe del impuesto ha aumentado un 6,9 % en
términos reales en el período considerado.
4 1,069 = 1,017
que nos permite afirmar que el incremento total del 6,9 % es equivalente a un in-
cremento constante anual del 1,7 % durante 4 años.
Queremos señalar que estos resultados también se podrían obtener a partir de los
índices «encadenados», aunque no es razonable si disponemos de los valores de la
magnitud por analizar.
P. Juan Verdoy / M. J. Beltrán / M. J. Peris - ISBN: 978-84-15444-38-1 209 Problemas resueltos de estadística aplicada a las ciencias sociales - UJI - DOI: http://dx.doi.org/10.6035/Sapientia100
d) Suponiendo que los impuestos sigan este comportamiento, averigua el valor
en términos nominales o monedas corrientes para los años 2011, 2012 y
2013.
Como nos piden que demos el resultado en moneda corriente o términos nomina-
les tendremos que estimar los posibles valores del ipc en los años venideros, para
operar de una manera similar en el apartado a) pero en sentido opuesto.
A tal fin, obtendremos el incremento medio anual del ipc de los años del período
estudiado, a partir de los valores del primer y último año.
2010
IPC 2006 108,588
2006
= = 1,08588 y para obtener el incremento medio anual del ipc del
IPC 2006 100
período calcularemos la raíz cuarta correspondiente,
4 1,08588 = 1,0208 que nos permite afirmar que dicho incremento es del 2,08 %
anual.
Así, basándonos en este resultado, podremos estimar el ipc de los siguientes años:
IPC2006
2011
= IPC2006
2010
⋅1,0208 = 108,588⋅1,0208 = 110,847
IPC2006
2012
= IPC2006
2010
⋅1,02082 = 108,588⋅1,02082 = 113,152
IPC2006
2013
= IPC2006
2010
⋅1,02083 = 108,588⋅1,02083 = 115,506
Como estos resultados están expresados en términos reales del año 2006, hay que
convertirlos a términos nominales:
IPC2006
2011
110,847
Año 2011 g 547,25⋅ = 547,25 ⋅ = 606,61
IPC2006
2006
100
IPC2006
2012
113,152
Año 2012 g 556,46⋅ = 556,46 ⋅ = 629,65
IPC2006
2006
100
IPC2006
2013
115,506
Año 2013 g 565,82 ⋅ = 565,82 ⋅ = 653,56
IPC2006
2006
100
Tan solo notar que esta estimación está hecha bajo la hipótesis de que tanto el ipc
como el importe del impuesto, evolucionará al ritmo anual que indique el incre-
mento medio anual de cada una de las magnitudes.
P. Juan Verdoy / M. J. Beltrán / M. J. Peris - ISBN: 978-84-15444-38-1 210 Problemas resueltos de estadística aplicada a las ciencias sociales - UJI - DOI: http://dx.doi.org/10.6035/Sapientia100
En este ejercicio, a pesar de todo, parece que este incremento no refleja la realidad
del comportamiento del importe del impuesto, que ya hemos comentado que ha
sido estable la mayor parte del período y solo experimentó un importante aumento
del 8 % en el año 2009, de manera puntual. Esta matización hace que las estima-
ciones, en cierto modo, pierdan cierta fiabilidad.
Ejercicio 8
En la tabla siguiente se indica el valor de la nómina mensual de un trabajador en
los últimos años.
Año Nómina mensual (€)
2007 2034,75
2008 2062,13
2009 2218,61
2010 2253,67
2011 2181,75
Solución
El incremento de estos precios está reflejado en el ipc que publica el ine cada mes.
Nosotros tomaremos la media anual general de este índice que podremos encon-
trar fácilmente en la web de este organismo.
P. Juan Verdoy / M. J. Beltrán / M. J. Peris - ISBN: 978-84-15444-38-1 211 Problemas resueltos de estadística aplicada a las ciencias sociales - UJI - DOI: http://dx.doi.org/10.6035/Sapientia100
Ganancia o pérdida de poder adquisitivo = ∆poder adquisitivo =
A tal fin, comenzaremos por calcular los índices «encadenados» de los salarios,
que nos permitirán averiguar los incrementos salariales anuales. En la siguiente
tabla se detallan cálculos y resultados.
2062,13
2008 2062,13 I 2007
2008
= = 1,014 Ha aumentado 1,4 %
2034, 75
2218,61
2009 2218,61 I 2008
2009
= = 1,076 Ha aumentado 7,6 %
2062,13
2253,67
2010 2253,67 I 2009
2010
= = 1,016 Ha aumentado 1,6 %
2218,61
2181, 75
2011 2181,75 I 2010
2011
= = 0,968 Ha disminuido 3,2 %
2253,67
Consultaremos la página del ine para encontrar los valores del ipc de estos años.
Nos interesa la media anual del índice general en base 2006. Si no se dispone de
los datos del año 2011, se utiliza la estimación que se obtiene en el ejercicio 7 de
esta colección. Y con estos datos haremos los mismos análisis que hemos hecho
con las nóminas para obtener los incrementos anuales.
ipc
Año Índice
Base 2006
2007
2007 IPC2006 = 102,787 ------ -------
2008 106,976
2008 2008
IPC2006 = 106,976 I 2007 = = 1,041 Ha aumentado 4,1 %
102,787
2009 106,668
2009 2009
IPC2006 = 106,668 I 2008 = = 0,997 Ha disminuido 0,3 %
106,976
2010 108,588
2010 2010
IPC2006 = 108,588 I 2009 = = 1,018 Ha aumentado 1,8 %
106,668
2011 110,847
2011 2011
IPC2006 = 110,847 I 2010 = = 1,021 Ha aumentado 2,1 %
108,588
P. Juan Verdoy / M. J. Beltrán / M. J. Peris - ISBN: 978-84-15444-38-1 212 Problemas resueltos de estadística aplicada a las ciencias sociales - UJI - DOI: http://dx.doi.org/10.6035/Sapientia100
Ya hemos explicado al comenzar el ejercicio el concepto de pérdida o ganancia
de poder adquisitivo. Se gana poder adquisitivo cuando el incremento salarial está
por encima del incremento del ipc que nos indica, asimismo, el incremento de los
precios de los bienes de consumo. Del mismo modo, habrá una pérdida de poder
adquisitivo cuando el incremento salarial esté por debajo del incremento del ipc.
Para hacer esta comparación, partiremos de los índices que hemos calculado en las
dos tablas anteriores y, como se hace un estudio en términos relativos, haremos los
cocientes de estas cantidades año por año. Mostramos los resultados en la siguien-
te tabla y los cálculos de las casillas sombreadas en gris están debajo de la tabla.
1,014 1,076
Año 2008 g = 0,974 Año 2009 g = 1,079
1,041 0,997
1,016 0,968
Año 2010 g = 0,998 Año 2011 g = 0,948
1,018 1,021
g Ha aumentado un 7,2 %
Calculemos ahora el incremento del ipc (recordemos que la fecha del ipc del 2011
es una estimación).
P. Juan Verdoy / M. J. Beltrán / M. J. Peris - ISBN: 978-84-15444-38-1 213 Problemas resueltos de estadística aplicada a las ciencias sociales - UJI - DOI: http://dx.doi.org/10.6035/Sapientia100
2011
IPC2006 110,847
I IPC 2011
2007 = 2007
= = 1,078 g Ha aumentado un 7,8 %
IPC2006 102,787
Advertimos que aunque de un vistazo nos pueda parecer que los resultados de las
casillas sombreadas se podrían obtener sumando y restando los porcentajes en filas
y columnas, hay que fijarse en que no es cierto tal y como se puede comprobar con
las datos totales y en algunas columnas, por ejemplo en el año 2008.
Ahora bien, sí podemos obtener los resultados, a partir de los índices de la tabla
previa, multiplicándolos.
I poder adquisitiu 2011 = 0,974 · 1,079 · 0,998 · 0,948 = 0,994 g Ha disminuido un 0,6 %
2007
Hay que advertir que la diferencia con los resultados anteriores (del orden de déci-
mas) se debe al redondeo de cada factor. Por esta razón insistimos en la recomen-
dación de utilizar los datos originales de las magnitudes por analizar si dispone-
mos de estas, pero presentamos los dos métodos de resoluciones, para los casos en
que la información disponible sean los incrementos porcentuales anuales.
P. Juan Verdoy / M. J. Beltrán / M. J. Peris - ISBN: 978-84-15444-38-1 214 Problemas resueltos de estadística aplicada a las ciencias sociales - UJI - DOI: http://dx.doi.org/10.6035/Sapientia100
Ejercicio 9
En las tablas siguientes se presentan los valores del ipc y el incremento salarial de
un trabajador en los años que se indica en cierta comunidad.
Solución
P. Juan Verdoy / M. J. Beltrán / M. J. Peris - ISBN: 978-84-15444-38-1 215 Problemas resueltos de estadística aplicada a las ciencias sociales - UJI - DOI: http://dx.doi.org/10.6035/Sapientia100
Año Salarios Índice
2008
Para calcular el incremento medio de los salarios del período consideraremos que
tenemos 3 índices, y así calcularemos la raíz tercera del producto de estos factores:
Para calcular el incremento total del período lo haremos a partir de los índices
encadenados:
Para calcular el incremento anual, medio y total del ipc en el período 2008-2011,
calcularemos la secuencia de índices encadenados que presentamos a continua-
ción, donde podemos ver los incrementos anuales:
Para calcular el incremento total del período podemos operar a partir de los índices
encadenados:
o también a partir de los valores del ipc iniciales y finales del período total:
P. Juan Verdoy / M. J. Beltrán / M. J. Peris - ISBN: 978-84-15444-38-1 216 Problemas resueltos de estadística aplicada a las ciencias sociales - UJI - DOI: http://dx.doi.org/10.6035/Sapientia100
interpretaremos que el ipc ha aumentado un 7,56 % en todo el período.
Para calcular el incremento medio del ipc, también podemos operar paralelamente:
u obrar así:
Partiremos del último dato conocido del ipc del año 2011 y lo incrementaremos
con el porcentaje que hemos obtenido como incremento medio en el apartado
anterior:
d) Estudia para cada año y para el período total la pérdida o ganancia del poder
adquisitivo y realiza una interpretación de los datos obtenidos.
Para calcular las variaciones del poder adquisitivo presentaremos los datos de los
incrementos en la siguiente tabla:
Para hacer esta comparación partiremos de los índices que hemos calculado en las
dos tablas anteriores y, como se hace un estudio en términos relativos, haremos
P. Juan Verdoy / M. J. Beltrán / M. J. Peris - ISBN: 978-84-15444-38-1 217 Problemas resueltos de estadística aplicada a las ciencias sociales - UJI - DOI: http://dx.doi.org/10.6035/Sapientia100
los cocientes de estas cantidades año por año. Mostramos los resultados en la tabla
anteriores y los cálculos de las casillas sombreadas en gris están a continuación:
Ejercicio 10
Para hacer un estudio de la evolución del precio de cierto modelo de ordenador en
términos reales, disponemos de los datos que presentamos en la tabla siguiente:
a) Calcula el incremento anual, medio y total del precio del ordenador en tér-
minos reales.
b) Si seguimos esta evolución, estima el precio que podría tener el ordenador
en 2008.
c)
2000 2001 2002 2003 2004
ipc base 1992 131 135 139
ipc base 2002 103 106 109
1300 1275 1250 1100 950
Solución
Para empezar, hay que hacer un cambio de base y encontrar todos los valores del
ipc en la misma base. Llenaremos la tabla con los nuevos valores encontrados (en
rojo) y bajo anotaremos los cálculos realizados.
P. Juan Verdoy / M. J. Beltrán / M. J. Peris - ISBN: 978-84-15444-38-1 218 Problemas resueltos de estadística aplicada a las ciencias sociales - UJI - DOI: http://dx.doi.org/10.6035/Sapientia100
2000 2001 2002 2003 2004
ipc base 1992 131 135 139 143,05 147,10
ipc base 2002 97,07 100,04 103 106 109
103 g 106
139 g X
IPC2002
2003
⋅ IPC1992
2002
IPC 2003
1992 = = = 106 · 1,35 = 143,05
IPC20022002
103 g 109
139 g X
IPC2002
2004
⋅ IPC1992
2002
IPC1992
2004
= = = 109 · 1,35 = 147,10
IPC20022002
Para continuar el ejercicio utilizaremos los ipc en esta base 1992 o en 2002. Es
indiferente siempre y cuando tengamos cuidado de trabajar todos los índices en la
misma base.
a) Calcula el incremento anual, medio y total del precio del ordenador en términos
reales.
Dado que el análisis del precio del ordenador nos lo piden en términos reales, pri-
mero es necesario hacer la conversión del precio del ordenador en moneda cons-
tante del año 2000 (deflactación de la serie de precios del ordenador).
P. Juan Verdoy / M. J. Beltrán / M. J. Peris - ISBN: 978-84-15444-38-1 219 Problemas resueltos de estadística aplicada a las ciencias sociales - UJI - DOI: http://dx.doi.org/10.6035/Sapientia100
Precio ordenador Precio ordenador
Año
(términos nominales) (términos reales 2000)
2000 1300 1300
IPC1992
2000
IPC1992
2000
131
2004 950 950 · = 950⋅ = 846,02
IPC1992
2004
147,10
Para calcular el incremento anual del precio del ordenador en términos reales,
operamos en la tabla siguiente mediante índices encadenados:
Precio Precio
ordenador ordenador Interpretación:
Año Índice
(términos (términos Incremento anual
nominales) reales 2000)
2000 1300 1300 -----
1237,2 Ha disminuido
2001 1275 1237,2 I 2000
2001
= = 0,9517
1300 un 4,83 %
1178,06
2002 1250 1178,06 I 2001
2002
= = 0,9522 Ha disminuido
1237,2 un 4,78 %
1007,34
2003 1100 1007,34 I 2002
2003
= = 0,8551 Ha disminuido
1178,06 un 14,49 %
846,02
2004 950 846,02 I 2003
2004
= = 0,8399 Ha disminuido
1007,34 un 16,01 %
846,02
I 2000
2004
= = 0,6508 g A lo largo del período ha disminuido un 34,92 % su
1300
valor en términos reales, que equivale a un incremento medio anual de:
846,02 4
4 = 0,6508 = 0,8982 g una disminución anual media del 10,18 %
1300
P. Juan Verdoy / M. J. Beltrán / M. J. Peris - ISBN: 978-84-15444-38-1 220 Problemas resueltos de estadística aplicada a las ciencias sociales - UJI - DOI: http://dx.doi.org/10.6035/Sapientia100
b) Si seguimos esta evolución, estima el precio que podría tener el ordenador
en 2008.
Para hacer este apartado, consideramos que nos piden la estimación en términos
corrientes del precio, suponiendo que no varía el comportamiento del ipc ni la
evolución del precio del ordenador en términos reales que hemos analizado en el
apartado anterior.
Para hacer estas estimaciones necesitamos el incremento medio de las dos series.
Nos falta calcular el incremento medio del ipc en el período que nos ocupa:
IPC
IPC
IPC
2008
2008
1992 ==IPC
2008
1992
1992 =IPC
IPC
2004
·1,0294
2004
1992 · ·1,0294
2004
1992
1992 ·1,0294==147,10·1,0294
4 4 4
=147,10·1,0294
147,10·1,0294
· ==165,18
4 4 4
=165,18
165,18
Haremos las mismas operaciones con la serie de los precios de los ordenadores en
términos reales.
Precio ordenador para el año 2008 en t. reales del 2000 = 846,02 · 0,89824 =
550,65 euros.
IPC
IPC
2008
2008
165,18
165,18
550,65·
550,65·
550,65 · 1992
1992
==550,65·
550,65·
550,65 · ==694,32€
694,32€
€
IPC
IPC
2000
2000
1992
1992 131
131
P. Juan Verdoy / M. J. Beltrán / M. J. Peris - ISBN: 978-84-15444-38-1 221 Problemas resueltos de estadística aplicada a las ciencias sociales - UJI - DOI: http://dx.doi.org/10.6035/Sapientia100
unidad 4
Series temporales
P. Juan Verdoy / M. J. Beltrán / M. J. Peris - ISBN: 978-84-15444-38-1 223 Problemas resueltos de estadística aplicada a las ciencias sociales - UJI - DOI: http://dx.doi.org/10.6035/Sapientia100
Introducción teórica
Como elementos introductorios de este capítulo, es conveniente recordar defini-
ciones de conceptos que necesitaremos para alcanzar los objetivos de esta unidad
(referencias bibliográficas 1, 21 y 24).
Serie temporal
Es una sucesión de observaciones cuantitativas de un fenómeno ordenadas en los
tiempos y períodos equidistantes. Cada observación que denotaremos por yij, co-
rresponde al valor de la magnitud en el año i y período j. Ejemplo: si tenemos una
serie de observaciones trimestrales a lo largo de los años 2001 a 2005, entendere-
mos que el dato concierne al valor x23 correspondiente al tercer trimestre de 2002.
P. Juan Verdoy / M. J. Beltrán / M. J. Peris - ISBN: 978-84-15444-38-1 225 Problemas resueltos de estadística aplicada a las ciencias sociales - UJI - DOI: http://dx.doi.org/10.6035/Sapientia100
Tendencia: es la componente que nos explica el comportamiento del fenómeno a
«largo plazo». La denotaremos por Tik y nos permitirá explicar si las medias anua-
les de los valores de la serie aumentan o disminuyen en el período que queremos
analizar.
Variaciones cíclicas: son variaciones que se producen con una periodicidad su-
perior al año y frecuentemente se manifiestan como consecuencia de períodos de
prosperidad y de depresión en la actividad económica, o en otras magnitudes cual-
quiera. Las denotamos por cik. No las obtendremos en este tema, ya que quedan
fuera del alcance de las técnicas que desarrollaremos para tablas pequeñas a fin de
estudiar el desarrollo y la justificación teóricos y explícitos de los cálculos. Para
tablas más grandes nos ayudaremos de software que nos dará resultados que habrá
que analizar con las consideraciones teóricas que podremos ver en los ejercicios
propuestos con tablas de menor tamaño.
Para hacer el análisis de una serie estudiaremos dos métodos: ajuste analítico y el
método de las medias móviles. A continuación pondremos el formulario y la no-
tación de cada uno de los métodos que se podrán seguir en los ejercicios resueltos
a continuación:
P. Juan Verdoy / M. J. Beltrán / M. J. Peris - ISBN: 978-84-15444-38-1 226 Problemas resueltos de estadística aplicada a las ciencias sociales - UJI - DOI: http://dx.doi.org/10.6035/Sapientia100
Método del ajuste analítico
Para trabajar este método, es conveniente presentar los cálculos en forma de tabla
(véanse ejemplos en los ejercicios resueltos) convenientemente ordenados.
Hay que explicar que la fila i es una escala que crearemos para facilitar la reso-
lución del sistema lineal de dos ecuaciones con dos incógnitas. El procedimiento
nos dará resultados óptimos situando el valor del año 0 en la columna central de la
tabla en caso de tener un número impar de años en la tabla, o en cualquiera de las
columnas adyacentes en caso de un número par de años por estudiar:
Ejemplo:
TOTALES
i -2 -1 0 1 2 0
TOTALES
i -2 -1 0 1 2 3 3
⎧∑ y = Na + b∑ i
⎪ i i i
⎨
⎪∑ yi ⋅ i = a∑ i + b∑ i 2
⎩ i i i
donde los coeficientes a y b son los coeficientes de la recta de regresión que de-
nominamos recta de tendencia, la formula es Ti = a + b, en la que i hace referencia
al año que se indica en la escala de las tablas superiores de los ejemplos y N es el
número de años o columnas que tiene la tabla de los datos.
Esta recta que encontramos no es sino la recta de ajuste lineal por mínimos cua-
drados a las medias anuales yi.⋅ i
P. Juan Verdoy / M. J. Beltrán / M. J. Peris - ISBN: 978-84-15444-38-1 227 Problemas resueltos de estadística aplicada a las ciencias sociales - UJI - DOI: http://dx.doi.org/10.6035/Sapientia100
positivo o negativo respectivamente, y el valor del incremento medio anual de la
media anual de los valores de la serie.
∑y '
k
M= k
m
que podemos interpretar como el valor medio de las nuevas medias corregidas y que
representará el 100 % o valor de referencia, frente a la que se comparan los com-
portamientos estacionales que calculamos en las dos columnas de la derecha de la
tabla y que son la componente estacional y los índices estacionarios
yk'
I k = ·100. Con estos resultados podremos interpretar en qué períodos los valores
M
de las observaciones están por encima o por debajo del valor de M. ek nos pre-
senta esta desviación en cantidades absolutas, mientras que I k lo indica de manera
porcentual.
P. Juan Verdoy / M. J. Beltrán / M. J. Peris - ISBN: 978-84-15444-38-1 228 Problemas resueltos de estadística aplicada a las ciencias sociales - UJI - DOI: http://dx.doi.org/10.6035/Sapientia100
Para calcular la componente residual rik habrá que determinar primeramente el valor
de la tendencia Ti para cada año considerado en la tabla, sustituyendo en la recta de
tendencia el valor de i correspondiente y consideraremos para la componente esta-
cional ek los valores que ya hemos calculado y explicado en los párrafos anteriores.
Así, para cada observación, operaremos rik = yik − Ti − ek y dispondremos los re-
sultados en la distribución de la tabla original para facilitar su interpretación e
identificación del período y año correspondientes.
Hacemos esta advertencia porque todos sabemos que las cantidades que hay que
obtener de la componente residual deberían ser pequeñas en valor absoluto, y que no
presentan ninguna regularidad. Ya sabemos que estamos calculando las cantidades
no explicadas por nuestro modelo y que permitirán resaltar aquellos valores pun-
tuales que, por razones no predecibles, muestran divergencia del valor que cabría
esperar, atendiendo a las componentes de la tendencia y estacional.
Hacer predicciones para los años próximos implica que el análisis de nuestro mo-
delo sea vigente y que ninguna otra circunstancia ajena altere las regularidades
que hemos reseñado con nuestro modelo (la tendencia explicada y el comporta-
miento de los períodos ya cuantificado).
Si queremos prever las cantidades de los próximos años será necesario calcular los
valores de su tendencia sustituyendo en la ecuación de su recta los valores de i que
les correspondería en caso de que la tabla continuara.
Este método está basado en el «suavizado» de una serie cuando esta es sustituida
por una sucesión de medias aritméticas de p observaciones, como explicaremos a
continuación. En este apartado teórico (cálculo de las medias móviles) cambiare-
mos la notación de la serie de observaciones inicial y pasaremos a ordenarla con
un único subíndice, considerándola como una sucesión ordenada sin contemplar
su procedencia de período y año.
Para aplicar este método hay que elegir un número p de observaciones por prome-
diar con unos criterios que después explicaremos.
, ,
P. Juan Verdoy / M. J. Beltrán / M. J. Peris - ISBN: 978-84-15444-38-1 229 Problemas resueltos de estadística aplicada a las ciencias sociales - UJI - DOI: http://dx.doi.org/10.6035/Sapientia100
donde puede verse que los subíndices que adjudicamos a estas medias obtenidas ,
, ... corresponden a un número entero, por lo que estas medias podemos
hacerlas corresponder a un período original, ya que corresponde al centro de los
períodos promediados.
Así:
Este método está basado en que la nueva serie de medias móviles nos permitirá
vislumbrar la tendencia de la serie original a «largo plazo», ya que se suaviza el
valor individual de cada uno de los datos y las oscilaciones. Para que esta afirma-
ción sea cierta hay que elegir convenientemente el número p de observaciones por
promediar, como hemos indicado antes y vamos a detallar a continuación.
De ello resulta que, para calcular la tendencia, habrá que coger un número p de ob-
servaciones que sea el mínimo común múltiplo de m y q. Por ejemplo, si tenemos
una serie de datos trimestrales, m = 4 y de la observación de la gráfica podemos
ver un patrón bianual que se repite aproximadamente cada 8 observaciones, en ese
caso el número p que deberemos considerar para el cálculo de las medias móviles
P. Juan Verdoy / M. J. Beltrán / M. J. Peris - ISBN: 978-84-15444-38-1 230 Problemas resueltos de estadística aplicada a las ciencias sociales - UJI - DOI: http://dx.doi.org/10.6035/Sapientia100
será 8, y por tratarse de un número par será necesario hacer después un posterior
«centrado».
Así: .
Para finalizar esta parte, recordamos que los temas siguientes serán el desarrollo
de la probabilidad y la inferencia (referencias bibliográficas 7 y 26).
P. Juan Verdoy / M. J. Beltrán / M. J. Peris - ISBN: 978-84-15444-38-1 231 Problemas resueltos de estadística aplicada a las ciencias sociales - UJI - DOI: http://dx.doi.org/10.6035/Sapientia100
Objetivos
Los problemas deben permitir que los alumnos alcancen los objetivos didácticos:
4a) Reconocer en una colección de datos los patrones y la notación de una serie
temporal.
4b) Analizar una serie y a partir de su gráfica, poder comprobar que se adapta
al modelo aditivo.
4c) Conocer las diferentes componentes de una serie temporal: tendencia, com-
ponente estacional, componente errática o residual.
4d) Saber calcular las diferentes componentes de una serie, suponiendo un mo-
delo aditivo, por el método del ajuste analítico.
4e) Saber calcular las diferentes componentes de una serie, suponiendo un mo-
delo aditivo, por el método de las medias móviles.
4f ) Saber interpretar los resultados obtenidos de las diferentes componentes de
una serie temporal y relacionarlos con la gráfica de la serie.
4g) Hacer estimaciones de los valores de una serie temporal en fechas futuras
cercanas a los valores analizados, en el ajuste analítico.
Objetivos
4a 4b 4c 4d 4e 4f 4g
Ejercicios
1 x x x x x x
2 x x x x x x
3 x x x x x x
4 x x x
5 x x x x x
6 x x x x x
7 x x x x x x x
P. Juan Verdoy / M. J. Beltrán / M. J. Peris - ISBN: 978-84-15444-38-1 232 Problemas resueltos de estadística aplicada a las ciencias sociales - UJI - DOI: http://dx.doi.org/10.6035/Sapientia100
Enunciados
4a) Reconocer en una colección de da-
tos los patrones y la notación de una
serie temporal.
4b) Analizar una serie y a partir de su
gráfica, poder comprobar que se
adapta al modelo aditivo.
4c) Conocer las diferentes componen-
tes de una serie temporal: tenden-
cia, componente estacional, com-
ponente errática o residual.
Ejercicio 1
Para analizar la evolución de los gastos en un departamento de una empresa, se
tomaron los siguientes datos, que expresan en miles de euros los gastos cuatrimes-
trales de los cuatro años que figuran en la tabla:
1.er cuatrimestre 26 25 21 20
2.o cuatrimestre 18 15 12 10
3.er cuatrimestre 22 20 18 12
a) Suponiendo modelo aditivo, calcula por el método del ajuste analítico, las
componentes de esta serie e interpreta cada uno de los resultados obtenidos.
b) Estima los valores de los gastos que se pueden esperar para el año 2012.
Ejercicio 2
Los siguientes datos, extraídos del ini, nos muestran las pernoctaciones hoteleras
en la Comunidad Valenciana, desde el año 2006 hasta el 2010.
P. Juan Verdoy / M. J. Beltrán / M. J. Peris - ISBN: 978-84-15444-38-1 233 Problemas resueltos de estadística aplicada a las ciencias sociales - UJI - DOI: http://dx.doi.org/10.6035/Sapientia100
Realiza un análisis del fenómeno, obteniendo las diferentes componentes de la
serie temporal para el ajuste analítico, suponiendo un modelo aditivo. Interpreta el
significado de cada una de las componentes.
Haz las previsiones que podemos esperar para los años 2012 y 2013.
Ejercicio 3
Con los siguientes datos, extraídos de la dgt, que nos muestran las nuevas licen-
cias de todos los tipo de carnés de conducir en la Comunidad Valenciana, desde el
año 2008 hasta el 2010, realiza un análisis del fenómeno, obteniendo las diferentes
componentes de la serie temporal para el ajuste analítico.
P. Juan Verdoy / M. J. Beltrán / M. J. Peris - ISBN: 978-84-15444-38-1 234 Problemas resueltos de estadística aplicada a las ciencias sociales - UJI - DOI: http://dx.doi.org/10.6035/Sapientia100
Haz las previsiones que podemos esperar para los años 2011 y 2012.
Ejercicio 4
La siguiente gráfica es la representación de una serie temporal donde se detallan
los datos bimensuales de 6 años. Si tuviéramos que calcular la tendencia y la com-
ponente estacional de dicha serie por el método de las medias móviles, explica la
elección del número de datos que hay que considerar para el cálculo de las medias
(p) en cada caso, justificando la respuesta.
P. Juan Verdoy / M. J. Beltrán / M. J. Peris - ISBN: 978-84-15444-38-1 235 Problemas resueltos de estadística aplicada a las ciencias sociales - UJI - DOI: http://dx.doi.org/10.6035/Sapientia100
26
23
20
17
14
11
1/10 1/11 1/12 1/13 1/14 1/15 1/16
Ejercicio 5
En la siguiente tabla presentamos el número total de viajeros transportados en los
servicios de transporte público en la Comunidad Valenciana, detallados por meses,
de los años 2006 al 2010.
a) Calcula las componentes de esta serie, por el método de las medias móviles.
P. Juan Verdoy / M. J. Beltrán / M. J. Peris - ISBN: 978-84-15444-38-1 236 Problemas resueltos de estadística aplicada a las ciencias sociales - UJI - DOI: http://dx.doi.org/10.6035/Sapientia100
4a) Reconocer en una colección de da-
tos los patrones y la notación de una
serie temporal.
4b) Analizar una serie y a partir de su
gráfica, poder comprobar que se
adapta al modelo aditivo.
Ejercicio 6
Realiza la gráfica de la siguiente serie que indica los miles de kilos de fruta comer-
cializada por trimestres en los últimos 4 años.
1.er trimestre 10 23 12 29
2.o trimestre 11 27 11 28
3.er trimestre 9 25 10 21
4.o trimestre 8 20 8 23
Observa las siguientes tablas que presenten los cálculos que hemos hecho para
obtener la tendencia y la componente estacional de dicha serie.
Identifica el método empleado, añade aquellos datos que faltan en las tablas, co-
mentando el procedimiento de cálculo que hay que hacer en las mesas, justificán-
dolos.
P. Juan Verdoy / M. J. Beltrán / M. J. Peris - ISBN: 978-84-15444-38-1 237 Problemas resueltos de estadística aplicada a las ciencias sociales - UJI - DOI: http://dx.doi.org/10.6035/Sapientia100
datos datos
10 10
11 11
9 9
12,75
8 8
16,75
23 23 18,75
27 27
16,875 23,75
25 16,9375 25 22,375
17 21
20 17 20 19
17 17
12 17,375 12 15,125
13,25
11 11 11,75
17,875 10,25
10 17,625 10
17,375
8 8 16,625
18,75
29 29 20,125
28 28
21 21
23 23
P. Juan Verdoy / M. J. Beltrán / M. J. Peris - ISBN: 978-84-15444-38-1 238 Problemas resueltos de estadística aplicada a las ciencias sociales - UJI - DOI: http://dx.doi.org/10.6035/Sapientia100
4a) Reconocer en una colección de da-
tos los patrones y la notación de una
serie temporal.
4b) Analizar una serie y a partir de su
gráfica, poder comprobar que se
adapta al modelo aditivo.
4c) Conocer las diferentes componen-
tes de una serie temporal: tenden-
cia, componente estacional, com-
ponente errática o residual.
4d) Saber calcular las diferentes com-
ponentes de una serie, suponiendo
un modelo aditivo, por el método
del ajuste analítico.
Ejercicio 7
La siguiente serie cronológica muestra el número de nuevas contrataciones de una
superficie comercial por cuatrimestres en los años indicados:
1.er cuatrimestre 41 39 35 21 22
2.o cuatrimestre 37 33 27 15 16
3.er cuatrimestre 36 30 16 12 13
P. Juan Verdoy / M. J. Beltrán / M. J. Peris - ISBN: 978-84-15444-38-1 239 Problemas resueltos de estadística aplicada a las ciencias sociales - UJI - DOI: http://dx.doi.org/10.6035/Sapientia100
Ayudas
En este apartado se presentarán las ayudas para emplear en caso de ser necesario
a la hora de realizar los ejercicios y problemas. Es conveniente no hacer un abuso
excesivo de estas ayudas, es decir, antes de emplear la ayuda hay que pensar el
problema al menos durante unos 10-15 minutos. Después se consultará la ayuda
de tipo 1 y se intentará resolver el ejercicio con esta ayuda. Si no es posible resol-
verlo, entonces se consultará la ayuda de tipo 2, y en último término la solución.
Ayudas Tipo 2
Ejercicio 1
Para resolver este problema sería conveniente llenar la siguiente tabla. En la parte
inferior de los datos realizaremos los cálculos referentes a la recta de tendencia.
Con los valores de las celdas de los totales podremos resolver el sistema corres-
pondiente.
Observa la diferencia en este apartado por ser un número impar de columnas (en
el ejercicio 2 había 4 columnas) y para hacer la escalera tal como está indicada en la
siguiente tabla (fila i).
En las columnas de la derecha podremos hacer los cálculos para obtener la com-
ponente estacional y los índices estacionales (en porcentaje).
TOTALES
yi M=
i -2 -1 0 1 2
yi ⋅ i
i2
P. Juan Verdoy / M. J. Beltrán / M. J. Peris - ISBN: 978-84-15444-38-1 240 Problemas resueltos de estadística aplicada a las ciencias sociales - UJI - DOI: http://dx.doi.org/10.6035/Sapientia100
Recuerda interpretar los resultados que te permitirán confirmar la coherencia de
tus resultados con los datos originales.
Como se trata de una serie mensual con muchos datos habría que ayudarse con una
hoja de cálculo.
Para hacer las previsiones habrá que calcular previamente la tendencia de cada año
y la componente de cada período, y para obtener los datos que queremos, sumare-
mos en cada caso los datos correspondientes.
Ejercicio 2
Para hacer este ejercicio seguiremos el mismo procedimiento que en el ejercicio 2.
También se trata de una serie mensual, por lo que sería conveniente utilizar una
hoja de cálculo. Por tratarse también de un número impar de columnas y utilizando
la escala de la fila i, poniendo el 0 en la columna central, se simplifica mucho la
resolucion del sistema que hay que plantear para la tendencia.
Ejercicio 3
En este ejercicio no se pide hacer ningún cálculo. Tan solo es una reflexión para
aprender a elegir el número de datos (p) que hay que coger para hacer las medias
móviles, tanto para el cálculo de la tendencia como para el cálculo de la compo-
nente estacional.
Ejercicio 4
Se trata de una serie con muchos datos, por lo que habría que ayudarse de una
hoja de cálculo porque debemos abordar el análisis por el método de las medias
móviles.
Hay que hacer, en primer lugar, la gráfica de los datos y buscar la periodicidad de
dicha gráfica. En este caso tiene un comportamiento que se repite año tras año, habrá
pues que calcular medias móviles de 12 datos (p = 12) para el cálculo de la tendencia.
Por tratarse de un número par tendremos que hacer después un posterior «centrado».
P. Juan Verdoy / M. J. Beltrán / M. J. Peris - ISBN: 978-84-15444-38-1 241 Problemas resueltos de estadística aplicada a las ciencias sociales - UJI - DOI: http://dx.doi.org/10.6035/Sapientia100
Para trabajar más claramente sería conveniente preparar una tabla parecida a esta
(presentamos tan solo los primeros cálculos y espacios).
12227,5
12244,3333
12269,8333
Ejercicio 5
En este ejercicio ya nos dan las tablas preparadas para el método de las medias
móviles y con muchos cálculos ya realizados. Es un ejercicio de consolidación de
la técnica y también se trabaja el mismo objetivo del problema 4, que es aprender
a averiguar el número de datos que hay que tomar para calcular la tendencia y la
componente estacional. Comienza pensando qué es este número p en cada caso y
completa las tablas donde faltan valores al principio, en medio y al final. Por tra-
tarse de números pares hay que hacer después un «centrado» en cada caso.
P. Juan Verdoy / M. J. Beltrán / M. J. Peris - ISBN: 978-84-15444-38-1 242 Problemas resueltos de estadística aplicada a las ciencias sociales - UJI - DOI: http://dx.doi.org/10.6035/Sapientia100
Ejercicio 6
En realidad este ejercicio es «doble» ya que nos piden el análisis por los dos mé-
todos. Este es un ejercicio para terminar el tema y consolidar nuestro trabajo repa-
sando las dos técnicas de análisis que hemos visto a lo largo del tema.
Habrá que hacer, en primer lugar, un análisis por el método del ajuste analítico.
Puedes seguir la pauta de los ejercicios 2 y 3 en este apartado.
Para hacer el análisis por el método de las medias móviles puedes seguir la pauta
de los ejercicios 5 y 6 pero con menos datos, lo que simplificará los cálculos.
Nos piden que comparemos ambos métodos para reflexionar sobre las semejanzas
y diferencias entre ellos.
Ayudas Tipo 2
Ejercicio 1
Para realizar el análisis de una serie temporal por el método del ajuste analítico es
conveniente disponer los datos en la tabla siguiente, como ya se indicaba en la de
la ayuda tipo 1.
06 07 08 09 10 yk y k' ek I k
TOTALES
yi 10200467 M = 2.059.542
i –2 –1 0 1 2 0
yi ×i –424346
i2 4 1 0 1 4 10
Para calcular la tendencia, nos fijaremos en las celdas de la parte inferior. Hemos
llenado los valores de la columna de los «totales» para poder comprobar sus cál-
culos y habrá que resolver el siguiente sistema:
P. Juan Verdoy / M. J. Beltrán / M. J. Peris - ISBN: 978-84-15444-38-1 243 Problemas resueltos de estadística aplicada a las ciencias sociales - UJI - DOI: http://dx.doi.org/10.6035/Sapientia100
⎧∑ y = Na + b∑ i
⎪ i i i
⎧10200467 = 5a + 0b
⎨ ⇒ ⎨
⎪∑ yi ⋅ i = a∑ i + b∑ i 2 ⎩-424346 = 0a +10b
⎩ i i i
Para obtener la componente residual rik = yik - Ti - ek , por lo que hay que tener
previamente calculados los valores de la tendencia (para cada año) y el valor de la
componente estacional (para cada período).
Para hacer las previsiones hay que calcular la tendencia que corresponderá a los
años 2012 y 2013, y construir la serie para los períodos que nos piden sumando
estas componentes: y ik = Ti + ek .
Ejercicio 2
Este ejercicio es muy parecido al anterior y la tabla y los cálculos seguirán el mis-
mo planteamiento.
08 09 10 yk y k' ek I k
TOTALS M = 9.772
yi 26602
i –1 0 1 0
yi ×i –3948
i2 1 0 1 2
P. Juan Verdoy / M. J. Beltrán / M. J. Peris - ISBN: 978-84-15444-38-1 244 Problemas resueltos de estadística aplicada a las ciencias sociales - UJI - DOI: http://dx.doi.org/10.6035/Sapientia100
Algunos resultados parciales que puedes comprobar:
Recta de tendencia: Ti = a + bi = 8867,36 −1974i
b/m = –164,5
e1 = –611 e2 = 21 e3 = –805
e4 = –278 e5 = 276 e6 = 447
e7 = 5.202 e8 = –6.721 e9 = 745
e10 = 707 e11 = 1.350 e12 = –332
Con estos valores se debe encontrar la componente errática o residual y las previ-
siones que nos piden.
Ejercicio 3
Para resolver este ejercicio es necesario observar la gráfica de la serie y el número
de datos que hay en cada «período» de la gráfica.
26
23
20
17
14
11
1/10 1/11 1/12 1/13 1/14 1/15 1/16
En este caso, para calcular la tendencia debemos considerar que en esta gráfica se
«repite» el patrón cada 9 observaciones y que por tratarse de datos bimensuales
tenemos 6 datos por año. ¿Cuál será, pues, el número de datos que hay que tomar
en cada media para hacer un «suavizado» por el método de las medias móviles?
Ejercicio 4
Se trata de una serie con muchos datos por lo que hay que advertir que sería reco-
mendable hacer los cálculos con la ayuda de una hoja de cálculo.
Como vamos a utilizar el método de las medias móviles, en primer lugar hay que
decidir el número de datos por considerar en cada media, por lo que hay que ver
la gráfica de la serie:
P. Juan Verdoy / M. J. Beltrán / M. J. Peris - ISBN: 978-84-15444-38-1 245 Problemas resueltos de estadística aplicada a las ciencias sociales - UJI - DOI: http://dx.doi.org/10.6035/Sapientia100
Podemos ver que tiene una periodicidad anual y como tenemos datos mensuales,
pues hay que calcular medias con 12 datos. Por tratarse de un número par de datos,
tendremos que hacer después un «centrado».
P. Juan Verdoy / M. J. Beltrán / M. J. Peris - ISBN: 978-84-15444-38-1 246 Problemas resueltos de estadística aplicada a las ciencias sociales - UJI - DOI: http://dx.doi.org/10.6035/Sapientia100
La columna de la derecha recoge los valores de la tendencia.
Para hallar la componente estacional, calculamos las medias de los datos origina-
les, por períodos y las denotamos como yk:
Por otra parte, en este caso, podemos aprovechar los resultados de las medias de
la tendencia (por estar calculadas con 12 datos, observaciones que tenemos de cada
año), aunque hay que redistribuirlos en años y períodos, en forma de tabla y calcu-
lar sus medias por períodos (filas). Las denotaremos por Ek .
En la siguiente tabla tienes algunos valores para comprobar, aunque hay otros que
deberás calcular.
Junio 10894,875
P. Juan Verdoy / M. J. Beltrán / M. J. Peris - ISBN: 978-84-15444-38-1 247 Problemas resueltos de estadística aplicada a las ciencias sociales - UJI - DOI: http://dx.doi.org/10.6035/Sapientia100
Julio 12235,9167
Agosto 12257,0833
Septiembre 12270,1667
Octubre 12299,375
Noviembre 12340
Diciembre 12354,4583
Para calcular la componente estacional habrá que restar las columnas finales de
estas dos tablas, ek = y k - E k , que nos permitirá explicar cuáles son los meses
de mayor y menor utilización del transporte público en la Comunidad Valenciana.
Para calcular la componente errática o residual hay que restarle a cada valor inicial
el valor de la tendencia correspondiente a cada celda en los casos en que esta existe
(no a los primeros y últimos valores de la serie), y también le restamos el valor de
la componente estacional que corresponde a cada período.
En la siguiente tabla se presentan los resultados de estos cálculos que puedes com-
probar. ¿Sabrías explicar lo que nos dicen los valores reseñados en rojo y en azul?
P. Juan Verdoy / M. J. Beltrán / M. J. Peris - ISBN: 978-84-15444-38-1 248 Problemas resueltos de estadística aplicada a las ciencias sociales - UJI - DOI: http://dx.doi.org/10.6035/Sapientia100
Ejercicio 5
En este ejercicio nos presentan dos tablas que, evidentemente, se corresponden al
método de las medias móviles.
Miramos la gráfica de la serie (el patrón de periodicidad se puede decir que se re-
pite cada dos años, 8 observaciones) y como se trata de datos trimestrales (4 datos
por año), debemos tomar 8 datos para calcular las medias de la tendencia , ya que
mcm (8,4) = 8.
P. Juan Verdoy / M. J. Beltrán / M. J. Peris - ISBN: 978-84-15444-38-1 249 Problemas resueltos de estadística aplicada a las ciencias sociales - UJI - DOI: http://dx.doi.org/10.6035/Sapientia100
Ejercicio 6
Este ejercicio propone hacer el análisis de la serie por los dos métodos para invi-
tarnos a confrontar las dos técnicas.
1r cuat. 41 39 35 21 22 112,06 %
2n cuat. 37 33 27 15 16 97,87 %
TOTALES
3r cuat. 36 30 16 12 13 90,07 %
i
yi 38 34 26 16 17 131 M = 28,2
i 0
yi ×i -60
i2 10
b/m = –6/3 = –2
∑y '
k
M= k
= 28,2
m
Componente estacional:
P. Juan Verdoy / M. J. Beltrán / M. J. Peris - ISBN: 978-84-15444-38-1 250 Problemas resueltos de estadística aplicada a las ciencias sociales - UJI - DOI: http://dx.doi.org/10.6035/Sapientia100
Índices estacionales:
y1' 31,6
I1 = ·100 = ·100 = 112,05%
112,05 %
M 28,2
y' 27,6
I 2 = 2 ·100 = ·100 = 97,87
97,87%%
M 28,2
y' 25, 4
I 3 = 3 ·100 = ·100 = 90,07
90,07%%
M 28,2
datos Tik
41
37 38,00
36 37,33
39
33
30 32,67
35 3067
27
16
21 17,33
15 16,00
12
22
16 17,00
13
P. Juan Verdoy / M. J. Beltrán / M. J. Peris - ISBN: 978-84-15444-38-1 251 Problemas resueltos de estadística aplicada a las ciencias sociales - UJI - DOI: http://dx.doi.org/10.6035/Sapientia100
Estos resultados, que hemos obtenido de las medias, los colocamos de nuevo en
forma de tabla de doble entrada (como el enunciado) haciendo corresponder a
cada período de la tabla su media, y repetiremos todo el procedimiento como se ha
indicado en el ejercicio 6.
Las portadas se diferencian únicamente por las noticias que aparecen, y no por la
posición de cada noticia en la primera plana. Por lo tanto, hay que contar combi-
naciones de 6 noticias agrupadas de 4 en 4.
P. Juan Verdoy / M. J. Beltrán / M. J. Peris - ISBN: 978-84-15444-38-1 252 Problemas resueltos de estadística aplicada a las ciencias sociales - UJI - DOI: http://dx.doi.org/10.6035/Sapientia100
Soluciones
Ejercicio 1
Para analizar la evolución de los gastos en un departamento de una empresa, se
tomaron los siguientes datos que expresan en miles de euros los gastos cuatrimes-
trales de los cuatro años que figuran en la tabla:
1.er cuatrimestre 26 25 21 20
2.o cuatrimestre 18 15 12 10
3.er cuatrimestre 22 20 18 12
a) Suponiendo un modelo aditivo, calcula por el método del ajuste analítico, las
componentes de esta serie e interpreta cada uno de los resultados obtenidos.
b) Estima los valores de los gastos que se pueden esperar para el año 2012.
Solución
a) Suponiendo modelo aditivo, calcula por el método del ajuste analítico, las
componentes de esta serie e interpreta cada uno de los resultados obtenidos.
Siempre hay que empezar con una gráfica de los datos para ver el patrón de com-
portamiento de la serie y confirmar que podemos aplicarle un ajuste analítico de
tipo aditivo:
Viendo esta gráfica solo cabe esperar una tendencia decreciente y también una
componente estacional bastante marcada por la «periodicidad», que podemos ver
en la gráfica (eje X) que coincide con el intervalo anual que corresponde cada tres
datos.
P. Juan Verdoy / M. J. Beltrán / M. J. Peris - ISBN: 978-84-15444-38-1 253 Problemas resueltos de estadística aplicada a las ciencias sociales - UJI - DOI: http://dx.doi.org/10.6035/Sapientia100
Cálculo de la tendencia
Vemos que en la fila siguiente podemos encontrar una escalera i que hace refe-
rencia a los años para simplificar los cálculos; es recomendable poner el valor 0
en alguna de las columnas centrales de la tabla porque simplificará muchos los
cálculos posteriores.
Después sumaremos las filas y obtendremos los valores que podemos encontrar en
la columna «totales».
1.er cuatrimestre 26 25 21 20
2.o cuatrimestre 18 15 12 10
yi 22 20 17 14 73
i -1 0 1 2 2
yi ×i -22 0 17 28 23
i2 1 0 1 4 6
Utilizaremos estos valores «totales» para resolver el sistema que se plantea a con-
tinuación:
⎧∑ y = Na + b∑ i
⎪ i i i
⎨
⎪∑ yi ⋅ i = a∑ i + b∑ i 2
⎩ i i i
P. Juan Verdoy / M. J. Beltrán / M. J. Peris - ISBN: 978-84-15444-38-1 254 Problemas resueltos de estadística aplicada a las ciencias sociales - UJI - DOI: http://dx.doi.org/10.6035/Sapientia100
donde N es el número de años de los que tenemos datos en la tabla (en este caso,
4 años que corresponden a las 4 columnas) y los coeficientes a y b son los coefi-
cientes de la recta de regresión que denominamos recta de tendencia, la fórmula
de la cual es Ti = a + bi , donde i hace referencia al año que se indica en la escala de
la tabla superior.
⎧∑ y = Na + b∑ i
⎪ i i i
⎧ 73 = 4a + 2b
⎨ ⇒ ⎨
⎪∑ yi ⋅ i = a∑ i + b∑ i 2 ⎩23 = 2a + 6b
⎩ i i i
Para interpretar esta componente de la serie, Ti , que se llama tendencia y que nos
explica el comportamiento del fenómeno a «largo plazo», nos fijamos en el valor
de la pendiente b = 2,7. Que por ser negativa nos permite explicar que los gastos
del departamento van decreciendo año tras año, y además podemos detallar que
el valor de la media de gastos cuatrimestrales del departamento, y i, cada año ha
disminuido en 2,7 miles de euros.
P. Juan Verdoy / M. J. Beltrán / M. J. Peris - ISBN: 978-84-15444-38-1 255 Problemas resueltos de estadística aplicada a las ciencias sociales - UJI - DOI: http://dx.doi.org/10.6035/Sapientia100
2008 2009 2010 2011 yk y k' ek Ik
TOTALES
3.er cuatrimestre 22 20 18 12 18 19,8 0,65 103,39 %
i
M = 19,15
En este ejercicio, b/m = –2,7 / 3 = – 0,9. Al ser una tendencia negativa, los valores
de las medias corregidas y k' seran mayores que las medias originales y k , ya que
estas se calculan así:
b
y k' = y k - (k - 1)
m
Así:
b
y1' = y1 − (1−1) = 23− (−0,9)(1−1) = 23
m
b
y2' = y2 − (2 −1) = 13, 75 − (−0,9)(2 −1) = 14,65
m
b
y3' = y3 − (3−1) = 18 − (−0,9)(3−1) = 19,8
m
∑y '
k
23+14,65 +19.8
M= k
= = 19,15
m 3
y representa el valor de referencia para analizar los valores de los períodos, me-
diante ek = yk' –- M,
M que calcularemos en la siguiente columna:
P. Juan Verdoy / M. J. Beltrán / M. J. Peris - ISBN: 978-84-15444-38-1 256 Problemas resueltos de estadística aplicada a las ciencias sociales - UJI - DOI: http://dx.doi.org/10.6035/Sapientia100
La componente estacional ek nos explicita el comportamiento por períodos en
valores absolutos, indicándonos signo y cantidad en las mismas unidades que los
datos originales (miles de euros). Así, diremos que durante el primer cuatrimestre
los gastos del departamento de nuestra empresa tienen un valor por encima de la
la media de 3850 euros, mientras que los gastos del segundo cuatrimestre son de
4500 euros por debajo de la media y el tercer cuatrimestre son superiores solo en
650 euros a dicha media. El valor de la media de referencia sería M = 19.150 euros
que podría representar un promedio de gastos cuatrimestrales global.
Otra interpretación de estos datos se puede dar con los índices estacionales
y'
I k = k ·100 que calculamos en la siguiente columna, donde se indica en forma
M
de porcentaje (valor relativo, donde M representa el 100 %) la misma información
que la componente estacional, pero que al tener carácter porcentual es más fácil de
presentar sin particularizar y dar el valor de M.
y1' 23
I1 = ·100 = ·100 = 120,10%
120,10 %
M 19,15
y2' 14,65
I2 = ·100 = ·100 = 76,50
76,50%%
M 19,15
y3' 19,8
I3 = ·100 = ·100 = 103,39%
103,39 %
M 19,15
Podremos afirmar que los gastos eran mayores en el primer cuatrimestre, con va-
lores un 20,10 % superiores a la media anual, mientras que los valores del tercer
cuatrimestre siquiera superan dicho valor en un 3,39 %. Cabe destacar que los
gastos disminuyen el segundo cuatrimestre con valores que están alrededor del
76,50 % del valor de dicha media anual global, que podríamos considerar el valor
de M = 19,15 miles de euros.
En tercer lugar, hay que calcular la componente errática o residual que denotamos
por rik, que nos permite destacar el comportamiento de algún dato yik, el valor del
cual no se pueda explicar por las anteriores componentes, lo que permitirá inferir
que por cualquier causa por identificar (motivos extraordinarios) este valor no está
dentro del patrón de comportamiento que hemos encontrado y con el que hemos
interpretado los datos originales para explicar el fenómeno. Los valores de esta
componente errática deben ser pequeños en valor, variados en signo y sin regulari-
dad ni patrón. Nos permiten ver que los datos reales no se ajustan completamente
P. Juan Verdoy / M. J. Beltrán / M. J. Peris - ISBN: 978-84-15444-38-1 257 Problemas resueltos de estadística aplicada a las ciencias sociales - UJI - DOI: http://dx.doi.org/10.6035/Sapientia100
al patrón que hemos encontrado con la tendencia y la componente estacional. Es
por eso que si algún valor es muy alto o bajo dejará identificar algún dato que
corresponda al período de un año, el valor del cual se aleja mucho de los valores
que cabría esperar.
La calcularemos así rik = yik − Ti − ek en cada celda de la tabla. Para tal fin, prime-
ramente hay que calcular la tendencia para cada año de la tabla Ti = 19,6 − 2, 7i .
De estos resultados, los valores que nos llaman más la atención serían los corres-
pondientes al primer cuatrimestre de 2011, que es superior a lo que cabría esperar
con r2011,1 = 1,95, y el tercer cuatrimestre del mismo año con un valor aún más infe-
rior con r2011,3 = −2,85. Habría que estudiar si alguna circunstancia extraordinaria
justifica estos valores o, por el contrario, indica que el comportamiento del fenó-
meno está cambiando sustancialmente. Habría que estar atentos a los próximos
datos del año siguiente.
b) Estima los valores de los gastos que se pueden esperar para el año 2012.
Para hacer las estimaciones que nos piden en este apartado, recordemos que no
podemos prever la componente residual, por lo que calcularemos:
yik = Ti + ek
Considerando la escala que hemos adoptado en la tabla para los años, con el
propósito de simplificar los cálculos de la tendencia, podemos establecer que si
2009 ⇒ i = 0, esto comporta 2012 ⇒ i = 3, lo que nos permitirá obtener el valor
P. Juan Verdoy / M. J. Beltrán / M. J. Peris - ISBN: 978-84-15444-38-1 258 Problemas resueltos de estadística aplicada a las ciencias sociales - UJI - DOI: http://dx.doi.org/10.6035/Sapientia100
de la tendencia para este año: T2012 = T3 = 19,6 − 2, 7·3 = 11,5 y como conocemos
la componente estacional e1 = 3,85, e2 = −4,5 y e3 = 0,65, podremos estimar los
valores de los gastos del año 2012 por quadrimestres.
Ejercicio 2
Los siguientes datos, extraídos del ini, nos muestran las pernoctaciones hoteleras
en la Comunidad Valenciana, desde el año 2006 hasta el 2010.
Haz las previsiones que podemos esperar para los años 2012 y 2013.
P. Juan Verdoy / M. J. Beltrán / M. J. Peris - ISBN: 978-84-15444-38-1 259 Problemas resueltos de estadística aplicada a las ciencias sociales - UJI - DOI: http://dx.doi.org/10.6035/Sapientia100
Solución
Para empezar, hay que observar la gráfica de los datos y comprobar que pueden ser
analizados por el método del ajuste analítico, suponiendo un modelo aditivo. Es
fácil observar un patrón que se repite con bastante regularidad año tras año con un
marcado comportamiento estacional reiterado a lo largo de la colección de datos
que presentamos. En cambio, no se observa una tendencia de marcada pendiente,
ya que los datos se mantienen bastante constantes a largo plazo.
Cálculo de la tendencia
Consideraremos los datos de la serie siguiente que hace referencia a las pernocta-
ciones mensuales hoteleras en la Comunidad Valenciana en los últimos cinco años:
P. Juan Verdoy / M. J. Beltrán / M. J. Peris - ISBN: 978-84-15444-38-1 260 Problemas resueltos de estadística aplicada a las ciencias sociales - UJI - DOI: http://dx.doi.org/10.6035/Sapientia100
Diciembre 1437036 1420988 1251809 1201342 1174451 TOTALES
Podemos ver que en la parte inferior de la tabla hemos calculado las medias men-
suales de cada año y i , los valores de la escala i y las dos files inferiores yi ⋅ i, i 2,
que nos permitirá calcular en la columna totales la suma de los valores de cada fila.
En todos los cálculos hemos redondeado a números enteros por tratarse de número
de pernoctaciones.
donde los coeficientes a y b son los coeficientes de la recta de regresión que de-
nominamos recta de tendencia, la formula es Ti = a + bi, donde i hace referencia
al año que se indica en la escala de la tabla superior.
Podemos ver en este ejemplo que la estrategia de darle el valor i = 0 al año corres-
pondiente en la columna central, cuando N (número de años) es impar, simplifica
mucho la resolucion del sistema. Así:
10200467 −424346
a= = 2040093,4 b= = −42434,6
5 10
P. Juan Verdoy / M. J. Beltrán / M. J. Peris - ISBN: 978-84-15444-38-1 261 Problemas resueltos de estadística aplicada a las ciencias sociales - UJI - DOI: http://dx.doi.org/10.6035/Sapientia100
∑y ij
Recordemos que en la primera columna, yk = i son las medias de las pernoc-
N
taciones de cada mes calculadas con los datos originales, por filas.
∑y '
k
M= k
m
que podemos interpretar como el valor medio de las pernoctaciones mensuales y que
representará el 100 % o valor de referencia.
Después, las dos columnas siguientes muestran los valores de la componente es-
yk'
tacional ek = yk –- M y los índices estacionales I k = ·100 , donde podemos ver
'
M
en qué meses el número de pernoctaciones está por encima o por debajo del valor
de M. Así pues, ek nos presenta esta desviación en cantidades absolutas (número de
pernoctaciones) mientras que I k lo indica de manera porcentual.
Podemos interpretar que el mes con más pernoctaciones es agosto con un valor por
encima de la media es 59,55 %, mientras que el mes que registra menos pernoc-
taciones es enero, que registra tan solo unos valores que corresponden al 58,95 %
del valor de referencia M. Podemos observar también que los valores más impor-
tantes se concentran en los meses de agosto, julio y septiembre, mientras que los
meses de menor afluencia corresponden a enero, diciembre y febrero.
P. Juan Verdoy / M. J. Beltrán / M. J. Peris - ISBN: 978-84-15444-38-1 262 Problemas resueltos de estadística aplicada a las ciencias sociales - UJI - DOI: http://dx.doi.org/10.6035/Sapientia100
Tabla correspondiente a la serie de pernoctaciones en la Comunidad Valenciana
(2006-2010)
2006 2007 2008 2009 2010 yk y k' ek Ik
Enero 1296648 1307384 1289627 1115865 1061450 1214195 1214195 –845348 58,95
Febrero 1424453 1472806 1562471 1329013 1347885 1427326 1430862 –628681 69,47
Marzo 1750282 1892925 1993175 1700733 1800323 1827488 1834560 –224982 89,08
Abril 2152783 2226734 1868049 1925454 1943080 2023220 2033828,6 –25714 98,75
Mayo 2131194 2181889 2114631 1952409 2049616 2085948 2100092,6 40550 101,97
Junio 2399782 2523555 2311444 2241147 2049616 2305109 2322789,8 263247 112,78
Julio 2884491 2983227 2877028 2871011 2945899 2912331 2933548,4 874006 142,44
Agosto 3153407 3308833 3227055 3274561 3341961 3261163 3285916,8 1226374 159,55
Septiembre 2540711 2580090 2524888 2381776 2424567 2490406 2518696 459154 122,29
Octubre 2207203 2097005 2012838 1954615 2053500 2065032 2096858 37316 101,81
Noviembre 1674433 1741296 1498967 1471579 1472610 1571777 1607139 –452403 78,03
Diciembre 1437036 1420988 1251809 1201342 1174451 TOTALES 1297125 1336023,4 –723519 64,87
i –2 –1 0 1 2 0
i2 4 1 0 1 4 10
Para calcular la componente residual rik = yik − Ti − ek habrá que calcular primero el
valor de la tendencia para cada año, y consideraremos para la componente estacio-
nal ek los valores que podemos encontrar en la tabla ya calculados. Así:
P. Juan Verdoy / M. J. Beltrán / M. J. Peris - ISBN: 978-84-15444-38-1 263 Problemas resueltos de estadística aplicada a las ciencias sociales - UJI - DOI: http://dx.doi.org/10.6035/Sapientia100
T2007 = 2040093,4 – 42434,6(–1) = 2082528
T2008 = 2040093,4 – 42434,6 · 0 = 2040093,4
T2009 = 2040093,4 – 42434,6 · 1 = 1997658,8
T2010 = 2040093,4 – 42434,6 · 2 = 1955224,2
Con estos datos, los valores de la componente residual están calculados en la si-
guiente tabla (para ver mejor los datos a efectos de interpretación hemos redon-
deado los resultados en número exacto de pernoctaciones y hemos reseñado con
rojo los valores negativos).
Por ser la componente residual estas cifras podrían sorprendernos, pero hay que
considerar que si comparamos los valores más extremos resaltados (que posterior-
mente comentaremos), estamos hablando de magnitudes cercanas a +/– 150.000
frente al valor global de la tabla M = 2.059.542. Por lo cual, estamos hablando de
valores relativos cercanos al 7 %.
Hacemos esta advertencia porque todos sabemos que las cantidades que hay que
obtener de la componente residual deberían ser pequeñas en valor absoluto, y que
no presentan ninguna regularidad. Ya sabemos que estamos calculando las canti-
dades no explicadas por nuestro modelo y que permitirán resaltar aquellos valores
puntuales, que por razones no predecibles, muestran divergencia del valor que
cabría esperar, atendiendo a las componentes de la tendencia y estacional.
Como se puede ver, en marzo y agosto de 2006, los valores estuvieron por debajo
las previsiones, mientras que en abril y junio de 2007 los valores estuvieron por
encima. Hay que fijarse con el comportamiento de los datos en los meses de febre-
ro, marzo y abril de 2008 y junio, julio y agosto de 2010 que presentan, en ambos
casos, la secuencia de tres meses con valores que parece que se «compensan» en
la misma temporada.
P. Juan Verdoy / M. J. Beltrán / M. J. Peris - ISBN: 978-84-15444-38-1 264 Problemas resueltos de estadística aplicada a las ciencias sociales - UJI - DOI: http://dx.doi.org/10.6035/Sapientia100
Agosto –197930 –69 –39413 50528 160362
Septiembre –43405 38408 25641 –75036 10189
Octubre 44925 –22839 –64571 –80359 60960
Noviembre 1874 111171 –88723 –73676 –30211
Diciembre 35592 61979 –64765 –72798 –57254
Hacer predicciones para los años posteriores implica que el análisis de nuestro
modelo sea vigente y que ninguna otra circunstancia ajena altere las regularidades
que hemos reseñado con nuestro modelo (la tendencia ligeramente decreciente y
el comportamiento mensual ya comentado).
Si queremos prever las cantidades de los años 2012 y 2013 será necesario calcular
la tendencia sustituyendo los valores i = 4 (para el año 2012) e i = 5 (para el año
2013). Estos valores serían los que corresponderían a estos años en la escala de los
valores i de la primera parte de la tabla. Así:
P. Juan Verdoy / M. J. Beltrán / M. J. Peris - ISBN: 978-84-15444-38-1 265 Problemas resueltos de estadística aplicada a las ciencias sociales - UJI - DOI: http://dx.doi.org/10.6035/Sapientia100
Ejercicio 3
Con los siguientes datos, extraídos de la dgt, que nos muestran las nuevas licen-
cias de todos los tipo de carnés de conducir en la Comunidad Valenciana, desde el
año 2008 hasta el 2010, realiza un análisis del fenómeno, obteniendo las diferentes
componentes de la serie temporal por el ajuste analítico.
Haz las previsiones que podemos esperar para los años 2011 y 2012.
Solución
Para empezar, hay que observar la gráfica de los datos y comprobar que pueden
ser analizados por el método del ajuste analítico, suponiendo un modelo aditivo.
P. Juan Verdoy / M. J. Beltrán / M. J. Peris - ISBN: 978-84-15444-38-1 266 Problemas resueltos de estadística aplicada a las ciencias sociales - UJI - DOI: http://dx.doi.org/10.6035/Sapientia100
Podemos observar una tendencia ligeramente decreciente y un comportamiento
estacional bastante constante, exceptuando los meses de julio y agosto.
Cálculo de la tendencia
i -1 0 1 0
i2 1 0 1 2
Podemos ver que en la parte inferior de la tabla hemos calculado las medias men-
suales de cada año y i, los valores de la escala i y las dos filas inferiores yi ⋅ i, i 2, que
nos permitirá calcular en la columna Totales la suma de los valores de cada fila.
P. Juan Verdoy / M. J. Beltrán / M. J. Peris - ISBN: 978-84-15444-38-1 267 Problemas resueltos de estadística aplicada a las ciencias sociales - UJI - DOI: http://dx.doi.org/10.6035/Sapientia100
Con estos datos, plantearemos el siguiente sistema:
⎧∑ y = Na + b∑ i
⎪ i i i
⎧26602 = 3a + 0b
⎨ ⇒ ⎨
⎪∑ yi ⋅ i = a∑ i + b∑ i 2 ⎩-3948 = 0a + 2b
⎩ i i i
Podemos ver en este ejemplo que la estrategia de darle el valor i = 0 al año corres-
pondiente en la columna central, cuando N (número de años) es impar simplifica
mucho la resolucion del sistema. Así:
26602 - 3948
a= = 8867,36
36 b= = - 1974
3 2
∑y '
k
M= k
m
que podemos interpretar como el valor medio de las nuevas medias corregidas
mensuales y que representará el 100 % o valor de referencia.
P. Juan Verdoy / M. J. Beltrán / M. J. Peris - ISBN: 978-84-15444-38-1 268 Problemas resueltos de estadística aplicada a las ciencias sociales - UJI - DOI: http://dx.doi.org/10.6035/Sapientia100
Después, las dos columnas siguientes muestran los valores de la componente es-
yk'
tacional ek = yk -– M
'
M y los índices estacionales I k = ·100 , donde podemos ver
M
en qué meses el número de nuevas licencias está por encima o debajo del valor
de M. Así pues, ek nos presenta esta desviación en cantidades absolutas (número de
pernoctaciones) mientras que I k lo indica de manera porcentual.
Podemos interpretar que el mes con menos licencias nuevas expedidas es agosto
con un valor muy por debajo de la media del 31 %, mientras que el mes que registra
más licencias expedidas es julio, que registra un valor del 53 % por encima del valor
de referencia M. Podemos observar también que el resto de meses tienen valores
bastante cercanos al 100 %, lo que podemos interpretar como que este fenómeno no
tiene un comportamiento estacional marcado, excepto los meses de julio y agosto
antes citados.
i –1 0 1 0
i2 1 0 1 2
b/m = –164,5
P. Juan Verdoy / M. J. Beltrán / M. J. Peris - ISBN: 978-84-15444-38-1 269 Problemas resueltos de estadística aplicada a las ciencias sociales - UJI - DOI: http://dx.doi.org/10.6035/Sapientia100
Recta de tendencia: Ti = a + bi = 8867,36 −1974i con i = 0 que corresponde al año
2009, como se pueden ver en la tabla.
e1 = –611 e2 = 21 e3 = –805
e4 = –278 e5 = 276 e6 = 447
e7 = 5.202 e8 = –6.721 e9 = 745
e10 = 707 e11 = 1.350 e12 = –332
Con estos datos, los valores de la componente residual están calculados en la si-
guiente tabla (para ver mejor los datos a efectos de interpretación hemos redon-
deado los resultados en número exacto de licencias y hemos reseñado con rojo los
valores negativos)
Hacemos esta advertencia porque todos sabemos que las cantidades que hay que
obtener de la componente residual deberían ser pequeñas en valor absoluto, y que
no presentan ninguna regularidad. Ya sabemos que estamos calculando las canti-
dades no explicadas por nuestro modelo y que permitirán resaltar aquellos valores
puntuales que por razones no predecibles, muestran divergencia del valor que ca-
bría esperar, atendiendo a las componentes de la tendencia y estacional.
Como se puede ver, en la tabla siguiente hemos remarcado en rojo los datos que
están por debajo de los valores que cabría esperar y con azul los valores que están
por encima. Para interpretar conjuntamente los datos reales y los resultados de
la componente estacional hemos introducido debajo de la tabla un gráfico de las
subseries anuales de los datos.
P. Juan Verdoy / M. J. Beltrán / M. J. Peris - ISBN: 978-84-15444-38-1 270 Problemas resueltos de estadística aplicada a las ciencias sociales - UJI - DOI: http://dx.doi.org/10.6035/Sapientia100
Residual Residual Residual
2008 2009 2010
Enero 1801 124 789
Febrero 1346 105 771
Marzo –539 –89 2356
Abril 2298 –1230 165
Mayo 1450 –1269 559
Junio 1435 –1433 245
Julio 2960 –2249 –957
Agosto –1973 –800 2033
Septiembre –760 –736 263
Octubre –353 –1201 –174
Noviembre –1563 –80 –578
Diciembre –1446 –453 –816
Podemos observar que los valores de los datos de la componente residual del año
2008, efectivamente, corresponden a los meses, los datos de los cuales se alejan
bastante del comportamiento que corresponde al patrón de los otros años. Los
datos de agosto distorsionan un poco porque no siguen el comportamiento de la ten-
dencia anual; es como si dijéramos que es un mínimo porque paran los servicios y
es independiente de los valores de la tendencia.
La mayor parte de los datos reseñados corresponden al año 2008 porque se puede
observar mejor en este gráfico que no sigue el mismo patrón estacional que los
años siguientes, si exceptuamos los valores de los meses de verano.
En todo caso, cabe destacar que es una serie demasiado corta (tres años) para hacer
un análisis muy riguroso.
P. Juan Verdoy / M. J. Beltrán / M. J. Peris - ISBN: 978-84-15444-38-1 271 Problemas resueltos de estadística aplicada a las ciencias sociales - UJI - DOI: http://dx.doi.org/10.6035/Sapientia100
Previsiones para los años 2012 y 2013
Hacer predicciones para los años posteriores que implica que el análisis de nuestro
modelo sea vigente y que ninguna otra circunstancia ajena altere las regularidades
que hemos reseñado con nuestro modelo (la tendencia ligeramente decreciente y
el comportamiento mensual ya comentado).
Si queremos prever las cantidades de los años 2012 y 2013 será necesario calcular
la tendencia sustituyendo los valores i = 2 (para el año 2011) e i = 3 (para el año
2012). Estos valores serían los que corresponderían a estos años en la escala de los
valores i de la primera parte de la tabla. Así:
Hay que hacer notar que los resultados de la tabla anterior están redondeados por
tratarse de número de nuevas licencias que podemos prever para los años que se
señalan. No se debe olvidar, insistimos, que la fiabilidad de estas previsiones está
en función de la hipótesis de que el fenómeno mantenga el comportamiento decre-
ciente que nos ha indicando la tendencia.
P. Juan Verdoy / M. J. Beltrán / M. J. Peris - ISBN: 978-84-15444-38-1 272 Problemas resueltos de estadística aplicada a las ciencias sociales - UJI - DOI: http://dx.doi.org/10.6035/Sapientia100
Ejercicio 4
La siguiente gráfica es la representación de una serie temporal donde se detallan
los datos bimensuales de 6 años. Si tuviéramos que calcular la tendencia y la com-
ponente estacional de dicha serie por el método de las medias móviles, explica
la elección del número de datos que habría que considerar para el cálculo de las
medias (p) en cada caso, justificando la respuesta.
Solución
Para empezar la resolucion por el método de las medias móviles hay que elegir el
número adecuado de observaciones por incluir en cada media. Este número depen-
de de la componente que queremos encontrar.
Este número que denotaremos por p es el mínimo común múltiplo, mcm en ade-
lante, el número de observaciones por año (en este caso 6 para ser observaciones
bimensuales, es decir, tenemos un dato cada dos meses, por lo que tenemos 6 datos
por año) y el número de observaciones que incluye cada «período» de la gráfica (9
en este caso porque tal y como se ve en la gráfica, la serie tiene un comportamiento
o patrón que se repite cada 9 puntos aproximadamente).
Así pues, para calcular la tendencia el número de observaciones por tomar para
cada media móvil es p, donde
p = mcm (6,9) = 18
Esta elección nos asegura que al hacer el suavizado de 18 observaciones, todas las
fluctuaciones anuales y estacionales se contemplan en cada medio, y así sustitui-
mos cada valor que se abandona en una media por otro que sería equivalente a la
media siguiente a fin de conseguir la tendencia, que explica el comportamiento del
fenómeno a largo plazo de la serie.
En este caso, el número p es el número de observaciones que hay que tomar para
tener un año completo. Es decir, en nuestro problema, p = 6.
P. Juan Verdoy / M. J. Beltrán / M. J. Peris - ISBN: 978-84-15444-38-1 273 Problemas resueltos de estadística aplicada a las ciencias sociales - UJI - DOI: http://dx.doi.org/10.6035/Sapientia100
En esta elección, cada dato es sustituido en un promedio por otra que tiene el mis-
mo comportamiento estacional el año próximo en la media siguiente. Podremos
observar que en cada uno de los cálculos siempre consideraremos los datos de un
año completo.
Ejercicio 5
En la siguiente tabla presentamos el número total de viajeros trasladados en los
servicios de transporte público en la Comunidad Valenciana, detallados por meses,
de los años 2006 al 2010.
Solución
Calcula las componentes de esta serie por el método de las medias móviles. Inter-
preta los resultados.
Análisis de los datos para decidir el número de observaciones que deben tomarse
en cada media
Para empezar la resolución por el método de las medias móviles hay que elegir el
número adecuado de observaciones por incluir en cada media. Este número depen-
de de la componente que queramos encontrar.
P. Juan Verdoy / M. J. Beltrán / M. J. Peris - ISBN: 978-84-15444-38-1 274 Problemas resueltos de estadística aplicada a las ciencias sociales - UJI - DOI: http://dx.doi.org/10.6035/Sapientia100
Este número que denotaremos por n es el mínimo común múltiplo, mcm en ade-
lante, el número de observaciones por año (en este caso 12 para ser observaciones
mensuales) y el número de observaciones que incluye cada «período» de la gráfica
(12 en este caso porque tal y como se ve, la gráfica tiene un comportamiento que
se repite cada año).
Así, hay que hacer las medias aritméticas de 12 datos, de tal modo que en el primer
caso, calculemos su media:
y así vamos sustituyendo un dato (el primero) por el siguiente dato de la serie, de
tal manera que siempre hacemos la media de 12 datos, es decir, determinamos por
el método de las medias móviles de 12 datos la segunda columna que utilizaremos
para calcular la tendencia de la serie. Se puede observar que siempre se trata de la me-
dia de los datos de todo un año, aunque esta colección va empezando en cada media
por los diferentes meses:
P. Juan Verdoy / M. J. Beltrán / M. J. Peris - ISBN: 978-84-15444-38-1 275 Problemas resueltos de estadística aplicada a las ciencias sociales - UJI - DOI: http://dx.doi.org/10.6035/Sapientia100
Un tema que hay que especificar es que estas medias corresponden a 12 meses
(número par), por lo que es difícil hacer corresponder estas medias calculadas a
ninguno de los períodos de los que partimos, ya que no tendremos un período que
corresponda al centro de las observaciones promediado. En estos casos en que
el promedio corresponde a un número par de datos, hay que calcular la tercera
columna donde tendremos las medias móviles centradas y, además, es la media
aritmética de cada dos datos consecutivos de la segunda, columna para hacerlos
corresponder a un mes en particular.
En este método de las medias móviles obtenemos un valor diferente que hace
referencia a cada mes de cada año, exceptuando los valores iniciales y finales que
no podemos calcular.
P. Juan Verdoy / M. J. Beltrán / M. J. Peris - ISBN: 978-84-15444-38-1 276 Problemas resueltos de estadística aplicada a las ciencias sociales - UJI - DOI: http://dx.doi.org/10.6035/Sapientia100
Septiembre 2007 11768 12021,25 12157,5833
Octubre 2007 13266 12133,5833 12077,4167
Noviembre 2007 12655 12044,9167 12089,25
Diciembre 2007 11624 12005,3333 12025,125
Enero 2008 12622 12004,25 12004,7917
Febrero 2008 12202 12006,9167 12005,5833
Marzo 2008 10457 12031 12018,9583
Abril 2008 12960 12031,9167 12031,4583
Mayo 2008 12713 12016,8333 12024,375
Junio 2008 12619 12021,6667 12019,25
Julio 2008 12351 11958,9167 11990,2917
Agosto 2008 8846 11889,1667 11924,0417
Septiembre 2008 12057 12019,75 11954,4583
Octubre 2008 13277 11812,1667 11915,9583
Noviembre 2008 12474 11755,9167 11784,0417
Diciembre 2008 11682 11730,5 11743,2083
Enero 2009 11869 11658,75 11694,625
Febrero 2009 11365 11590,5 11624,625
Marzo 2009 12024 11499,4167 11544,9583
Abril 2009 10469 11389,3333 11444,375
Mayo 2009 12038 11326,3333 11357,8333
Junio 2009 12314 11260,6667 11293,5
Julio 2009 11490 11128,5 11194,5833
Agosto 2009 8027 11096,5 11112,5
Septiembre 2009 10964 11111,75 11104,125
Octubre2009 11956 11118,4167 11115,0833
Noviembre 2009 11718 11121,5833 11120
Diciembre 2009 10894 11077,3333 11099,4583
Enero 2010 10283 11004,9167 11041,125
Febrero 2010 10981 10977,5 10991,2083
Marzo 2010 12207 10955,9167 10966,7083
Abril 2010 10549 10913,5 10934,7083
Mayo 2010 12076 10900,0833 10906,7917
Junio 2010 11783 10889,6667 10894,875
Julio 2010 10621
P. Juan Verdoy / M. J. Beltrán / M. J. Peris - ISBN: 978-84-15444-38-1 277 Problemas resueltos de estadística aplicada a las ciencias sociales - UJI - DOI: http://dx.doi.org/10.6035/Sapientia100
Agosto 2010 7698
Septiembre 2010 10705
Octubre 2010 11447
Noviembre 2010 11557
Diciembre 2010 10769
12227,5 + 12244,3333
T juliol 2006 = = 12235,9167
2
12244,3333 + 12269,8333
Tagost 2006 = = 12257,0833
2
12269,8333 + 12270,5
Tsetembre 2006 = = 12270,1667
2
Habría que explicar mejor que los valores de la segunda y tercera columnas, qui-
zás quedarían mejor referidos al período, si las presentaremos como lo hacemos
en la tabla siguiente. Hemos calculado los promedios de 12 valores y los hacemos
corresponder en el «centro» de este período, que situamos en la celda de la tabla
que hemos previsto intercalando una fila entre cada dos filas de datos originales,
y que después permitirán ver más claramente los datos de este procedimiento de
medias móviles centradas. No hemos presentado los cálculos de toda la serie por
motivos de espacio, como es evidente. Sin embargo, sí queremos mostrarlos con
los primeros valores de la serie:
yik Tik
Enero 2006 12340
P. Juan Verdoy / M. J. Beltrán / M. J. Peris - ISBN: 978-84-15444-38-1 278 Problemas resueltos de estadística aplicada a las ciencias sociales - UJI - DOI: http://dx.doi.org/10.6035/Sapientia100
12269,8333
Septiembre 2006 12148 12270,1667
12270,5
Octubre 2006 13141 12299,375
12328,25
Noviembre 2006 13307 12340
12351,75
Diciembre 2006 11859 12354,4583
12357,1667
Enero 2007 12542 12367,4167
12377,6667
Febrero 2007 12156 12378,125
12378,5833
Marzo 2007 13729 12362,75
12346,9167
Abril 2007 11612 12352,125
12357,3333
Mayo 2007 13777 12330,1667
12303
Junio 2007 13094 12293,2083
12283,4167
Julio 2007 12364 12286,75
12290,0833
Agosto 2007 8814 12292
12293,9167
Septiembre 2007 11768 12157,5833
12021,25
Octubre 2007 13266 12077,4167
12133,5833
Noviembre 2007 12655 12089,25
12044,9167
Diciembre 2007 11624 12025,125
Se puede observar que los primeros y últimos datos no tienen sus medias corres-
pondientes por la técnica utilizada. Podremos interpretar mejor el sentido de estos
datos calculados con la representación de los valores encima de la serie, que nos
permite interpretar el comportamiento a largo plazo de los valores de la utilización
del transporte público en la Comunidad Valenciana:
P. Juan Verdoy / M. J. Beltrán / M. J. Peris - ISBN: 978-84-15444-38-1 279 Problemas resueltos de estadística aplicada a las ciencias sociales - UJI - DOI: http://dx.doi.org/10.6035/Sapientia100
Podemos ver que a largo plazo, si consideramos los datos que analizamos, la utili-
zación del transporte público en la Comunidad Valenciana parece disminuir. Tiene
un comportamiento decreciente si observamos en el gráfico anterior la línea roja
que representa los valores de la tendencia.
∑y ij
yk = i .
N
P. Juan Verdoy / M. J. Beltrán / M. J. Peris - ISBN: 978-84-15444-38-1 280 Problemas resueltos de estadística aplicada a las ciencias sociales - UJI - DOI: http://dx.doi.org/10.6035/Sapientia100
Por otra parte, vamos a ubicar en la tabla siguiente los valores de las medias móvi-
les que hay que calcular con un número de datos p, que es el número de datos que
tenemos por año. En este problema, podremos aprovechar los valores de la tercera
columna del cálculo de la tendencia, ya que en este caso también utilizamos me-
dias móviles con p = 12. Así pues, redistribuiremos los valores de dichos medios
en una tabla donde cada celda indicará el valor que corresponde a cada mes y año.
Para calcular la componente estacional habrá que restar las columnas finales de
estas dos tablas, , lo que nos permitirá explicar cuáles son los meses
de mayor y menor utilización del transporte público en la Comunidad Valenciana.
ek
Enero 154,2104
Febrero –39,0854
Marzo 704,256275
Abril –388,86665
Mayo 1165,00833
Junio 942,591675
Julio –138,085425
Agosto –3376,25678
Septiembre –229,105845
Octubre 900,908964
Noviembre 664,754316
Diciembre –270,709321
P. Juan Verdoy / M. J. Beltrán / M. J. Peris - ISBN: 978-84-15444-38-1 281 Problemas resueltos de estadística aplicada a las ciencias sociales - UJI - DOI: http://dx.doi.org/10.6035/Sapientia100
Así pues, veamos los resultados en la siguiente columna, donde podemos destacar
que el mes de mayor utilización del transporte público en la Comunidad Valencia-
na se produce en mayo, seguido también de los meses de junio y octubre, por lo
contrario, se ve que el mes que destaca porque su valor es muy inferior a la media
es el de agosto. Esta interpretación podemos comprobarla porque los máximos y
mínimos de la gráfica de la serie coinciden con estos valores de la componente
estacional.
Para calcular la componente errática o residual hay que restar a cada valor inicial
el valor de la tendencia correspondiente a cada celda en los casos en que esta existe
(no a los primeros y últimos valores de la serie), y también le restamos el valor de
la componente estacional que corresponde a cada período.
P. Juan Verdoy / M. J. Beltrán / M. J. Peris - ISBN: 978-84-15444-38-1 282 Problemas resueltos de estadística aplicada a las ciencias sociales - UJI - DOI: http://dx.doi.org/10.6035/Sapientia100
2006 2007 2008 2009 2010
12542– 12622– 11869– 10283
Enero 12367,4167– 12004,7917 11694,625 –11041,125
–154,2104 –154,2104 –154,2104 –154,210
12156– 12202– 11365– 10981–
Febrero 12378,125 12005,5833 11624,625 10991,2083
+39,0854 +39,0854 +39,0854 +39,0854
10457– 12024– 12207–
13729–12362,75
Marzo 12018,9583 11544,9583 10966,7083
–704,256275
–704,256275 –704,256275 –704,256275
11612– 12960– 10469– 10549–
Abril 12352,125 12018,9583 11444,375 10934,7083
+388,86665 +388,86665 +388,86665 +388,86665
13777– 12713– 12038– 12076–
Mayo 12330,1667 12024,375 11357,8333 10906,7917
–1165,00833 –1165,00833 –1165,00833 –1165,00833
13094– 12619– 11783–
12314–11293,5
Junio 12293,2083 12019,25 10894,875
–942,591675
–942,591675 –942,591675 –942,591675
12118 – 12351– 11490–
12364–12286,75
Julio 12235,9167 11990,2917 11194,5833
+138,085425
+138,085425 +138,085425 +138,085425
8803 – 8846–
8814–12292 8027 – 11112,5
Agosto 12257,0833 11924,0417
+3376,25678 +3376,25678
+3376,25678 +3376,25678
12148 – 11768– 12057– 10964–
Septiembre 12270,1667 12157,5833 11954,4583 11104,125
+229,105845 +229,105845 +229,105845 +229,105845
13141– 13266– 13277– 11956–
Octubre 12299,375 12077,4167 11915,9583 11115,0833
–900,908964 –900,908964 –900,908964 –900,908964
12474–
13307 – 12340 12655–12089,25 11718–11120
Noviembre 11784,0417
– 664,754316 –664,754316 –664,754316
-664,754316
11859– 11624– 11682– 10894–
Diciembre 12354,4583 12025,125 11743,2083 11099,4583
+270,709321 +270,709321 +270,709321 +270,709321
P. Juan Verdoy / M. J. Beltrán / M. J. Peris - ISBN: 978-84-15444-38-1 283 Problemas resueltos de estadística aplicada a las ciencias sociales - UJI - DOI: http://dx.doi.org/10.6035/Sapientia100
2006 2007 2008 2009 2010
Enero 20,3729 462,9979 20,1646 –912,335
Para facilitar la interpretación de los datos de esta tabla, hemos resaltado en rojo
los valores que corresponden a períodos donde la utilización del transporte público
ha sido por encima de lo esperado atendiendo al modelo que hemos encontrado, y
los valores reseñados en azul corresponden a períodos con valores que están por
debajo de las previsiones, siempre según el modelo que hemos estudiado.
Podemos destacar que los valores que se encuentran de alguna manera «fuera del
modelo» corresponden, en todos los años de nuestra tabla, a los meses de marzo
y abril. Podríamos explicar que, tal vez, hay que considerar que en estos meses
se producen fiestas importantes en la Comunidad y que las vacaciones de Semana
Santa y Pascua son también en estos meses de manera oscilante y no en un mes
concreto, lo que hubiera facilitado el estudio de la componente estacional.
P. Juan Verdoy / M. J. Beltrán / M. J. Peris - ISBN: 978-84-15444-38-1 284 Problemas resueltos de estadística aplicada a las ciencias sociales - UJI - DOI: http://dx.doi.org/10.6035/Sapientia100
Ejercicio 6
Realiza la gráfica de la siguiente serie que indica los miles de kilos de fruta comer-
cializada por trimestres en los últimos 4 años.
1.er trimestre 10 23 12 29
2.o trimestre 11 27 11 28
3.er trimestre 9 25 10 21
4.er trimestre 8 20 8 23
Observa las siguientes tablas que presenten los cálculos que hemos hecho para
obtener la tendencia y la componente estacional de dicha serie.
datos datos
10 10
11 11
9 9
12,75
8 8
16,75
23 23 18,75
27 27
16,875 23,75
25 16,9375 25 22,375
17 21
20 17 20 19
17 17
12 17,375 12 15,125
13,25
11 11 11,75
17,875 10,25
P. Juan Verdoy / M. J. Beltrán / M. J. Peris - ISBN: 978-84-15444-38-1 285 Problemas resueltos de estadística aplicada a las ciencias sociales - UJI - DOI: http://dx.doi.org/10.6035/Sapientia100
10 17,625 10
17,375
8 8 16,625
18,75
29 29 20,125
28 28
21 21
23 23
Solución
a) Identifica el método empleado, añade aquellos datos que faltan en las tablas,
comentando el procedimiento de cálculo que hay que hacer en ellas, justificán-
dolos.
y podemos ver que la periodicidad del fenómeno, hace que los datos repitan el
«patrón» cada dos años.
Cálculo de la tendencia
P. Juan Verdoy / M. J. Beltrán / M. J. Peris - ISBN: 978-84-15444-38-1 286 Problemas resueltos de estadística aplicada a las ciencias sociales - UJI - DOI: http://dx.doi.org/10.6035/Sapientia100
Para decidirnos hay que considerar dos números: el número de datos de cada «pe-
ríodo» de la gráfica antes presentada (en este caso, es evidente, que es 8) y el nú-
mero de observaciones por año (en este caso, es 4 porque son datos trimestrales).
Por lo que el número de datos por coger es el mcm (4, 8) = 8. Pero esta decisión
permite ver que la tabla de la izquierda está construida para calcular la tendencia,
haciendo en la columna primera las medias con p = 8, y a la derecha el posterior
centrado que hay que hacer por tratarse de un número par de datos.
La primera media que falta en la primera columna la hemos obtenido tomando los
primeros 8 datos (lo indicaremos en el subíndice). Así:
10 +11+ 9 + 8 + 23+ 27 + 25 + 20
y1−8 = = 16,625
8
del mismo modo, continuaremos rellenando las siguiente casillas de la misma co-
lumna. Indicamos al subíndice el ordinal de los datos extremos del intervalo de
datos que tomaremos en cada media. Hay que recordar que estamos empleando un
método de «suavizado» para medias móviles.
27 + 25 + 20 +12 +11+10 + 8 + 29
y6−13 = = 17, 75
8
y también falta la última celda que corresponde a la media siguiente (que calcula-
mos con los datos de los últimos dos años):
12 +11+10 + 8 + 29 + 28 + 21+ 23
y9−16 = = 17, 75
8
Como podemos ver en la tabla anterior, esta columna no se relaciona todavía con
los valores de la tendencia, ya que las medias obtenidas no corresponden a los
períodos (trimestres) de los que tenemos los datos. Como se trata de medias ob-
tenidas con un número par de datos se hará un posterior centrado para evitar este
problema. A tal fin, hay que hacer la media aritmética de cada dos datos (medias
de la columna primera).
P. Juan Verdoy / M. J. Beltrán / M. J. Peris - ISBN: 978-84-15444-38-1 287 Problemas resueltos de estadística aplicada a las ciencias sociales - UJI - DOI: http://dx.doi.org/10.6035/Sapientia100
Para completar esta primera columna, que ya corresponde a los valores de la ten-
dencia para cada período (Tik), hemos empezado llenando las primeras casillas que
faltaban a partir de los primeros datos de la columna anterior. Así, tenemos:
16,625 +16,875
T09/1 = = 16, 75
2
16,875 +16,875
T09/2 = = 16,875
2
los siguientes datos de la tabla están ya calculados hasta llegar a la siguiente celda
la vacía que corresponde a:
17, 75 +17,875
T10/2 = = 17,8125
2
y la última, obtenida a partir de las últimas medias:
17,375 +17, 75
T10/4 = = 17,5625
2
Podemos ver que el cálculo de la tendencia por este método impide obtener la ten-
dencia de los primeros y últimos períodos por carencia de datos para calcular las
medias móviles y el posterior centrado.
Indicamos a continuación los cálculos de las medias que faltan en las celdas vacías
e indicaremos el subíndice con el ordinal de los datos del intervalo de valores que
tomamos en cada una.
Así, empezaremos por las primeras celdas que podemos calcular en la primera
columna. Los resultados están en rojo en la tabla siguiente:
10 +11+ 9 + 8
y1−4 = = 9,5
4
11+ 9 + 8 + 23
y2−5 = = 12, 75 (ya está en la tabla)
4
Podemos comprobar los siguientes resultados hasta llegar a las celdas:
8 + 23+ 27 + 25
y4−7 = = 20, 75
4
P. Juan Verdoy / M. J. Beltrán / M. J. Peris - ISBN: 978-84-15444-38-1 288 Problemas resueltos de estadística aplicada a las ciencias sociales - UJI - DOI: http://dx.doi.org/10.6035/Sapientia100
11+10 + 8 + 29
y10−13 = = 14,5
4
8 + 29 + 28 + 21
y12−15 = = 21,5
4
29 + 28 + 21+ 23
y13−16 = = 25,25
4
Como también se trata de un número par de datos (p = 4) habrá también que hacer
el centrado, al igual que en la tabla de la izquierda. Para llenar la segunda columna
recordemos que deberemos hacer la media aritmética de cada dos medias. Indica-
remos el subíndice del año y trimestre al que hacer corresponder cada resultado.
Así, la primera celda, denotada por y08/3'
corresponde a la media móvil del tercer
trimestre del año 2008.
9,5 +12, 75
y08/3
'
= = 11,125
2
12, 75 +16, 75
y08/4
'
= = 14, 75
2
20, 75 + 23, 75
y09/2
'
= = 22,25
2
10,25 +14,5
y10/3
'
= = 12,375
2
21,5 + 25,25
y11/2
'
= = 23,375
2
11 11
9,5
9 9 11,125
12,75
8 8 14,75
16,625 16,75
P. Juan Verdoy / M. J. Beltrán / M. J. Peris - ISBN: 978-84-15444-38-1 289 Problemas resueltos de estadística aplicada a las ciencias sociales - UJI - DOI: http://dx.doi.org/10.6035/Sapientia100
23 16,75 23 18,75
16,875 20,75
27 16,875 27 22,25
16,875 23,75
25 16,9375 25 22,375
17 21
20 17 20 19
17 17
12 17,375 12 15,125
17,75 13,25
11 17,8125 11 11,75
17,875 10,25
10 17,625 10 12,375
17,375 14,5
8 17,5625 8 16,625
17,75 18,75
29 29 20,125
21,5
28 28 23,375
25,25
21 21
23 23
Hay que hacer, en parte, el cálculo de las medias de los datos originales por pe-
ríodos. Las denotaremos por yk y están en la columna derecha de la siguiente
tabla:
2008 2009 2010 2011 yk
1.er trimestre 10 23 12 29 18,5
2. trimestre
o
11 27 11 28 19,25
3.er trimestre 9 25 10 21 16,25
4.o trimestre 8 20 8 23 14,75
P. Juan Verdoy / M. J. Beltrán / M. J. Peris - ISBN: 978-84-15444-38-1 290 Problemas resueltos de estadística aplicada a las ciencias sociales - UJI - DOI: http://dx.doi.org/10.6035/Sapientia100
Por otra parte, situaremos las medias móviles de la tabla de la derecha, ya cum-
plimentada, en esta distribución por años y períodos, haciendo corresponder cada
valor al período adecuado. Veamos:
Podemos interpretar, si analizamos estos resultados, que los datos del cuarto tri-
mestre son muy inferiores a los del resto y destacaríamos los valores del tercer
trimestre por encima de la media global.
P. Juan Verdoy / M. J. Beltrán / M. J. Peris - ISBN: 978-84-15444-38-1 291 Problemas resueltos de estadística aplicada a las ciencias sociales - UJI - DOI: http://dx.doi.org/10.6035/Sapientia100
c) Calcula la componente errática o residual.
Ejercicio 7
La siguiente serie cronológica muestra el número de nuevas contrataciones de
cierta superficie comercial por cuatrimestres en los años que se indican:
1.er cuatrimestre 41 39 35 21 22
2.o cuatrimestre 37 33 27 15 16
3.er cuatrimestre 36 30 16 12 13
P. Juan Verdoy / M. J. Beltrán / M. J. Peris - ISBN: 978-84-15444-38-1 292 Problemas resueltos de estadística aplicada a las ciencias sociales - UJI - DOI: http://dx.doi.org/10.6035/Sapientia100
a) Realiza la gráfica de la serie y, suponiendo un modelo aditivo, calcula por el
método del ajuste analítico las componentes de esta serie, e interpreta cada
uno de los resultados obtenidos.
b) Haz las previsiones que podemos esperar para los años 2012 y 2013.
c) Realiza el análisis de la serie por el método de las medias móviles, estiman-
do también las componentes de la serie.
d) Compara los resultados del análisis por los dos métodos empleados.
Solución
a) Realiza la gráfica de la serie y, suponiendo un modelo aditivo, calcula por el
método del ajuste analítico las componentes de esta serie, e interpreta cada
uno de los resultados obtenidos.
Siempre hay que empezar con una gráfica de los datos para ver el patrón de com-
portamiento de la serie y nos confirme que podemos aplicarle un ajuste analítico
de tipo aditivo:
Viendo esta gráfica solo cabe esperar una tendencia decreciente y también una
componente estacional bastante marcada por la «periodicidad», que podemos ver
en la gráfica (eje X) que coincide con el intervalo anual que corresponde cada tres
datos.
Cálculo de la tendencia
P. Juan Verdoy / M. J. Beltrán / M. J. Peris - ISBN: 978-84-15444-38-1 293 Problemas resueltos de estadística aplicada a las ciencias sociales - UJI - DOI: http://dx.doi.org/10.6035/Sapientia100
Podemos ver que en la fila siguiente hay una escalera i que hace referencia a los
años para simplificar los cálculos; es recomendable poner el valor 0 en la columna
central porque simplificará mucho el cálculo del sistema que hay que plantear para
obtener los coeficientes de la recta de tendencia.
Después sumaremos las filas y obtendremos los valores que podemos encontrar en
la columna «totales».
1.er cuatrimestre 41 39 35 21 22
2.o cuatrimestre 37 33 27 15 16
yi 38 34 26 16 17 131
i –2 –1 0 1 2 0
yi ⋅ i –76 –34 0 16 34 –60
i2 4 1 0 1 4 10
Utilizaremos estos valores «totales» para resolver el sistema que se plantea a con-
tinuación:
⎧∑ y = Na + b∑ i
⎪ i i i
⎨
⎪∑ yi ⋅ i = a∑ i + b∑ i 2
⎩ i i i
donde N es el número de años de los que tenemos datos en la tabla (en este caso,
4 años que corresponden a las 4 columnas) y los coeficientes a y b son los coefi-
cientes de la recta de regresión que denominamos recta de tendencia, la formula
es Ti = a + biib, donde i hace referencia al año que se indica en la escala de la tabla
superior.
⎧∑ y = Na + b∑ i
⎪ i i i
⎧131 = 5a + 0b
⎨ ⇒ ⎨
⎪∑ yi ⋅ i = a∑ i + b∑ i 2 ⎩−60 = 0a +10b
⎩ i i i
P. Juan Verdoy / M. J. Beltrán / M. J. Peris - ISBN: 978-84-15444-38-1 294 Problemas resueltos de estadística aplicada a las ciencias sociales - UJI - DOI: http://dx.doi.org/10.6035/Sapientia100
Resolveremos el sistema aislando en cada ecuación el valor de los coeficientes a
i b. La tarea se facilita por la situación del 0 de la escala en la columna central en
cuanto su número es impar.
131 −60
Los valores que hemos calculado son: a = = 26,2 y b = = −6 , con los que
podemos concluir que Ti = 26,2 – 6i. 5 10
Para interpretar esta componente de la serie, Ti , que se llama tendencia y que nos
explica el comportamiento del fenómeno a «largo plazo», nos fijamos en el valor
de la pendiente b = –6, que por ser negativa nos permite explicar que las contrata-
ciones van decreciendo año tras año, y podemos además detallar que el valor de la
media de gastos cuatrimestrales del departamento, y i , ha disminuido en 6 cada año.
TOTALES
3.er cuatrimestre 36 30 16 12 13 21,4 25,4 –2,8 90,07 %
i
M = 28,2
P. Juan Verdoy / M. J. Beltrán / M. J. Peris - ISBN: 978-84-15444-38-1 295 Problemas resueltos de estadística aplicada a las ciencias sociales - UJI - DOI: http://dx.doi.org/10.6035/Sapientia100
En la siguiente columna calcularemos las medias corregidas y k' (donde elimina-
mos en cada dato el valor proporcional a la tendencia que le podemos asignar a
cada período), suponiendo que este decrecimiento b = –6 ha sido constante a lo
largo de los períodos del año.
En este ejercicio, b/m = –6/3 = –2. Al ser una tendencia negativa, los valores de las
medias corregidas y k' serán mayores que las medias originales y k , ya que estas se
calculan así:
Así:
b
y1' = y1 − (1−1) = 31,6 − (−2)(1−1) = 31,6
m
b
y2' = y2 − (2 −1) = 25,6 − (−2)(2 −1) = 27,6
m
b
y3' = y3 − (3−1) = 21, 4 − (−2)(3−1) = 25, 4
m
y representa el valor de referencia para analizar los valores de los períodos, me-
diante , que calcularemos en la siguiente columna.
P. Juan Verdoy / M. J. Beltrán / M. J. Peris - ISBN: 978-84-15444-38-1 296 Problemas resueltos de estadística aplicada a las ciencias sociales - UJI - DOI: http://dx.doi.org/10.6035/Sapientia100
Otra interpretación de estos datos se puede dar con los índices estacionales
y'
I k = k ·100 que calculamos en la siguiente columna donde se indica en forma
M
de porcentaje (valor relativo, donde M representa el 100 %) la misma información
que la componente estacional, pero que al tener carácter porcentual es más fácil de
presentar sin particularizar y dar el valor de M.
y1' 31,6
I1 = ·100 = ·100 = 112,05%
112,05 %
M 28,2
y2' 27,6
I2 = ·100 = ·100 = 97,87%
98,87 %
M 28,2
y3' 25, 4
I3 = ·100 = ·100 = 90,07%
90,07 %
M 28,2
Podremos afirmar que los gastos eran mayores en el primer cuatrimestre, con valo-
res de un 12,05 % superiores a la media anual, mientras que los valores del tercer
cuatrimestre solo llegan a tener valores inferiores en un 10% aproximadamente
inferiores. Cabe destacar que las contrataciones del segundo cuatrimestre tienen
valores que están en torno al valor de dicha media anual global, que podríamos
considerar el valor de M = 28,2 contrataciones.
En tercer lugar, hay que calcular la componente errática o residual, que denotamos
por rik, que nos permite destacar el comportamiento de algún dato yik, el valor del
cual no se pueda explicar por las anteriores componentes, lo que permitirá inferir
que por cualquier causa por identificar (motivos extraordinarios) este valor no está
dentro del patrón de comportamiento que hemos encontrado y con el que hemos
interpretado los datos originales para explicar el fenómeno. Los valores de esta
componente errática deben ser pequeños en valor, variados en signo y sin regulari-
dad ni patrón. Nos permiten ver que los datos reales no se ajustan completamente
al patrón que hemos encontrado con la tendencia y la componente estacional. Es
por eso que si algún valor es muy alto o bajo dejará identificar algún dato que
corresponde al período de un año, el valor del cual se aleja mucho de los valores
que cabría esperar.
La calcularemos así rik = yik − Ti − ek en cada celda la de la tabla. Para tal fin, prime-
ramente hay que determinar la tendencia para cada año de la tabla Ti = 26,2 − 6i.
P. Juan Verdoy / M. J. Beltrán / M. J. Peris - ISBN: 978-84-15444-38-1 297 Problemas resueltos de estadística aplicada a las ciencias sociales - UJI - DOI: http://dx.doi.org/10.6035/Sapientia100
T2007 = T−2 = 26,2 − 6·(−2) = 38,2
T2008 = T−1 = 26,2 − 6(−1) = 32,2
T2009 = T0 = 26,2 − 6·0 = 26,2
T2010 = T1 = 26,2 − 6·1 = 20,2
T2011 = T2 = 26,2 − 6·2 = 14,2
De estos resultados, podemos observar que los valores que nos llaman la atención
los marcamos con color rojo. Podremos destacar los correspondientes al primer
cuatrimestre de 2009, que es superior a lo que cabría esperar con r2009,1 = 5,4 y el
tercer cuatrimestre del mismo año con un valor aún muy inferior con r2011,3 = –7,4.
- 7,4
Y también el valor del tercer cuatrimestre de 2010 r2010,3 = -–5,4
5,4 que nos indica
que ese cuatrimestre es un valor inferior al que cabría esperar. Habría que estudiar
si alguna circunstancia extraordinaria justifica estos valores.
b) Haz las previsiones que podemos esperar para los años 2012 y 2013.
Para hacer las estimaciones que nos piden en este apartado, recordemos que no
podemos prever la componente residual, por lo que calcularemos:
y ik = Ti + ek
Considerando la escala que hemos adoptado en la tabla para los años, con el
propósito de simplificar los cálculos de la tendencia, podemos establecer que si
2009 ⇒ i = 0 , esto comporta 2012 ⇒ i = 3 , lo que nos permitirá obtener el valor
de la tendencia para este año: T2012 = T3 = 26,2 − 6·3 = 8,2 y como conocemos la
componente estacional e1 = 3,4 , e2 = -–0,6
0,6 y e3 = -–2,8,
2,8 podremos estimar los va-
lores de los gastos del año 2012 por cuatrimestres:
P. Juan Verdoy / M. J. Beltrán / M. J. Peris - ISBN: 978-84-15444-38-1 298 Problemas resueltos de estadística aplicada a las ciencias sociales - UJI - DOI: http://dx.doi.org/10.6035/Sapientia100
y2012,1qua = 8,2 + 3,4 = 11,6,6contrataciones
y2012, 2 qua = 8,2–0,6
- 0,6==7,6
7,6contrataciones
y2012,3qua = 8,2–2,8
- 2,8==5,4
5,4contrataciones
Para analizar la serie por el método de las medias móviles, hay que fijarse en la
gráfica de la serie que nos permite ver que tiene una periodicidad anual.
Cálculo de la tendencia
Para calcular la tendencia hay que elegir el número de datos que tomaremos para
determinar cada una de las medias. En este caso p = 3. A tal fin, escribimos en la
tabla siguiente los resultados de las medias móviles que son los valores de la ten-
dencia y la gráfica de su interpretación:
P. Juan Verdoy / M. J. Beltrán / M. J. Peris - ISBN: 978-84-15444-38-1 299 Problemas resueltos de estadística aplicada a las ciencias sociales - UJI - DOI: http://dx.doi.org/10.6035/Sapientia100
datos Tik
41
37 38,00
36 37,33
39 36,00
33 34,00
30 32,67
35 30,67
27 26,00
16 21,33
21 17,33
15 16,00 Se ve un comportamiento a largo plazo decreciente,
12 16,33 aunque con los últimos datos parece que empieza a
22 16,67 corregirse.
16 17,00
13
Para calcular la componente estacional, hay que determinar en primer lugar las
medias de los datos originales por períodos. Las denotamos por yk .
Por otra parte, tomaremos las medias móviles con p = 3, ya que es el número de
datos por año. En nuestro caso podremos aprovechar los datos ya calculados en el
apartado anterior. Los colocaremos distribuidos por años y cuatrimestres.
P. Juan Verdoy / M. J. Beltrán / M. J. Peris - ISBN: 978-84-15444-38-1 300 Problemas resueltos de estadística aplicada a las ciencias sociales - UJI - DOI: http://dx.doi.org/10.6035/Sapientia100
Para hallar la componente estacional restamos estas columnas calculadas entre sí.
Así, ek = yk - Ek nos permite interpretar el comportamiento de la serie por cua-
trimestres.
Es evidente que los primeros cuatrimestres los valores de la serie tienen los mayores
valores con 6,43 contrataciones por encima de una hipotética media anual. Desta-
caremos también el resultado del tercer cuatrimestre con valores inferiores, que se
reflejan con el –5,52 contrataciones que veamos en la celda correspondiente. Esta
interpretación también es coherente con la gráfica de la serie que hemos visto al
comenzar el problema.
Aunque no son cantidades muy elevadas, hemos reseñado en rojo los datos que
corresponden al primer cuatrimestre del año 2008 por ser 3,43 menos contratacio-
nes de lo que se espera para la regularidad del fenómeno. También hemos reseñado
el dato del tercer cuatrimestre de 2007, que es de 4,19 contrataciones por encima.
d) Compara los resultados del análisis por los dos métodos empleados.
P. Juan Verdoy / M. J. Beltrán / M. J. Peris - ISBN: 978-84-15444-38-1 301 Problemas resueltos de estadística aplicada a las ciencias sociales - UJI - DOI: http://dx.doi.org/10.6035/Sapientia100
que la ecuación de la recta de tendencia que obtenemos con el método del primer
enunciado nos permite obtener valores de tendencia por años cercanos, siempre
que consideramos como hipótesis de trabajo que el fenómeno mantendrá un com-
portamiento similar a los datos reales que tenemos.
P. Juan Verdoy / M. J. Beltrán / M. J. Peris - ISBN: 978-84-15444-38-1 302 Problemas resueltos de estadística aplicada a las ciencias sociales - UJI - DOI: http://dx.doi.org/10.6035/Sapientia100
Bibliografía
P. Juan Verdoy / M. J. Beltrán / M. J. Peris - ISBN: 978-84-15444-38-1 303 Problemas resueltos de estadística aplicada a las ciencias sociales - UJI - DOI: http://dx.doi.org/10.6035/Sapientia100
Barbancho, A. G., Estadística Elemental Moderna. Ed. Ariel Economía, 1982.
Beltrán, J. y Peris, M. J., Introducció a l’estadística aplicada a les ciències so-
cials. Servei de Publicacions de la uji. Col·lecció Sapientia, 2013.
Escudero Vallés, R., Métodos estadísticos aplicados a la economía. Ed. Ariel
Economía, 1994.
Biosca, A.; Espinet, M. J.; Fandos, M. J.; Jimeno, M. y Villagrà, J., Matemáticas
aplicadas a las Ciencias Sociales II. Barcelona: Edebé, 1999.
Brunet, I., Belzunegui, A. y Pastor, I. Les tècniques d’investigació social i la
seva aplicació. Universitat Rovira i Virgili, 2000.
Colera, J.; García, R. y Oliveira, M. J. Matemàtiques aplicades a les Ciències
Socials. Madrid: Anaya, 2003.
Correa, J. C. y González, N., Gráficos en R. Universidad Nacional Sede Mede-
llín, 2002.
Fernández Cuesta, C. y Fuentes García, F., Curso de Estadística Descriptiva.
Teoria y práctica. Ed. Ariel, 1994.
Gracia, F.; Mateu, J. y Vindel, P., Problemas de Probabilidad y Estadística.Va-
lencia: Tilde, 1997.
Ibáñez, M. V. y Simó, A., Apuntes de Estadística para Ciencias Empresariales.
Castellón: uji, 2002.
Kazmier, L., Estadística aplicada a la administración y a la economía. Ed. MC Graw-
Hill, 3.a ed., 1998.
Martín, P. y Martín Pliego, J., Curso Básico de Estadística Económica. Ed. AC,
3.a ed., 1991.
Martín Pliego, J., Introducción a la Estadística Económica y Empresarial. Ed.
AC. Colección Plan Nuevo, 2004.
Meyer, P. L. Probabilidad y aplicaciones estadísticas, Ed. Addson-Wesley, 1986.
Monteagudo, M. F. y Paz, J., Matemáticas aplicadas a las Ciencias Sociales II.
Zaragoza: Luis Vives, 2003.
Montero Lorenzo, J. M., Estadística para Relaciones Laborales. Ed. AC, 2003.
Newbold, P. Carlson, W. L. y Thorne, B., Estadística para administración y eco-
nomía. Ed. Prentice Hill, 2007.
Ruíz-Maya Pérez, L. y Martín-Pliego López, F. J., Fundamentos de Inferencia
Estadística, 3.a ed., Thomson, 2005.
Sanz, J. A., Bedate, A., Rivas, A. y González, J., Problemas de Estadística des-
criptiva empresarial. Ed. Ariel Economía, 1996.
Spiegel, M., Estadística. Ed. Mc. Graw-Hill. Serie Schaum, 1970.
Tomeo Perucha, V. y Uña Juárez, I., Diez Lecciones de Estadística Descriptiva
(Curso Teórico-Práctico). Ed. AC, 2003.
Triola, M. F., Estadística Elemental, Ed. Pearson Educations, 7.a ed., 2000.
Venables, W. N., Smith , D. M. y The R Development Core Team, An introduction
to R. isbn 3-900051-12-7, 2008.
Webster, A. L., Estadística aplicada a los negocios y a la economia. Ed. MC Graw-
Hill, 2000.
Wonnacot, T. H. y Wonnacot, R. J., Introducción a la Estadística. Limusa No-
riega Editores, 1996.
Zaiats, V., Calle, M. L. y Presas, R., Probabilitat i Estadística. Exercicis I. Ed.
Eumo, 1998.
P. Juan Verdoy / M. J. Beltrán / M. J. Peris - ISBN: 978-84-15444-38-1 305 Problemas resueltos de estadística aplicada a las ciencias sociales - UJI - DOI: http://dx.doi.org/10.6035/Sapientia100
Webs
www.ine.es
www. ub.edu/stat/GrupsInnovacio/Statmedia
www.monografias.com
P. Juan Verdoy / M. J. Beltrán / M. J. Peris - ISBN: 978-84-15444-38-1 306 Problemas resueltos de estadística aplicada a las ciencias sociales - UJI - DOI: http://dx.doi.org/10.6035/Sapientia100