Location via proxy:   [ UP ]  
[Report a bug]   [Manage cookies]                

Mest3 U1 A1 Elvc

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 6

Licenciatura en Matemáticas

Asignatura: Estadística III

Unidad 1.- Procesos y series de tiempo

Actividad 1.-Uso de Software

Alumna: Elda Josefina Vázquez Calderón

Grupo: MT-MEST3-2201-B1-000

Docente: Marco Antonio Olivera Villa

.
Actividad 1

Análisis inicial de series de tiempo con R


I.- Datos
En esta primera parte vamos a trabajar con el archivo pobla.dat que contiene datos
anuales del gasolina en España entre enero de 1966 y agosto de 1977.. El archivo está
en la dirección http://verso.mat.uam.es/~joser.berrendero/datos/gas6677.dat

II.- Transformando los datos en una serie de tiempo


Contesta las siguientes preguntas:

Pregunta 1: En R, copia y pega el siguiente código y escribe qué observas

gas = scan('http://verso.mat.uam.es/~joser.berrendero/datos/gas6677.dat')
plot(gas)

Vemos que el gráfico resultante no es el más apropiado para describir una serie temporal. Si
queremos que R trate a un objeto como serie temporal, tenemos que determinar
apropiadamente sus características con el comando ts. Para definir la serie correctamente
escribimos:
gas.ts = ts(gas, start = c(1966,1), frequency = 12)
print(gas.ts)
plot(gas.ts)

Vemos ahora cómo el resultado depende de las características que hemos definido para la
serie. Si queremos comparar la distribución del consumo de gasolina para cada mes, un
gráfico útil es
boxplot(gas.ts ~ cycle(gas.ts))
El comando cycle determina la unidad de tiempo a la que pertenece cada observación de la
serie:
cycle(gas.ts)

Por lo tanto, en el gráfico anterior se ha producido un diagrama de cajas para cada mes del
año.

Pregunta 2.- ¿En qué año se observa el mayor porcentaje de consumo de


gasolina?, ¿Podrías explicar por qué?

Según el diagrama en 1978. Porque en cuanto más nos acercamos a la época actual hay más
personas que ya tienen vehículo y por lo tanto tienen que consumir la gasolina

Pregunta 3: Qué hacen cada uno de los comandos descritos en el código


anterior
Comando ¿Qué hace el comando?
La función scan nos permite tanto introducir datos
directamente en la consola como desde el portapapeles o
desde un fichero. ... Si los datos leídos no corresponden al
scan tipo, ya sea por defecto o especificado a través de what, se
genera un mensaje de error. Por ello diferenciaremos
números, caracteres o una mezcla de ambos
En R, la función plot() es usada de manera general para crear
gráficos. Esta función tiene un comportamiento especial, pues
plot dependiendo del tipo de dato que le demos como argumento,
generará diferentes tipos de gráfica.
La función ts() convierte un objeto a serie temporal.
IMPORTANTE: La construcción de objetos de la clase ts
requiere que los datos de partida estén distribuidos
ts regularmente en la escala temporal utilizada; por ejemplo, que
haya siempre un dato por día, o dos datos por mes o un dato
cada dos años.
Para imprimir texto en pantalla utilizamos el comando
print print("texto"), también se puede utilizar para mostrar el valor
guardado en variables.
Es una serie de tiempo de desempleo
start: Referencia de la primera observación, es un vector con
ts(desempleo, start dos valores numéricos, el primero relativo al año y el segundo
= c(1991,1), relativo al trimestre y mes de inicio (1 para el primer trimestre
y 1 para enero en series de datos mensuales).
frequency = 1)
frequency: Número de observaciones por año (4 en series
trimestrales, 12 en series mensuales).

III.- Analizando la serie de tiempo

Una serie de tiempo se puede descomponer en:


Serie observada = Tendencia + Efecto estacional + Residuos.

En este modelo, la serie observada es el resultado de sumar una tendencia que


representa el comportamiento a largo plazo de la serie, un efecto estacional que
describe sus fluctuaciones periódicas y un componente residual que describe las
variaciones a corto plazo, normalmente impredecibles.

Pregunta 4.- ¿Qué se observa al ejecutar el código de abajo?,


gas.ts = ts(gas, start = c(1966,1), frequency = 12)
plot(gas.ts.desc, xlab='Año')
gas.ts = ts(gas, start = c(1966,1), frequency = 12)

El argumento frequency se utiliza para indicar la periodicidad de la serie (en


este caso mensual), mientras que el argumento start indica la fecha de la
primera observación (enero de 1966). Si ahora escribimos print (gas.ts) y plot
(gas.ts) vemos cómo el resultado depende de las características de la serie. Si
queremos comparar la distribución del consumo de gasolina para cada mes,
un gráfico útil seria:

boxplot(gas.ts ~ cycle(gas.ts))

Con R es muy sencillo obtener una descomposición estructural de este tipo. Se usa el
comando decompose:
gas.ts.desc = decompose(gas.ts)
plot(gas.ts.desc, xlab='Año')

Esta descomposición se basa en métodos elementales: la tendencia se calcula con


una media móvil, el efecto estacional se calcula promediando los valores de cada
unidad de tiempo para todos los periodos (por ejemplo, todos los meses de enero si
la serie es mensual) y luego centrando el resultado. Finalmente, los residuos se
obtienen restando a la serie observada las dos componentes anteriores. La
descomposición solo es totalmente adecuada si se dispone de un número completo
de periodos (por ejemplo, un múltiplo de 12 si la serie es mensual).

Referencias:

UnADM Matemáticas/Estadística III Contenido Nuclear Unidad 1 /Procesos y series


de tiempo/México, D.F. 2015

También podría gustarte