Etude de la serie airmiles

La chronique airmiles (dans la bibliothèque TSA), donne le nombre de passagers transportés sur les lignes aériennes aux USA de janvier 1996 à mai 2007.

Proposez des modèles d’intervention basés sur :

  • une variable pulse qui prend la valeur 1 en septembre 2001, 0 sinon ;
  • une variable step qui prend la valeur 1 après septembre 2001, 0 avant ;
  • une variable présentant une décroissance géométrique dont il faudra estimer la vitesse de décroissance.


In [1]:
library(forecast)
library(lmtest)
library(TSA)  

options(repr.plot.width=12, repr.plot.height=10) # pour redimensionner les graphiques
Loading required package: zoo


Attaching package: ‘zoo’


The following objects are masked from ‘package:base’:

    as.Date, as.Date.numeric



Attaching package: ‘TSA’


The following objects are masked from ‘package:stats’:

    acf, arima


The following object is masked from ‘package:utils’:

    tar


Représentations graphiques, étude qualitative

In [2]:
data(airmiles)
airmiles
A Time Series: 10 × 12
JanFebMarAprMayJunJulAugSepOctNovDec
1996309831743214766338342975359691133647439138772238403956574173849933580773363898423273490136866146
1997288297942971536937179450340020043458549736981956389126403971597132047526344055233212125434447370
1998338092573268844839908269386185153882380541119273421531934317161035309230385705063629155637511830
1999354505763433778542448030408183784046405743527294469189314584104437829297416510473987574939190232
2000361954023723974045664486432629774446760147261820488265574816057939573944429008704184751540727132
2001383065063696933945686100437116644367482646654145495972735016990727077913341815543474980835726959
2002338956713362097242633492395363544089502444060019471833644689936634776695400930253721399742407172
2003371978093509931642910514403702924187512645592190496334394834383837858815425072874023825343698675
2004391801143973643547876012470504394653413051134050543173145239298541816777472056654455365346316602
20054276065741120838520530594815258550047901

On remarque que les données sont disponibles jusque mai 2005.

In [3]:
plot(airmiles, type="o", pch =20)
grid()
plot(log(airmiles), type="o", pch =20)
grid()

On identifie plutôt un modèle multiplicatif: l'amplitude des fluctuations périodiques étant (un peu) plus grande lorsque la tendance est plus élevée (cf séance 1).

Lorsqu'on examine le logarithme de la chronique, les fluctuations périodiques semblent plus régulières. On travaillera donc sur le logarithme de la chronique. Notons qu'il s'agit d'un choix de modélisation discutable qui pourrait être remis en question.


Etant donnée la saisonnalité, nous allons opérer une dérivée saisonnière.

In [4]:
plot(diff(log(airmiles),12))
grid()

L'aspect du graphe est plutôt celui d'une "marche aléatoire" que celui d'un processus stationnaire.

Examinons le graphe de cette chronique encore dérivée.

In [5]:
plot(diff(diff(log(airmiles),12)))

Le graphe a maintenant l'air de celui d'un processus stationnaire, "à l'intervention près".


Modélisation de la chronique initiale

(sans intervention, pour avoir une référence à laquelle comparer)

On travaillera sur log(airmiles).

In [6]:
tsdisplay(log(airmiles))

L'ACF présente une périodicité: cela confirme la nécessité d'une dérivation saisonnière.

In [7]:
tsdisplay(diff(log(airmiles),12))

L'ACF de la chronique dérivée saisonnièrement présente une décroissance lente: elle n'est donc toujours pas stationnaire, on dérive à nouveau la chronique.

In [8]:
tsdisplay(diff(diff(log(airmiles),12)))