Autoregressive integrated moving average (ARIMA) : définition
ARIMA est un modèle statistique pour analyser ou prédire les données de séries temporelles ou time series. Le principe est également connu sous l'appellation moyenne mobile autorégressive intégrée.
L'autoregressive integrated moving average (ARIMA), c'est quoi ?
Acronyme pour désigner l’autoregressive integrated moving average, l’ARIMA est un modèle statistique conçu pour l’analyse et la prédiction de données d'une série temporelle. Comme son petit frère, le modèle ARMA (pour autoregressive moving average), il détermine les valeurs en fonction des précédentes valeurs chronologiques observées et au regard d'une combinaison linéaire d'erreurs aléatoires. Mais à la différence de celui-ci, il supprime les effets saisonniers par dérivation, par exemple en différentiant une série linéaire une fois, une série quadratique deux fois, etc.
Concrètement, cela permet d’anticiper l’évolution d’un phénomène. Cette notion mathématique demeure essentielle dans l'analyse de statistiques et le domaine de l’économétrie. Elle est aussi utilisée dans les processus d’action liés à l’intelligence artificielle (IA).
Quel est le rôle de l'autoregressive integrated moving average (ARIMA) dans l'analyse des séries temporelles (ou séries chronologiques) ?
Pour rappel, une série temporelle ou chronologique est un ensemble fini de valeurs numériques exprimées à partir d’un indice de temps. Il peut s’agir d’une minute, d’une journée ou même d’une année. Elle est généralement représentée sous forme de graphiques afin d’appréhender un contexte, ainsi que son évolution sur le court, moyen ou long terme. On retrouve essentiellement ce concept en mathématiques, analyse statistique et économétrie.
L’autoregressive integrated moving average (ARIMA) permet de déterminer une perspective de changement ou de transformation. Les modèles de machine learning qui usent de ce processus prennent en charge des calculs et des algorithmes spécifiques (voir tableau ci-dessous). Ceux-ci sont nécessaires à l’expression d’une prédiction sur la base des précédentes valeurs, leurs fluctuations (hausse ou baisse), sans oublier l’échelle de temps utilisée.
Qu'est-ce que le seasonal autoregressive integrated moving average (SARIMA) ?
A la différence de l’ARIMA, le SARIMA (pour seasonal autoregressive integrated moving average) permet comme son nom l'indique de prédire une tendance en intégrant des effets de saisonnalité. En résumé, il s'agit d'un modèle ARIMA prenant en compte la composante saisonnière.
ARMA (autegressive moving average) ou Box-Jenkins | ARIMA (autegressive integrated moving average) | SARIMA (seasonal ARIMA) | |
---|---|---|---|
Ordre de la partie autorégressive (AR) | x | x | x |
Ordre de la moyenne mobile(MA) | x | x | x |
Ordre de la différence ou dérivation du processus | x | x | |
Ordre de la partie autorégressive saisonnière | x | ||
Ordre de la différence saisonnière | x | ||
Ordre de la moyenne mobile saisonnière | x | ||
Période de la composante saisonnière | x |
Le modèle SARIMA ingère ainsi des effets conjoncturels sur une période donnée en complément des paramètres d'ARIMA. Par exemple la différence saisonnière ou encore la moyenne mobile saisonnière. SARIMA permet donc d’optimiser l’efficacité du modèle et d’être en mesure de justifier les analyses prédictives d’une série temporelle ou chronologique.