Aus den in 4.4 spezifizierten Modellen können Forecasts generiert werden. Dies wird am Beispiel Modell des SARIMA Modells für Deutschland erläutert. Die im Anhang gegebenen Spezifikationen der Modellparameter beziehen sich auf die jeweilige Modellparametrisierung der Programmiersprache R. Für ARIMA Modelle wird folgende Parametrisierung verwendet, die etwas von der in Kapitel 3.2 vorgestellten Definition abweicht:

(4.5.1) (1 − ϕ1B − ⋯ − ϕp Bp )(yt ′ − μ) = (1 + θ1B + ⋯ + θ𝑞Bq )ϵ𝑡 ,𝑚𝑖𝑡 𝑦𝑡 ′ = (1 − 𝐵)𝑑 𝑦𝑡

Der Unterschied besteht in dem weiteren „Drift“ Parameter μ sowie umgekehrten Vorzeichen der MA-Koeffizienten θ1 … θ𝑞 . Mit entsprechender Erweiterung für saisonale AR Komponenten ergibt sich für das SARIMA (0,1,2)x(1,0,0)12 Deutschlands folgende Gleichung:

(4.5.2) (1 − Φ1B12)(yt ′ − μ) = (1 + θ1B + θ2B2)ϵ𝑡 , 𝑚𝑖𝑡 𝑦𝑡 ′ = (1 − 𝐵)𝑦𝑡

Aufgelöst nach yt erhält man:

(4.5.3) yt = (1 − Φ1)μ + yt−1 + Φ1 (yt−12 − yt−13) + ϵt + θ1ϵt−1 + θ2ϵt−2

Die Zeitreihe (Trainingsdaten) Deutschlands reicht von September 2010 bis Dezember 2018 und umfasst dementsprechend T = 88 Beobachtungen, die folglich mit t = 1, 2,3, … 88 bezeichnet werden. Da eine Box-Transformation mit λ = 0.9282 vorgenommen wurde, beziehen sich die yt-Werte der Gleichung (4.5.3) auf die boxtransformierten Werte der Zeitreihe. Die Vorhersage für Januar 2018 entspricht folglich dem Index T + 1 = 89. Zur Berechnung der Punktschätzung setzt man in (4.5.3) die geschätzten Parameter μ, Φ1, θ1, θ2 und die (historischen120) box-transformierten yt Werte ein. Für die historischen Fehlerterme ϵt werden die korrespondierenden Residuen des angepassten ARIMA Modells angesetzt. Für alle prognostizierten (d.h. t > T) Fehlerterme ϵt wird hingegen ϵt = E[ϵt ] = 0 angenommen.121 Somit ergibt sich für t = T + 1 = 89 folgende Punktschätzung:

(4.5.4) ŷ89 = (1 − Φ1)μ + y88 + Φ1(y87 − yt86) + 0 + θ1ϵ88 + θ2ϵ88

= (1 − 0.7618) ⋅ 42578 .88 + 3175599 .9 + −1.2656 ⋅ (2927826.83 − 3003507.96) + 0 + −1.266 ⋅ −41522.24 + 0.7704 ⋅ 43773.94

= 3214369

Den Forecast für Januar 2018 in der ursprünglichen Skalierung der Zeitreihe (hier mit st bezeichnet) erhält man durch eine abschließende Invertierung der Box- Transformation:

(4.5.5) st = (𝑦𝑡 𝜆 + 1)1/𝜆

(4.5.6) s89 = (3214369 ⋅ 0.9282 + 1) 1 0.9282 = 9446714

Mit Annahme einer Normalverteilung der Residuen (Prognosefehler) ϵt lassen die Grenzen des α-prozentigen Konfidenzintervalls [l̂h,𝛼 ,ûh,𝛼 ] für t = T + h wie folgt berechnen:

(4.5.7) 𝑙̂𝑇+ℎ,𝛼 = ŷ𝑇+ℎ − z1−α/2 σϵ,𝑇+ℎ

(4.5.8) 𝑢̂ 𝑇+ℎ,𝛼 = ŷ𝑇+ℎ + 𝑧1−𝛼/2 𝜎ϵ,T+ℎ

ŷ𝑇+ℎ bezeichnet die h-schrittige Punktschätzung, 𝑧1−𝛼 /2 das α/2 Quantil der Standardnormalverteilung und σϵ,T+h die Standardabweichung des h-schrittigen Prognosefehlers ϵT + h. Für das 95% Konfidenzintervall, der Einschritt -Prognose (Januar 2018) ergibt sich folglich:

(4.5.9) 𝑙̂89,0.95 = 3214369 − 1.96 ⋅ √8496918201 = 3033699

(4.5.10) 𝑢̂ 89,0.95 = 3214369 + 1.96 ⋅ √8496918201 = 3395039

Wiederum müssen diese durch eine inverse Box-Transformation auf das ursprüngliche Skalenniveau abgebildet werden. Mit jeweiligen Einsetzen der Intervallgrenzen für yt in (4.5.5) ergibt sich:

𝑙89,0.95 = 8875977 und 𝑢89,0.95 = 10019950

Die Symmetrieeigenschaft des Konfidenzintervalls um die Punktschätzung (bei Normalverteilung der Prognosefehler) geht nach dieser Transformation verloren. Die Richtigkeit des hergeleiteten Konfidenzintervalls beruht auf der Annahme von unkorrelierten und normalverteilten Residuen ϵt. Folgen die Residuen keiner Normalverteilung, so können die Konfidenzintervalle simulativ unter Anwendung von „Resampling“123 Methoden kalkuliert werden. Weiterhin ist aus der oben dargestellten Berechnung der Konfidenzintervalle ersichtlich, dass diese tendenziell zu eng bemessen sind. Dies ist dem Umstand geschuldet, dass die Konfidenzintervalle zwar die Varianz der Prognosefehler nicht aber die Varianz der geschätzten Parameter widerspiegeln.124 Für eine angemessene Interpretation der Konfidenzintervalle sollte dies berücksichtigt werden.