:: 5/2015

Von Jahres- zu Quartalswerten – ohne unterjährige Informationen

Was tun, wenn unterjährige Daten benötigt werden, die entsprechenden Zeitreihen jedoch nur Jahreswerte ausweisen? Das Mittel der Wahl ist üblicherweise eine temporale Disaggregation mit höherfrequenten Indikatorzeitreihen, wie es beispielsweise für die Berechnung des quartalsweisen Bruttoinlandsprodukts Baden‑Württembergs Anwendung findet. Mitunter liegen angemessene Indikatorzeitreihen jedoch nicht immer vor. Lisman und Sandee haben bereits vor einem halben Jahrhundert ein Verfahren vorgeschlagen, wie Quartalswerte allein aus den Jahreswerten generiert werden können, indem angenommen wird, dass die Quartalswerte einem »glatten Trend« folgen.1 Bis heute findet dieses bewährte Verfahren nicht nur in der amtlichen Statistik Deutschlands Anwendung. Am Beispiel des nominalen Bruttoinlandsprodukts für Baden‑Württemberg wird illustriert, dass die als gewichtete Durchschnitte von Jahreswerten berechneten Quartalswerte die Trend-Konjunktur-Komponente einer Reihe mit ausgeprägtem saisonalem Muster recht gut approximieren.

Quartalswerte als gewichteter Durchschnitt von Jahreswerten

Ausgangspunkt der Überlegungen ist, dass die unbekannten Quartalswerte (yti) eine Funktion des Jahreswertes xt sowie der angrenzenden Jahre xt-1 und xt+1 seien:


(1)

ytIytIIytIIIytIV=aedbfccfbdeaxt-1xtxt+1

Die 4x3-Disaggregationsmatrix in (1) enthält lediglich sechs unbekannte Parameter, da Lisman und Sandee diverse Plausibilitätsannahmen ausgenutzt haben. Der Umstand, dass die dritte Spalte in umgekehrter Reihenfolge der ersten entspricht, erklärt sich dadurch, dass, wenn das »Randjahr«xt-1 mit dem Faktor a in das Anfangsquartal ytI eingeht, xt+1 aus Gründen der Symmetrie mit dem gleichen Gewicht in das Endquartal ytIV eingehen sollte usw. Das Muster der Parameter in der zweiten Spalte folgt einer ähnlichen Logik. Das Gewicht des Jahreswertes xt sollte für die Berechnung des Anfangs- und Endquartals des Jahres t gleich sein (Parameter e). Ebenso sollten die Parameter für das 2. und 3. Quartal übereinstimmen (Parameter f). Die Disaggregationsmatrix in (1) enthält die simpelste Möglichkeit, Quartalswerte zu erzeugen, als Spezialfall. Wenn die Parameter der ersten und der dritten Spalte gleich null gesetzt werden und e=f=1/4, dann teilt sich der Jahreswert gleichmäßig auf die 4 Quartale auf und der Jahreswert ergibt sich aus der Summe der 4 Quartale. Für e=f=1 stimmen die Quartalswerte mit dem Jahreswert überein, was offensichtlich dann angemessen ist, wenn sich der Jahreswert aus dem Durchschnitt der 4 Quartale berechnet. Von einem glatten Trend kann bei dieser Berechnung natürlich keine Rede sein. Zum Jahreswechsel erhält man Sprünge. Insofern sind plausiblere Annahmen bezüglich der Parameter zu treffen.

Mit den Symmetrieannahmen ist die potenzielle Anzahl der Parameter schon von zwölf auf sechs reduziert worden. Um die verbliebenen sechs Parameter bestimmen zu können, benötigt man linear unabhängige Gleichungen in entsprechender Anzahl. Hier sind zunächst die Informationen auszunutzen, die sich aus der Restriktion ergeben, wonach sich die vier Quartalswerte zum Jahreswert ergänzen müssen. Lisman und Sandee behandeln in ihrem Aufsatz den Fall, dass sich der Jahreswert xtaus dem Durchschnitt der 4 Quartale ergibt, alsoxt=1/4IIVyti=1/4Xt. Hieraus folgt unmittelbar, dass


(2)

a+b+c+d=0

gelten muss, da nur so gewährleistet ist, dass sich zum einen der Einfluss der Nachbarjahre xt-1 und xt+1 auf die Quartalswerte des Jahres t zum Jahreswert aggregiert aufhebt. Zum anderen muss die Summe der Quartale dem vierfachen Jahreswert entsprechen (Xt=4xt), woraus die Bedingung folgt:


(3)

2e+f=4

Weitere Bedingungen für die Parameter der Disaggregationsmatrix erhält man, wenn man vom Spezialfall konstanter Jahreswerte xt-1=xt=xt+1 ausgeht. In diesem Fall ergeben sich a+e+dxt=1/4Xt und b+f+cxt=1/4Xt.

Damit die Bedingung xt=1/4IIVyti=1/4Xt erfüllt ist, muss gelten:


(4)

a+e+d=1

und


(5)

b+f+c=1

Von den Gleichungen (2) bis (5) sind jedoch nur drei linear unabhängig; die Koeffizienten von (2), (4) und (5) sind jeweils als Linearkombination der übrigen beiden Gleichungen darstellbar.

Weitere Bedingungen für die Bestimmung der Parameter leiten sich aus folgender Überlegung ab. Wenn sich die Jahreswerte xt um einen konstanten Betrag p verändern, dann müssen sich auch die Quartalswerte um einen konstanten Betrag verändern, und zwar im Vergleich zum Vorjahresquartal um p und von Quartal zu Quartal um 1/4p; anders ausgedrückt: yti-yti-1=1/4p. Unter Berücksichtigung der ersten beiden Gleichungen aus (1) ergibt sich aus ytII-ytI=1/4p

1/4p=b-axt-1+f-ext+c-dxt+1

Wenn nun xt-1=xt-p und xt+1=xt+p substituiert werden,2 erhält man unter Berücksichtigung von (4) und (5):


(6)

a-b+c-d=1/4

Für ytIII-ytII=1/4p erhält man entsprechend:


(7)

2b-c=1/4

Lisman und Sandee weisen darauf hin, dass durch weitere Subtraktionen keine weiteren Restriktionen für die Parameter hergeleitet werden können, eben aufgrund der Symmetrieannahme. Auch aus der Bedingung, wonach für die Vorjahresveränderung der Quartalswerte yti-yt-1i=p gilt, folgen keine neuen Restriktionen, sondern lediglich wieder die Gleichungen (4) und (5).

Annahme zum Verlauf Trend-Konjunktur-Komponente

Damit hat man fünf linear unabhängige Gleichungen und sechs Parameter. Definiert man einen beliebigen Parameter als arbiträre Größe (hier wurde c=γ gesetzt), liefert das Gleichungssystem (2) bis (7) die Lösung.

ytIytIIytIIIytIV=    1/89/8-1/4    1/87/8      0      07/8    1/8-1/49/8    1/8+γ-1   2-1   1-2   1   1-2   1-1   2-1xt-1xtxt+1

Auf den ersten Blick mag dieses Ergebnis ein anderes als das von Lisman und Sandee sein. Jedoch muss berücksichtigt werden, dass es sich bei um eine arbiträre Konstante handelt. Setzt man also γ=-1+α/16, so sind die Lösungen identisch:

ytIytIIytIIIytIV=116   316-3   116-1-116   1-316   3+α16-1   2-1   1-2   1   1-2   1-1   2-1xt-1xtxt+1

Schließlich ist noch ein angemessener Wert für α zu finden, der für die entsprechenden glatten Werte sorgt. Die Autoren machen hierzu einen bemerkenswerten Vorschlag, der Orientierungshilfe gibt. Angenommen, die Jahreswerte verliefen alternierend mit einem sinusoidalen Verlauf der zu ermittelnden glatten Quartalswerte, den man als Trend-Konjunktur-Zyklus bezeichnen kann (Schaubild 2; die Abbildung basiert auf Lisman/Sandee, wurde jedoch ergänzt), dann gilt, wenn q die Differenz zwischen zwei Jahreswerten und r die Amplitude ist, für beide Größen stets die Beziehung r/q=0,765, die man sich zunutze machen kann. Es gilt ytII-ytI=0,765qsin67,5°-sin22,5°=0,414q. Aus den ersten beiden Gleichungen aus (1) folgt diesmal:

0,414q=b-axt-1+f-ext+c-dxt+1

Das weitere Verfahren folgt dem Prinzip der Herleitung von (6). Jedoch muss hier (da ja für xt ein alternierender Verlauf angenommen wurde) xt-1=xt-q bzw. xt+1=xt-q substituiert werden3, sodass man als weitere unabhängige Bedingung erhält:

a-b+c-d=0,414

Für a,b,cund d sind die Lösungen aus obigem Gleichungssystem einzusetzen, die nur noch von abhängig sind. Aufgelöst erhält man α=-1,656, womit auch die obige Distributionsmatrix bestimmt ist.

Der andere Fall: Jahreswerte gleich Jahressumme

Lisman und Sandee behandeln den Fall, wonach der Jahreswert dem Durchschnitt der

4 Quartale entspricht (xt=1/4IIVyti=1/4Xt).

Dies ist beispielsweise bei den als Kettenindex veröffentlichten BIP-Quartalswerten der Fall. Betrachtet man dagegen die Absolutwerte, so berechnet sich der Jahreswert als Summe der

4 Quartalswerte (xt=IIVyti=Xt). Das Lisman-Sandee-Verfahren lässt sich natürlich problemlos auf diesen Fall übertragen. Gleichung (2) bleibt unverändert. Die übrigen modifizieren sich zu:

(2) a+b+c+d=0

(3mod) 2e+f=1

(4mod) a+e+d=1/4

(5mod) b+f+c=1/4

(6mod) a-b+c-d=1/16

(7mod) 2b-c=1/16

Auch hier hat man wieder fünf linear unabhängige Gleichungen und sechs Parameter. Setzt man c=γ liefert das Gleichungssystem (2) bis (7mod) die Lösung:

ytIytIIytIIIytIV=    1/329/32-1/16    1/327/32      0      07/32    1/32-1/169/32    1/32+γ-1   2-1   1-2   1   1-2   1-1   2-1xt-1xtxt+1

Ganz analog zu Lisman und Sandee ist γ zu bestimmen. Das Verhältnis von Amplitude und Differenz der Jahreswerte ist r=0,1913q. Also erhält man unter Berücksichtigung der ersten beiden Gleichungen aus (1):

0,1913q=b-axt-1+f-ext+c-dxt+1

Die Substitution von xt-1=xt-q und xt+1=xt-q liefert unter Berücksichtigung der Lösung des Gleichungssystems (2) bis (7mod) für die arbiträre Konstante den Wert γ=-0,0415.

Das Lisman-Sandee-Verfahren wird beispielsweise vom Statistischen Bundesamt angewendet, um die FuE-Ausgaben, die als Jahresdaten erhoben werden, auf Quartale zu verteilen.4 Für die dort verwendete Distributionsmatrix wurde (implizit) γ=-3/64=-0,0469 gewählt, was dem von Lisman und Sandee vorgeschlagenen Wert einigermaßen entspricht. Der genaue Wert würde am Verlauf der geglätteten Quartalswerte kaum etwas ändern. Schließlich handelt es sich um einen Parameter, der »largely arbitrary« und »in a commonsense way« zu wählen ist, sodass es einen gewissen Spielraum gibt.

Wie gut die Lisman-Sandee-Methode eine Zeitreihe mit ausgeprägtem saisonalen Muster approximiert, sieht man beispielhaft am nominalen quartalsweisen Bruttoinlandsprodukt Baden‑Württembergs. Diese Zeitreihe wird mit dem indikatorgestützten Chow-Lin-Verfahren berechnet. Die saisonalen Schwankungen der zugrunde liegenden Indikatoren finden sich aggregiert in den BIP-Quartalswerten wieder. Diese Quartalswerte veranschaulichen, dass die Lisman-Sandee-Distribution tatsächlich eine saisonbereinigte Trend-Konjunktur-Komponente approximiert. Die Annahme, dass die Quartalswerte einem glatten Trend folgen, ist damit nicht lediglich eine der Optik geschuldete Ad-hoc-Annahme, sondern durchaus gerechtfertigt.

Bleibt noch das »Endpunktproblem« zu lösen. Das erste und das letzte Jahr der Zeitreihe fällt dem Glättungsverfahren konstruktionsbedingt zum Opfer. Hier kann man sich behelfen, indem die Reihe über den aktuellen Rand hinaus extrapoliert wird, im Beispiel mit einem ARIMA-Modell. Der für 2015 extrapolierte BIP-Jahreswert erlaubt nun auch eine Lisman-Sandee-Quartalszerlegung für 2014. Man sieht, dass sich die Lisman-Sandee-Werte auch am aktuellen Rand recht gut an die mit dem Saisonbereinigungsverfahren erzeugte Trend-Konjunktur-Komponente anschmiegen. Aufgrund der Tatsache, dass drei Jahreswerte berücksichtigt werden, ist die Quartalszerlegung gegenüber eventuellen Prognosefehlern relativ unempfindlich.

Das Lisman-Sandee-Verfahren zeigt einen Weg auf, wie eine temporale Disaggregation vorgenommen werden kann, wenn über den unterjährigen Verlauf der Zeitreihe, insbesondere etwaige saisonale Muster, nichts bekannt ist. Die Herangehensweise ist daher zwangsläufig »agnostisch«, führt jedoch bei einfacher Umsetzbarkeit zu plausiblen Resultaten, wie das behandelte Beispiel zeigt.

1 Lisman, J. H. C./Sandee, J. (1964): Derivation of Quarterly Figures from Annual Data, in: Journal of the Royal Statistical Society. Series C (Applied Statistics), Bd. 13 (2), S. 87–90.

2 Der im Text von Lisman und Sandee an dieser Stelle eingefügte Koeffizient vor p ist folglich ein Druckfehler.

3 Auf der linken Seite der zweiten Gleichung ist im Ursprungstext der Zeitindex zu korrigieren.

4 Adler, W. u. a.: Forschung und Entwicklung in den Volkswirtschaftlichen Gesamtrechnungen, in: Wirtschaft und Statistik 12/2014, S. 703–717.