:: 7/2014

Mit dem Irrtum leben (und mit ihm rechnen) – methodische Anmerkungen zur Konjunkturberichterstattung

Die verschiedenen Säulen, auf die sich die Konjunkturberichterstattung des Statistischen Landesamtes stützt, waren bereits wiederholt Gegenstand von Beiträgen im Statistischen Monatsheft. An dieser Stelle soll ein früherer Beitrag aufgegriffen werden, der mit »Konjunkturprognosen – Lernen aus der Vergangenheit?« (4/2011) betitelt war. Dort wurde dargelegt, wie aus verschiedenen konjunktur‑relevanten Zeitreihen eine (nur indirekt messbare) gemeinsame Konjunkturkomponente herausgefiltert werden kann. Standen in diesem Beitrag die Grundidee und die empirischen Resultate im Vordergrund, soll nun auf die Methode näher eingegangen werden.

Anhand simulierter Daten, mittels deren sich das Verfahren anschaulicher machen lässt, wird dargelegt, wie die Konjunkturkomponente mit einem angemessenen Zeitreihenmodell abgebildet werden kann, bevor auf empirische Daten zurückgegriffen wird. Dabei müssen zufällige Störungen, die zum einen auf den modellierten dynamischen Prozess und zum anderen auf dessen Messung wirken, bei der Schätzung der Parameter berücksichtigt werden. Für die Schätzung werden Prozess und Messung in State‑Space‑Form dargestellt, was die Anwendung des sogenannten Kalman‑Filters ermöglicht. Das Verfahren liefert als Resultat eine aus den Indikatorzeitreihen gewonnene gemeinsame Komponente, die die unterschiedliche Zuverlässigkeit dieser Reihen ebenso berücksichtigt wie die Modellstruktur und deren Unsicherheit.

Konjunkturzyklus und Prognosemethoden

Der geläufige Begriff vom »Konjunkturzyklus« impliziert bereits die Vorstellung eines im Zeitverlauf wiederkehrenden Musters. Man geht bezüglich der wirtschaftlichen Aktivität (hier gemessen am realen Bruttoinlandsprodukt [BIP]) von einem Normalzustand aus, beispielsweise einem (ansteigenden) Trend, der von den konjunkturellen Phasen überlagert wird, die wie folgt charakterisiert werden können:

  • Hochkonjunktur (Boom): Das BIP liegt über dem Trend und steigt weiter.
  • Abschwung: Das BIP liegt über dem Trend und sinkt.
  • Rezession: Das BIP liegt unter dem Trend und sinkt.
  • Aufschwung: Das BIP liegt unter dem Trend und steigt.

Das BIP gilt gemeinhin als das umfassende Maß der wirtschaftlichen Aktivität eines Wirtschaftsraums und ist daher eine bevorzugte, wenngleich nicht die einzige Zielgröße von Konjunkturprognosen. Für die Konjunkturberichterstattung ist dabei das quartalsweise berechnete BIP von besonderem Interesse, um Konjunkturzyklen abzubilden. Gerade die Situation des Jahres 2013 illustriert die Notwendigkeit, das BIP unterjährig zu berechnen: Hinter der realen Jahreswachstumsrate von 0,9 % verbirgt sich für das 1. Quartal ein Rückgang des realen BIP, der demzufolge in den folgenden 3 Quartalen aufgeholt und überkompensiert worden sein muss. Um diese unterjährigen Schwankungen sichtbar zu machen, berechnet das Statistische Landesamt Baden‑Württemberg das quartalsweise BIP für das eigene Land. Da diese Berechnungen allerdings erst (aufgrund der Verfügbarkeit der Datenbasis) mit einer Zeitverzögerung von etwa 2 Monaten nach Ablauf eines Quartals für ebendieses erfolgen können, ist man für das jüngst vergangene Quartal ebenso auf Schätzungen angewiesen wie für das laufende und die folgenden. Verschiedene Methoden liefern hierzu Bausteine für die Prognose: der Gesamtkonjunkturindikator des Statistischen Landesamtes, der verschiedene konjunkturrelevante Einzelreihen zu einem einzelnen Index verdichtet, ferner ein zeitreihenökonometrisches Modell, das den zukünftigen Verlauf des BIP aus dem bisherigen Verlauf der Zeitreihe zu prognostizieren versucht und schließlich ein Modell, das gewissermaßen eine Synthese aus beiden Verfahren darstellt und bereits im Monatsheft 4/2011 vorgestellt wurde: Aus monatlich vorliegenden Indikatoren, die mit der Wirtschaftsleistung in engem Zusammenhang stehen (wie beispielsweise den für den Gesamtkonjunkturindikator verwendeten), wird ein gemeinsamer Faktor herausgefiltert, den man als eine Art »Pseudo‑Monats‑BIP« bezeichnet könnte. Die Prognose erfolgt in diesem Fall durch die Extrapolation der gemeinsamen Komponente mit einem zeitreihenökonometrischen Modell, wie es analog auch für die Prognose des Quartals‑BIP »aus sich selbst heraus« verwendet wird.

Der Zustand eines dynamischen Systems und seine Messung

Wie wird nun aus verschiedenen konjunkturrelevanten Zeitreihen die gemeinsame Komponente ermittelt? Dies soll durch einen ebenso hypothetischen wie idealtypischen Konjunkturverlauf illustriert werden, wie er im Schaubild dargestellt ist. Man erkennt jeweils drei Indikatorzeitreihen und das vorweggenommene Ergebnis, das sich in den Szenarien aufgrund unterschiedlicher Annahmen, die unten erläutert werden, unterscheidet.

Die hypothetischen Reihen wurden konstruiert, indem von einem gemeinsamen Faktor ausgegangen wurde, der einem autoregressiven Prozess zweiter Ordnung folgt, wobei die Koeffizienten so gewählt wurden, dass das System mit der Zeit zu einem stabilen Gleichgewicht konvergiert. Hinzu kommt allerdings, dass das dynamische System auch zufälligen Störungen ausgesetzt sein kann, was ebenfalls modelliert wurde. Der wahre Zustand des Systems (die Konjunktur) entzieht sich annahmegemäß der unmittelbaren Beobachtung. Was dagegen beobachtet werden kann, sind die Indikatorvariablen (zum Beispiel Produktion des Verarbeitenden Gewerbes, Auftragseingänge, ifo‑Geschäftsklimaindex und dergleichen). Diese bilden die Zielgröße (das BIP) unterschiedlich gut ab. Man erkennt, dass die Indikatorzeitreihen ebenfalls und unterschiedlich stark um die Zielgröße schwanken, da sie neben den unten erläuterten Prozessstörungen auch »Messstörungen« ausgesetzt sind. Der Begriff ist deswegen in Anführungsstriche gesetzt, da er nicht wörtlich zu verstehen ist in dem Sinne, dass die Methoden, mit denen beispielsweise der Produktionsindex den Output der Industrie misst, diese Größe fehlerhaft abbilden würde. Die Messstörung ist vielmehr bezogen auf die unbeobachtete gemeinsame Komponente der betrachteten Einzelindikatoren, bei der es sich ja um ein hypothetisches Konstrukt handelt. Die so definierte Messstörung bildet damit ein Maß dafür, wie gut der jeweilige Indikator das misst, was er in diesem Zusammenhang messen soll, nämlich die Konjunktur. Die in einer Periode auftretende Messstörung wirkt nur auf die beobachteten Werte in dieser Periode – und damit weder auf zukünftige Messungen noch auf den Zustand des Systems.1 Von anderer Qualität sind die Prozessstörungen. Diese treten ebenso wie die Messstörungen im Zeitablauf unabhängig voneinander auf, allerdings wirken diese auf das System selber. Angenommen eine Störung trifft das autoregressive System nur zu einem bestimmten Zeitpunkt, so würde sich dieser Impuls auch in die nachfolgenden Systemzustände mit abnehmender Intensität übertragen. In dem zu schätzenden Modell muss die unterschiedliche Natur der Störungen entsprechend berücksichtigt werden.

Von den Messungen auf den wahren Wert schließen

Es ist intuitiv einleuchtend, dass eine Schätzung des Systemzustandes auf Grundlage der vorhandenen Indikatorzeitreihen die Prozessstörungen und die Messstörungen angemessen berücksichtigen sollte. Welche Rolle diese Faktoren spielen, soll anhand verschiedener Szenarien verdeutlicht werden: Angenommen bezüglich des zugrundeliegenden Prozesses bestehe keine Unsicherheit. Unter diesen Umständen würden die Indikatoren nicht in die Schätzung des Konjunkturverlaufs eingehen, sondern allein die Prozessparameter. In einem solchen deterministischen System bräuchte man auch keine Beobachtungen, solange die Prozessparameter und die Anfangsbedingungen bekannt sind (Schaubild: Szenario 1). Besteht nun bezüglich des Prozesses Unsicherheit, so gewinnen die Beobachtungen an Bedeutung. In welchem Maße die einzelnen Indikatoren Rückschlüsse auf die Konjunkturkomponente zulassen, hängt natürlich davon ab, wie zuverlässig sie eingeschätzt werden. Szenario 2 stellt die Konstellation dar, dass die Messstörung von Indikator 3 im Vergleich zu den anderen beiden stark um die Konjunkturkomponente streut. Wenn man keine Kenntnis vom Konjunkturverlauf hat und annimmt, dass dieser Indikator die Konjunkturkomponente gut wiedergibt, stimmt deren Schätzung fast genau mit den beobachteten Werten von Indikator 1 überein. Szenario 3 schließlich zeigt den realistischeren Fall von konjunkturrelevanten Indikatoren, deren Streuung sich weniger stark unterscheidet, wobei zusätzlich von einer gewissen Prozessstörung ausgegangen wird. Man erkennt, dass die Indikatoren recht »ausgewogen« in die Schätzung eingehen und die unbekannten wahren Werte des Prozesses sehr gut approximieren. Im Folgenden soll gezeigt werden, wie diese »Ausgewogenheit« erzielt werden kann.

Die Darstellung des dynamischen Systems in State‑Space‑Form

Es ist zweckmäßig, den skizzierten autoregressiven Prozess und die Beobachtung desselben in der sogenannten State‑Space‑Form abzubilden.2 Der unbekannte Zustand des Systems folgt, wie man durch Ausmultiplizieren überprüfen kann, der Zustandsgleichung (»state equation«):

Ct+2Ct+1ξt+1=φ1φ210FCt+1Ctξt+vt+20vt+1

mit vt als Vektor der normalverteilten Prozessstörung mit dem Erwartungswert 0 und konstanter Varianz. Die den Messungen zugrundeliegende gemeinsame Komponente folgt demnach einem autoregressiven Prozess zweiter Ordnung. Die Koeffizienten φ1 und φ2 wurden im Beispiel so gewählt, dass sich eine gedämpfte Schwingung ergibt.3 Dieser dynamische Prozess wird durch die Beobachtungsgleichungen (»observation equations«) gemessen:

y1,ty2,ty3,tyt=μ1,tμ2,tμ3,tμt+010101H'Ct+1Ctξt+w1,tw2,tw3,twt

Die Beobachtungsgleichungen, die hier zusammengefasst sind, enthalten keine verzögerten Werte und modellieren damit keine Dynamik, sondern bilden allein die Messung ab. wt bezeichnet den Vektor der normalverteilten Messstörungen, die unkorreliert sind und ebenfalls Erwartungswerte von 0 und konstante Varianzen aufweisen. Die beobachteten Indikatorwerte yt ergeben sich also aus einer Konstanten μt und dem unbeobachteten gemeinsamen Faktor ξt zuzüglich der jeweiligen Messstörung. Der Vorteil der State‑Space‑Darstellungsweise liegt darin, dass damit autoregressive Prozesse höherer Ordnung in ein Matrixsystem erster Ordnung überführt werden können, was weitere Berechnungen, wie die folgenden Optimierungen, wesentlich erleichtert.

Der Kalman‑Filter‑Algorithmus

Da der Zustand des Systems unbekannt ist, gilt es mithilfe der Indikatorzeitreihen indirekt Rückschlüsse darauf zu ziehen.4 Die Art und Weise wie das geschieht, wird als Kalman‑Filter bezeichnet. Der erste Schritt ist, zum Ausgangszeitpunkt t = 1 den Systemzustand der Folgeperiode zu prognostizieren. Die beste Schätzung für t = 2 unter Ausnutzung der bis t = 1 vorliegenden Informationen über das System ergibt sich aus der Zustandsgleichung: ξ2|1=1|1

Ausgehend vom Zeitpunkt t = 1 benötigt man also als Anfangsbedingung eine Schätzung für ξ1|1, um ξ2|1=1|1 berechnen zu können. Allgemein formuliert: ξt+1|t=t|t

Im zweiten Schritt kommt die Prognosequalität ins Spiel. Als ein Maß für die Prognosequalität dient der mittlere quadratische Prognosefehler (mean squared error, MSE). Über die Größenordnung ist zunächst nichts bekannt, sodass man auch hier von einem Anfangszustand P1|1 ausgeht und im zweiten Schritt eine Schätzung für die MSE‑Matrix berechnet: Pt+1|t=FPt|tF'+Q, wobei

Q=σ2000

die Kovarianzmatrix der Prozessstörung vt bezeichnet.

Die ersten beiden Schritte konnten allein aufgrund von gesetzten Anfangsbedingungen durchgeführt werden und bezeichnen A‑priori‑Schätzungen. Aus ξt+1|t und den beobachteten Werten der Indikatorzeitreihen yt+1 erhält man aus der Beobachtungsgleichung als Residualgrößen einen Schätzwert für wt+1 und damit ein Maß dafür, wie gut ξt+1|t die Beobachtungen yt+1 abbildet. Der Kalman‑Filter gibt nun an, wie die Schätzung für ξt+1|t zu aktualisieren ist, wenn die Beobachtungen yt+1 hinzukommen: ξt+1|t+1=ξt+1|t+Kt+1yt+1-H'ξt+1|t

Der zum Zeitpunkt t für die Folgeperiode t + 1 geschätzte Systemzustand ξt+1|t, also die Ausprägung der gemeinsamen Konjunkturkomponente, wird hier gewissermaßen mit der Realität abgeglichen. Angenommen, die Schätzung würde genau mit den in t + 1 beobachteten Indikatorwerten yt+1 übereinstimmen, dann könnte die ursprüngliche Schätzung auch im Lichte der aktuellen Indikatorwerte yt+1 beibehalten werden (ξt+1|t+1=ξt+1|t), was bei Messwerten, die Störungen ausgesetzt sind, natürlich nicht der Fall ist. Die optimale A‑posteriori‑Schätzung für ξt+1|t+1 entspricht also der A‑priori‑Schätzung, die um den zweiten Summanden korrigiert wird. Je größer die Ungenauigkeit, mit der ξt+1|t die Beobachtungen yt+1 abbildet, desto größer ist unter sonst gleichen Umständen die betragsmäßige Korrektur der A‑priori‑Schätzung ξt+1|t. Hinzu kommt jedoch, dass der Korrekturbedarf mit der Matrix Kt+1 gewichtet wird, der sogenannten Kalman‑gain‑Matrix, hinter der sich der Ausdruck verbirgt:5Kt+1=Pt+1|tHH'Pt+1|tH+R-1, wobei R=ρ12000ρ22000ρ32 die Kovarianzmatrix der Messstörungen wt bezeichnet. Man erkennt die Bedeutung der Streuung von Mess- und Prozessstörung für den Kalman gain. Je größer die Streuung der Messstörungen R, desto kleiner wird Kt+1, was durchaus nachvollziehbar ist: Je unzuverlässiger die Indikatoren, desto geringer sollte deren Beitrag für die Prognose von ξt|t sein. Die Kovarianzmatrix der Prozessstörung Q geht in Pt+1|t ein. Je größer die Prozessunsicherheit, desto größer der MSE und desto größer wird – wiederum unter sonst gleichen Bedingungen – das Gewicht der Beobachtungen. Der Kalman gain wird auch für die Aktualisierung der MSE‑Matrix herangezogen: Pt|t=I-KtH'Pt|t-1

Damit sind alle Schritte spezifiziert, um die Berechnungen für den weiteren Zeitverlauf des dynamischen Systems durchzuführen. Die Übersicht stellt den Zusammenhang von dynamischem Prozess (»System«), der Messung des Systemzustandes, den Fehlern, die auf beides wirken, und den Kalman‑Filter zur Schätzung des Systemzustandes schematisch dar.

Die Optimierung und die Schätzergebnisse

Das beschriebene Zeitreihenmodell weist mit F, Q und R diverse Unbekannte auf, von denen die Schätzung des gemeinsamen Faktors abhängt. Ist man sich bezüglich des zugrundeliegenden dynamischen Prozesses unsicher und postuliert für φ1 und φ2 Werte, die recht weit von den wahren Prozessparametern entfernt liegen, kann die Unsicherheit aufgefangen werden, indem man eine im Vergleich zur Messstörung große Prozessstörung annimmt und diese in F einsetzt. Auf diese Weise hat man gewissermaßen eine Toleranz gegenüber einer Fehlspezifikation des Modells eingebaut, mit der Konsequenz, dass das Gewicht der Beobachtungen umso größer ist, je unsicherer das Modell ist. Im Grenzfall würde die Modelldynamik eben keinen Erklärungsbeitrag für den gemeinsamen Faktor liefern und dieser sich allein aus einer anhand der (allerdings ebenfalls zu spezifizierenden!) Streuung der Messstörungen zu gewichtenden Summe der Einzelindikatoren ergeben. Für den Zeitraum, in dem beobachtete Indikatorwerte vorliegen, wäre das durchaus noch hinnehmbar. Es wird jedoch problematisch, wenn out‑of‑sample-Prognosen für den gemeinsamen Faktor erstellt werden sollen, da man hier allein auf die unterstellte Dynamik des Systems zurückgreifen muss. Vermeintliches »Auf‑Nummer‑Sicher‑Gehen« und von großer Prozessunsicherheit auszugehen, würde hier zu unbefriedigenden Resultaten führen.

Glücklicherweise ist man nicht darauf angewiesen, die unbekannten Parameter zu postulieren. Der Kalman‑Filter bietet alle Voraussetzungen, diese mit relativ geringem Aufwand mittels der Maximum‑Likelihood‑Methode zu schätzen. Die Maximum‑Likelihood‑Funktion in ihrer logarithmierten Form lautet in diesem Zusammenhang:

lnLt=-ln2π2-12lnH'Pt|t-1H+R             -12yt-H'ξt|t-1'H'Pt|t-1H+R-1yt-H'ξt|t-1

Die Schätzung der unbekannten Parameter ist dank der State‑Space‑Formulierung nicht mehr schwierig. Sie kann ohne Weiteres in einem Tabellenkalkulationsprogramm mit der Solver‑Funktion durchgeführt werden. Die Schätzergebnisse für die Parameterkonstellation, die in oben genanntem Szenario 3 bereits grafisch vorweggenommen wurde, sind in der Tabelle aufgeführt.

Würde sich der Konjunkturzyklus mit der Regelmäßigkeit einer Pendelbewegung, wie sie im Beispiel konstruiert wurde, abspulen, könnten auch aus den »gestörten« Messwerten recht gute Prognosen erstellt werden (mit positiven Auswirkungen auf das Prestige des Prognostikers). Doch die Verhältnisse sind nicht so – leider weicht die Realität ökonomischer Zeitreihen vom skizzierten idealtypischen Zustand ab. Wenn Prozess- und Messunsicherheiten in der Empirie auch eine noch größere Rolle spielen, gibt der Kalman‑Filter eine Antwort darauf, wie man mit dem Irrtum leben – und mit ihm rechnen kann.

1 Oder, wie das Sprichwort weiß: »Vom Wiegen wird die Sau nicht fett.« Man könnte ergänzen: Auch dann nicht, wenn verschiedene Waagen mit unterschiedlicher Präzision herangezogen und die Messungen wiederholt durchgeführt werden. Dennoch wäre ein solches Vorgehen sinnvoll, da es die Datenbasis für ein Verfahren zur relativ präzisen Bestimmung des tatsächlichen Gewichts liefert – davon handelt dieser Beitrag.

2 Bei dem folgenden Modell handelt es sich um eine Variante des von Stock und Watson (1988) vorgestellten: Stock und Watson (1988): A Probability Model of the Coincident Economic Indicators, NBER Working Paper Nr. 2772.

3 Chiang (1984): Fundamental Methods of Mathematical Economics, S. 576 ff.

4 Die Notation ist in der Literatur nicht immer einheitlich. Die hier verwendete orientiert sich an: Hamilton (1994): Time Series Analysis.

5 Für die Herleitung des Kalman gains: Gelb (Hrsg. 1974): Applied Optimal Estimation, S. 108 ff.