:: 6/2015

Methodische Anmerkungen zur Berechnung der Innovationsdynamik

Erfasst eine Größe das, was sie erfassen soll, und erfasst sie dieses zuverlässig? Die Frage nach Validität und Reliabilität stellt sich auch beim Innovationsindex, den das Statistische Landesamt Baden‑Württemberg für die Regionen der Europäischen Union und für die Kreise des eigenen Landes berechnet. Der Innovationsindex ist ein zusammengesetzter Indikator, und so folgt die Auswahl der Indikatoren der Frage nach der Validität. Gegenstand des vorliegenden Beitrags soll dagegen die Reliabilität der ausgewählten Indikatoren sein. Grundsätzlich ist die Innovationsfähigkeit als strukturelle Größe zu verstehen, das heißt konjunkturelle, zufällige oder eventuelle saisonale Einflüsse sollten keine Rolle spielen. Tatsächlich zeigen die Einzelindikatoren mitunter im Zeitverlauf deutliche Schwankungen. Hier stellt sich die Frage, ob die beobachteten Veränderungen Ausdruck einer veränderten Innovationsdynamik oder auf Einflüsse zurückzuführen sind, die mit der zu messenden Eigenschaft nicht in Zusammenhang stehen. Da die Einzelindikatoren in den Innovationsindex nicht nur als Niveaugrößen, sondern auch mit ihrer zeitlichen Entwicklung eingehen, kommt dieser Frage eine große Bedeutung zu.

Nur vermeintlich einfach zu messen – der Teilindikator »Dynamik«

In die Berechnung des Innovationsindex fließen mehrere Einzelindikatoren ein, die eine vergleichende Bewertung der Innovationsfähigkeit der Regionen ermöglichen. Der Innovationsindex setzt sich außerdem aus den beiden Teilindizes »Niveau« und »Dynamik« zusammen. In den Niveauindex gehen die aktuellsten Werte der herangezogenen Einzelindikatoren ein. Der Dynamikindex umfasst hingegen die Entwicklung dieser Einzelindikatoren.

Ein Einzelindikator, der einen Teilaspekt der Innovationsfähigkeit einer Region misst, sind beispielsweise die Existenzgründungen in Hochtechnologiebranchen. Um die interregionale Vergleichbarkeit zu gewährleisten, werden diese auf die Einwohner bezogen. Für diese Größe liegen auf Kreisebene Zeitreihen vor. Die naheliegende Idee ist, dass Regionen mit starker Innovationsfähigkeit auch mehr Existenzgründungen aufweisen sollten. Außerdem sollte die Entwicklung dieser Größe bei der Bewertung der Innovationsfähigkeit Berücksichtigung finden, da sich eventuell einzelne Regionen, ausgehend von einem niedrigen Niveau, in einem Aufholprozess befinden. Für das Niveau der Innovationsfähigkeit kann der aktuelle Wert herangezogen werden und für die Dynamik seine Veränderungsrate.

Welche Interpretationsprobleme sich bei der Berechnung der Dynamik ergeben können, soll anhand stilisierter, aber realitätsnaher Fälle illustriert werden. Dargestellt sind die Existenzgründungen bezogen auf 100 000 Einwohner in vier fiktiven Wirtschaftsräumen. Was sagen die vier Zeitreihen über die Entwicklung der Innovationsfähigkeit aus? Wenn Innovationsfähigkeit ein strukturelles Merkmal ist, sollte auch die Dynamik im längerfristigen Kontext gesehen werden. In Region C war die Tendenz in den letzten 3 Jahren des Beobachtungszeitraums aufwärtsgerichtet. Aber wie ist der Rückgang von 2009 auf 2010 zu bewerten? Das Durchschnittswachstum von 2009 bis 2013 ist negativ. Wird dagegen 2010 als Ausgangspunkt der Dynamikberechnung gewählt, kommt man zu einer entgegengesetzten Aussage. Ebenso sensibel auf die Wahl des Basisjahres reagiert die Berechnung des Durchschnittswachstums in den Regionen D und B. In Region A dagegen liegt im Betrachtungszeitraum ein vergleichsweise stabiler, aufwärts gerichteter Trend vor, sodass hier die Wahl des Basisjahres für die Beurteilung der Innovationsdynamik von untergeordneter Bedeutung ist. Die Auswirkungen der Wahl des Basisjahres auf die Veränderungsraten und das Ranking der Räume ist in den Spalten1 bis 4 in der Tabelle wiedergegeben.

Wenn das Durchschnittswachstum ein wenig robuster Indikator für die Messung der Dynamik ist, könnte die trendmäßige Entwicklung herangezogen werden, wie sie in Schaubild 1 bereits in Form linearer Regressionsgeraden eingetragen ist, die für alle Wirtschaftsräume unterschiedlich steigen. Sind nun alle Steigungen gleichermaßen Ausdruck einer gestiegenen Innovationsdynamik (bzw. eines Teilaspekts davon)? Wie ist der Umstand zu bewerten, dass die Streuung um die Regressionsgeraden in den Regionen B, C und D deutlich höher ist als in Region A?

Innovationsfähigkeit – aus den Einzelindikatoren herauszufiltern

Jeder Einzelindikator wird nur in einem Teilaspekt durch die Innovationsfähigkeit bestimmt. Beispielsweise wird der Innovationsindikator Existenzgründungen durch das Innovationsklima in einer Region begünstigt. Die Nähe zu Forschungseinrichtungen, hochqualifizierten Arbeitskräften und regionalen Fördermitteln wirken sich neben anderen Faktoren auf die Merkmalsausprägung dieses Indikators aus. Beeinflusst wird die Variable aber auch durch die Konjunktur – in welche Richtung auch immer –, durch veränderte rechtliche Rahmenbedingungen oder durch andere Einflüsse, die sich der Kategorisierung entziehen und die vereinfachend als »unsystematisch« bezeichnet werden können. Idealerweise wären die nicht dem Innovationsklima zuzuordnenden Einflüsse herauszurechnen, jedoch ist auch hier die Operationalisierung schwierig.

Ziel ist es, ein Verfahren zu finden, das die ­Innovationsdynamik nachvollziehbar bestimmt. Ausgangspunkt ist die Hypothese, dass die ­Innovationsfähigkeit demselben linearen Zeittrend folgt wie der Indikator. Ob eine lineare Trendschätzung eine angemessene Modellierung ist, kann letztlich nicht abschließend beurteilt werden, denkbar wäre auch ein exponentieller Verlauf. Da die Anzahl der Beobachtungen gering ist, kann das lineare Modell als zulässige Vereinfachung angesehen werden. Die OLS-Schätzung (Ordinary Least Squares, Kleinste-Quadrate-Schätzung) des linearen Modells ist an bestimmte Bedingungen geknüpft, deren Vorliegen ebenfalls angenommen werden soll, und die sich vor allem auf die Eigenschaften der Störgrößen beziehen. So ist eine Forderung, dass die Störgrößen keinen Erklärungsbeitrag für die Zielgröße leisten. Für Region B in Schaubild 1 scheint dies nicht erfüllt zu sein, da die Abbildung negativ autokorrelierte Schätzfehler nahelegt, jedoch gilt auch hier, dass die Anzahl der zur Verfügung stehenden Beobachtungen zu gering ist.

Ist die lineare Regression eine angemessene Modellierung?

Die Innovationsdynamik soll also grundsätzlich mit der Steigung der Regressionsgeraden gemessen werden, wobei die Zuverlässigkeit der Schätzung zu berücksichtigen ist. Eine stark streuende Zeitreihe (mit relativ wenigen Werten) reagiert bei der Berechnung der durchschnittlichen Veränderungsrate sehr sensibel auf die Wahl von Anfang- und Endpunkt, wie anhand Schaubild 1 erläutert.

Wenn man die beobachteten Werte als Realisationen einer Zufallsvariablen begreift, wird eine andere Stichprobe auch eine andere Regressionsgerade mit sich bringen. Je größer die Streuung um den linearen Trend, desto größer wird das Intervall, in dem sich mit vorgegebener Wahrscheinlichkeit die unbekannten wahren Regressionsparameter bewegen. Schaubild 2 veranschaulicht das Phänomen: Dargestellt ist die fiktive Entwicklung eines Indikators in unterschiedlichen regionalen Einheiten. In der Region E folgt die Entwicklung einem relativ stabilen zeitlichen Trend. Entsprechend gering ist die Fehlervarianz der OLS-Schätzung, und verschiedene Stichproben werden ähnliche Schätzwerte der Regressionsparameter liefern. In der Region F dagegen ist die Streuung deutlich größer; dementsprechend unterschiedlich fallen die Schätzergebnisse auf Grundlage unterschiedlicher Stichproben aus. Hier wird deutlich, wie unzuverlässig Aussagen über die Entwicklung der Innovationsfähigkeit auf der Grundlage einer nur fünf Beobachtungen umfassenden Zeitreihe ist: Man erhält einen steigenden »Pseudo-Trend« für die ersten fünf Beobachtungen, aber einen fallenden für die folgenden (wobei der wahre stochastische Prozess über den gesamten Beobachtungszeitraum der gleiche ist). Eine Aussage über die Entwicklung der Zielgröße ist unter diesen Umständen mit großer Unsicherheit behaftet.

Die Indikatorentwicklung für bare Münze nehmen? – Schlussfolgerung

Die Steigung der geschätzten Werte sollte mit einem Streuungsmaß gewichtet werden – für Region F müsste die Steigung so gewichtet werden, dass sie gegen null geht. Für Region E dagegen würde die Indikatorentwicklung ­relativ genau die der Zielgröße »Innovationsdynamik« abbilden. Eine Möglichkeit für eine solche Gewichtung besteht darin, die Steigung der Regressionsgeraden mit dem Faktor 1+σ^-1 zu multiplizieren. Je größer die Standardabweichung der Störgrößen σ^, desto kleiner wird der Gewichtungsfaktor, bis die Steigung der Regressionsgeraden im Grenzfall mit null bewertet wird: Bei einer starken Streuung hat die noch dazu auf nur wenigen Beobachtungen basierende Steigung des Indikators keinen Erklärungsgehalt mehr für die Dynamik der Zielgröße. Je kleiner dagegen die Schätzfehler, desto größer der Zusammenhang, und der Faktor nähert sich dem Grenzwert eins an – die Indikatorentwicklung bildet die der Zielgröße »eins zu eins« ab. Diese Gewichtung hat für die Innovationsdynamik und das Ranking der vier Regionen aus Schaubild 1 folgende Konsequenzen: Die ungewichtete Steigung ist in Region B am höchsten. Da die Schätzung dieses Trends aber relativ unzuverlässig ist, wird der Spitzenwert nach der Gewichtung von Region A eingenommen, die vorher sogar nur den dritten Rang belegte. Damit liegt die Region auf Platz eins, die im Betrachtungszeitraum den stabilsten positiven Trend vorweist.

Anhand der simulierten Werte wird deutlich, dass ein Indikator, der die eigentliche Zielgröße lediglich indirekt erfasst, durch weitere Einflussfaktoren bestimmt sein kann, die als unsystematisch angenommen werden. Die aufgeführten Beispiele wurden so konstruiert, dass typische Schwierigkeiten der Dynamikberechnung, unabhängig von der gewählten Methode, dargestellt werden konnten, sind aber nicht willkürlich gewählt – ähnliche Muster sind empirisch beispielsweise beim Indikator »Existenzgründungen« durchaus anzutreffen. Die Gewichtung der sich aus der Regressionsgeraden ergebenden durchschnittlichen Veränderungsrate mit der Streuung der Schätzfehler eröffnet einen Weg, die »Zufälligkeit« der Indikatorentwicklung in den Griff zu bekommen, was der strukturellen Größe »Innovationsdynamik« eher gerecht wird als eine unbereinigte Veränderungsrate. Die Umsetzung der hier vorgestellten Methode ist für die Berechnung des Innovationsindex im Jahr 2016 vorgesehen.