:: 5/2014

Daten der Wasserwirtschaft im Angebot des Forschungsdatenzentrums

Im 3-jährlichen Turnus werden die Daten der Wasserwirtschaft durch die Statistischen Landesämter in Deutschland erhoben. Sie dienen unter anderem als wichtige Grundlage für Planungen in Politik und Wirtschaft. Ausgewählte Ergebnisse der Erhebungen sind für jedermann über das Internet oder über die Auskunftsdienste der Statistischen Ämter zugänglich.

Für viele Wissenschaftler sind die Informationen, die sie über die veröffentlichten Ergebnisse erhalten, jedoch nicht ausreichend. Für komplexe wissenschaftliche Vorhaben werden anonymisierte Einzeldaten benötigt, die von den zuständigen Behörden aus Gründen der statistischen Geheimhaltung nicht veröffentlicht werden. Um dieser wichtigen Zielgruppe den Zugang zu den sensiblen Informationen – unter Wahrung der erforderlichen Geheimhaltung – zu gewähren, wurden vor mehr als 10 Jahren die Forschungsdatenzentren des Bundes und der Länder eingerichtet.

Die Forschungsdatenzentren des Bundes und der Länder

Als Schnittstelle zwischen Wissenschaft und amtlicher Statistik erleichtern die Forschungsdatenzentren des Bundes und der Länder (FDZ) Wissenschaftlern unabhängiger Forschungseinrichtungen den Zugang zu Mikrodaten1 der amtlichen Statistik. Die beiden Forschungsdatenzentren sind separate Einrichtungen, die jedoch eng zusammenarbeiten.

Die wesentliche Stärke der FDZ liegt in der dezentralen Anordnung ihrer Standorte in Deutschland. In jedem Statistischen Amt ist ein regionaler Standort integriert. Außerdem wurden mehrere Außenstellen an Forschungseinrichtungen (zum Beispiel beim Deutschen Institut für Wirtschaftsforschung in Berlin, an der Universität Dresden oder beim ifo Institut in München) aufgebaut. Die Vorteile sind relativ kurze Wege für die Nutzer zum nächstgelegenen FDZ sowie ein klar zuordenbarer betreuender Standort. Die Produkte der FDZ können über alle Standorte bezogen werden.

Neben dieser regionalen Zuständigkeit hat fast jeder FDZ-Standort auch die fachliche Betreuung einer oder mehrerer Statistiken übernommen. Hier werden die Daten der jeweiligen Statistik für die FDZ aufbereitet, zentral gehalten und für Forschungsprojekte zur Verfügung gestellt. Der Vorteil der zentralen Datenhaltung ist, dass Datensätze erzeugt und gespeichert werden, die ganz Deutschland abbilden. Dafür werden die Statistiken jedes Bundeslandes vom zuständigen Standort angefordert und anschließend von den FDZ-Mitarbeitern verknüpft und bearbeitet. Das Statistische Landesamt Baden-Württemberg ist dabei verantwortlich für die zentrale Datenhaltung der Statistiken des Baugewerbes sowie der Umweltstatistiken, zu denen unter anderem die Erhebungen der Wasserwirtschaft und der Umweltökonomie zählen.

Mikrodaten der Wasserwirtschaft in den FDZ

Das Datenangebot der FDZ zur Wasserwirtschaft beinhaltet die Statistiken der öffentlichen sowie der nichtöffentlichen Wasserversorgung und Abwasserentsorgung in Deutschland, die nach § 7 und § 8 des Umweltstatistikgesetzes erhoben werden. Ab dem Berichtsjahr 1998 stehen die im 3-jährlichen Turnus erhobenen Daten für Wissenschaftler aufbereitet zur Verfügung. Den Datensätzen der FDZ liegen dabei die gleichen Mikrodaten zugrunde wie den entsprechenden Veröffentlichungen und Ergebnissen der Statistischen Landesämter sowie des Statistischen Bundesamtes.2

Aus den Wasserwirtschaftsdaten können Informationen über die Nutzung der natürlichen Wasservorräte durch den Menschen gewonnen werden. Sie umfassen zum einen die Gewinnung von Wasser aus der Natur sowie die Art der Verwendung (zum Beispiel als Trinkwasser im Haushalt oder als Kühlwasser in der Industrie) und zum anderen den Anfall und die Einleitung sowie die Behandlung von Abwasser in den Kläranlagen im öffentlichen und nichtöffentlichen Bereich. Für die Erhebungen werden alle Anstalten, Körperschaften, Unternehmen und andere Einrichtungen befragt, die Anlagen der Wasserversorgung bzw. Abwasserentsorgung betreiben, sowie die zuständigen Gemeinden.

Neben den abgefragten Merkmalen können die Merkmalsträger räumlich bis zur Ebene der Gemeinde zugeordnet werden. Des Weiteren sind Informationen zu den Wassereinzugsgebieten und seit dem Berichtsjahr 2010 auch zu den Flussgebietseinheiten in den Datensätzen enthalten (i-Punkt).

Verfügbare Statistiken für die Wissenschaft

  • Statistik der öffentlichen Wasserversorgung

Diese Statistik enthält Informationen zum Stand und zur Entwicklung der öffentlichen Trinkwasserversorgung. Um die Informationen zu gewinnen, werden alle Betreiber von Anlagen der öffentlichen Wasserversorgung befragt. Die Statistik stellt Daten zur Gewinnung von Grund-, Quell- und Oberflächenwasser, zur Wasserabgabe an Haushalte und Kleinbetriebe, Wasserabgabe zur Weiterverteilung sowie zu den versorgten Einwohnern bereit.

Die Angaben zur Wassergewinnung und -verwendung können in den FDZ nach dem Sitz des Wasserversorgungsunternehmens, der Wassergewinnungsanlage oder der versorgten Gemeinde ausgewertet werden. Für jeden dieser Merkmalsträger existiert aufgrund der unterschiedlichen Inhalte auch ein separater Datensatz.

  • Statistik der öffentlichen Abwasserentsorgung

Im Rahmen dieser Statistik werden die Kanalisationsbetreiber über das Kanalnetz, die Regenentlastungsanlagen sowie den Verbleib des gesammelten Schmutzwassers ihres Entsorgungsgebietes befragt. Dabei können die Informationen zu Art, Länge und Baujahr des Kanalnetzes durchgängig nach dem Sitz des Kanalisationsbetreibers und nach der entsorgten Gemeinde3 ausgewertet werden. Die Angaben zur Einleitung von Schmutzwasser sowie zu den an die Kanalisation angeschlossenen Einwohnern liegen in der regionalen Gliederung nach dem Sitz des Kanalisationsbetreibers vor. Für Gemeinden, die an industrielle bzw. ausländische Kläranlagen angeschlossen sind, wird die Abwassermenge sowie die Zahl der angeschlossenen Einwohner abgebildet. Für jede Gemeinde liegt die Information vor, ob sie an eine öffentliche Kläranlage angeschlossen ist oder ob andere Entsorgungswege gewählt wurden. Zusätzlich können Informationen zur Schmutzwassermenge und Zahl der angeschlossenen Einwohner über den Ort der Direkteinleitung von Schmutzwasser in ein Oberflächengewässer oder in den Untergrund abgerufen werden.

  • Statistik der öffentlichen Abwasserbehandlung

Zur Erhebung dieser Statistik werden die Betreiber von Kläranlagen befragt. In erster Linie liefern ihre Angaben Informationen über Menge, Beschaffenheit und Behandlungsart des Abwassers. Zusätzlich werden Informationen über die Ausbaugröße der Anlagen und die Zahl der angeschlossenen Einwohner und Einwohnerwerte4 erhoben. Die Angaben zur Abwasserbehandlung können nach unterschiedlichen Regionalgliederungen ausgewertet werden, und zwar nach dem Standort der Kläranlage und nach dem Ort der Einleitstelle des geklärten Abwassers in ein Oberflächengewässer oder in das Grundwasser. Darüber hinaus liegen Angaben über die an die Kläranlage angeschlossenen Gemeinden vor.

  • Statistik der Wassereigenversorgung und -entsorgung privater Haushalte

Diese Erhebung stellt eine Ergänzung der oben beschriebenen Statistiken dar, im Rahmen derer die angeschlossenen Einwohner an die öffentliche Wasserversorgung und an die öffentliche Kanalisation erfragt werden. Sie bildet die Anzahl der Einwohner einer Gemeinde, die nicht an die öffentliche Wasserversorgung bzw. an die öffentliche Kanalisation angeschlossen sind, ab. Zudem sind die Anschlussverhältnisse der Bevölkerung gemeindebezogen im Datensatz enthalten.

  • Statistik der nichtöffentlichen Wasserversorgung und Abwasserentsorgung

Zusätzlich zu den Statistiken der öffentlichen Wasserversorgung und Abwasserentsorgung werden über diese Erhebung die Betriebe befragt, die im Bereich der nichtöffentlichen Wasserwirtschaft eine wesentliche Rolle spielen. Die Statistik ermöglicht die Auswertung von Informationen über die Gewinnung von Grund-, Quell- und Oberflächenwasser, die Wasserverwendung im Betrieb bis hin zum Verbleib des Abwassers. Außerdem werden die Herkunft des betriebseigenen Abwassers sowie die Behandlung und die Entsorgungswege des Klärschlamms erfragt. Dadurch wird ein regelmäßiger Überblick über die Gesamtsituation der gewerblichen Wasserversorgung und Abwasserentsorgung gewährleistet. In den FDZ gibt es zu dieser Statistik zwei Datenmaterialien. Zum einen den Datensatz, der alle Angaben zum Frischwasser im Betrieb beinhaltet, und zum anderen den Datensatz, der die Angaben zum Abwasser enthält. Neben der räumlichen Gliederung bis hin zu den Gemeinden liegen hier auch Informationen zu den Wirtschaftszweigen der Betriebe vor.5

Auswertung von Daten der Wasserwirtschaft – Hindernisse

Auf den ersten Blick erscheinen die Statistiken der Wasserwirtschaft übersichtlich und selbsterklärend. Bei mehreren Forschungsprojekten hat sich jedoch gezeigt, dass es immer wieder Verständnisschwierigkeiten hinsichtlich der unterschiedlichen Merkmalsträger einer Statistik gibt. Die in Übersicht 2 enthaltenen Merkmale müssen dabei immer aus der Sichtweise des Merkmalsträgers ausgewertet werden, sonst kann es zu Abweichungen der Ergebnisse kommen. Die einzelnen Datensätze mit unterschiedlichen Merkmalsträgern sind untereinander auch nur bedingt vergleichbar. Bei der Auswertung der Statistik der öffentlichen Wasserversorgung kann beispielsweise ein Wasserversorgungsunternehmen aus Baden-Württemberg eine Gemeinde in Bayern versorgen. Im Datensatz mit dem Merkmalsträger »Wasserversorgungsunternehmen« wird die bayerische Gemeinde dann in Baden-Württemberg aufgeführt. Im Datensatz mit dem Merkmalsträger »versorgte Gemeinde« wird diese jedoch Bayern zugeordnet. Auch werden Gemeinden in den benachbarten Ländern Deutschlands versorgt, die dann zwar im Datensatz des Wasserversorgungsunternehmens aufgelistet sind, jedoch im Datensatz der angeschlossenen Gemeinde nicht vorkommen, weil sie sich im Ausland befinden.

Bei Forschungsfragen zum Thema Abwasser genügt es für viele Fragestellungen nicht, nur eine der beiden Statistiken der öffentlichen Abwasserentsorgung bzw. öffentlichen Abwasserbehandlung auszuwerten. Vor Beantragung der Daten sollten die Inhalte beider Statistiken in Hinblick auf die Auswertungsziele betrachtet werden. Soll zum Beispiel die Anzahl der angeschlossenen Einwohner an Abwasserbehandlungsanlagen insgesamt ermittelt werden, ist dies nur durch die Summenbildung der angeschlossenen Einwohner an öffentliche Abwasserbehandlungsanlagen (Statistik der öffentlichen Abwasserbehandlung) und der angeschlossenen Einwohner an industrielle und ausländische Abwasserbehandlungsanlagen (Statistik der öffentlichen Abwasserentsorgung) möglich. Ähnlich verhält es sich mit der Anzahl und dem Speichervolumen von Regenentlastungsanlagen. Um alle Regenentlastungsanlagen einer Gemeinde zu erfassen, müssen wiederum beide Statistiken betrachtet werden. Bei der Statistik der öffentlichen Abwasserbehandlung sind nur die Regenentlastungsanlagen aufgeführt, die sich auf dem Gelände der Kläranlage befinden. Diese Anlagen werden in der Statistik der öffentlichen Abwasserentsorgung nicht in der Gemeindeangabe mitgezählt. Um die genaue Zahl zu ermitteln, müssen die Angaben also addiert werden.

Forschungsprojekte, die auf die Mikrodaten der nichtöffentlichen Wasserversorgung und Abwasserentsorgung zurückgreifen, stoßen auf Probleme anderer Art. Bei Auswertungen nach Wirtschaftszweigen müssen die Analysedatensätze unter Berücksichtigung der statistischen Geheimhaltung oftmals stark anonymisiert werden. Eine Auswertung auf Gemeindeebene ist daher in den meisten Fällen nicht sinnvoll. Um eine ausreichende Fallzahl von Betrieben zu erreichen, werden die Daten mindestens auf Kreisebene dargestellt. Eine andere Möglichkeit ist das Zusammenfassen von Wirtschaftszweigen zu Klassen, sodass mindestens drei Betriebe pro Wirtschaftszweigklasse in einem Kreis ausgewiesen werden.

Zugangswege zu den Statistiken der Wasserwirtschaft

Die Nutzung der Einzeldaten der Wasserwirtschaft ist über mehrere Zugangswege möglich. Sie unterscheiden sich hinsichtlich des Orts des Datenzugangs und des Anonymisierungsgrads der Daten.

Alle Statistiken der Wasserwirtschaft können als On-Site-Produkte6 bezogen werden. Je nach Anspruch des Wissenschaftlers an den Informationsgehalt der Daten sind die Nutzungen am Gastwissenschaftlerarbeitsplatz (GWAP) des Standorts Stuttgart7 oder per kontrollierter Datenfernverarbeitung (KDFV) möglich. Der GWAP ist ein Arbeitsplatz in den FDZ, an dem die Forscher vor Ort ihre Analysen durchführen können. Die statistischen Daten können dort unter Verwendung der Statistikprogramme SPSS, STATA, SAS oder R untersucht werden. Aufgrund der kontrollierbaren Rahmenbedingungen in den FDZ müssen die Daten weniger stark anonymisiert werden als bei einer Off-Site-Nutzung8. Nach Beendigung seiner Analysen erhält der Wissenschaftler die auf statistische Geheimhaltung geprüften Ergebnisse.

Bei der Kontrollierten Datenfernverarbeitung (KDFV) hat der Forscher keinen direkten Kontakt zum Originaldatenmaterial. Der Forscher entwickelt ein Auswertungsprogramm, welches er den FDZ-Mitarbeitern zur Verfügung stellt. Hierfür erhält er einen Strukturdatensatz mit fiktiven Werten, der dem Originaldatenmaterial in Aufbau und Merkmalsausprägungen gleicht. Das damit erzeugte Auswertungsprogramm wird von den FDZ-Mitarbeitern auf die Originaldaten angewandt. Dem Forscher werden danach lediglich die auf statistische Geheimhaltung geprüften Ergebnisse übermittelt.

Für die Statistiken der öffentlichen Wasserversorgung und Abwasserentsorgung wurden für die Off-Site-Nutzung zusätzlich Scientific-Use-Files (SUF) entwickelt. Dieser Zugangsweg zeichnet sich dadurch aus, dass die faktisch anonymen9 Daten auf einem Datenträger an die Wissenschaftler übermittelt werden und somit am Arbeitsplatz des Nutzers ausgewertet werden können. Um die statistische Geheimhaltung bei diesen Produkten zu gewährleisten, ist der Anonymisierungsgrad der Daten höher als bei den On-Site-Zugängen und der Informationsgehalt dadurch niedriger. Wegen der oben erwähnten Sensibilität der Daten der nicht­öffentlichen Wasserversorgung und Abwasserentsorgung können diese Produkte nicht als SUF bezogen werden. Der Grad der Anonymisierung wäre für die Daten zu hoch und der Informationsgehalt für die Forscher zu gering.

Fazit

Die Forschungsdatenzentren des Bundes und der Länder haben sich in den letzten Jahren als zentraler Anlaufpunkt für Wissenschaftler entwickelt, deren Fragestellungen über die allgemein zugänglichen Ergebnistabellen der amtlichen Statistik hinausgehen. Mit den zur Verfügung stehenden Daten der Wasserwirtschaft, die das ganze Spektrum von der Wasserversorgung bis hin zur Abwasserentsorgung abdecken, können Mikrodaten ab dem Berichtsjahr 1998 deutschlandweit analysiert werden. Mit den Daten können somit zeitliche Veränderungen in den unterschiedlichen Bereichen der Wasserwirtschaft untersucht und regionale Vergleiche angestellt werden. Je nach Anforderung an den Anonymisierungsgrad der Daten können diese über verschiedene Zugangswege bezogen und ausgewertet werden.

1 Mikrodaten sind Einzeldaten statistischer Erhebungen.

2 Rothe, Patrick: »Hochschulstatistikdaten im Angebot des Forschungsdatenzentrums«, in: »Statistisches Monatsheft Baden-Württemberg 1/2014«, S.25–29.

3 Kanäle auf der Gemarkung einer Gemeinde.

4 Der Einwohnerwert ergibt sich aus der Summe der angeschlossenen Einwohner und der Einwohnergleichwerte. Als Einwohnergleichwert wird eine Messzahl bezeichnet, die die Verschmutzung von gewerblichem oder industriellem Schmutzwasser mit derjenigen von häuslichem Schmutzwasser vergleicht. Dabei wird von einem 5-tägigen biochemischen Sauerstoffbedarf des Abwassers von 60 Gramm pro Einwohner und Tag ausgegangen.

5 Zu allen in den FDZ angebotenen Statistiken sind Beschreibungen auf www.forschungsdatenzentrum.de eingestellt.

6 On-Site-Produkte zeichnen sich dadurch aus, dass die Mikrodaten in den FDZ ausgewertet werden und die Räumlichkeiten der amtlichen Statistik nicht verlassen.

7 Die Daten können auch an jedem anderen FDZ-Standort in Deutschland am GWAP genutzt werden.

8 Off-Site-Produkte werden den Forschern postalisch übermittelt.

9 Faktisch anonym bedeutet, dass die Daten gemäß § 16 Abs. 6 BStatG nur mit einem unverhältnismäßig großen Aufwand an Zeit, Kosten und Arbeitskraft zugeordnet werden können.