:: 7/2019

Zensus 2021 – Das Steuerungsregister im Blickpunkt

Im Jahr 2021 führen die Statistischen Ämter des Bundes und der Länder wieder einen Zensus durch. Wie bereits beim Zensus 2011 wird hierbei ein registergestütztes Verfahren angewandt. Im Mittelpunkt dieses Verfahrens steht zur Vorbereitung, Organisation und Durchführung des Zensus das zentral geführte anschriftenbezogene Steuerungsregister. Das Steuerungsregister ist im Zensusvorbereitungsgesetz 2021 geregelt und befindet sich derzeit im Aufbau. Es dient als Datengrundlage für die Haushaltebefragung auf Stichprobenbasis, für die Erhebung an Anschriften mit Sonderbereichen und für die Gebäude- und Wohnungszählung, sowie zur Steuerung und Koordinierung der Abläufe im Zensus. Im vorliegenden Beitrag werden dessen Aufbau, die verwendeten Datenquellen und dessen Funktionen näher erläutert.

Im Rahmen des Zensus werden wesentliche Daten zur Bevölkerung und zur Wohnungssituation in der Bundesrepublik Deutschland erhoben, dessen Ergebnisse die Grundlage für viele politische Planungen und Entscheidungen sowie Basis für zahlreiche andere Statistiken – unter anderem die Bevölkerungsfortschreibung – darstellt. Die dort ermittelte bzw. fortgeschriebene Bevölkerungszahl ist unter anderem Berechnungsgrundlage für den kommunalen und Länderfinanzausgleich, die Einteilung der Wahlkreise, die Stimmenverteilung der Länder im Bundesrat oder die Be­soldungsstufe von Bürgermeisterinnen und Bürgermeistern.

Mit dem Zensusvorbereitungsgesetz 20211 (ZensVorbG) wurden bereits die rechtlichen Grundlagen für die Vorbereitung des Zensus 2021 geschaffen. Dieses Gesetz regelt unter anderem den Aufbau und die Pflege des Steuerungsregisters2,3 sowie die Aufgaben des Statistischen Bundesamtes und der statistischen Ämter der Länder für die Vorbereitung und Durchführung des Zensus 2021.

Der vorliegende Beitrag behandelt den Aufbau und die wesentlichen Quellen des Steuerungsregisters und bietet damit einen ersten Überblick über die wichtige Datengrundlage des kommenden registergestützten Zensus.

Aufbau des Steuerungsregisters

In Deutschland wird beim Zensus 2021 wie bereits beim Zensus 2011 ein registergestütztes Verfahren angewendet. Hierbei werden Registerdaten um Angaben aus primärstatistischen Erhebungen ergänzt, da gegenwärtig auf Länder- bzw. Bundesebene keine Verwaltungsregister existieren, in welchen Anschriften-, Gebäude- oder Personendaten aktuell geführt werden. Deshalb erstellen die Statistischen Ämter des Bundes und der Länder zur Vorbereitung des Zensus ein Register, um die Grundlage für die Durchführung der eigentlichen Primärerhebungen des Zensus 2021 zu schaffen. Dieses Register wird gemäß § 3 des ZensVorbG 2021 als Steuerungsregister4 bezeichnet und enthält alle Anschriften mit (potenziellem) Wohnraum. Das Statistische Bundesamt ist für die Entwicklung der dafür erforderlichen technischen Anwendungen sowie der notwendigen IT-Infrastruktur für die Aufbereitung und Datenhaltung verantwortlich, während die statistischen Landesämter für die Prüfung auf Korrektheit, Vollständigkeit und Bearbeitung ihrer Daten zuständig sind. Im Steuerungsregister werden die Anschriften aus den verschiedenen Quellen zusammengeführt. Es dient deshalb als »Schaltzentrale« für die eingangs erwähnten primärstatistischen Erhebungen mit dem Ziel, einen Grundbestand an Informationen auf Anschriftenebene darzustellen. Neben dem Steuerungsregister wird parallel der Personenbestand aufgebaut, welcher die in Deutschland in den Melderegistern geführten Personen enthält, um die Vorbereitung und Durchführung der Personenerhebung an Stichprobenanschriften und Sonderbereichen zu unterstützen. Zusammen ergibt sich aus beiden Registern der sogenannte Referenzdatenbestand (siehe Übersicht 1).

Für die unterschiedlichen Erhebungen (Haushaltebefragung, Erhebung an Anschriften mit Sonderbereichen, Gebäude- und Wohnungszählung) des Zensus werden jeweils separate IT-Fachverfahren durch das Statistische Bundesamt zentral zur Verfügung gestellt, mit denen die einzelnen Erhebungen durch die Statistischen Landesämter durchgeführt werden. Diese IT-Fachverfahren greifen jeweils auf die Anschriften des Steuerungsregisters zu, damit erhebungsübergreifend eine einheitliche Datengrundlage gewährleistet ist.

Quellen des Steuerungsregisters

Damit das Steuerungsregister für die Erhebungsvorbereitung des Zensus 2021 genutzt werden kann, wurde von den Statistischen Ämtern des Bundes und der Länder bereits im Jahr 2017 mit dessen Aufbau begonnen. Das Steuerungsregister wird primär aus drei Datenquellen (jeweils mit mehreren Aktualisierungslieferungen) aufgebaut (siehe Übersicht 2). Es handelt sich hierbei um Daten aus dem Amtlichen Liegenschaftskatasterinformationssystem (ALKIS) der Landesvermessungsbehörden, den Georeferenzierten Adressdaten (GA) des Bundesamtes für Kartographie und Geodäsie sowie dem Melderegister (MR) der Einwohnermeldeämter. Darüber hinaus können weitere Quellen gemäß § 13 des ZensVorbG 2021 genutzt werden, darunter das Dauerhafte Anschriftenregister (DAR) 5. Das DAR bildet den Anschriftenbestand des letzten Zensus zum Stichtag 9. Mai 2011 ab und beinhaltet neben anschriftenbezogenen Daten auch die damals gemeldete Personenzahl und die Wohnraumeigenschaft (Gebäude mit oder ohne Wohnraum). Dieser Datenbestand wurde seitdem weder aktualisiert noch ergänzt, kann aber zur Recherche für den Aufbau des Steuerungsregisters für den Zensus 2021 hilfreich sein. Dafür wurden die Gebietsstände mithilfe des Gemeindeverzeichnis-Informationssystems (GV-ISys) im DAR dem aktuellen Stand angepasst.

Angaben aus den Melderegistern der Kommunen sind die Basisdatenquelle des Zensus, da neben den Anschriften auch Wohnungsstatus (Hauptwohnung, Nebenwohnung, alleinige Wohnung) sowie demografische Grunddaten der Bevölkerung (zum Beispiel Geburtsdatum) übermittelt werden. Diese Informationen sind erforderlich, um die Haushaltebefragung inklusive der Stichprobenziehung methodisch und organisatorisch vorzubereiten. Die Meldebehörden übermitteln insgesamt fünf6 teilweise unterschiedlich umfangreiche Datenlieferungen, welche in den Referenzdatenbestand eingespeist werden. Die erste MR-Lieferung erfolgte zum Stichtag 15. November 2017. Diese Lieferung ermöglichte, aufgrund der darin enthaltenen Anschriften, die initiale Erstellung des Steuerungsregisters. Zwei weitere Lieferungen zur Aktualisierung des Datenbestands vor dem Stichtag im Mai 2021 erfolgen zum Februar 2020 und November 2020. Zum Zensusstichtag sowie 3 Monate danach erfolgen zwei weitere MR-Lieferungen, mit dem Ziel, den zum Zensusstichtag aktuellen Melderegisterabzug zu erhalten. Dies ist notwendig, da Personen, die kurz vor dem Stichtag umgezogen sind, möglicher weise noch nicht mit der neuen Adresse gemeldet sind und dies nach dem Stichtag nachholen. Diese Personen werden damit fälschlicherweise noch mit ihrer alten Adresse zur Datenlieferung am Zensusstichtag geführt. Bundesweit werden zum Stichtag jeder Lieferung ca. 90 Mill. Datensätze eingezogen, davon ca. 12 Mill. für Baden-Württemberg. Die Abweichung zur aktuellen Bevölkerungszahl7 ergibt sich überwiegend aus den mitgelieferten Datensätzen von Personen mit Nebenwohnsitzen.

Die ALKIS-Daten enthalten die wesentlichen Informationen aus der Katasterverwaltung der Länder. Diese Daten sind bei der Prüfung und Pflege des Steuerungsregisters sehr nützlich, da zu jeder Anschrift eine Gebäudefunktion8 hinterlegt ist und damit hilfreiche Informationen zur Wohnraumprüfung (siehe »Prüfung auf Wohnraum«) vorliegen. Neben der Mitteilung der Gebäudefunktion der jeweiligen Anschrift werden die ALKIS-Daten für die Ermittlung auskunftspflichtiger Personen bei der Gebäude- und Wohnungszählung genutzt, da auch Informationen zu Eigentümerinnen und Eigentümern von Gebäuden und Flurstücken in den Jahren 2018 und 2020 mitgeliefert werden. Für die Jahre 2019, 2021 und 2022 hingegen sind diese Informationen nicht Bestandteil der Datenlieferungen.

Die GA-Daten des Bundesamtes für Kartographie und Geodäsie liefern deutschlandweit Gebäudeadressen mit Anschriftenangaben, Koordinaten zur Lage des Gebäudes sowie Angaben zur Verwaltungszugehörigkeit. Als Grundlage werden hierbei die Adressen der Zentralen Stelle Hauskoordinaten und Hausumringe der Vermessungs- und Katasterverwaltungen der Bundesländer (ZSHH) genutzt. GA-Datenlieferungen erfolgen jeweils zum November in den Jahren 2017 bis 2022 mit Stand April des jeweiligen Jahres.

Gemäß ZensVorbG 2021 können weitere Quellen für den Aufbau und die Pflege des Steuerungsregisters genutzt werden. Dazu zählen auch statistikinterne Quellen der Statistischen Landesämter wie zum Beispiel das Unternehmensregister und weitere fachstatistische Quellen. Mithilfe von Straßenverzeichnissen der Landesvermessungsämter können Straßenumbenennungen und Neubaugebiete identifiziert werden. Weitere wichtige öffentlich zugängliche Quellen sind zahlreiche Kartendienstleister wie beispielsweise Geoportal BW, Google Maps oder OpenStreetMap, deren Luftbilder und thematische Karten ebenfalls bei der Pflege des Steuerungsregisters helfen können. Zusätzlich werden zur Anschriftenpflege bundesweit Daten der Deutsche Post Direkt GmbH9 verwendet.

Zusammenführung und Überprüfung der Daten

Nach § 10 des ZensVorbG 2021 werden die Daten aus den Quellen vom Statistischen Bundesamt zusammengeführt und bilden den Grundbestand des Steuerungsregisters. Die Statistischen Landesämter haben dabei Zugriff auf ihren jeweiligen Zuständigkeitsbereich. Die Zusammenführung der einzelnen Quellen zu einem Registerbestand macht es erforderlich, zuvor mögliche Unterschiede (zum Beispiel unterschiedliche Schreibweisen) zu vereinheitlichen. Frühzeitige bundesweite »Richtlinien« für das Erstellen bzw. Benennen der Variablen sind Grundvoraussetzung dafür, dass die Datenbearbeitung schnell und zielführend erfolgen kann. Es kommt regelmäßig vor, dass die Schreibweise von Straßennamen in den Quellen unterschiedlich vorliegt und bei deren Zusammenführung ohne eine vorhergehende Normierung zwei unterschiedliche Datensätze zur Verfügung stehen, obwohl es sich um dieselbe Straße handelt. Beispielsweise könnte in den ALKIS-Daten die »Johann-Wolfgang-von-Goethe-Straße« geliefert werden, während die Melderegister diese als »J.-W.-v.-Goethe-Str.« führen. Mithilfe sogenannter Leitdateien werden Anschriftenvariablen aktualisiert und standardisiert. Bei den hauptsächlich verwendeten Leitdateien handelt es sich in Baden-Württemberg um:

  • ein Gemeindeverzeichnis (GV-ISys), welches Gemeindeauflösungen, Teilausgliederungen, Änderungen des Gemeindeschlüssels sowie Namensänderungen liefert,
  • Straßenverzeichnisse der Deutschen Post (Streetcode) und des Landesamtes für Geoinformation und Landesentwicklung (LGL) sowie
  • einen sogenannten »Straßenthesaurus«, welcher verschiedene Straßenschreibweisen beinhaltet und anhand dessen eine Standardisierung der Straßennamen verschiedener Quellen durchgeführt wird. Der Straßenthesaurus wurde im Rahmen des Zensus 2011 durch das Statistische Bundesamt aufgebaut und wird für den Zensus 2021 weitergeführt. Er beinhaltet rund 2,4 Mill. unterschiedliche Schreibweisen von Straßennamen und verringert damit manuelle Korrekturarbeiten.

Beispielsweise liegen aufgrund von verschiedenen Abkürzungen und Satzzeichen über 25 unterschiedliche Schreibweisen der Johann-Sebastian-Bach-Straße in Baden-Württemberg vor. Anhand einer Auflistung der vorhandenen Schreibweisen werden diese im Anschluss einheitlich auf die ausgeschriebene Variante des Straßennamens normiert. Wird bei anschließenden Lieferungen einer Quelle die Straße wie oben beschrieben übermittelt, erkennt das System diese und passt sie automatisch der hinterlegten normierten Schreibweise an. Die Aufbereitungsschritte müssen nicht erneut durchgeführt werden.

Prüfung auf Wohnraum

Alle Anschriften des Steuerungsregisters werden mit dem Einzug der erforderlichen Quellen ab dem 3. Quartal 2019 bis Ende Februar 2022 auf das Vorhandensein von Wohnraum geprüft, denn nur diese sind für den Zensus 2021 zählungsrelevant. Es werden daher nur Anschriften für die Erhebung der Haushaltebefragung, der Sonderbereiche und der Gebäude- und Wohnungszählung berücksichtigt, an denen Personen wohnen oder wohnen können und nicht vollständig gewerblich genutzt werden. Diese Wohnraumprüfung wird zeitlich in drei Abschnitte aufgeteilt: Eine Wohnraumprüfung aller Anschriften bis zur Stichprobenziehung (voraussichtlich September 2020), eine nachfolgende Prüfung bis zum Zensusstichtag (voraussichtlich Mai 2021) sowie der abschließenden Wohnraumprüfung bis Ende Februar 2022, wenn die Rückläufe der verschiedenen Erhebungsteile bearbeitet wurden. Die ALKIS- und GA-Daten enthalten in jeder Lieferung einen Komplettbestand aller fertiggestellten Gebäude. Für Baden-Württemberg sind dies mehr als 3 Mill. und für das gesamte Bundesgebiet ca. 22,4 Mill. Anschriften. 10 Unter diesen befinden sich auch zahlreiche gewerblich genutzte Objekte, die für den Zensus nicht relevant sind. Aus den Daten der Melderegister liegt die Information vor, an welchen Anschriften Personen gemeldet sind und diese geben damit einen wesentlichen Anhaltspunkt, ob es sich um eine Anschrift mit Wohnraum handelt. Durch die Zusammenführung der Vermessungsdaten mit den Daten der Melderegister können so bereits eine Vielzahl von Anschriften mit Wohnraum identifiziert werden. Dennoch ergeben sich nach der Zusammenführung noch einige Prüffälle, bei denen geklärt werden muss, ob es sich um eine Anschrift mit Wohnraum handelt oder nicht. Solche Prüffälle sind dann gegeben, wenn eine Anschrift im Datenbestand der Vermessungsämter vorliegt, aber nicht »bemeldet« ist. Es ist also an dieser Anschrift keine Person gemeldet und liegt daher nicht im Datenbestand der Melderegister vor. Umgekehrt kann es auch vorkommen, dass Anschriften im Melderegister vorliegen, die aber in den Vermessungsämtern nicht vorhanden sind. Inkonsistenzen aus der Zusammenführung resultieren beispielsweise daraus, dass

  • aufgrund der Lieferung aller Gebäudeanschriften durch die Vermessungsämter viele Gewerbe- und Gebäudeanschriften mit sonstiger Funktion (Garagen, Gartenhäuser etc.) enthalten sind.
  • bewohnbare Leerstände und Gebäude existieren, in denen eine Wohnfunktion vorkommen kann, wie beispielsweise Forstwirtshäuser oder Industriegebäude mit Wohnraum.
  • nicht jede an einer Anschrift wohnende Person an dieser gemeldet ist. Dadurch ist die Anschrift nicht zwingend in den Melderegisterlieferungen enthalten und enthält deshalb zunächst keinen Wohnraum.
  • eine Person in ein Neubaugebiet gezogen und dort beim zuständigen Einwohnermeldeamt gemeldet ist. Dem Steuerungsregister liegen diese Anschriften aber aufgrund von festgelegten Lieferterminen der zuständigen Vermessungsbehörden noch nicht vor.

Darüber hinaus kommt es vor, dass die datenliefernden Quellen das identische Objekt jeweils beinhalten, allerdings unter einer abweichenden Anschrift. Beispielhaft führen die Melderegister die Hauptstraße 1 A, während dieses Gebäude von den Vermessungsämtern als Hauptstraße 1/1 geführt wird. Eine automatische Zusammenführung der Datensätze kann dadurch nicht erfolgen und zieht eine manuelle Betrachtung und bei Bestätigung des identischen Objektes eine Bearbeitung durch die Statistischen Landesämter nach sich.

Für die Prüfung auf Wohnraum wird anhand von festgelegten Regeln vorab definiert, ob eine Anschrift als »ohne Wohnraum« oder »mit Wohnraum« gekennzeichnet wird oder ob weiterhin ein Prüffall bleibt, wenn die drei oben vorgestellten Hauptquellen kein eindeutiges Bild liefern. Folgende Prüfschritte (siehe Übersicht 3) werden beim Zensus 2021 bei der Wohnraumprüfung durchlaufen, wenn Anschriften nach Abgleich der drei Hauptquellen weiterhin als Prüffall geführt werden:

Im ersten Schritt werden je nach Fall weitere Quellen wie die Ergebnisse einer Vorbefragung der Gebäude- und Wohnungszählung, statistikinterne Register (Unternehmensregister, Baustatistik etc.) und Merkmale aus den Microdialogdaten der Deutsche Post Direkt GmbH sowie Recherchen im Internet zurate gezogen. Öffentlich zugängliche Kartendienstleister wie Geoportal BW, OpenStreetMap oder Google Maps können ebenfalls bei der Identifizierung von Wohnraum helfen. Sollten weiterhin Anhaltspunkte für fehlerhafte oder unvollständige Daten vorliegen, durchlaufen diese den nächsten Prüfschritt. In diesem Schritt dürfen die statistischen Landesämter den datenliefernden Stellen (zum Beispiel Gemeinden und Vermessungsämtern) Anschriftenbereiche11 übermitteln, damit diese die ursprünglich übermittelten Daten auf Vollständigkeit und Vollzähligkeit überprüfen können. Sollte auch diese Prüfung zu keinem Ergebnis führen, können die Statistischen Landesämter an den noch ungeklärten Anschriften Begehungen durchführen.

Löschung der Daten

Gemäß § 16 Abs. 1 ZensVorbG 2021 müssen die Daten des Anschriftenbestandes 6 Jahre nach dem Zensusstichtag gelöscht werden, die übermittelten Daten der Vermessungsämter und der Meldebehörden laut § 16 Abs. 4 zum frühestmöglichen Zeitpunkt nach der Verarbeitung und dem Einpflegen in das Steuerungsregister, spätestens allerdings 4 Jahre nach Zensusstichtag.

1 Einschließlich dem Gesetz zur Änderung des Zensusvorbereitungsgesetzes vom 27. November 2018. Weitere nationale Rechtsgrundlagen für den Zensus 2021 sind noch nicht in Kraft getreten: Zensusgesetz 2021, Gesetz zur Ausführung des Zensusgesetzes 2021 (Landesgesetzliche Regelung).

2 Gesetz zur Vorbereitung eines registergestützten Zensus einschließlich einer Gebäude- und Wohnungszählung 2021, Abschnitt 2§§ 3–12.

3 Weitere Ausführungen hierzu in: Michel, Nicole: »Zensus 2021: Zensusvorbereitungsgesetz leitet die nächste Zensusrunde ein«, in: »Statistisches Monatsheft Baden-Württemberg 10/2017«, S. 10 ff.

4 Im Zensus 2011 gab es bereits eine analoge Datenbank, welche als Anschriften- und Gebäuderegister (AGR) bezeichnet wurde.

5 Geregelt in § 13 Abs. 2 des Bundesstatistikgesetzes.

6 Die erste Lieferung ist im ZensVorbG 2021 geregelt. Die vier weiteren für das Steuerungsregister vorgesehenen Lieferungen sind im ZensG 2021 zu regeln. Zudem erfolgte im Januar 2019 eine weitere Lieferung von Melderegisterdaten, die sogenannte Pilotdaten-Lieferung, welche ebenfalls im ZensVorbG 2021, zuletzt geändert am 27. November 2018, geregelt ist. Die Daten dieser Lieferung sind nicht Bestandteil des Steuerungsregisters, da die Lieferung lediglich zur Prüfung der Übermittlungswege, der Übermittlungs- und Verarbeitungszeit sowie zur Prüfung der Qualität der zu übermittelnden Daten diente.

7 Aus der Bevölkerungsfortschreibung.

8 Beispielsweise »Wohnhaus« oder »Kiosk«.

9 Sogenannte Microdialogdaten.

10 Stand GA 2017–Daten zum April 2017.

11 Zum Beispiel Hauptstraße 3 bis 13.