:: 8/2012

Einsatz von Standardwerkzeugen mit Schwerpunkt »Datengewinnung«

Die amtliche Statistik hat sich die Standardisierung und Optimierung wichtiger Teilprozesse der Statistikproduktion durch die Schaffung statistikübergreifender Verfahren und Techniken zum Ziel gesetzt. Durch die Verwendung statistikübergreifend einsetzbarer Tools in den Teilprozessen, die in vielen Statistiken in gleicher oder ähnlicher Weise ablaufen, und dem Ineinandergreifen dieser Tools mittels standardisierter Schnittstellen werden die Fachbereiche in den Statistischen Ämtern bei ihrer Arbeit langfristig optimal unterstützt und entlastet.

Mit dieser Einschätzung wird im StaNet, dem Statistischen Wissensportal für den Statistischen Verbund (Statistische Ämter des Bundes und der Länder), in die Philosophie des Themenbereichs SteP (Standardisierung der Prozesse) eingeführt. Folgender Beitrag bietet hierzu einen Überblick über die wichtigsten Quellen und Referenzen. Ein Großteil der Textpassagen wurde den jeweils angegebenen Unterlagen bzw. Internetseiten direkt entnommen. Bei dieser zusammenfassenden Darstellung veröffentlichter Inhalte, die zwischen den Statistischen Ämtern abgestimmt wurden, wurde auf eine Kennzeichnung der Zitate verzichtet. Die angegebenen Links verweisen auf Inhalte und Unterlagen des Statistischen Verbunds. Ein externer Zugriff ist hier nicht möglich. Bei Interesse hilft Ihnen der Autor sowie die SteP-Beauftragte des Statistischen Landesamtes Baden-Württemberg, Frau Madeleine de la Croix (E-Mail: Madeleine.delaCroix@stala.bwl.de) gerne weiter.

Historische Entwicklung und Philosophie

Bei der Sonder-Amtsleiterkonferenz am 20./21. Februar 2003 in Hannover haben die Leiterinnen und Leiter der Statistischen Ämter des Bundes und der Länder unter dem Titel »Masterplan zur Reform der amtlichen Statistik in Deutschland« u. a. folgende Schritte beschlossen:

  • Standardisierung der Geschäftsprozesse, Verfahren und Methoden
  • Einsatz moderner Aufbereitungs- und Analysesoftware

Dies geschah vor dem Hintergrund der »Empfehlungen der Rechnungshöfe des Bundes und der Länder zur Wirtschaftlichkeit des öffentlichen Statistikwesens in Deutschland« mit den Zielen der Effizienzsteigerung des Statistischen Systems und der Entlastung der Auskunftspflichtigen.

In der Folge ging aus der AG »Neue Programmiersprachen« in der Sitzung vom 8./9. Mai 2003 in Wiesbaden die AG »Standardisierung der Prozesse« (SteP) mit folgenden Aufgaben hervor:

  • Standardisierung durch Erarbeitung eines Gesamtprozessmodells, Analyse der Teilprozesse, Priorisierung dieser hinsichtlich der Standardisierungsmöglichkeiten.
  • Entwicklung von statistikübergreifend und verbundfähig einsetzbaren einheitlichen IT-Verfahren für einzelne Teilprozesse der Statistikproduktion.

Der historische und pragmatisch sinnvolle Weg bestand anschließend darin, die Teilprozesse zu identifizieren, Abgrenzungen immer wieder zu modifizieren und den Werkzeugeinsatz punktuell voranzubringen. Im Sinne einer Gesamtschau auf den aktuell erreichten Stand wird im Folgenden nicht auf die schrittweise Entwicklung eingegangen, sondern mit dem umfassenden Rahmen des Geschäftsprozessmodells begonnen:

Das »Geschäftsprozessmodell Amtliche Statistik« (GMAS) beschreibt die Teilprozesse der Statistikerstellung. Es ist ein Leitfaden, der auf dem »Generic Statistical Business Process Modell« (GSBPM) der United Nations Economic Commission for Europe (UNECE) aufbaut, dabei das »Vorgehensmodell Amtliche Statistik« (VMAS) berücksichtigt und als Kommunikationsgrundlage für die Einheitlichkeit der Terminologie sorgt.

In der Abbildung auf der nächsten Seite sind die neun Phasen (blau), die sich wiederum in 47 Teilprozesse (gelb) untergliedern lassen, dargestellt.

Die einzelnen Phasen und Teilprozesse, die im GMAS nacheinander beschrieben sind, müssen nicht zwangsläufig in einer vorgegebenen Reihenfolge durchlaufen werden, sondern können auch gleichzeitig erfolgen, sich wiederholen oder auch ganz ausgelassen werden. Es gilt generell, dass, falls ein Teilprozess im Rahmen der Statistikproduktion durchlaufen wird, er idealerweise so bearbeitet wird, wie im GMAS beschrieben.

Das GMAS ist ein »lebendes« Dokument, das ständig erweitert, ergänzt und ggf. korrigiert wird. Das hängt damit zusammen, dass das GMAS kein theoretisches Modell ist, welches in die Praxis überführt wird, sondern vielmehr eine Niederschrift der bestehenden Praxis in der amtlichen Statistik, die damit festgehalten wird. Wenn sich die Praxis ändert, wird das GMAS entsprechend angepasst.

Unter dem Dach des GMAS, aber historisch bedingt in anderer Gliederung als in den oben erwähnten Phasen und Teilprozessen, wurden und werden in der AG SteP folgende – ebenfalls so genannte – 21 Teilprozesse des Statistikgeschäftsprozesses von den Statistischen Ämtern bearbeitet:

  1. Gestaltung und Druck von Erhebungsunterlagen
  2. Versand von Erhebungsunterlagen
  3. Eingangskontrolle und Mahnwesen
  4. Hilfspersonal verwalten
  5. Dateneinzug
  6. Pflege und Nutzung von Berichts- und Regionalkreisangaben, Schlüsselsystematiken und Leitbändern
  7. Stichprobenziehung
  8. Vorprüfung
  9. Signierung
  10. Typisierung
  11. Plausibilisierung
  12. Berechnungen
  13. Hochrechnungen
  14. Fehlerrechnung
  15. Geheimhaltung
  16. Tabellierung
  17. Datenbereitstellung
  18. Archivierung
  19. Auswertung
  20. Vermarktung
  21. Arbeit mit Berichtspflichtigen und Auskunftsgebenden

Entsprechend der Priorisierung der einzelnen Teilprozesse ergibt sich für die AG SteP und ihre UAGs folgendes Arbeitsprogramm:

  • step 1 Einheitlicher Fragebogen
  • step 2 Einheitliche Identifikatoren
  • step 3 Erhebungsdatenbank
  • step 4 Eingangsdatenbank
  • step 5 Eingangskontrolle und Mahnwesen
  • step 6 Leitbandpflege
  • step 7 Signierung
  • step 8 Plausibilisierung
  • step 9 Ausgangsdatenbank (Auswertungsdatenbank)
  • step 10 Archivierung
  • step 11 Geheimhaltung
  • step 12 Metadaten
  • step 13 Adressverarbeitung
  • step 14 Leitfaden Geschäftsprozessmodell

Standardwerkzeuge im Überblick

SteP-Werkzeuge sind Standardanwendungen und -komponenten, die statistikübergreifend eingesetzt werden können und nach einer ausführlichen Test- und Pilotierungsphase über die AG SteP durch den LA OPTIKO freigegeben wurden. Nach der Freigabe gelten die SteP-Werkzeuge als »produktionsreif« und müssen bei der Planung von Fachverfahren, vor allem bei anstehenden Neuprogrammierungen, berücksichtigt werden. Gemäß »Leitfaden zur Projektdurchführung bei der Softwareentwicklung und -pflege im Statistischen Verbund« (VMAS-SE, Version 1.14, S. 20) ist zu prüfen, welche der aufgeführten SteP-Werkzeuge und Schnittstellen an welcher Stelle im Verfahren berücksichtigt werden sollen. Sofern im Einzelfall der Einsatz von SteP-Werkzeugen oder Schnittstellen nicht möglich sein sollte, muss dies im Lastenheft begründet werden.

Der große Vorteil ist neben der Unterstützung der Fachbereiche, dass der Einsatz der Werkzeuge den Aufwand bei Neuprogrammierungen reduziert bzw. diese überflüssig macht. Werden in einem Fachverfahren SteP-Werkzeuge eingesetzt, ist daher nur ein vereinfachtes Lastenheft erforderlich.

Folgende SteP-Werkzeuge und Schnittstellen stehen derzeit zur Verfügung und sind bei der Programmierung verbindlich zu berücksichtigen:

  1. Adobe-InDesign, einsetzbar für SteP-Teilprozess Gestaltung und Druck von Erhebungsunterlagen
  2. IDEV, eSTATISTIK.core, einsetzbar für SteP-Teilprozesse Gestaltung und Druck von Erhebungsunterlagen; Versand von Erhebungsunterlagen; Dateneinzug; Vorprüfung
  3. Schnittstellen zu Eingangskontrollsystemen (EKS), soweit diese von der AG SteP bestätigt wurden, einsetzbar für SteP-Teilprozesse Versand von Erhebungsunterlagen; Eingangskontrolle und Mahnwesen
  4. BASE (Statspez, PL-Editor, SDF-Editor, Formulareditor), einsetzbar für SteP-Teilprozesse Gestaltung und Druck von Erhebungsunterlagen; Dateneinzug; Stichprobenziehung; Vorprüfung; Signierung; Typisierung; Plausibilisierung (PL): Berechnungen; Hochrechnung; Fehlerrechnung; Geheimhaltung; Tabellierung; Auswertung
  5. SAS, einsetzbar für SteP-Teilprozesse Typisierung, Berechnungen; Hochrechnung; Fehlerrechnung; Tabellierung; Auswertung
  6. GENESIS, einsetzbar für SteP-Teilprozess Auswertung
  7. Erhebungsdatenbank, einsetzbar für SteP-Teilprozesse Gestaltung und Druck von Erhebungsunterlagen; Versand von Erhebungsunterlagen; Dateneinzug; Plausibilisierung
  8. Konvert-Center, einsetzbar für SteP-Teilprozess Dateneinzug
  9. PL-Ablaufumgebung, einsetzbar für SteP-Teilprozesse Signierung; Typisierung; Plausibilisierung. Ausführlichere Hinweise zu den Werkzeugen und Schnittstellen sowie eine Kommunikationsplattform bietet der »SteP trac«.

Folgende Werkzeuge und Schnittstellen befinden sich derzeit noch in der Pilotierungsphase.

  • Eingangsdatenbank: Koordination der Dateneingänge über verschiedene Meldewege, Speicherung und Verwaltung der Meldungen, Zugriff von Eingangskontrollsystem, PL-Ablaufumgebung und Fachverfahren/-anwendung.
  • DatML/SET: Format für die Beschreibung plausibler statistischer Datenbestände. Enthält sowohl plausibilisierte Daten als auch Informationen zum Plausibilisierungsvorgang (Art und Umfang der Plausibilisierung) und dient dem Austausch von Daten zwischen Plausibilisierungs- und Auswertungsprozess.
  • DatML/ASK: Format für die Erstellung der Online-Formulare (IDEV, .CORE). Außer Informationen zu Merkmalen, die erhoben werden, enthält es auch Formatierungen und grafische Darstellungen.

Eine sehr gute Zusammenfassung des Themenkomplexes »Standardisierung« mit Darstellungen wie »Die SteP-Werkzeuge im Überblick« oder »Die Familie der DatML-Formate« bietet die SteP-Broschüre des Statistischen Bundesamtes.

Datengewinnung

Zur Vorbereitung der Datengewinnung sind in einem ersten Schritt die Erhebungsunterlagen zu konzipieren. Sowohl Druckvorlagen als auch elektronische Formulare werden nach einheitlichen Regeln erstellt.

Neben der klassischen Datenerfassung im Dialogsystem und der Beleglesung spielt die elektronische Datenübermittlung nun eine immer größere Rolle. Die Eingabe von Daten im Online-Portal IDEV durch die Auskunftspflichtigen sowie die Übermittlung von Daten, die bereits elektronisch beim Auskunftspflichtigen vorliegen, dienen der effizienten Statistikproduktion. Die beiden Verfahren IDEV und eSTATISTIK.core (kurz .CORE) und deren Datenübermittlungswege werden im Folgenden näher beschrieben.

Erstellung von Erhebungsunterlagen

Die AG Design stellt den Statistischen Ämtern des Bundes und der Länder in Zusammenarbeit mit der Zentralen Fragebogenerstellung des Statistischen Bundesamtes Druckvorlagen für die Erstellung von Fragebogen im Farb- und im Schwarzdruck bereit. Bei der Erstellung neuer Erhebungsbogen ist zu beachten, dass diese den Anforderungen des »Handbuchs zur Erstellung von Erhebungsunterlagen der amtlichen Statistik« der Bund-Länder-Arbeitsgruppe »Standardisierung von Erhebungsunterlagen« (Version 1.6) genügen. Das Handbuch enthält aber auch Checklisten und Mustervorlagen zur Erstellung von IDEV-Formularen sowie Informationen zu druck- und beleglesetechnischen Voraussetzungen.

IDEV

IDEV (Internet-Datenerhebung im Verbund) ist ein gemeinsam von den Statistischen Ämtern des Bundes und der Länder entwickeltes Online-Meldeverfahren, das seit 2005 im Einsatz ist. Es ermöglicht die formularbasierte manuelle Eingabe von Daten sowie den Import von Daten aus einer CSV-Datei ins Formular. Dabei bietet IDEV viele Unterstützungsfunktionen, die den Aufwand für die Melder erheblich reduzieren. Die Datenübermittlung erfolgt über eine verschlüsselte Verbindung direkt an den IDEV-Server des jeweils zuständigen Statistischen Amtes, wo die Meldungen im DatML/RAW-Format eingehen. Jeder Melder erhält individuelle Zugangsdaten, was die Datensicherheit zusätzlich erhöht.

Alle über IDEV angebotenen Formulare haben das gleiche Layout und die gleiche einheitliche Bedienoberfläche. Die Programmierung der IDEV-Formulare erfolgt durch die IT-Entwickler im Statistischen Bundesamt oder im programmierenden Statistischen Landesamt. Dafür benötigen sie die zuvor durch den Fachbereich im PL-Editor erzeugten PL-Metadaten. Die Programmierung erfolgt dann in Abstimmung mit den Organisatoren und der Fachabteilung auf Basis der erstellten Liefervereinbarung. Abschließend werden die IDEV-Formulare durch die AG Design im Hinblick auf die einheitlichen Designvorgaben überprüft und freigegeben.

Nach der Freigabe durch die AG Design werden die fertigen Formulare auf der IDEV-Webseite des Statistischen Bundesamtes (bei zentralen Erhebungen) bzw. auf den IDEV-Webseiten der Statistischen Landesämter (bei dezentralen Erhebungen) bereitgestellt.

Im IDEV-Formular können Plausibilitätsprüfungen bereits vor der Übermittlung der Daten durchgeführt und dadurch Rückfragen vermieden werden. Aufgabe der Fachstatistik ist es, Art und Umfang dieser Plausibilitätsprüfungen festzulegen. Der Melder erhält vor der Übermittlung Hinweise über falsch bzw. unvollständig ausgefüllte Felder und kann seine Angaben entsprechend berichtigen.

Um das IDEV-Angebot zu testen, steht unter https://idev.bayern.de/ ein Gastzugang zur Verfügung, mit dem der volle Funktionsumfang getestet werden kann. IDEV wird inzwischen bundesweit für mehr als 200 zentrale und dezentrale Statistiken angeboten. Mit über 400 000 Meldern, die monatlich rund 14 Mill. Datensätze mit IDEV an die Statistischen Ämter des Bundes und der Länder übermitteln (Stand: März 2011), hat dieser Meldeweg bereits eine hohe Akzeptanz erreicht.

Neben der Möglichkeit der Meldung statistischer Daten bietet IDEV folgenden Service an:

  • Änderungsdienste für Adresse und Ansprechpartner
  • Informationen zu Schlüsselverzeichnissen und Rechtsgrundlagen
  • vorausgefüllte Formularfelder für sich wiederholende Angaben
  • Vorprüfungen von ausgefüllten Formularen, um spätere Rückfragen zu reduzieren
  • Archivierung und/oder Ausdruck von Meldungen
  • E-Mail-Erinnerungsservice zu vorgegebenen Meldeterminen
  • Meldungsübersichten im Melderkonto

Weitere Informationen zu IDEV stehen im Internet unter dem Link https://idev.statistik-bw.de/idev/ zur Verfügung, die IDEV-Online-Hilfe (https://idev.statistik-bw.de/idev/doc/hilfe.html) bietet zusätzliche Unterstützung.

eSTATISTIK.core

.CORE steht für »Common Online Rawdata Entry« und ist als Online-Meldeverfahren seit 2005 im Einsatz. Es unterstützt Melder bei der automatisierten Gewinnung der von der Statistik erfragten Daten aus Softwaresystemen oder anderen elektronisch auswertbaren Datenbeständen, deren Bündelung als Statistikmeldung sowie deren verschlüsselter Übermittlung an die amtliche Statistik. Nach erfolgreicher Übermittlung wird dem Melder ein Prüfprotokoll zur Verfügung gestellt.

Ebenso wie bei IDEV werden die Daten im einheitlichen Lieferformat der amtlichen Statistik DatML/RAW übermittelt. Individuelle Zugangsdaten (Kenn- und Passwort) erhöhen die Datensicherheit zusätzlich.

Für die Datenübermittlung können Melder drei Wege nutzen:

  1. CORE.connect. Um .CORE-Meldungen zu übermitteln, benötigen Melder ein Statistikmodul, das sie bei der Gewinnung und Übermittlung der erfragten Daten unterstützt. Diese Module werden von Softwareherstellern für ihre Produkte entwickelt. Sie steuern die korrekte Auswahl der Daten für die gewählte Statistik und wandeln die gewonnenen Daten in das DatML/RAW-Format um. Zur Übermittlung der Daten stellt das Statistische Bundesamt die Kommunikationsschnittstelle CORE.connect kostenlos zur Verfügung, welche in die Module eingebunden wird. Grundlage für die Entwicklung der Module ist die Erhebungsbeschreibung. Nach der Übermittlung gelangen .CORE-Meldungen zunächst ins Konvert-Center des Statistischen Bundesamtes. Dort werden sie formal geprüft und an das zuständige Statistische Amt weitergeleitet.
  2. Datenübermittlung über die Homepage von eSTATISTIK.core. Melder, die mithilfe eines Statistikmoduls Meldungen im DatML/RAW-Format erzeugen, welches nicht über die Kommunikationsschnittstelle CORE.connect verfügt, können ihre Meldung über http://www.statspez.de/core/uebermitteln.html auf sicherem Weg an die amtliche Statistik übermitteln.
  3. CORE.reporter. Melder, die keine Software mit Statistikmodul einsetzen, können die Anwendung CORE.reporter nutzen. Hier können die Daten entweder manuell in ein Formular eingegeben, über eine CSV-Datei zur Bearbeitung in das Formular importiert oder direkt übertragen werden. Wie bei IDEV besteht die Möglichkeit, bereits vor der Datenübermittlung Plausibilitätsprüfungen im Formular durchzuführen. Im Unterschied zu IDEV eignet sich der CORE.reporter auch, um Daten und Meldungen zu speichern, kontinuierlich zu bearbeiten und zu archivieren.

Informationen für Anwender und Entwickler über das Online-Meldeverfahren eSTATISTIK.core sind www.statspez.de/core/ zu entnehmen.

Die Erstveröffentlichung dieses Beitrags ist in der Veröffentlichung »Bayern in Zahlen 2/2012« erschienen. Wir danken dem Bayerischen Landesamt für Statistik und Datenverarbeitung für die freundliche Nachdruckgenehmigung.