Drei Billionen Dollar. Das sind mehr als 2.500 Milliarden Euro. Auf diese unfassbare Zahl taxierte das McKinsey Global Institute bereits 2013 das jährliche Potenzial, das mit Hilfe von Open Data weltweit gehoben werden könnte. Allein auf Europa entfielen bei dieser Schätzung rund 770 Milliarden Euro. Nur zum Vergleich: Die Gesamtausgaben des Bundes beliefen sich im Jahr auf „läppische“ 316 Milliarden Euro. Das Thema scheint also Potenzial zu haben. Für uns ist dies der Ausgangspunkt, im Rahmen einer zweiteiligen Blogserie das Phänomen näher zu beleuchten.
Beitragsserie: Open Data
- Open Data in Behörden: Anspruch & Wirklichkeit
- Open Data in Behörden: Nutzen & Perspektiven
Open Data: Was ist das eigentlich?
Wie lässt sich der Optimismus in Bezug auf das Potenzial offener Daten erklären? Zunächst einmal müssen wir verstehen, was sich hinter dem Begriff Open Data überhaupt verbirgt. Ganz trivial gesprochen geht es um die Bereitstellung von Daten in maschinenlesbarer Form durch die öffentliche Hand. Damit diese Daten auch wirklich als offen eingestuft werden können, müssen aber eine ganze Reihe von Kriterien erfüllt sein. Hierzu werden in der Regel die Vorgaben der Sunlight Foundation, einer Stiftung, die sich für Transparenz in der Politik und der Verwaltung einsetzt, herangezogen:
- Vollständigkeit: Es sollten unter Wahrung von Datenschutzvorgaben sämtliche Daten zu einem spezifischen Thema veröffentlicht werden, inklusive der dazugehörigen Metadaten.
- Primärquellen: Die öffentliche Einrichtung, die die Daten als erstes erhoben hatte, sollte diese auch veröffentlichen.
- Zeitliche Nähe: Der zeitliche Abstand zwischen der Erhebung bis zur Veröffentlichung sollte möglichst kurz sein.
- Leichter Zugang: Ein einfacher Download über Benutzer- oder Programmierschnittstellen sollte sichergestellt sein.
- Maschinenlesbarkeit: Die Datensätze sollten in gängigen Formaten abgespeichert sein, so dass eine computerbasierte Auswertung möglich ist (eingescannte Papierdokumente sollten vermieden werden).
- Diskriminierungsfreiheit: Jeder Nutzer sollte in der Lage sein, die Daten ungehindert herunterzuladen, ohne z.B. vorher einen Registrierungsprozess durchlaufen zu müssen.
- Verwendung offener Standards: Es sollten Dateiformate verwendet werden, die jeder kostenfrei verwenden kann (ein Excel-Datensatz würde dieser Forderung z.B. nicht entsprechen, da die Verwendung von Excel eine Nutzungslizenz erfordert).
- Lizenzierung: Die Daten sollten ohne Vorgaben zu Nutzungsbedingungen bereitgestellt werden.
- Dauerhaftigkeit: Die veröffentlichen Daten sollten dauerhaft verfügbar sein (vgl. Archivierungserfordernis).
- Nutzungskosten: Die Daten sollten kostenfrei zur Verfügung gestellt werden.
Herausforderungen für die Verwaltung
Klar ist, dass die öffentliche Verwaltung eine Unmenge an Daten erhebt und somit veröffentlichen könnte. Und die Sunlight-Kriterien machen aus Sicht der Wirtschaft, die die durch die Verwaltung bereitgestellten Daten veredeln soll, natürlich absolut Sinn. Führen wir uns aber die tatsächliche Situation in Bezug auf den Datenschatz, den es zu bergen gilt, vor Augen, könnte schnell Ernüchterung eintreten:
- Die internen Prozesse für die Bereitstellung der Daten (inkl. Prüfmechanismen) sind in den wenigsten Behörden etabliert. Hierfür sind entsprechende Projekte aufzusetzen und Budgets freizugeben.
- Die konsequente Anwendung des Open-Data-Prinzips erfordert einen Mentalitätswandel bei den Verantwortlichen, da bisher die Daten eher geschützt als bereitgestellt wurden.
- Gerade ältere Fachverfahren wurden überhaupt nicht so konzipiert, eine Datenfreigabe ohne Probleme durchzuführen. Die erforderlichen Exportmöglichkeiten müssten nachträglich (mit ggf. hohen Kosten) realisiert werden.
- Daten zu einem bestimmten Thema liegen nicht immer zentral an einem Ort, sondern sind über verschiedene Anwendungen verteilt (Stichwort: Datensilos). Hinzukommt ggf. sogar noch eine Datenverteilung über die Ebene Bund, Land und Kommune. Der Aufwand für die Datenbeschaffung nimmt damit deutlich zu.
Die Herausforderungen für die öffentliche Verwaltung können also durchaus komplex sein. Ob sich der Aufwand, offene Datensätze zu veröffentlichen, trotzdem lohnt, wird Gegenstand des zweiten Teils der Mini-Blogserie sein, der sich mit dem Nutzen und den Perspektiven von Open Data befasst.
Bildquelle: Shutterstock