Wir leben im Informationszeitalter. Kommunikationsnetzwerke umspannen den Planeten und ermöglichen auch in den entlegensten Winkeln der Welt Zugriff auf das World Wide Web und damit – vereinfacht gesagt – unter anderem auf das gesammelte Wissen der Menschheit. Doch beinhaltet diese immense Informationsansammlung wirklich Antworten auf alle Fragen? Und ist das überhaupt möglich? Wohl eher nicht.
Das Web in seiner derzeitigen Form und viele andere Informationsquellen sind wie eine riesige Bibliothek, deren Bücher zwar zumeist Verweise auf andere Bücher, in denen man mehr erfahren kann, enthalten – die dem eigentlichen Inhalt zugrunde liegenden Daten verbleiben jedoch im Verborgenen. Die Bibliothek kann zu Fragen, die andere Personen bereits gestellt haben, Antworten geben. Was ist, wenn man eine Frage hat, die nie gestellt wurde? Was, wenn man Zweifel an einer Antwort hat und nachvollziehen möchte, wie sie entstanden ist?

Befreit die Daten!

Open Data nennt sich eine Bewegung, die das Ziel verfolgt, freien Zugriff auf möglichst viele Rohdaten und damit deren uneingeschränkte Nutzung, Interpretation und Weiterverarbeitung für jeden, der daran Interesse hat, zu ermöglichen. Die Bewegung ist verwandt mit der Praxis des Open Access, also der freien Veröffentlichung wissenschaftlicher Artikel – zusätzlich oder gar an Stelle der Veröffentlichung über einen Verlag. Anders als Open Access, wofür es bereits einige ausgearbeitete Definitionen und Strategien in der wissenschaftlichen Gemeinschaft gibt, ist der Begriff Open Data aber noch eher schwammig gefasst und derzeit mehr eine übergeordnete Philosophie verschiedener Bestrebungen und Projekte.

Rohdaten können z.B. Ergebnisse wissenschaftlicher Experimente, staatlich erhobene Statistiken, Geodaten, also Positionsangaben zu bestimmten Objekten, oder auch Fahrpläne von öffentlichen Verkehrsmitten sein.

Viele solche Daten sind nur einem eingeschränkten Personenkreis oder nur gegen Zahlung zugänglich, sie werden abgeschottet aufbewahrt und die Nutzungsrechte eingeschränkt. Dafür kann es verschiedene Gründe geben: datenschutzrechtliche Bedenken, staatliche oder betriebliche Geheimnisse, der Wunsch, die Deutungshoheit über bestimmte Daten zu behalten, finanzielle Vorteile, etc. Doch ebenso einfach lassen sich Argumente für die Aufhebung von Schranken und die Freigabe zum Nutzen der Allgemeinheit finden: Rohdaten sind Fakten und sollten niemandem „gehören“. Insbesondere Daten aus Medizin- und Umweltforschung sollten schon aus moralischen Gründen jedem zugänglich sein. Hinzu kommt, dass sowohl wissenschaftliche als auch staatlich erhobene Daten mit öffentlichen Geldern finanziert wurden. Zu guter Letzt steigt die Geschwindigkeit der Gewinnung neuer Erkenntnisse mit der Anzahl der Personen, die einen Datenbestand betrachten.

Das Recht auf Information

Ein Begriff, der im Zusammenhang mit Open Data immer wieder fällt, ist Open Government. Auch dies ist ein Sammelbegriff verschiedener Konzepte, die Offenheit und Nachvollziehbarkeit staatlichen Handelns in Regierung und Verwaltung fördern sollen. Neben der Offenlegung von Handlungsgrundlagen umfasst dies auch verstärkte Beteiligung der Bevölkerung an Entscheidungsprozessen, etwa bei Großprojekten.
Selbst wenn die Philosophie des Open Government sich nur allmählich durchsetzen wird, so gibt es immerhin mittlerweile in vielen Ländern Gesetze, die der Bevölkerung – teilweise gegen Gebühr – ein Recht auf Einsicht in Regierungsdokumente gewähren; angefangen in Schweden, wo dies bereits im 18. Jahrhundert eingeführt wurde, über den seit 1966 bestehenden „Freedom of Information Act“ in den USA bis hin zum deutschen Informationsfreiheitsgesetz, welches am 1. Januar 2006 in Kraft trat. Es gibt zwar weiterhin Ausnahmen, etwa bei personenbezogenen Daten oder militärischen Geheimnissen, und Ablehnungen, die Kritik hervorriefen, jedoch stellen die Gesetze eine Abkehr vom Amtsgeheimnis dar: Anstatt den Antrag auf die Erteilung einer Information speziell begründen zu müssen, bedarf nun die Ablehnung eines solchen Antrags einer Begründung.

maschinenlesbare Regierung

Bereits Ende der 80er Jahre forderte der Chaos Computer Club eine „maschinenlesbare Regierung“. Der Staat soll also nicht nur allerhand Information freigeben, dies soll auch noch in einer Form geschehen, die eine einfache computergestützte Verarbeitung ermöglicht und nicht nur Dokumente darstellt, welche von Menschen gelesen werden können.

Mehr als 20 Jahre später hat sich der Wunsch des CCC leider noch nicht wirklich erfüllt. Allzu oft kommt es vor, dass Daten zwar verfügbar sind, jedoch z.B. als Tabelle in einer PDF-Datei oder als Fließtext auf Webseiten vorliegen und in mühevoller Handarbeit oder mit fehleranfälligen automatisierten Verfahren in eine Form überführt werden müssen, in der sie weiterverarbeitet werden können. Gerade bei Rohdaten, die heutzutage ohnehin in irgendeinem standardisierten Format vorliegen dürften, ein eigentlich überflüssiger Aufwand.

Dennoch gibt es glücklicherweise Personen, die Zeit und Mühe investieren und einen Vorgeschmack auf das geben, was möglich ist. So sind unter anderem interaktive Visualisierungen des Bundeshaushaltes (bund.offenerhaushalt.de) und der Parteispenden (labs.vis4.net/parteispenden) entstanden.

Wohin geht die Reise?

Wie es besser geht, beweisen die USA und Großbritannien mit ihren Websites www.data.gov und data.gov.uk, die eine große Vielfalt an Daten in verschiedenen Formaten bereitstellen – von der Wasserqualität einzelner Flüsse bis hin zur Anzahl der ausgesprochenen Bußgelder für Graffitis oder nicht beseitigte Hundehaufen, aufgelistet nach Stadtteilen. Entsprechende Lizenzen garantieren dabei die freie Nutzung. Darüberhinaus bieten die Websites Diskussionsplattformen wo Verbesserungsvorschläge geäußert und auch erwünschte Daten angefordert werden können und ermöglichen es Nutzern, die mit Hilfe der Daten entstandenen Anwendungen zu präsentieren.

Am Aufbau der britischen Website war unter anderem kein geringerer als Tim Berners-Lee beteiligt, der Anfang der 90er Jahre das World Wide Web aus der Taufe hob. Er prägt derzeit einen neuen Begriff: Linked Data. Die Daten sollen nicht für sich alleine stehen. So wie Websites mit Links untereinander verknüpft sind, sollen einzelne Datensätze Adressen haben und über diese Beziehungen untereinander ausdrücken können. Auf diese Weise werden sich größere Zusammenhänge maschinell erkunden lassen, ähnlich wie wir Menschen beispielsweise durch die Wikipedia navigieren. Die Reise hat begonnen und aus Linked Data entsteht die nächste Generation des World Wide Web: das Semantic Web.

Noch keine Kommentare, sei der Erste!