Wenn aus Datenbanken „Drucksachen“ werden

Beim Bund gibt es Datenbanken, in denen die Transporte von Kernbrennstoffen und Atommüll erfasst sind. Die Daten liegen unter anderem beim Bundesamt für Strahlenschutz (BfS) und beim Bundesamt für Wirtschaft und Ausfuhrkontrolle (BAFA).

Auf eine Kleine Anfrage der Grünen hin, hat die Bundesregierung diese Datenbestände veröffentlicht – leider nicht gemäß der Open-Data-Prinzipien, sondern als ein mehr als 1000-seitiges PDF-Dokument.

Egal wie man zu Atomkraft und Atomtransporten steht: Die genauere Auswertung dieser Daten und die Verknüpfung mit anderen Quellen wäre definitiv interessant. Leider ist das mit PDF-Dokumenten nur schwer möglich, abgesehen davon dass mir als IT-ler ein kalter Schauer über den Rücken läuft, wenn jemand Datenbanktabellen in ein PDF-Dokument exportiert.

Mir wirft das ganze folgende Fragen auf:

  • Warum wurden keine Rohdaten veröffentlicht bzw. kann die Regierung dazu bewogen werden auch die Rohdaten (und seien es nur Excel-Tabellen) zur Verfügung zu stellen?
  • Arbeitet bereits jemand an der Überführung der Daten in ein maschinenlesbares Format?
  • Was haben die Grünen jetzt eigentlich mit den Daten vor? Alles manuell auswerten? Oder gibt es dort Bestrebungen ebenfalls an maschinenlesbare Daten heran zu kommen?
  • Wäre es zielführend, per Petition zu fordern, dass tabellarische Antworten stets auch nach Open-Data-Kriterien veröffentlicht werden?

Ich werde diesen Fragen in den kommenden Wochen nachgehen. Wer ebenfalls an dem Thema arbeitet oder mitarbeiten möchte, möge sich bei mir melden.