Anleitung zur Datenveröffentlichung

Definition von offenen Daten

Open Data bedeutet, dass Informationen in einem offenen Format verfügbar sind und von allen zu jedem Zweck frei verwendet, weiterverwendet und weitergegeben werden können.
(EU Open Data und PSI Richtlinie 2019/1024)

In Österreich und international bilden die 10 Prinzipien offener Verwaltungsdaten (vgl. White Paper der Cooperation OGD Austria) die Grundlagenkriterien zur Festlegung von offenen Daten.

Worum geht es bei einer Veröffentlichung?

Es geht um die Ermöglichung des Downloads bzw. einer freien Weiterverwendung von bestehenden (intern vorliegenden) Datensätzen zu privaten oder kommerziellen Zwecken mit minimalen oder keinen rechtlichen, technischen oder finanziellen Beschränkungen.

Es geht um eine offene Verwaltung (Open Government), welche die Bürgerinnen und Bürger mit transparenten Informationen versorgt und offen für Rückmeldungen zur Verbesserung von Services ist.

Das Datenportal data.gv.at fungiert als zentrale Bestandsliste bzw. Suchmaschine über alle verfügbaren offenen Daten des öffentlichen Sektors in Österreich und ist wiederum verbunden mit dem Europäischen Datenportal.

Worauf es ankommt
  • Rechtlich
    Verfügbarmachung unter einer freien Lizenz.

    Die österreichische Verwaltung verwendet gemäß Übereinkommen im Wege der Cooperation OGD Österreich für jedwede Datensätze grundsätzlich die offene Lizenz Creative Commons 4.0 mit Namensnennung (CC-BY 4.0). Dies trägt zur gegenseitigen Rechtssicherheit bei. Bis auf die Nennung der datenveröffentlichenden Stelle bestehen für Weiterverwender somit keine weiteren Einschränkungen bei einer Datenverwendung.

    Die Quellenangabe ermöglicht eine korrekte Zuordenbarkeit der Daten zur öffentlichen Verwaltung. Dieser jederzeit überprüfbare Nachweis lässt auf die entsprechende Vertrauenswürdigkeit amtlicher Daten rückschließen und trägt ebenso zur Vermeidung von Falschinformationen bei. Für offene Daten unter CC-BY 4.0 besteht ein grundsätzlicher Gewährleistungs- und Haftungsausschluss.

  • Technik
    Dauerhafter Weblink auf die Ressource und maschinenlesbare Formate

    Die Verfügbarmachung von Daten erfolgt über den Web-Server der betreffenden öffentlichen Stelle. Die Speicherung und Pflege der Primärdaten erfolgt also weiterhin seitens der datenverantwortlichen Stellen.
    Die Veröffentlichung von Daten sollte ohne zusätzlichen Aufwand in den bereits vorhandenen, bearbeitbaren Datei-Formaten erfolgen. Grundsätzlich sind offene Formate zu bevorzugen, die eine betriebssystemunabhängige und freie Verwendbarkeit ermöglichen.
    Maschinenlesbarkeit bedeutet, dass keine manuellen Umwandlungsprozesse von Inhalten erforderlich sind (etwa Abtippen von Texten von Fotos).

    Beispiele

    Texte .odt, .rtf, .epub
    (aber auch .docx ist erlaubt)
    Tabellen .csv, .ods, .xml, JSON, RDF
    (aber auch .xlsx ist erlaubt)
    Kartographische Daten KML, GeoJSON, WFS
    Dynamische Daten Dynamische (sich rasch ändernde) Daten sind grundsätzlich über eine Anwendungsprogrammierschnittstelle (API) zu veröffentlichen (z.B. im Format JSON oder XML)
  • Organisatorisches
    Metadaten

    Für die Strukturierung und Suchbarkeit von Daten über das Datenportal data.gv.at ist es erforderlich ein Metadatenblatt zu jedem Datensatz zu befüllen. Mittels dieser Metadaten wird der jeweilige Datensatz näher beschrieben (Angaben zu den Inhalten, datenverantwortliche Stelle, Aktualisierungshäufigkeit, Lizenz, etc.).
    Siehe etwa folgendes Beispiel: COVID-19: Epidemiologische Kurve

  • Datenmanagement

    Im Sinne eines gesamthaften Datenmanagements muss jede Stelle vor einer Veröffentlichung prüfen, ob die Vorgehensweise nicht gegen das Datenschutzrecht verstößt. Es ist ebenso möglich Teile von Datensätzen verfügbar zu machen, diese einer Anonymisierung zu unterziehen oder aggregierte Daten bereitzustellen. Grundsätzlich gilt das Prinzip der Vollständigkeit von Daten. Das Team von data.gv.at kann zur Beratung kontaktiert werden.

Nutzerperspektive einnehmen

Bei der Datenveröffentlichung ist eine Betrachtung aus der Perspektive der Nutzer wichtig. Daten sind dann von entscheidendem Mehrwert, wenn diese breitestmöglich weiterverwendbar sind. Die Wahl der Formate hängt entscheidend von der Art der bereitzustellenden Daten und der internationalen Verbreitung entsprechender Formate ab. Grundsätzlich sind offene, nicht-proprietäre Formate die beste Wahl (wie etwa Open Document Formate).

Beispiele

Schlechtes Beispiel: PDF

Textdateien werden häufig als PDF veröffentlicht. PDF ist jedoch ein geschlossenes Format, welches grundsätzlich keine weitere Bearbeitung ermöglicht. Das Kopieren und die Verwendung von Inhalten dieses Dateiformats ist nur erschwert möglich. Insbesondere können die für Datenverwender interessanten tabellarischen Daten oder Diagramme nicht automatisiert verarbeitet werden. Eine Veröffentlichung im PDF Format sollte daher nicht ohne eine zusätzliche Verfügbarmachung in anderen, bearbeitbaren Formaten erfolgen.

Gutes Beispiel: Ist-Zustand bzw. Open Document Formate

Der grundsätzliche Ansatz ist es Text- oder Tabellen-Dokumente so wie sie vorliegen bzw. wie diese gespeichert sind (in deren Ist-Zustand, engl. „as is“) zu veröffentlichen (etwa .docx, .xlsx). Empfehlenswert ist aber eine Veröffentlichung der Primärdaten in Open Document Formaten (.odt, .ods) oder als CSV Datei (bei Tabellen).

Publikationshinweis

In Dokumenten oder Publikationen empfiehlt sich zur leichteren Erkennbarkeit die Anbringung eines offenen Lizenzhinweises mit Angabe der offenen Creative Commons Lizenz 4.0 International (CC-BY 4.0) mit Piktogramm auf den Anfangsseiten der Publikation.

Vorteile: Rechtssicherheit, eine breite Nutzungsmöglichkeit und erhöhte Auffindbarkeit von offenem Wissen werden ermöglicht. Für Weiterverwender wird klargestellt unter welchen Bedingungen Inhalte weiterverwendet werden dürfen bzw. dass Inhalte des Werks nur unter der Angabe des Quellhinweises weiterverwendet werden können.

Dieses Dokument ist unter der offenen Creative Commons Lizenz 4.0 International (CC-BY 4.0) veröffentlicht.

Download des Piktogramms unter https://www.data.gv.at/cc-by.png

Anleitungen und weiterführende Informationen
Weblink: data.gv.at/anleitung
Teilen

2 Klicks für mehr Datenschutz: Ein wesentliches Open Data-Prinzip besagt, dass keine Daten veröffentlicht werden dürfen, die einen Rückschluss auf einzelne natürliche Personen zulassen. Ein ähnliches Prinzip zum Schutz persönlicher Daten wird auf data.gv.at bei Teilen-Buttons für Social-Media-Netzwerke verfolgt: da diese Teilen-Buttons allein beim Laden bereits Daten übermitteln, bieten wir Ihnen die Möglichkeit der Selbstbestimmung - Sie können selbst entscheiden, ob ein Teilen-Button aktiviert werden soll oder nicht.