Attributive Konsistenz von OpenStreetMap-Daten

In unserem UNIGIS-Studium haben wir uns innerhalb des zweiten Pflichtmoduls „Räumliche Daten: Modelle und Strukturen“ gerade vertieft mit der topologischen Konsistenz von GIS-Daten auseinandergesetzt. Im Hinblick auf Daten aus dem OpenStreetMap-Projekt (OSM) haben wir dabei auch einen detaillierten Blick auf das OSM-Qualitätssicherungswerkzeug Osmose geworfen und Topologiefehler im Sinne der OpenStreetMap-Logik analysiert. Im Modul kam bereits der Hinweis, dass es sich nicht bei allen Fehlertypen in Osmose um Topologiefehler handelt. Die nicht-topologischen Oberkategorien in der dortigen Kartenlegende sind u.a. daran erkennbar, dass sie das Wort „Eigenschaften“ im Namen enthalten.

Diese attributbezogenen Fehler sind, summiert man alle betreffenden Oberkategorien auf, in der OSM-Datenbank quantitativ durchaus schwerwiegender als die topologischen Fehler. Wie aber lassen sich die attributbezogenen Fehler analog zur topologischen Konsistenz begrifflich gruppieren? Aus meiner Sicht liegt dabei die Bezeichnung „attributive Konsistenz“ nahe. Eine DuckDuckGo-Recherche führte aber eigentlich nur zu einer Hauptquelle, die diesen Begriff verwendet (die wiederum auch von den Salzburger GIS-Experten stammt, die auch in unserem Studium seitens der Lehre mit von der Partie sind): Implementation systematischer Qualitätssicherungs- und Modellierungsroutinen bei der Verwendung von GIP-Daten von Martin Loidl, Bernhard Zagel und Robin Wendel (2015).

Das scheint also keine gängige Bezeichnung für die der Topologie gegenüberstehende Menge bei der Fehleranalyse von GIS-Datensätzen zu sein. Allerdings bin ich auch noch nicht fündig geworden, wie es nun wirklich heißt. Im Wikipedia-Beitrag zu Geodaten gibt unter „Logische Konsistenz (logical consistency)“ neben der topologischen Konsistenz zahlreiche weitere Konsistenz-Bereiche und keine Zweiteilung in topologische Konsistenz und die übrige Menge.

Es mag aber auch sehr spezifisch für OpenStreetMap-Daten sein, dass man innerhalb der Datenbank für ein und dasselbe Thema zahlreiche unterschiedliche Varianten der Kombination von Attributen (einheitliche Schlüssel aber unterschiedliche Werte oder sogar ganz unterschiedliche Schlüssel-Wert-Paare mit demselben Zweck) findet. Schließlich wird vieles von den Qualitätssicherungs-Schritten (so auch bei der Prüfung vor dem Upload der Daten aus JOSM) vom System als korrekt „durchgewinkt“. Es gibt also keinen einheitlichen Weg für das attributiv korrekte „Mappen“ in OSM und es ist den Vorzügen der jeweiligen Mapper überlassen, welche Variante sie wählen wollen.

Beispiel stillgelegte Bahnstrecken

Ein detaillierter Blick auf die Systematik stillgelegter Bahnstrecken in OSM auf struktureller und attributiver Ebene zeigt, dass es hier sehr viele verschiedene Varianten gibt. Abfragen aus der OSM-Datenbank müssen daher sehr viele Fälle berücksichtigen und sind entsprechend komplex. Ganz abgesehen davon ist dies ein Bereich, der in OSM noch längst nicht vollständig ist.

Mir schwebt eine Website vor, die umfassende, kategorisierbare Informationen zu allen stillgelegten Bahnstrecken bzw. Bahnstrecken ohne Schienenpersonnennahverkehr (SPNV) enthält: Eröffnung, Datum Einstellung SPNV, diverse statistische Werte auf baulicher Ebene, Initiativen zur Reaktivierung, durchgeführte Machbarkeitsstudien, Kosten der Reaktivierung je nach Variante etc. Dabei spielt natürlich auch eine interaktive kartografische Darstellung der Strecken eine besondere Rolle, nach Möglichkeit mit farblicher Abstufung u.a. der politischen, baulichen, landschaftlichen und anliegerbedingten Widerstände je nach Streckenabschnitt.

Ein Versuch, alle stillgelegten Bahnstrecken in Norddeutschland, die bereits als zuammenhängende Relationen in der OSM-Datenbank vorhanden sind, per Overpass Turbo ausfindig zu machen und als GeoJSON-Datensatz herunterzuladen, stellte sich als sehr aufwändiges Unterfangen heraus, das ich erstmal aufschieben musste. Die Allertalbahn ist zum Beispiel als Relation vorhanden und mit historic=railway getaggt (zumindest in den Einzelabschnitten Gifhorn Stadt–Celle und Celle–Wahnebergen). Die Bahnstrecke Celle–Braunschweig hingegen weist dieses Schlüssel-Wert-Paar nicht auf. Aus der Relation alleine wird dort gar nicht deutlich, dass es sich um eine fast durchgängig stillgelegte Bahnstrecke handelt. Bei einer Overpass-Turbo-Abfrage der mit historic=railway getaggten Bahnstrecken in Niedersachsen tauchen folglich viele stillgelegte Bahnstrecken gar nicht auf.

Hier gilt es also, weiter nach Filtermöglichkeiten zu suchen. Die bisherigen Fälle zeigen aber auch, dass hier selbst in vermeintlich vollständig eingetragenen Fällen noch Bearbeitungen der OSM-Daten nötig sind, um die Daten für den dargestellten Zweck automatisiert extrahieren zu können.

S-Bahnen sind keine Stadtbahnen!

Die Darstellung von einiges S-Bahn-Netzen als Stadtbahnen ist ein Beispiel für eine inkonsequente und nicht den tatsächlichen Gegebenheiten entsprechende Kategoriezuweisung innerhalb von OpenStreetMap.

Der Begriff Stadtbahn ist zwar nicht generell eindeutig, reduziert auf die klare Bezeichnung einer Verkehrsmittelkategorie aber schon. Es handelt sich also um eine Mischung aus U- und Straßenbahn, die nach BOStrab betrieben wird (wie U-Bahnen und Straßenbahnen selbst im Übrigen auch). Die Systeme weisen sowohl über Blocksignale gesteuerte Abschnitte (wie U-Bahnen) und solche mit Fahren auf Sicht (Straßenbahnen in straßengebundenen Abschnitten) auf. Zudem gibt es kreuzungsfreie Abschnitte und solche mit niveaugleichen Kreuzungen und Bahnübergängen. Die Fahrzeugabmessungen richten sich nach den Maximalwerten für Straßenbahnen (z.B. 2,65 Meter maximale Breite und 75 Meter maximale Länge, die nur in Ausnahmefällen überschritten werden darf). Das Pendant im englischsprachigen Raum ist „Light Rail“.

Dass bestimmte S-Bahn-Netze in OSM durchgängig als railway=light_rail getaggt werden (u.a. Berlin, Hamburg und Kopenhagen) ist daher völlig unpassend. Die S-Bahnen werden durchweg nach EBO (oder den jeweils gültigen Eisenbahn-Betriebsordnungen) betrieben. Es ist mir selbst nach einigen Diskussionen mit OSM-Enthusiasten und vehementen Vertretern dieser Systematik ein Rätsel, wie es bei OSM zu so einer unpassenden Deklaration der betreffenden S-Bahn-Netze kommen konnte. Selbst bei dem kleineren Lichtraumprofil der per Gleichstrom über eine seitliche Stromschiene betriebenen S-Bahnen in Hamburg und Berlin haben die meisten übrigen technischen Parameter sehr eindeutig Eisenbahn- und nicht U-Bahn- oder Straßenbahn-Charakter. Die Wagenbreite der DSB-SE-Fahrzeuge der S-Bahn Kopenhagen liegt mit 3,60 Metern sogar fast einen Meter über dem für Stadtbahnen zugelassenen Maximum.

Wie dem auch sei: Dieses Ärgernis wird in OSM wohl bestehen bleiben, denn die Befürworter dieser unlogischen Deklaration sind in der Überzahl. Das nehmen wir nun also vorerst mal so hin und konzentrieren uns darauf, nicht die OSM-Systematik an sich zu ändern, sondern alles Eingetragene stückweise konsistenter und besser gebündelt auswertbar zu machen!

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert