Möglichkeiten zur Qualitätskontrolle und -verbesserung von OpenStreetMap-Daten

von Leoni Möske, WhereGroup

Infobrief 01 | 2020

 

Aktuell werden in den meisten Projekten der WhereGroup OpenStreetMap(OSM)-Daten eingesetzt. Diese werden aus unterschiedlichen Gründen zumeist mit anderen Datenquellen kombiniert. Ein Grund dafür ist die häufig nicht ausreichende Datenqualität bezüglich Geometrien und Attributen (sogenannte Tags).

Zusammenhang Datenqualität und Anzahl der aktiven Mapper
Eine Maßnahme zur Einschätzung der Qualität ist die Betrachtung der Aktivität der OSM-Mapper bezogen auf ein bestimmtes Gebiet. Je mehr Beitragende in einem räumlichen Bereich aktiv sind, desto besser sollte die Qualität der Datensätze sein [I]. Bei einer großen aktiven Community in einem bestimmten Gebiet ist davon auszugehen, dass die Qualität einzelner Datensätze über die Zeit durch stetige Kontrolle und Verbesserung steigt. Hierbei ist zu beachten, dass im gesamten OSM-Projekt insgesamt nur sehr wenige OSM-Mapper einen aktivenBeitrag zum OSM-Datensatz leisten. So haben die Autoren Neis und Zipf 2012 [II] herausgefunden, dass 5 % aller registrierten Beitragenden 89 % der Transaktionen (Changesets) durchgeführt haben. Da sich jeder Bürger frei am OSM-Projekt beteiligen kann, kann die Qualitätssicherung nicht wie z. B. bei Google Maps zentral gesteuert werden. Die o.g. Annahme, dass die Datenqualität für ein definiertes Gebiet umso besser ist, je mehr OSM-Mapper in diesem Gebiet aktiv sind, lässt eine räumlich uneinheitliche Datenqualität aufgrund der ungleichen Verteilung aktiver OSM-Mapper vermuten. Tatsächlich sind Qualitätsunterschiede in den OSM-Daten nicht nur zwischen städtischen und ländlichen Gebieten deutlich zu erkennen, sondern auch zwischen Groß- und Kleinstädten. In meiner Masterarbeit [III] konnte ich feststellen, dass beim Vergleich der Städte Köln und Gera die Millionenstadt Köln eine bessere Datenqualität der OSM-Gebäudedaten als Gera aufweist. Hierbei ist zu beachten, dass dies nur für die Qualität eines bestimmten Anwendungsfalls überprüft werden konnte.

 

Abb. 1: JOSM-Validator-Tool (Screenshot: Leoni Möske, WhereGroup)

 

Abb. 2: Osmose-Tool (Screenshot: Leoni Möske, WhereGroup)

 

Tools zur Verbesserung der Datenqualität
Um die Datensätze in OSM zu verbessern, bietet die Community verschiedene Tools an, die Fehler oder auch Vandalismus im Datensatz detektieren und es ermöglichen, Änderungen der OSM-Daten zu beobachten. Eine vollständige Liste der Tools zur Fehlererkennung und Datenüberwachung befindet sich im OpenStreetMap Wiki [1]. Häufig verwendete und beliebte Tools in diesem Bereich sind das JOSM-Validator-Tool [2] (vgl. Abb. 1) als Fehlererkennungs-Tool und die TagInfo-Webseite [3] für Statistiken zu OSM-Tags. Das JOSM-Validator-Tool ist ein integriertes Feature im JOSM-Editor. Es zeigt Fehler und Warnungen in den heruntergeladenen OSM-Daten an (wie fehlende Tags, überlappende Gebäude etc.) und kann automatische Korrekturen durchführen. Als Standardeinstellung werden alle geänderten Objekte in dem heruntergeladenen Datensatz auf Fehler hin überprüft. Mit diesem Tool können sowohl der gesamte Datensatz als auch nur ausgewählte Objekte validiert werden. Neben der Fehlererkennung bei lokalen Datensätzen im JOSM-Editor existieren auch Tools, die potenzielle Fehler direkt in der weltweiten OSM-Web-Karte darstellen, bspw. das Tool Osmose [4] (vgl. Abb. 2).

Die TagInfo-Webseite enthält Statistiken, die u.a. anzeigen, wie häufig OSM-Mapper bestimmte Tags verwenden oder die veranschaulichen, wie die Tags kombiniert werden. Dieses Tool bietet sich an um festzustellen, mit welchen Tags die Mehrheit der OSM-Mapper bestimmte Objekte versehen und so zu prüfen, ob Objekte korrekt und vollständig getaggt sind.

Nachhaltige Qualitätssicherung
Nach einer erfolgreichen Qualitätssicherung – z. B. mit den oben genannten Tools – sollte der eigene Datensatz in einem bestimmten Gebiet gezielt hinsichtlich Veränderungen beobachtet werden, um die Qualität nachhaltig zu gewährleisten. Für diesen Zweck bietet sich das Datenüberwachungs-Tool OSMCT der WhereGroup an [5]. Dieses informiert über Änderungen im OSM-Datenbestand, so dass eigene Daten entsprechend überarbeitet werden können. Über den konkreten Einsatz von OSMCT bei einem unserer Kunden haben wir im letzten Infobrief berichtet [6].
Um zu entscheiden, ob die heterogenen OSM-Daten den eigenen projektbezogenen Qualitätsanforderungen entsprechen, empfiehlt die WhereGroup eine differenzierte Datenanalayse mit den beschriebenen Tools.

 

Quellen:
[I] Haklay, M., Basiouka, S., Antoniou, V. und Ather, A. (2010). How Many Volunteers Does it Take to Map an Area Well? The Validity of Linus’ Law to Volunteered Geographic Information. The Cartographic Journal 47(4), 315-322.
[II] Neis, P. und Zipf, A. (2012). Analyzing the Contributor Activity of a Volunteered Geographic Information Project - The Case of OpenStreetMap. ISPRS International Journal of GeoInformation 1(2), 146-165.
[III] Möske, L. (2019). Qualitätsbewertung von OpenStreetMap-Gebäudedaten als Datengrundlage für eine Expositionsabschätzung von extremen Hochwasserereignissen – am Anwendungsbeispiel der Untersuchungsgebiete in Köln und Gera. Masterarbeit. Universität Heidelberg. (Erhältlich auf Anfrage: leoni.moeskewheregroup.com)

 

Weiterführende Links:
[1] https://wiki.openstreetmap.org/wiki/Quality_assurance
[2] https://wiki.openstreetmap.org/wiki/JOSM/Validator
[3] https://taginfo.openstreetmap.org/
[4] https://wiki.openstreetmap.org/wiki/DE:Osmose
[5] https://wheregroup.com/produkte/openstreetmap-controltool.html
[6] https://wheregroup.com/unternehmen/infobrief/infobrief-02-19-neue-funktionen-osm-control-tool

 

>>> Zurück zum Inhaltsverzeichnis Infobrief 01 | 2020