Entwicklung und Evaluierung eines Web-Tools zur crowd-basierten Erfassung von Bäumen aus 3D Punktwolken

Bachelorarbeit am ifp - Yifei Yin

Yifei Yin

Entwicklung und Evaluierung eines Web-Tools zur crowd-basierten Erfassung von Bäumen aus 3D Punktwolken

Dauer der Arbeit: 4 Monate
Abschluss: Oktober 2019
Betreuer: M.Sc. Michael Kölle, Dr.-Ing. Volker Walter
Prüfer: Prof. Dr.-Ing. Uwe Sörgel


 

Motivation

Die semantische Interpretation von 3D Punktwolken gewinnt in vielen Forschungsgebieten an Bedeutung. Für das Training eines überwachten Klassifikators kommen manuell annotierte Datensätze als Trainingsdaten zum Einsatz, um die zu trainierenden unbekannten Parameter möglichst optimal zu erlernen bzw. zu bestimmen. Dabei spielen die Menge und insbesondere die Qualität der Trainingsdaten eine wichtige Rolle. Zur Datengewinnung bietet Crowdsourcing die Möglichkeit, einfache Aufgaben wie Datenannotation an die Masse der Internetnutzer auszulagern. Viele Crowdsourcing Aufgaben im Bereich der Geoinformation konzentrieren sich auf die Datenerfassung aus 2D-Geodaten wie Luftbildern und Satellitenbildern, jedoch werden 3D-Geodaten wie ALS Punktwolken kaum als Eingabedaten für die Crowdsourcing Aufgabe eingesetzt. Daher ist es von großem Interesse, Potential einer crowd-basierten Informationsextraktion aus 3D Szenen zu nutzen und insbesondere die Qualität der Erfassung von komplexen Objekten wie Bäumen mittels Crowdsourcing genauer zu untersuchen.

Methodik

Datengewinnung

Zur Erstellung der Crowdsourcing Aufgabe wird zunächst ein Web-Tool entwickelt. Dieses Web-Tool ermöglicht es, Bäume aus 3D ALS Punktwolken mittels minimal umschließender Zylinder zu erfassen. Die Nutzer können Zylinder per Maus positionieren, sowie den Radius und die Höhe der Zylinder skalieren, um einen jeden einzelnen Baum optimal zu approximieren. Das erstellte Web-Tool wird dann über die Crowdsourcing-Plattform Microworkers den potentiellen Arbeitnehmern, repräsentiert durch die Crowd, zugänglich gemacht. Dabei werden zwei Erfassungskampagnen gestartet: fünf für Vaihingen-Enz Testfeld Datensatz (V3D-Datensatz) und 14 für Stuttgart Mercedes-Benz Museum Datensatz (M3D-Datensatz) ausgewählte Punktwolkenausschnitte werden von je 10 Crowdworkern erfasst.

 

Abbildung 1: Das entwickelte Web-Tool zur Erfassung von Bäumen aus 3D Punktwolken.

Qualitätsanalyse

Die von Crowdworkern erfassten Daten werden anschließend mit den Referenzdaten verglichen. Die Qualitätsanalyse der Objektextraktion aus ALS Punktwolken kann entweder auf Punktlevel oder Objektlevel basieren. Aus der Konfusionsmatrix werden drei Maße zur Qualitätsanalyse der Erfassung abgeleitet: Vollständigkeit (completeness, auch Recall, Producer’s Accuracy), Korrektheit (correctness, auch Precision, User’s Accuracy) und Qualität (Rutzinger et al. 2009).

 

Datenintegration

Als Nächstes werden die durch einzelne Crowdworker mehrfach erfassten Bäume im Sinne einer Mehrheitsentscheidung integriert. Mittels des Clustering-Algorithmus DBSCAN (Ester et al. 1996) werden die horizontalen Positionen der Zylinder ohne Verwendung der Referenzdaten automatisch in Gruppen eingeordnet. Nach Elimination der Ausreißer mit stark unterschiedlichen Zylinderpositionen und Zylindergrößen werden gemittelte Zylinder  durch Mittelwertbildung der Positionen, Radien und Höhen der einer jeden Gruppe zugehörigen Zylinder rekonstruiert. Die gemittelten Zylinder aus der Datenintegration werden am Ende wieder mit den Referenzdaten verglichen und hinsichtlich der Qualität evaluiert.

Abbildung 2: Ablauf des Clusterings und der Ausreißerdetektion: (a) Einteilung der Zylinder anhand der X- und Y-Koordinaten in Gruppen mittels DBSCAN (b) DBSCAN kann Rauschpunkte filtern (blau: korrekte Erfassungen, rot: Ausreißer mit stark unterschiedlichen Zylinderpositionen) (c) Weitere Ausreißerdetektion anhand gegenseitiger Überlappung (blau: korrekte Erfassungen, rot: Ausreißer mit stark unterschiedlichen Zylindergrößen) (d) Endergebnisse (verschiedene Gruppen mit verschiedenen Farben).

Ergebnisse und Fazit

Vor der Datenintegration

Die Qualität der mittels dem erstellten Web-Tool erfassten Daten hängt von der Komplexität der 3D Szenen ab. Für einfache Datensätze, die nur einfach strukturierte typische Bäume beinhalten, können die von den Crowdworkern erfassten Daten eine hohe durchschnittliche objekt-basierte Qualität von über 90% erreichen. Hingegen erzielen die Erfassungen bei komplexeren Datensätzen nur eine Qualität von unter 80%.

 

Nach der Datenintegration

Nach der Datenintegration wird die objekt-basierte Qualität um mindestens 10 Prozentpunkte gesteigert und erreicht einen hohen Wert von über 95%. Außerdem werden die Positionen und die Größen der durch Datenintegration rekonstruierten Zylinder weitgehend an den Referenzzylinder angepasst.

Abbildung 3: Steigerung der durchschnittlichen Vollständigkeit, Korrektheit und Qualität nach der Datenintegration.
Abbildung 4: Positionen der Zylinder vor und nach der Datenintegration für einen Punktwolkenausschnitt.
Abbildung 5 : Darstellung der integrierten Ergebnisse vom gesamten M3D-Datensatz (links: kolorierte Punktwolke als Eingabedaten, rechts: durch Datenintegration rekonstruierte gemittelte Zylinder).

Zusammenfassend lässt sich sagen, dass Crowdsourcing hinsichtlich Datenannotation von 3D Punktwolken großes Potential zeigt und die integrierten Ergebnisse aus Mehrfacherfassungen gegenüber den von Nutzern erfassten originalen Daten besser mit den Referenzdaten übereinstimmen und hohe Qualität erreichen können.

Referenz

Ester, Martin ; Kriegel, Hans-Peter ; Sander, Jörg ; Xu, Xiaowei u.a.: A density-based algorithm for discovering clusters in large spatial databases with noise. In: Proceedings of Second International Conference on Knowledge Discovery and Data Mining Bd. 96, 1996, S. 226–231.

Rutzinger, Martin ; Rottensteiner, Franz ; Pfeifer, Norbert: A comparison of evaluation techniques for building extraction from airborne laser scanning. In: IEEE Journal of Selected Topics in Applied Earth Observations and Remote Sensing 2 (2009), Nr. 1, S. 11–20.

Ansprechpartner

Dieses Bild zeigt Volker Walter

Volker Walter

Dr.-Ing.

Gruppenleiter Geoinformatik

Zum Seitenanfang