Yifei Yin
Entwicklung und Evaluierung eines Web-Tools zur crowd-basierten Erfassung von Bäumen aus 3D Punktwolken
Dauer der Arbeit: 4 Monate
Abschluss: Oktober 2019
Betreuer: M.Sc. Michael Kölle, Dr.-Ing. Volker Walter
Prüfer: Prof. Dr.-Ing. Uwe Sörgel
Motivation
Die semantische Interpretation von 3D Punktwolken gewinnt in vielen Forschungsgebieten an Bedeutung. Für das Training eines überwachten Klassifikators kommen manuell annotierte Datensätze als Trainingsdaten zum Einsatz, um die zu trainierenden unbekannten Parameter möglichst optimal zu erlernen bzw. zu bestimmen. Dabei spielen die Menge und insbesondere die Qualität der Trainingsdaten eine wichtige Rolle. Zur Datengewinnung bietet Crowdsourcing die Möglichkeit, einfache Aufgaben wie Datenannotation an die Masse der Internetnutzer auszulagern. Viele Crowdsourcing Aufgaben im Bereich der Geoinformation konzentrieren sich auf die Datenerfassung aus 2D-Geodaten wie Luftbildern und Satellitenbildern, jedoch werden 3D-Geodaten wie ALS Punktwolken kaum als Eingabedaten für die Crowdsourcing Aufgabe eingesetzt. Daher ist es von großem Interesse, Potential einer crowd-basierten Informationsextraktion aus 3D Szenen zu nutzen und insbesondere die Qualität der Erfassung von komplexen Objekten wie Bäumen mittels Crowdsourcing genauer zu untersuchen.
Methodik
Datengewinnung
Zur Erstellung der Crowdsourcing Aufgabe wird zunächst ein Web-Tool entwickelt. Dieses Web-Tool ermöglicht es, Bäume aus 3D ALS Punktwolken mittels minimal umschließender Zylinder zu erfassen. Die Nutzer können Zylinder per Maus positionieren, sowie den Radius und die Höhe der Zylinder skalieren, um einen jeden einzelnen Baum optimal zu approximieren. Das erstellte Web-Tool wird dann über die Crowdsourcing-Plattform Microworkers den potentiellen Arbeitnehmern, repräsentiert durch die Crowd, zugänglich gemacht. Dabei werden zwei Erfassungskampagnen gestartet: fünf für Vaihingen-Enz Testfeld Datensatz (V3D-Datensatz) und 14 für Stuttgart Mercedes-Benz Museum Datensatz (M3D-Datensatz) ausgewählte Punktwolkenausschnitte werden von je 10 Crowdworkern erfasst.
Qualitätsanalyse
Die von Crowdworkern erfassten Daten werden anschließend mit den Referenzdaten verglichen. Die Qualitätsanalyse der Objektextraktion aus ALS Punktwolken kann entweder auf Punktlevel oder Objektlevel basieren. Aus der Konfusionsmatrix werden drei Maße zur Qualitätsanalyse der Erfassung abgeleitet: Vollständigkeit (completeness, auch Recall, Producer’s Accuracy), Korrektheit (correctness, auch Precision, User’s Accuracy) und Qualität (Rutzinger et al. 2009).
Datenintegration
Als Nächstes werden die durch einzelne Crowdworker mehrfach erfassten Bäume im Sinne einer Mehrheitsentscheidung integriert. Mittels des Clustering-Algorithmus DBSCAN (Ester et al. 1996) werden die horizontalen Positionen der Zylinder ohne Verwendung der Referenzdaten automatisch in Gruppen eingeordnet. Nach Elimination der Ausreißer mit stark unterschiedlichen Zylinderpositionen und Zylindergrößen werden gemittelte Zylinder durch Mittelwertbildung der Positionen, Radien und Höhen der einer jeden Gruppe zugehörigen Zylinder rekonstruiert. Die gemittelten Zylinder aus der Datenintegration werden am Ende wieder mit den Referenzdaten verglichen und hinsichtlich der Qualität evaluiert.

Ergebnisse und Fazit
Vor der Datenintegration
Die Qualität der mittels dem erstellten Web-Tool erfassten Daten hängt von der Komplexität der 3D Szenen ab. Für einfache Datensätze, die nur einfach strukturierte typische Bäume beinhalten, können die von den Crowdworkern erfassten Daten eine hohe durchschnittliche objekt-basierte Qualität von über 90% erreichen. Hingegen erzielen die Erfassungen bei komplexeren Datensätzen nur eine Qualität von unter 80%.
Nach der Datenintegration
Nach der Datenintegration wird die objekt-basierte Qualität um mindestens 10 Prozentpunkte gesteigert und erreicht einen hohen Wert von über 95%. Außerdem werden die Positionen und die Größen der durch Datenintegration rekonstruierten Zylinder weitgehend an den Referenzzylinder angepasst.
Zusammenfassend lässt sich sagen, dass Crowdsourcing hinsichtlich Datenannotation von 3D Punktwolken großes Potential zeigt und die integrierten Ergebnisse aus Mehrfacherfassungen gegenüber den von Nutzern erfassten originalen Daten besser mit den Referenzdaten übereinstimmen und hohe Qualität erreichen können.
Referenz
Ester, Martin ; Kriegel, Hans-Peter ; Sander, Jörg ; Xu, Xiaowei u.a.: A density-based algorithm for discovering clusters in large spatial databases with noise. In: Proceedings of Second International Conference on Knowledge Discovery and Data Mining Bd. 96, 1996, S. 226–231.
Rutzinger, Martin ; Rottensteiner, Franz ; Pfeifer, Norbert: A comparison of evaluation techniques for building extraction from airborne laser scanning. In: IEEE Journal of Selected Topics in Applied Earth Observations and Remote Sensing 2 (2009), Nr. 1, S. 11–20.
Ansprechpartner

Volker Walter
Dr.-Ing.Gruppenleiter Geoinformatik