Automatische Erkennung und Klassifikation von Karten mittels Methoden der Bildverarbeitung

Bachelorarbeit am ifp - Michael Kölle

Michael Kölle

Automatische Erkennung und Klassifikation von Karten mittels Methoden der Bildverarbeitung

Dauer der Arbeit: 4 Monate
Abschluss: Juli 2016
Betreuer: Dr.-Ing. Volker Walter
Prüfer: apl. Prof. Dr.-Ing. Norbert Haala


 

Motivation

Das Internet hält bekanntermaßen eine ständig wachsende Zahl unterschiedlicher Informationen zu jeglichen Themen und Fragestellungen bereit, wozu unter anderem auch eine große Anzahl verschiedenartiger digitaler Bilder zählt. Unter anderem finden sich hierbei auch solche Bilder, die Karten eines bestimmten Typs darstellen. Das Ziel der Arbeit ist es, zu untersuchen, inwieweit eine automatische Bildersuche unter Nutzung von Bildmerkmalen möglich ist. Speziell soll hierbei das Augenmerk auf das Auffinden von verschiedenen Landkartentypen gelegt werden, wobei zur Analyse des  Bildinhalts die Mittel und Methoden der Digitalen Bildverarbeitung zur Anwendung kommen sollen.

Vorgehensweise

Um ein entsprechendes Erkennen von Karten zu erreichen, werden zunächst diejenigen Kartentypen definiert, die aufgefunden werden sollen. Hierbei wird zwischen historischen Karten, Weltkarten, topographischen Karten und homogenen Karten, wie z.B. Staatenkarten, unterschieden.

Im nächsten Schritt sollen typische Bildmerkmale gefunden werden. Dabei werden zum einen solche betrachtet, die sich ausschließlich auf die Farbinformationen in einem Bild beschränken, wie etwa die Anzahl der Farben im Bild, der Blauanteil als Indiz für Weltkarten sowie der Gelbanteil oder auch die Sättigung als Hinweis auf historische Karten. Zum anderen soll diese Art von Merkmalen aber auch mit solchen kombiniert werden, die die Textur eines Bildes erfassen. Hierbei kann beispielsweise die Anzahl der Bereiche im Bild für eine homogene Karte sprechen. Weiterhin werden Verfahren wie der "Canny-Algorithmus" zur Detektion von Kanten genutzt oder auch die "Quadtree-Decomposition" sowie die sogenannte Grauwertematrix zur Beschreibung der Homogenität eines Bildes. Die numerischen Größen, die durch diese Verfahren gewonnen werden, tragen mitunter maßgeblich zur Erkennung derjenigen  Bilder bei, die keine Karten darstellen, erlauben aber auch eine gewisse Unterscheidung zwischen den einzelnen Kartentypen.

Das eigentliche Erkennen von verschiedenen Kartentypen erfolgt mittels des Konzepts einer überwachten Klassifikation. Hierbei wird davon ausgegangen, dass sich Vertreter eines Kartentyps, also einer Klasse, durch einen für die jeweilige Klasse charakteristischen Merkmalsvektor auszeichnen, welcher, bezogen auf die einzelnen Merkmale, die entsprechenden numerischen Werte enthält. Zur  Klassifikation wird neben der "Minimum-Distance-Klassifikation" auch die "Maximum-Likelihood-Klassifikation" genutzt. Hierzu werden zunächst typische Vertreter einer Klasse als Trainingsdaten verwendet und der hierdurch trainierte Klassifikator anschließend auf einen Testbilddatensatz angewandt. Um bei diesem eine ähnliche Situation wie im Internet zu simulieren, besteht dieser hauptsächlich aus Bildern, die keine Karte darstellen, und aus nur wenigen Bildern, die den einzelnen Kartentypen zuzuordnen sind.

Ergebnisse und Fazit

Es zeigt sich, dass mit den ausgewählten Merkmalen bereits unter Nutzung der gängigen "Minimum-Distance-Klassifikation" bei einer simulierten Suche nach Karten im Internet zwar relativ gute Gesamtgenauigkeiten erzielt werden können. Jedoch ist bei diesem Verfahren insgesamt die Zahl der den Karten fehlerhaft zugeordneten Fotos zu hoch für ein effizientes Suchen, weshalb dieses für diesen Zweck nicht geeignet ist. Auch die "Maximum-Likelihood-Klassifikation" kann diesen Umstand nicht wesentlich verbessern.

Diesem Missstand kann aber eine Klassifikation unter Berücksichtigung der Zuordnungssicherheit abhelfen. Das heißt, es werden letztlich nur diejenigen klassifizierten Bilder betrachtet, die mit hoher Wahrscheinlichkeit tatsächlich Vertreter der entsprechenden Klasse sind. Wird eine solche genutzt, so werden bei beiden Klassifikationsmethoden brauchbare Ergebnisse generiert. Mit diesen wäre eine praktische Anwendung bereits denkbar, wenn auch noch eine gewisse Anzahl an fehlerhaften Ergebnissen in Kauf genommen werden müsste. Die Ursache hierfür ist, dass diese fälschlicherweise den Karten zugeordneten Bilder, bezogen auf die betrachteten Merkmale, einzelnen Kartentypen zu ähnlich sind. So ähnelt beispielsweise das Comic-Bild in Abbildung 2 einer Staatenkarte  oder auch das Bild des Raubtiers, ebenfalls in Abbildung 2, einer topographischen Karte in Bezug auf jene Merkmale. Die Anzahl solcher Fehlzuordnungen kann jedoch sehr klein gehalten werden, sodass typische Vertreter einzelner Kartentypen, wie diejenigen in Abbildung 1, auch ohne Probleme erkannt werden können.

Die folgenden Abbildungen stellen einen Auszug aus den Ergebnissen der Klassifikation dar. Die jeweilige Beschriftung gibt die zugeordnete Klasse des jeweiligen Bildes wieder.

 

Richtig zugeordnete Bilder
Abbildung 1: Richtig zugeordnete Bilder

Ansprechpartner

Dieses Bild zeigt Volker Walter

Volker Walter

Dr.-Ing.

Gruppenleiter Geoinformatik

Zum Seitenanfang