nextuppreviouscontents
Nächste Seite:8. ErkenntnisAufwärts:1. DokumentationVorherige Seite:6. ApplikationInhalt

Unterabschnitte



7. Anwendung ``Erkennen von Fahrzeugkennzeichen''

Die bisher verwendeten Daten waren Ziffernbeispiele mit hohen Auflösungen. Es stellt sich die Frage, ob die verwendeten Algorithmen, Merkmale und Methoden auch für Bilder tiefer Auflösung verwendet werden könnten - zum Beispiel für die Ziffernerkennung bei Autonummern.


7.1 Analyse der Daten

Für diese Betrachtungen habe ich ein neues Datenset zusammengestellt. Es besteht aus 150 Ziffernbeispiele aus Autonummern.
[ a]\resizebox* {!}{2.4cm}{\includegraphics{bilder/auto_sample.eps}} [b ]\resizebox* {!}{2.4cm}{\includegraphics{bilder/auto_sample_1.eps}}[c ]\resizebox* {!}{2.4cm}{\includegraphics{bilder/auto_sample_2.eps}}
Abbildung 7.1: Ziffern aus einer Autonummer
In Abbildung 7.1 sieht man bereits die ersten Probleme bei dieser Anwendung; durch das binarisieren der S/W-Bilder können Pixelfehler entstehen. Ist ein Pixel rechts oberhalb der Ziffer, oder ist die Figur nicht mehr zusammenhängend, so erkennt der verwendete Algorithmus den Umriss nicht mehr korrekt (Abbildung 7.2).
\resizebox* {0.4\textwidth}{!}{\includegraphics{bilder/contur_low_2.eps}}
Abbildung 7.2: Abtastfehler bei tiefen Auflösungen
Die geometrische Verteilung der Merkmale ist in Abbildung 7.3. Obwohl nur korrekt abgetastete Ziffern in dieser Graphik dargestellt werden, sind die Klassen relativ stark durchmischt7.1.
\resizebox* {0.8\textwidth}{!}{\includegraphics{bilder/fft_auto_2d.eps}}
Abbildung 7.3: 1. und 2 Hauptkomponente des Spektrums (Ziffern Autonummern)

7.2 Erkenntnisse aus Kapitel 7.1

Die Struktur der Eingabedaten, und somit die Merkmale scheinen für dieses Problem nicht geeignet.

Dies spiegelt sich auch in den schlechten Resultaten wieder7.2 :
 
 
 

\resizebox* {1\textwidth}{!}{\includegraphics{bilder/tab_trainbr_auto.eps}}

 

Es scheint geeigneter, einzelne Pixel, oder Mittelwerte von Pixelgruppen als Eingabemerkmale zu verwenden (Lit. [5], s. 10-38). In Abbildung 7.4 wurde die Ziffer 5 aufbereitet für ein Netz mit 100 Neuronen in der Eingabeschicht. Die ideale Anzahl Neuronen müsste noch bestimmt werden.

\resizebox* {0.8\textwidth}{!}{\includegraphics{bilder/auto_neuron_mat.eps}}
Abbildung 7.4: Pixelgruppen als Merkmale
So wäre es auch möglich, Graustufenbilder direkt zu verarbeiten. Das binarisieren würde somit entfallen. Da die Lage der Ziffern bereits beim Segmentieren des Nummernschildes bekannt sein muss, ist die fehlende Invarianz gegenüber Rotation und Translation kein Nachteil.

Als Architektur käme widerum ein Backpropagation-Netzwerk, oder ein assoziativer Speicher in Frage.


nextuppreviouscontents
Nächste Seite:8. ErkenntnisAufwärts:1. DokumentationVorherige Seite:6. ApplikationInhalt
Gfeller Patrik

2001-02-25