Zusammenfassung.
Die automatische Erkennung und Lokalisation von Objekten in digitalen Bildern ist ein wesentlicher Bestandteil vieler praktisch relevanter Anwendungen. In diesem Artikel wird ein erscheinungsbasiertes Verfahren zur Erkennung starrer zwei- oder dreidimensionaler Objekte vorgestellt, dem eine statistische Modellierung zugrundeliegt. Im Gegensatz zu segmentierungsbasierten Verfahren, wie sie vor allem im Bereich der 3D-Objekterkennung eingesetzt werden, ermöglicht der erscheinungsbasierte Ansatz aufgrund der Modellierung der Intensitätswerte oder davon abgeleiteter lokaler Merkmale eines Bildes die Erkennung komplexer Objekte. Die statistische Formulierung der Problemstellung bildet den mathematischen Kontext zur Bestimmung optimaler Lösungen.
Die Form der Modellierung erlaubt neben der Einzelobjekterkennung auch die Berücksichtigung von heterogenem Bildhintergrund und Mehrobjektszenen. Die dazu benötigten lokalen Merkmale entstehen durch räumlich begrenzte Transformationen des Bildes, wie beispielsweise Gabor- oder Wavelet-Transformationen. Die statistische Modellierung beschreibt die Verteilung dieser lokalen Merkmale anhand einer Dichtefunktion, die sich bei der Hintergrund- und Mehrobjektmodellierung als Mischungsverteilung der Einzelobjektverteilungen ergibt. Die Aufgabenstellungen des Erlernens und Erkennens von Objekten sind damit als Parameterschätzprobleme formal darstellbar. Dabei werden im einen Fall die Modellparameter und im anderen Fall die Lageparameter beziehungsweise die Klassen von Objekten geschätzt. Die experimentelle Überprüfung des Ansatzes anhand realer Objektaufnahmen durch CCD-Kameras zeigt seine Brauchbarkeit zur Erkennung von 2D- und 3D-Objekten bei homogenem und heterogenem Hintergrund.
Abstract.
The automatic recognition and localization of objects in digital images is an important part of many real world applications. In this article we present an appearance based statistical approach for the recognition of two and three dimensional objects. In contrast to segmentation based methods, the appearance based approach allows the recognition of complex objects. This is a consequence of modeling image intensity values or derived local features. The statistical formulation of the recognition problem defines the mathematical context for its optimal solution.
The model allows the recognition of single objects in images with homogeneous background as well as objects within heterogeneous background or multi object scenes. Local features for this model are derived from local transformations of the image. Examples for such transformations are Gabor or Wavelet transforms. The statistical model describes the distribution of the local features with a density function, which is defined as mixture density in case of background and multi object scenes. The object recognition and localization task can be formulated as parameter estimation problem, where the model parameters, the object pose and the object class are estimated respectively. We finally show experimental results of the presented approach, which demonstrate, that it can be utilized to successfully localize and recognize two and three dimensional objects in CCD-camera images with homogeneous as well as heterogeneous background.
Article PDF
Author information
Authors and Affiliations
Additional information
Eingegangen am 5. April 2000 / Angenommen am 20. Juli 2001
Rights and permissions
About this article
Cite this article
Pösl, J., Niemann, H. Erscheinungsbasierte statistische Objekterkennung. Informatik Forsch Entw 17, 21–40 (2002). https://doi.org/10.1007/s004500100091
Published:
Issue Date:
DOI: https://doi.org/10.1007/s004500100091