This paper describes an approach to estimating the number of pedestrians present in a real-life complex scene by processing a sequence of images. A set of features extracted from each acquired image is related to the number of people monitored. The static declarative knowledge describing the correlation between a feature value and the estimate of the number of people is represented by nonlinear piecewise models. The proposed estimation approach exploits temporal information by means of a distributed Kaiman filter network. The current crowding estimate is derived from the application of the static correlation models to the extracted observations (evidence), combined with the prediction obtained from the temporally previous estimate (expectation). This approach improves the estimation accuracy obtained by using only current available data (i.e., static knowledge), and can predict crowding values between two successive acquisitions, i.e., at those steps at which new data cannot be available. Extensive experimental tests carried out in the field (a metro station) yielded very promising results in terms of estimation accuracy and real-time response capability.
Dieser Beitrag beschreibt einen Versuch, die Anzahl der Fuβgänger in einer lebensechten komplexen Szene durch das Prozessieren einer Sequenz von Bildern zu schätzen. Ein Satz von Merkmalen, extrahiert aus jedem verarbeiteten Bild, wird zu der Zahl der aufgenommenen Leute in Beziehung gesetzt. Das statische deklarative Wissen, das die Korrelation zwischen einem Merkmalswert und dem Schätzwert der Zahl von Leuten beschreibt, wird repräsentiert durch stückweise nichtlineare Modelle. Der vorgeschlagene Weg zur Schätzung nutzt zeitliche Informationen mittels einem verteilten Netzwerk von Kalman Filtern. Der laufende Mengenschätzwert wird aus der Anwendung des statischen Korrelationsmodells zu den extrahierten Beobachtungen (Evidenz) hergeleitet, kombiniert mit der Prädiktion aus zeitlich vorangegangenen Schätzungen (Erwartung). Dieser Ansatz verbessert die Schätzgenauigkeit, die sich bei alleiniger Nutzung laufend verfügbarer Daten (z.B. statisches Wissen) ergibt und kann den Mengenschätzwert zwischen zwei sukzessiven Acquisitionen, d.h. in den Schritten, in denen keine neuen Daten verfügbar sind, vorhersagen. Ausgedehnte experimentelle Feldtests (eine Metro Station) wurden durchgeführt wobei vielversprechende Ergebnisse im Hinblick auf Schätzgenauigkeit und Echtzeitfähigkeit erzielt wurden.
Cet article décrit une approche permettant d'estimer le nombre de piétons présents dans une scène réelle complexe à partir d'une séquence d'images. Un ensemble de paramètres extraits de chaque image acquise est mis en relation avec le nombre de personnes surveillées. La connaissance déclarative statique décrivant la corrélation entre une valeur de paramètre et l'estimation du nombre de gens est représentée par des modèles nonlinéaires. L'approche proposée exploite l'information temporelle au moyen d'un réseau distribué de filtres de Kalman. L'estimation courante est déduite de l'application de modèles de corrélation statiques aux observations extraites (preuves), combinée avec la prédiction obtenue à partir de l'estimation précédente (hypothèse). Cette approche améliore la précision de l'estimation tout en utilisant seulement les données présentes (i.e. information statique), et permet de prédire les valeurs de population entre deux acquisitions successives, i.e. à des étapes où les données ne sont pas nécessairement disponibles. Des tests expérimentaux extensifs effectués dans l'environnement réel (station de métro) ont montré des résultats expérimentaux très prometteurs en termes de précision de l'estimation et de capacité de traitement temps réel.