Skip to main content
Log in

Data Mining mit unsicheren Daten

Fallbeispiel OpenStreetMap

Data Mining Based on Uncertain Data

An OpenStreetMap Case Study

  • Schwerpunkt
  • Published:
HMD Praxis der Wirtschaftsinformatik Aims and scope Submit manuscript

Zusammenfassung

Im Zeitalter von Big Data werden immense Informationsbestände aus unterschiedlichen Quellen gesammelt. Die Daten sind häufig unvollständig, unsicher und ungenau. Ein Beispiel hierfür ist das OpenStreetMap Projekt, bei dem Nutzer auf der ganzen Welt einmal mehr und einmal weniger „sauber“ bzw. vollständig Daten beisteuern. In diesem Beitrag wird gezeigt, ob sich diese Daten eignen um ein betriebswirtschaftliches Problem zu lösen. Ein konkretes Fallbeispiel verdeutlicht, wie gut Standortentscheidungen einer Fast Food Kette unter Anwendung fortgeschrittener datenanalytischer Verfahren, wie bspw. Künstlicher Neuronaler Netze, Entscheidungsbäume und Logit-Modelle, nachempfunden werden können. Als Grundlage dienen die Daten des OpenStreetMap Projekts. Im Konkreten geht es darum, potenzielle Filialstandorte hinsichtlich deren Güte mittels OpenStreetMap Daten zu klassifizieren und die prognostizierten Lokationen mit tatsächlichen Standortentscheidungen zu vergleichen. Dabei zeigt sich, dass die Daten des OpenStreetMap Projekts grundsätzlich für die Prognose von Standorten geeignet sind. Allerdings ist die Wahl des datenanalytischen Verfahrens von Bedeutung. Im vorliegenden Fall konnte mit Hilfe der Künstlichen Neuronalen Netze das beste Prognoseergebnis erzielt werden.

Abstract

In the age of big data, a huge amount of information is being collected from diverse sources. These data are often incomplete, uncertain, and imprecise. An excellent example is the OpenStreetMap project, where users across the whole world contribute data on a more or less precise and complete level. This article shows whether these data are suited to support management decisions. A real-world example illustrates the extent to which location decisions of a fast food restaurant chain may be reproduced by means of advanced data analytic techniques, such as neural networks, decision trees, and logit models. The data are retrieved form the OpenStreetMap project. The basic task deals with classifying potential locations of the fast food restaurant chain and comparing the predicted locations with the actual locations. We find that data based on the OpenStreetMap project are generally suited for forecasting locations. However, the choice of the data analytic technique is important. In the case under consideration, neural networks resulted in the best forecast.

This is a preview of subscription content, log in via an institution to check access.

Access this article

Price excludes VAT (USA)
Tax calculation will be finalised during checkout.

Instant access to the full article PDF.

Abb. 1
Abb. 2
Abb. 3
Abb. 4
Abb. 5

Literatur

Download references

Author information

Authors and Affiliations

Authors

Corresponding author

Correspondence to Nadine Schröder.

Rights and permissions

Reprints and permissions

About this article

Check for updates. Verify currency and authenticity via CrossMark

Cite this article

Kellner, F., Schröder, N. Data Mining mit unsicheren Daten. HMD 55, 601–613 (2018). https://doi.org/10.1365/s40702-018-0419-5

Download citation

  • Received:

  • Accepted:

  • Published:

  • Issue Date:

  • DOI: https://doi.org/10.1365/s40702-018-0419-5

Schlüsselwörter

Keywords

Navigation