Skip to content
Licensed Unlicensed Requires Authentication Published by De Gruyter (O) March 11, 2017

DaMoQ: Eine Open-Source-MATLAB-Toolbox zur Bewertung von Daten- und Modellqualität in Regressionen

DaMoQ: An open source MATLAB toolbox for data and model quality assessment
  • Wolfgang Doneit

    Wolfgang Doneit ist Mitarbeiter am Institut für Angewandte Informatik (IAI) am Karlsruher Institut für Technologie (KIT).

    Institut für Angewandte Informatik (IAI), Karlsruher Institut für Technologie (KIT), Hermann-von-Helmholtz-Platz 1, 76344 Eggenstein-Leopoldshafen

    EMAIL logo
    , Ralf Mikut

    Prof. Dr.-Ing. Ralf Mikut ist außerplanmäßiger Professor an der Fakultät für Maschinenbau des KIT und Projektleiter am Institut für Angewandte Informatik (IAI) am Karlsruher Institut für Technologie (KIT). Forschungsschwerpunkte: Computational Intelligence, Data Mining, Biosignalanalyse, Bildverarbeitung, Regelungstechnik, Robotik, Bewegungsanalyse, Modellierung von Energiesystemen.

    Institut für Angewandte Informatik (IAI), Karlsruher Institut für Technologie (KIT), Hermann-von-Helmholtz-Platz 1, 76344 Eggenstein-Leopoldshafen

    , Lutz Gröll

    PD Dr.-Ing Lutz Gröll ist Projektleiter am Institut für Angewandte Informatik (IAI) am Karlsruher Institut für Technologie (KIT). Forschungsschwerpunkte: Modellierung verfahrenstechnischer Anlagen, Parameteridentifikation, Regelungstheorie.

    Institut für Angewandte Informatik (IAI), Karlsruher Institut für Technologie (KIT), Hermann-von-Helmholtz-Platz 1, 76344 Eggenstein-Leopoldshafen

    , Tim Pychynski

    Dr.-Ing. Tim Pychynski war Mitarbeiter am Institut für Thermische Strömungsmaschinen (ITS) am Karlsruher Institut für Technologie (KIT) und ist Forschungsingenieur der Robert Bosch GmbH.

    Robert Bosch GmbH, Robert-Bosch-Campus 1, 71272 Renningen

    and Markus Reischl

    Dr.-Ing. Markus Reischl ist Projektleiter für das Projekt TELMYOS am Institut für Angewandte Informatik (IAI) am Karlsruher Institut für Technologie (KIT) und Mitglied der Heidelberg Karlsruhe Research Partnership. Hauptarbeitsgebiete: Mensch-Maschine-Schnittstellen, Bildverarbeitung, Bioinformatik, Data-Mining.

    Institut für Angewandte Informatik (IAI), Karlsruher Institut für Technologie (KIT), Hermann-von-Helmholtz-Platz 1, 76344 Eggenstein-Leopoldshafen

Zusammenfassung

In diesem Beitrag wird DaMoQ vorgestellt, eine Erweiterung zur MATLAB-Toolbox SciXMiner, um die Datenqualität von Eingangsdaten für Regressionen zu bewerten. Bei SciXMiner handelt es sich um eine Open-Source-MATLAB-Toolbox zur automatisierten Bild- und Datenanalyse. In DaMoQ werden verschiedene Muster ungleichmäßiger Verteilungen in Datensätzen quantifiziert und visualisiert. Während die Visualisierungen dem Anwender einen schnellen Einblick in den vorliegenden Datensatz geben, wird die Quantifizierung für eine aggregierte Bewertung der einzelnen Eingangsgrößen sowie des Datensatzes genutzt. Anhand Benchmark-Datensätze und einer Anwendung für Labyrinthdichtungen wird gezeigt, dass die Kriterien und Visualisierungen von DaMoQ nicht nur ähnliche Ergebnisse wie eine visuelle Analyse der Streuwolkendiagramme liefern, sondern auch visuell schwer erkennbare Phänomene identifizieren.

Abstract

We propose DaMoQ, an extension package of the data analysis MATLAB toolbox SciXMiner, to assess the quality of input data in regression problems. DaMoQ quantifies inhomogeneity and visualizes patterns of data distributions in order to evaluate the quality of a given dataset and its features. We use two benchmark datasets and a real world dataset for modelling the labyrinth seal discharge coefficient to show the similarity of DaMoQ results to a visual inspection of the data.

Über die Autoren

Wolfgang Doneit

Wolfgang Doneit ist Mitarbeiter am Institut für Angewandte Informatik (IAI) am Karlsruher Institut für Technologie (KIT).

Institut für Angewandte Informatik (IAI), Karlsruher Institut für Technologie (KIT), Hermann-von-Helmholtz-Platz 1, 76344 Eggenstein-Leopoldshafen

Ralf Mikut

Prof. Dr.-Ing. Ralf Mikut ist außerplanmäßiger Professor an der Fakultät für Maschinenbau des KIT und Projektleiter am Institut für Angewandte Informatik (IAI) am Karlsruher Institut für Technologie (KIT). Forschungsschwerpunkte: Computational Intelligence, Data Mining, Biosignalanalyse, Bildverarbeitung, Regelungstechnik, Robotik, Bewegungsanalyse, Modellierung von Energiesystemen.

Institut für Angewandte Informatik (IAI), Karlsruher Institut für Technologie (KIT), Hermann-von-Helmholtz-Platz 1, 76344 Eggenstein-Leopoldshafen

Lutz Gröll

PD Dr.-Ing Lutz Gröll ist Projektleiter am Institut für Angewandte Informatik (IAI) am Karlsruher Institut für Technologie (KIT). Forschungsschwerpunkte: Modellierung verfahrenstechnischer Anlagen, Parameteridentifikation, Regelungstheorie.

Institut für Angewandte Informatik (IAI), Karlsruher Institut für Technologie (KIT), Hermann-von-Helmholtz-Platz 1, 76344 Eggenstein-Leopoldshafen

Tim Pychynski

Dr.-Ing. Tim Pychynski war Mitarbeiter am Institut für Thermische Strömungsmaschinen (ITS) am Karlsruher Institut für Technologie (KIT) und ist Forschungsingenieur der Robert Bosch GmbH.

Robert Bosch GmbH, Robert-Bosch-Campus 1, 71272 Renningen

Markus Reischl

Dr.-Ing. Markus Reischl ist Projektleiter für das Projekt TELMYOS am Institut für Angewandte Informatik (IAI) am Karlsruher Institut für Technologie (KIT) und Mitglied der Heidelberg Karlsruhe Research Partnership. Hauptarbeitsgebiete: Mensch-Maschine-Schnittstellen, Bildverarbeitung, Bioinformatik, Data-Mining.

Institut für Angewandte Informatik (IAI), Karlsruher Institut für Technologie (KIT), Hermann-von-Helmholtz-Platz 1, 76344 Eggenstein-Leopoldshafen

Erhalten: 2016-11-4
Angenommen: 2017-2-3
Online erschienen: 2017-3-11
Erschienen im Druck: 2017-3-28

©2017 Walter de Gruyter Berlin/Boston

Downloaded on 30.4.2024 from https://www.degruyter.com/document/doi/10.1515/auto-2016-0128/html
Scroll to top button