Skip to content
Licensed Unlicensed Requires Authentication Published by De Gruyter (O) January 20, 2016

Automatische Identifikation und Selektion von untypischen Daten

Ein Beitrag zur Identifikation von untypischen Daten zur Trainingsdatenoptimierung für Support-Vektor-Maschinen am Beispiel von EEG-Daten

Automatic identification and selection of atypical data
A contribution to the identification of atypical data in training data optimization for support vector machines using the example of EEG data
  • Maria Trommer

    Dipl.-Ing. (FH) Maria Trommer ist wissenschaftliche Mitarbeiterin in der Forschungsgruppe Eingebettete Diagnosesysteme der Hochschule Schmalkalden. Hauptarbeitsgebiet: Einsatz lernfähiger Verfahren zur Klassifikation von biologischen Daten.

    Forschungsgruppe Eingebettete Diagnosesysteme, Hochschule Schmalkalden, Blechhammer 4–9, 98574 Schmalkalden

    EMAIL logo
    and Andreas Wenzel

    Prof. Dr.-Ing. Andreas Wenzel ist Professor an der HS-Schmalkalden und Leiter der Forschungsgruppe Eingebettete Diagnosesysteme. Er ist weiterhin als Leiter der Arbeitsgruppe Eingebettete Systeme am Fraunhofer Institutsteil Angewandte Systemtechnik IOSB-AST in Ilmenau tätig. Hauptarbeitsgebiet: Entwicklung von Diagnose-, Vorhersage- und Klassifikationsverfahren und deren Umsetzung in Eingebetteten Systemen.

    Forschungsgruppe Eingebettete Diagnosesysteme, Hochschule Schmalkalden, Blechhammer 4–9, 98574 Schmalkalden; Gruppe Eingebettete Systeme, Institutsteil Angewandte Systemtechnik AST des Fraunhofer IOSB, Am Vogelherd 50, 98693 Ilmenau

Zusammenfassung

Der Dichte-Lage Datenfilter, kurz DiLa-Filter, ist als neuartiger Datenbearbeitungsalgorithmus für die Klassifikation von Elektroenzephalogramm (EEG)-Daten durch Support-Vektor-Maschinen (SVM) entwickelt worden, aber auch für eine Vielzahl anderer Problemstellungen anwendbar. Der neuartige Algorithmus wird dazu eingesetzt, untypische Datensätze aus der Trainingsdatenmenge einer SVM zu entfernen und hierdurch die Generalisierungsfähigkeit der resultierenden Klassifikatoren deutlich zu steigern. Untersuchungen an realen EEG-Daten belegen die Verbesserung der Modelle durch die mittels DiLa-Filter modifizierten Trainingsdaten.

Abstract

The Density-Distance data filter is developed as data processing algorithm for classification of EEG-data with Support Vector Machine (SVM) but is also usable for many other applications. The novel algorithm is used to delete untypical data from training dataset of SVM and thus increasing generalization ability of resulting models essentially. Studies with real EEG-data evidence an improvement of SVM models by processed training data with Density-Distance data filter.

Über die Autoren

Maria Trommer

Dipl.-Ing. (FH) Maria Trommer ist wissenschaftliche Mitarbeiterin in der Forschungsgruppe Eingebettete Diagnosesysteme der Hochschule Schmalkalden. Hauptarbeitsgebiet: Einsatz lernfähiger Verfahren zur Klassifikation von biologischen Daten.

Forschungsgruppe Eingebettete Diagnosesysteme, Hochschule Schmalkalden, Blechhammer 4–9, 98574 Schmalkalden

Andreas Wenzel

Prof. Dr.-Ing. Andreas Wenzel ist Professor an der HS-Schmalkalden und Leiter der Forschungsgruppe Eingebettete Diagnosesysteme. Er ist weiterhin als Leiter der Arbeitsgruppe Eingebettete Systeme am Fraunhofer Institutsteil Angewandte Systemtechnik IOSB-AST in Ilmenau tätig. Hauptarbeitsgebiet: Entwicklung von Diagnose-, Vorhersage- und Klassifikationsverfahren und deren Umsetzung in Eingebetteten Systemen.

Forschungsgruppe Eingebettete Diagnosesysteme, Hochschule Schmalkalden, Blechhammer 4–9, 98574 Schmalkalden; Gruppe Eingebettete Systeme, Institutsteil Angewandte Systemtechnik AST des Fraunhofer IOSB, Am Vogelherd 50, 98693 Ilmenau

Erhalten: 2014-12-12
Angenommen: 2015-10-21
Online erschienen: 2016-1-20
Erschienen im Druck: 2016-1-28

©2016 Walter de Gruyter Berlin/Boston

Downloaded on 25.4.2024 from https://www.degruyter.com/document/doi/10.1515/auto-2015-0003/html
Scroll to top button