Navigation: Teaching / Previous Semesters
Wednesday, 2017-03-29

Ausreißererkennung in großen Datenmengen

Themen

Fast alle großen Datenmengen enthalten neben den erwarteten Datenpunkten auch Ausreißer. Diese können entweder auf Messfehler zurückzuführen sein oder auf eine Besonderheit in dem Prozess hindeuten, durch den die Daten generiert wurden, beispielsweise eine Fehlfunktion der überwachten Maschine. In beiden Fällen ist es wichtig, die Ausreißer in den Daten zu erkennen, ehe eine weitere Verarbeitung stattfinden kann.

In diesem Seminar sollen verschiedene Verfahren vorgestellt werden, mit denen Ausreißer in großen Datenmengen erkannt werden können. Dabei werden wir uns auf verschiedene Anwendungsgebiete beziehen, unter anderem die folgenden:

  • Sensordaten
  • Räumliche und räumlich-zeitliche Daten
  • Hochdimensionale Daten
  • Zeitreihen
  • Stromdaten

Im Seminar werden ausschließlich Verfahren behandelt, die unsupervised arbeiten. Die vorgestellten Verfahren beruhen auf unterschiedlichen Ansätzen, wie beispielsweise:

  • Statistische Ansätze
  • Distanzbasierte Ansätze
  • Dichtebasierte Ansätze

Die Modulbeschreibung der Lehrveranstaltung befindet sich hier.

Zeit und Ort

Donnerstag, 14 - 16 Uhr, INF 348, Raum 13.

Das erste Treffen (die Vorbesprechung mit Themenvorstellung usw.) findet am Donnerstag, den 14. Oktober 2010 um 14 Uhr (c.t.) in INF 348, Raum 13 statt.

Teilnehmerzahl und Anmeldung

Die Teilnehmerzahl für das Seminar ist auf 18 begrenzt. Die Anmeldung erfolgt per eMail an Conny Junghans. Plätze werden nach dem "first come, first serve" Prinzip vergeben. Wenn alle 18 Plätze belegt sind, wird es eine Warteliste geben. Nachdem Sie sich per eMail angemeldet haben, bekommen Sie den Zugangscode für die Seminarwebseite in Moodle zugesandt. Dort können Sie sich die Liste der Themen anschauen, und dann per eMail verbindlich für eines der noch offenen Themen anmelden.

Literatur

Die Literatur zu den einzelnen Themen wird beim ersten Treffen bekannt gegeben und auf der Kursseite in Moodle zur Verfügung stehen.

Schein und Leistungsnachweis

Für die "Erfolgreiche Teilnahme am Seminar Ausreißererkennung in großen Datenmengen" sind folgende Teilleistungen zu erbringen:

  1. Regelmäßige Teilnahme: max 1x unentschuldigtes Fehlen.
  2. Referat: Vor dem Referat ist eine Vorbesprechung obligatorisch (zur Klärung von offenen Fragen und zum Vorstellen des Plans für das Referat). Die endgültigen Folien müssen spätestens drei Tage vor dem Referat eingereicht werden (als pdf). Die Dauer eines Referats beträgt voraussichtlich 30 Minuten + 10 Minuten Diskussion.
  3. Hausarbeit: Die Hausarbeit soll mehr sein als eine reine schriftliche Ausarbeitung des Referats. Sie muss formalen, wissenschaftlichen Standards entsprechen (bzgl. Strukturierung, Referenzen usw.) und die Länge soll 10 - 15 Seiten betragen. Empfohlen wird außerdem eine Vorbesprechung anhand eines Inhaltsverzeichnisses oder Exposés.

Sowohl für das Referat als auch für die Hausarbeit sind folgende Punkte zu beachten:

  • Kein reines Nacherzählen des bearbeiteten Papiers.
  • sondern:
    • Darstellung relevanter Ansätze
    • Gegenüberstellung verschiedener Ansätze
    • Darstellung von Problemen und offenen Fragen
    • eigene Bewertung und Diskussion

Weitere Informationen

Dr. Conny Junghans, conny.junghans(at)informatik.uni-heidelberg(dot)de, INF 348, Raum 12c; Prof. Dr. Michael Gertz, gertz(at)informatik.uni-heidelberg(dot)de, INF 348, Raum 12b. Sprechstunden von Herrn Prof. Gertz und Conny Junghans siehe hier.

 

Letzte Änderung: 23.02.2011