Navigation: Teaching / Previous Semesters
Wednesday, 2017-03-29

Software Praktika

Im Sommersemester 2011 werden am Lehrstuhl für Datenbanksysteme eine Reihe von Praktika (anfänger und fortgeschritten) angeboten. Die Themen umfassen die Bereiche Daten-Management, Daten-Strukturen und Data Mining (siehe unten). Die Praktika sollen im Laufe des Semester bearbeitet werden. In der zweiten Vorlesungswoche gibt es einen zentralen Termin, an dem die Themen vorgestellt werden. Zum Ende des Semesters gibt es einen Termin an dem die Studenten ihre Projekte vorstellen.

Zeit und Ort der Einführungsveranstaltung: Montag 18.04.: 18 Uhr, INF 348, R015

Teilnehmer: Informatik-Studierende in Haupt- oder Nebenfach.

Weitere Informationen: Christian Sengstock (sengstock@informatik.uni-heidelberg.de), Prof. Dr. Michael Gertz (gertz@informatik.uni-heidelberg.de)

 

Themen Anfänger Praktika:

  • Hör' wer zwitschert denn dar - Aufbau eines Workflows zur Aufzeichnung und Analyse von Tweets
    Es sollen zeitliche, aber auch räumliche Informationen aus den geposteten Twitter Nachrichten extrahiert werden.

  • Quantitative Analyse von Raum-Zeit Informationen in Tweets
    In diesem Praktikum soll ein Analysewerkzeug für einen Twitterdatenstrom entwickelt werden. 

  • Entwicklung eines Regelsets für einen Temporal Tagger
    In diesem Praktikum soll für ein an unserem Lehrstuhl entwickeltes System ein neues Regelset entwickelt werden. 

Themen Forgeschrittenen Praktika:

  • Finden lokaler Bursts in georeferenzierten Datenströmen
    In dieses Praktikum soll eine Methode implementiert werden, die dem lokale Bursts in einem georeferenzierten Datenstrom erkannt werden.

  • Indexierung von Trajektorien in Strassennetzwerken
    In diesem Praktikum soll eine Indexstruktur implementiert werden, in der die Trajektorien von sich bewegenden Objekten verwaltet werden.

  • Erstellung einer Web-GUI für einen Temporal Tagger
    Für ein am Lehrstuhl entwickeltes System, das in Textdokumenten temporale Ausdrücke erkennt, soll eine Web-GUI programmiert werden.

  • Analyse von wissenschaftlicher Daten (Vektorfelder)
    Vektorfelder stellen in der Modellierung und Simulation die wichtigste Darstellung der berechneten Ergebnisse dar. Basierend auf bekannte Theorem sollen einfache Vektorfelder analysiert werden: Hodge-Helmholtz-Zerlegung, Morse-Zerlegung mit stationären Orbits bzw. Punkten. Kenntnisse der Grundvorlesungen in Mathematik sind mehr als ausreichend, da der Schwerpunkt auf der Implementierung liegt.

  • Query auto-completion (a la Google Suggest) auf Basis von Lucene
    Aufbauend auf einer bestehenden Query Suggestion Engine (TRIE-basiert) soll eine Erweiterung auf Basis von Lucene entwickelt werden. Diese Technik entspricht einem Ansatz, der auf der diesjährigen WWW-Konferenz vorgestellt wurde. Die Implementierung kann mit einem Query Logfile von AOL getestet werden.

  • Data Mining mit Hadoop
    Hadoop ist eine freie Implementierung von Map Reduce. Dieses Programmiermodel erlaubt es große Datenmengen parallel zu verarbeiten und ist in der Industrie weit verbreitet (Google, Yahoo, Facebook, Amazon). Auf Basis der Machine Learning Hadoop-Bibliothek ``Mahout'' soll ein Map Reduce Job implementiert werden, der ``Themen'' (Topics) in Flickr-Tags findet. Die Data Mining Grundlagen sind simpel und werden im Rahmen des Praktikums ausführlich erklärt, Vorwissen oder der Willen zur Einarbeitung in Map Reduce/Hadoop sind Vorraussetzung.

 

 

 

 

Letzte Änderung: 08.04.2011