Anmelden

Fachgebiet Data Science

Skip Navigation LinksTHUDEorgIFIFachgebiet Data Science

Institut für Informatik

Fachgebiet Data Science

Banner Data Science.png

Das Fachgebiet Data Science des Instituts für Informatik beschäftigt sich mit der Extraktion von Erkenntnissen aus großen und komplexen Datenmengen. Die Ausgangsbasis hierfür ist die Verarbeitung und Speicherung von Daten mittels relationaler Datenbanksysteme sowie die Verwendung von neuen, hoch-verteilten Technologien (NoSQL-Datenbanken und Hadoop).

Durch Data Engineering werden die oft heterogenen Daten in eine verwertbare Form gebracht, die es erlaubt, Informationen und Erkenntnisse mittels fortgeschrittener analytischer Methoden (Analytics) zu gewinnen. Dabei werden neben klassischen Ad-hoc Analysen auch statistische Verfahren sowie intelligente Algorithmen verwendet (Data Mining). Eine besondere Herausforderung ist hierbei die Notwendigkeit der verteilten Verarbeitung aufgrund der großen Datenmengen mit geeigneten Software-Tools im Clusterverbund. Zusätzlich werden auf oberster Ebene im Fachgebiet Data Science auch noch Methoden der künstlichen Intelligenz eingesetzt (Maschinelles Lernen), um beispielsweise Vorhersagen zu erstellen. Unternehmen bekommen so die Möglichkeit, objektive und datengestützte Entscheidungen zu treffen.

Im Fachgebiet Data Science arbeiten Professoren und Mitarbeiter mit diesen Technologien in unterschiedlichen Anwendungsgebieten: Medizin, Energiewirtschaft und Business Intelligence.

Kompetenzschwerpunkte

  • Relationale Datenbanken
  • NoSQL Datenbanken
  • Analytics
  • Data Mining
  • Maschinelles Lernen
  • Statistik

Lehrveranstaltungen

Durch das Fachgebiet werden u.a. folgende Lehrveranstaltungen unterstützt: Datenbanken, Inferenzstatistik, Biostatistische Verfahren, NoSQL, Data Warehousing, Database Programming, Data Science mit Python und R, Health Data Analytics, Analytics for Energy Data

Ausstattung

  • Seminarraum mit 20 Workstations
  • Projektraum für Data-Science-Projekte mit 12 Arbeitsplätzen
  • Zahlreiche Softwarepakete zur Datenmodellierung und Verwaltung in den PC-Pools
  • Data-Science-Cluster (im Aufbau) mit 12 Rechenknoten für verteilte Datenbanken und Analytics (z.B. Hadoop)

Ansprechpartner

Quicklinks