Diese Seite unterstützt Internet Explorer nicht mehr.

Fachgebiet Data Science

THU > Institute > Institut für Informatik > Fachgebiet Data Science

Institut für Informatik

Fachgebiet Data Science

Das Fachgebiet Data Science des Instituts für Informatik beschäftigt sich mit der Extraktion von Erkenntnissen aus großen und komplexen Datenmengen. Die Ausgangsbasis hierfür ist die Verarbeitung und Speicherung von Daten mittels relationaler Datenbanksysteme sowie die Verwendung von neuen, hoch-verteilten Technologien (NoSQL-Datenbanken und Hadoop).

Durch Data Engineering werden die oft heterogenen Daten in eine verwertbare Form gebracht, die es erlaubt, Informationen und Erkenntnisse mittels fortgeschrittener analytischer Methoden (Analytics) zu gewinnen. Dabei werden neben klassischen Ad-hoc Analysen auch statistische Verfahren sowie intelligente Algorithmen verwendet (Data Mining). Eine besondere Herausforderung ist hierbei die Notwendigkeit der verteilten Verarbeitung aufgrund der großen Datenmengen mit geeigneten Software-Tools im Clusterverbund. Zusätzlich werden auf oberster Ebene im Fachgebiet Data Science auch noch Methoden der künstlichen Intelligenz eingesetzt (Maschinelles Lernen), um beispielsweise Vorhersagen zu erstellen. Unternehmen bekommen so die Möglichkeit, objektive und datengestützte Entscheidungen zu treffen.

Im Fachgebiet Data Science arbeiten Professoren und Mitarbeiter mit diesen Technologien in unterschiedlichen Anwendungsgebieten: Medizin, Energiewirtschaft und Business Intelligence.

Kompetenzschwerpunkte

Relationale Datenbanken
NoSQL Datenbanken
Analytics
Data Mining
Maschinelles Lernen
Statistik

Lehrveranstaltungen

Durch das Fachgebiet werden u.a. folgende Lehrveranstaltungen unterstützt: Datenbanken, Inferenzstatistik, Biostatistische Verfahren, NoSQL, Data Warehousing, Database Programming, Data Science mit Python und R, Health Data Analytics, Analytics for Energy Data

Ausstattung

Seminarraum mit 20 Workstations
Projektraum für Data-Science-Projekte mit 12 Arbeitsplätzen
Zahlreiche Softwarepakete zur Datenmodellierung und Verwaltung in den PC-Pools
Data-Science-Cluster (im Aufbau) mit 12 Rechenknoten für verteilte Datenbanken und Analytics (z.B. Hadoop)

Ansprechpartner

Prof. Dr. Markus Goldstein (Maschinelles Lernen, NoSQL-Datenbanken)
Prof. Dr. Voker Herbort (Analytics in der Energiewirtschaft)
Prof. Dr. Klaus Peter Kratzer (Relationale Datenbanksysteme)
Prof. Dr. Reinhold von Schwerin (Data Mining, Analytics)
Prof. Dr. Kathrin Stucke-Straub (Statistik in der Medizin)
Prof. Dr. Manfred Wilhelm (Statistik in der Medizin)

Quicklinks

IT-Dienste ＆ THU-Card

Standorte ＆ Öffnungszeiten

Termine

Wege ins Ausland