Das Projekt besteht aus zwei größeren Zielen: Zum einen dient ein zusammenfassender Score des allgemeinen Gesundheitszustands als Indikator für den Bedarf und Optimierungserfolg ambulanter Pflege. Zum anderen ermöglicht die Datenerweiterung in Bezug auf das Reallabor die anschließende Anwendung maschineller Lernverfahren zur Vorhersage von Pflegebedarfen/-notfällen. Außerdem wird zum Aufbau der Care-Dateninfrastruktur beigetragen. Daher umfasst das Aufgabenspektrum die folgenden Bereiche:
- Datenvorverarbeitung und Katalogisierung der Daten.
- Evaluation der Datenquellen als Grundlage für die Bildung eines Gesundheits-Scores zur Bewertung der Gesamtsituation einer Proband*in unter Positive Health Aspekten.
- Erweiterung des vorhandenen Datensatzes zur Vorhersage von Pflegebedarfen und -notfällen.
- Umsetzung einer KI zur Vorhersage von Pflegebedarfen
Bezug zum Thema Data Science
Die Arbeit ist eng an den Aufbau einer Dateninfrastruktur angebunden. Daher werden die Teilbereiche der Vorverarbeitung und der Archivierung/Strukturierung von Datensätzen behandelt. Bei der Datenverarbeitung spielt die Bewertung der Datenquellen zur Bestimmung der Gesundheit eine große Rolle. Um maschinelle Lernverfahren, die auf Big Data angewiesen sind, im Reallabor anwenden zu können, steht Data Augmentation im Mittelpunkt. Zuletzt werden Lernverfahren aus der Predictive Maintenance auf die erhaltenen Datensätze angewandt.
Verfügbare Ressourcen
Für die rechenintensiven Anteile des Projekts stehen die Infrastruktur des CfADS, insbesondere des Data-Analytics-Cluster, zur Verfügung. Die Datengrundlagen bilden Erhebungen im Reallabor Geriatrie des TransCareTech Forschungsprojektes.
Projektplan
Erstes Semester: Einarbeitung in die Infrastruktur des CfADS, Analyse der im Zusammenhang mit dem Reallabor Geriatrie anfallenden Daten, Literaturrecherche zur Bewertung von ganzheitlichen Gesundheitsaspekten, insbesondere des Positive Health Ansatzes, und zum Thema „Predictive Maintenance“, Überblick über domänenspezifische Datensätze.
Zweites Semester:
Vorverarbeitung der Daten des Reallabors und Einbindung in die Care-Dateninfrastruktur, Einarbeitung in das Thema Data Augmentation.
Drittes Semester: Augmentieren der Daten des Reallabors, Herausstellung entscheidender Charakteristika von Pflegebedarfen und Generierung synthetischer Daten, Berechnung eines wochengenauen Gesundheits-Scores.
Viertes Semester: Umsetzung der Vorhersagen (hinsichtlich Versorgungsbedarfe/akuter -notfälle) und Evaluation in dem Reallabor Geriatrie, Vergleich mit dem State-Of-The-Art und Potentialanalyse.
Eignungskriterien
Zwingend:
- Programmierkenntnisse in mindestens einer objektorientierten Sprache
- Englischkenntnisse zur Lektüre englischsprachiger Veröffentlichungen
- Teamfähigkeit
Optional:
- Programmierkenntnisse in Python
- Grundkenntnisse in Hadoop
- Grundkenntnisse in HBase
Erwerbbare Kompetenzen
Der/die Studierende ist nach Abschluss des Projekts in der Lage,
- ML-basierte Verfahren auf großen Datensätzen anzuwenden.
- Datensätze künstlich zu erweitern, um Big Data Methoden in Bereichen mit Sparse Data zu benutzen.
- ML-Verfahren auf sequenziellen Datensätzen anzuwenden.
- wissenschaftliche Publikationen zu verfassen.
- die eigenen Ergebnisse vor einem Fachpublikum zu präsentieren.
- im Team zusammenzuarbeiten und fachbereichsübergreifend zu kommunizieren.