DataScience Projekt Smart2i

smart2i



Projektübersicht

Anzahl Studierende 1
Art Projekt mit externen Partnern
Projektverantwortung

Prof. Dr. Hans Brandt-Pook
Prof. Dr. Stefan Berlik

Projektkontext

Das Projekt findet in enger Zusammen-arbeit mit der Hymmen GmbH Maschinen- und Anlagenbau statt.
Es ist beabsichtigt, die/den Studierende*n als wissenschaftliche Hilfskraft zu beschäftigen.

Projektdurchführung

Louis Betsch

 

Kurzbeschreibung

smart2i – Industry Intelligence (https://www.smart2i.cloud/), eine Marke des Unternehmens Hymmen GmbH Maschinen- und Anlagenbau aus Bielefeld, greift auf jahrelange Erfahrung und Expertise im Bereich der Verfahrenstechnologie zurück. Produktionsdatenerfassung ist dabei unerlässlicher Bestandteil der gezielten Anlagensteuerung. Mit individuell gestalteten Dashboards, die von jedem Endgerät aus weltweit abrufbar sind, behalten freigeschaltete Nutzer stets den Überblick über ihre Produktion. smart2i hat das Ziel, Engpässe und Schwachstellen in der Produktion gezielt zu identifizieren und zu optimieren.
Im Rahmen des Projekts im Forschungsmaster sollen DataScience-Verfahren im Hinblick auf ihren Nutzen für diese Aufgabe untersucht werden.

Aufgabenstellung

Im Fokus steht der Einsatz von KI für die Analyse, Optimierung und Vorhersage von Signalwerten. Beispielsweise werden Produktionsdaten wie Geschwindigkeit, Druck oder Verbrauchsmengen in Echtzeit sicher, dauerhaft und cloudbasiert gespeichert. Durch den Einsatz von KI-Technologien können diese Daten analysiert und verschiedene KI-Algorithmen eingesetzt werden, um Prozesse zu optimieren und Vorhersagen zu treffen.
Untersuchungsgegenstände können insbesondere sein:

  • Zeitreihenvorhersagen Zeitreihenanalyse ist eine Methode zur Analyse von Daten, die im Laufe der Zeit gesammelt wurden. Sie wird verwendet, um Muster, Trends und Veränderungen in den Daten zu identifizieren und Prognosen für die Zukunft zu erstellen. Wenn Signaldaten im Laufe der Zeit gesammelt werden, können Muster und Trends erkannt und Vorhersagen über zukünftige Signaldaten getroffen werden. In der Industrie wird die Zeitreihenanalyse in vielen Bereichen eingesetzt. Ein Beispiel ist die Vorhersage von Maschinenausfällen. Das Ziel der Zeitreihenanalyse ist es, Erkenntnisse aus den Daten zu gewinnen und Vorhersagen für die Zukunft zu treffen. Durch die Verwendung von Zeitreihenanalysen können Nutzer die Entscheidungsfindung verbessern und wertvolle Einblicke in Trends und Muster gewinnen, die sonst möglicherweise unentdeckt geblieben wären. Die Ermittlung der passenden Algorithmen, Parameter und Vorhersagekriterien ist ein wesentlicher Bestandteil der Entwicklungsarbeit, um die Vorhersagen zu verbessern. Durch die Integration in smart2i können die Algorithmen jederzeit mit echten Daten, verschiedenen Zeiträumen und unterschiedlichsten Signaltypen getestet werden.
  • Anomaly Detection Die Erkennung von Anomalien in Signal-Daten ist ein wichtiger Prozess in vielen Branchen. Von der Überwachung von industriellen Prozessen bis hin zur Erkennung von Cyberangriffen gibt es zahlreiche Anwendungsfälle. Anomalien können als Abweichungen von normalen Mustern oder Trends in den Daten definiert werden und können ein Indikator für potenzielle Probleme oder Bedrohungen sein. Das Ziel der Anomalieerkennung in Signal-Daten ist es, Abweichungen von normalen Mustern zu identifizieren und mögliche Probleme oder Bedrohungen frühzeitig zu erkennen. Durch die Verwendung von Anomalieerkennung können Unternehmen oder Organisationen schneller auf potenzielle Probleme reagieren und effektiver handeln, um negative Auswirkungen zu minimieren.
  • One dimesional pattern detection Die eindimensionale Mustererkennung ist ein leistungsfähiges Werkzeug für die Analyse von Daten und die Identifizierung von Mustern und Trends, die in einer Vielzahl von Bereichen wertvolle Erkenntnisse liefern können. Sie bezieht sich auf Daten, die in einer einzigen Dimension angeordnet sind, z. B. in einer Zeitreihe. Die Erkennung von eindimensionalen Mustern kann Trends in Daten erkennen wie z. B. saisonale Schwankungen, zyklische Trends oder abrupte Veränderungen in den Daten. In smart2i kann die eindimensionale Mustererkennung verwendet werden, um Zustände und Trends in Daten von Produktionssystemen, wie z. B. Temperatur, Luftdruck, Geschwindigkeit, oder sonstige Produktionsparameter zu überwachen. Durch die Analyse der Daten können Nutzer potenzielle Probleme erkennen und Lösungsstrategien entwickeln.
  • Multidimensional dimensional pattern detection Die multidimensionale Erkennung bezieht sich auf den Prozess der Identifizierung von Mustern oder Trends in Daten, die in mehreren Dimensionen angeordnet sind. Im Gegensatz zur eindimensionalen Mustererkennung, die sich auf Daten konzentriert, die in einer einzigen Dimension angeordnet sind, berücksichtigt die multidimensionale Erkennung Daten, die in zwei oder mehr Dimensionen angeordnet sind. Die mehrdimensionale Erkennung kann mit verschiedenen statistischen Verfahren durchgeführt werden, z. B. Clusteranalyse, Hauptkomponentenanalyse und Data Mining. Mit diesen Techniken lassen sich Muster und Beziehungen zwischen den Signalen in den Daten erkennen, die wertvolle Einblicke in komplexe Systeme geben können. In Kombination mit der umfangreichen Datenbasis von smart2i lassen sich so neu und ggf. auch unerwartete Zusammenhänge in den Produktionsprozessen ermitteln.

 

Verfügbare Ressourcen

Smart2i bietet eine attraktive Arbeitsumgebung und eine intensive Begleitung durch das DataScience Team.

 

Projektplan

Erstes Semester: Das Ziel des ersten Semesters ist die Einarbeitung in das Konzept von Dashboards und die dabei eingesetzten ML-Methoden wie Zeitreihenvorhersagen oder Anomaly Detection. Hierfür ist sich in die vorhandene Infrastruktur bei Hymmen einzuarbeiten. Termine in der Produktion und mit dem DataScience Team bei Hymmen unterstützen hierbei. Die bereits aufgenommen Daten sind zu analysieren, um mit der Kenntnis der Anlagen und den Daten einen passgenauen Ansatz zur Anomalie Detektion und für Predictive Maintenance aufstellen zu können. Die Erstellung eines Forschungsexposés ist Prüfungsleistung.
Zweites Semester: Zum Trainieren von ML-Modellen werden große Datenmengen benötigt. Ergänzend zu den bereits vorhandenen Daten sind spezifische Daten der ausgewählten Anlagen aufzunehmen. Hierfür sind Skripte für den Datenfluss von der Maschine in eine NoSQL-Datenbank zu erstellen. Die Umsetzung dieses Workflows soll in Form eines „Short Papers“ als Prüfungsleistung gewertet werden. Idealerweise wird dieses auf einer (internationalen) Konferenz präsentiert
Drittes Semester: Basierend auf den Ergebnissen der ersten beiden Semester soll in diesem Semester eine geeignete maschinelle Lernmethode zur Detektion von Verschleiß oder Anomalien implementiert und in das Dashboard integriert werden. Hierfür sind die vorhandenen Daten speziell für die ausgewählte Methode aufzubereiten. Die Methode ist anschließend bei Hymmen in den vorhandenen Workflow zu integrieren und die Funktionalität zu validieren. Das Erstellen eines Full-Papers, in dem die Ergebnisse des zweiten und dritten Semesters kombiniert werden, ist Prüfungsleistung. Idealerweise wird dieses auf einer (internationalen) Konferenz präsentiert.

Viertes Semester: Die Masterarbeit knüpft thematisch an den vorherigen drei Semestern an. Der / Die Studierende kann den Fokus je nach Projektablauf und Interesse mehr auf die reale Anwendung setzen oder mehr theoretisch vertiefen: Beim Fokus auf die industrielle Anwendung sind mögliche Themen das Übertragen der Methoden auf weitere Anlagen, das Durchführen umfangreicher Benchmarks, das Durchführen von Anwenderstudien mit den Mitarbeitenden hinsichtlich Bedienbarkeit und Funktionalität. Alternativ kann der Fokus mehr auf wissenschaftliche Aspekte gelegt werden. Hierfür ist einer der zuvor implementierten Algorithmen eigenständig weiterzuentwickeln und zu veröffentlichen. Dies könnte den ersten eigenen Schritt in Richtung Promotion darstellen. Unabhängig vom Fokus sollten beide Aspekte einen Mindestanteil von 20% haben. Die Prüfungsleistung ist die Masterarbeit.

 

Eignungskriterien

Zwingend: Bachelor in einem MINT Studiengang oder der Wirtschaftsinformatik, Kenntnisse in mindestens einer Programmiersprache, erste Erfahrungen im Bereich Machine Learning und Statistik
Optional: Maschinenbauliche Expertise, Kenntnisse in Web-Technologien und zu Dashboards, Erfahrungen in der Forschung & Entwicklung mit Industriepartnern



Erwerbbare Kompetenzen

Umfassende Erfahrungen in der praktischen Anwendung der im Studiengang behandelten Data Science Konzepte, Durchführung eines eigenen und umfangreichen Projektes, wissenschaftliches Arbeiten in einem Forschungsteam sowie die Teilnahme an Konferenzen mit Präsentation der eigenen Forschungsergebnisse.