Συντάχθηκε 02-10-2024 12:04
Τόπος:
Σύνδεσμος τηλεδιάσκεψης
Έναρξη: 07/10/2024 16:00
Λήξη: 07/10/2024 17:00
ΠΟΛΥΤΕΧΝΕΙΟ ΚΡΗΤΗΣ
Σχολή Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών
Πρόγραμμα Προπτυχιακών Σπουδών
ΠΑΡΟΥΣΙΑΣΗ ΔΙΠΛΩΜΑΤΙΚΗΣ ΕΡΓΑΣΙΑΣ
Ιωάννη Λαμπρινίδη
με θέμα
Σύστημα Κατανεμημένης Μηχανικής Μάθησης στην Πλατφόρμα Akka
Distributed Machine Learning Framework on Akka
Εξεταστική Επιτροπή
Αναπληρωτής Καθηγητής Βασίλειος Σαμολαδάς (επιβλέπων)
Καθηγητής Αντώνιος Δεληγιαννάκης
Επίκουρος Καθηγητής Νικόλαος Γιατράκος
Περίληψη
Η αυξανόμενη διάδοση των εφαρμογών που βασίζονται στα δεδομένα έχει οδηγήσει σε αυξανόμενη ζήτηση για αποτελεσματικούς και κλιμακωτούς αλγόριθμους μηχανικής μάθησης. Αυτή η διατριβή εμβαθύνει στο σχεδιασμό και την υλοποίηση ενός κατανεμημένου πυρήνα επικοινωνίας στο Akka για το σύστημα Online Machine Learning and Data Mining (OMLDM), ένα σύστημα που υποστηρίζει κατανεμημένη online μάθηση αξιοποιώντας την Parameter Server αρχιτεκτονική, για την ανάπτυξη Online Machine Learning pipelines σε πλατφόρμες ροής. Ο στόχος ήταν η υλοποίηση ενός αποτελεσματικού, κλιμακωτού, ανθεκτικού σε σφάλματα και ισχυρού πυρήνα για το OMLDM, η ανάλυση της επιβάρυνσης απόδοσης του Akka σε σύγκριση με μια τοπική υλοποίηση του πυρήνα του OMLDM που υλοποιήθηκε σε Java Threads και η αξιολόγηση της αύξησης της ταχύτητας απόδοσης που επιτυγχάνει ο πυρήνας σε ένα περιβάλλον cluster. Παρουσιάζεται μέσω πειραμάτων η επιβάρυνση επικοινωνίας που εισάγει το Akka και η απόδοση του πυρήνα σε τοπικά και clustered περιβάλλοντα.
Abstract
The proliferation of data-driven applications has led to a growing demand for efficient and scalable machine learning algorithms. This thesis delves into the design and implementation of a distributed communication kernel in Akka for the Online Machine Learning and Data Mining system(OMLDM), a system that supports distributed online learning by utilizing the Parameter Server paradigm, for effortlessly deploying Online Machine Learning pipelines on streaming platforms. The objective was the implementation of an efficient, scalable, fault tolerant and robust kernel for the OMLDM, to analyze the performance overhead of Akka by comparing it to a local implementation of the OMLDM kernel, that utilizes Java Threads; To evaluate the performance speedup achieved by the kernel in a cluster environment. We demonstrate through experiments the communication overhead of Akka and the performance of the kernel in local and clustered environments.