Συντάχθηκε 08-12-2021 14:30
Τόπος: Με τηλεδιάσκεψη
Σύνδεσμος τηλεδιάσκεψης
Έναρξη: 15/12/2021 10:00
Λήξη: 15/12/2021 11:00
Σχολή Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών
Πρόγραμμα Προπτυχιακών Σπουδών
ΠΑΡΟΥΣΙΑΣΗ ΔΙΠΛΩΜΑΤΙΚΗΣ ΕΡΓΑΣΙΑΣ
ΣΕΙΣΑΚΗ ΕΥΤΥΧΙΑΣ με θέμα: Κατανεμημένη Πολυπαραγοντική Παλινδρόμιση μέσω της Γεωμετρικής Παρακολούθησης
Distributed Multivariate Regression via Functional Geometric Monitoring
Εξεταστική Επιτροπή:
Αναπληρωτής Καθηγητής Βασίλης Σαμολαδάς (επιβλέπων)
Καθηγητής Αντώνιος Δεληγιαννάκης
Αναπληρωτής Καθηγητής Μιχαήλ Λαγουδάκης
Περίληψη:Η Πολυπαραγοντική Γραμμική Παλινδρόμηση είναι μια σημαντική και καθολικά χρησιμοποιούμενη τεχνική που διαμορφώνει και προβλέπει τη συμπεριφορά δεδομένων σε πολλά πεδία. Σε σενάρια όπου τα δεδομένα εξελίσσονται με την πάροδο του χρόνου, είναι απαραίτητο να παρακολουθείται το μοντέλο, προκειμένου να εντοπιστούν πιθανές αλλαγές. Αυτή η κατάσταση γίνεται ακόμα πιο απαιτητική, όταν τα δεδομένα κατανέμονται σε ένα πλήθος από κόμβους και το μοντέλο παλινδρόμησης πρέπει να υπολογιστεί εκ νέου για να αποφευχθεί η ανακρίβεια. Η κεντρικοποίηση δυναμικών δεδομένων καθώς και ο περιοδικός επανυπολογισμός του μοντέλου μπορεί να αποδειχθεί ασύμφορος. Ως εκ τούτου, είναι σημαντική η ανάπτυξη μιας τεχνικής που διατηρεί μια εκτίμηση του μοντέλου με σχετική ακρίβεια πάνω από την ένωση των δεδομένων όλων των κόμβων σε ένα δίκτυο. Προτείνουμε έναν αλγόριθμο παρακολούθησης για μοντέλα πολυπαραγοντικής παλινδρόμησης κατανεμημένων ροών δεδομένων, που βασίζεται στο πρωτόκολλο της Γεωμετρικής Παρακολούθησης, η οποία εγγυάται ένα περιορισμένο σφάλμα μοντέλου και απαιτεί επικοινωνία μόνο όταν το προϋπολογισμένο μοντέλο απέχει αρκετά από το τρέχον. Στόχος μας είναι να συγκρίνουμε εμπειρικά την προτεινόμενη μέθοδο με άλλα υπάρχοντα μοντέλα, προκειμένου να εξετάσουμε αν μπορεί να επιτύχει λιγότερη επικοινωνία, διατηρώντας παράλληλα την επιθυμητή ακρίβεια μοντέλου.
Abstract: Multivariate linear regression is an important and massively used technique for modeling and predicting data behavior in many fields. In scenarios where the data evolves over time, it is essential to monitor the model in order to identify possible changes. This becomes more challenging when the data is distributed at a number of different nodes and the regression model must be recomputed to avoid inaccuracy. In such dynamic settings data centralization and periodic model recomputation can be wasteful. Therefore, the goal is to develop a technique which maintains an accurate estimate of the model over the union of all nodes’ data in a communication-efficient fashion. We propose a monitoring algorithm for multivariate regression models of distributed data streams, based on the core ideas of Functional Geometric Monitoring (FGM), which guarantees a bounded model error and demands communication only when the precomputed model is sufficiently far from the current global. We aim to compare empirically our proposed method with other existing models, in order to examine whether it can achieve less communication, while maintaining the desired model accuracy.
Meeting ID: 988 0044 8394
Password: 508953