Συντάχθηκε 11-12-2020 14:42
Τόπος: Η παρουσίαση θα γίνει με τηλεδιάσκεψη
Σύνδεσμος τηλεδιάσκεψης
Έναρξη: 14/12/2020 17:00
Λήξη: 14/12/2020 18:00
ΠΟΛΥΤΕΧΝΕΙΟ ΚΡΗΤΗΣ
Σχολή Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών
Πρόγραμμα Προπτυχιακών Σπουδών
ΠΑΡΟΥΣΙΑΣΗ ΔΙΠΛΩΜΑΤΙΚΗΣ ΕΡΓΑΣΙΑΣ
ΜΙΧΑΗΛ ΜΑΡΙΟΣ ΑΛΕΞΑΝΔΡΟΣ
θέμα
Βελτιστοποίηση Ανάλυσης Δεδομένων με Χρήση Πολυκριτήριων Μεθόδων Ανάλυσης Αποφάσεων και Μηχανικής Μάθησης
Data Analysis Optimization Using Multi-Criteria Decision Analysis and Machine Learning Methods
Εξεταστική Επιτροπή
Αναπληρωτής Μιχαήλ Λαγουδάκης (επιβλέπων)
Καθηγητής Μιχαήλ Ζερβάκης
Καθηγητής Νικόλαος Ματσατσίνης (Σχολή ΜΠΔ)
Περίληψη
Στον κόσμο των Μεγάλων Δεδομένων (Big Data), όπου ο όγκος αυτών αυξάνεται με ραγδαίους ρυθμούς, το ερευνητικό ενδιαφέρον επικεντρώνεται στην ανακάλυψη και εφαρμογή νέων και πιο αποτελεσματικών μεθόδων ανάλυσης δεδομένων. Στο πλαίσιο αυτό, διερευνώνται μέθοδοι από πολλούς ερευνητικούς χώρους, όπως η επιχειρησιακή έρευνα (βελτιστοποίηση, πολυκριτήρια ανάλυση, κλπ.), καθώς και νέοι τρόποι εφαρμογής αλλά και συνεργασίας μεθόδων, με την ανάπτυξη νέων ταξινομητών (classifiers) ή συνόλων ταξινομητών (ensemble classifiers). Σκοπός της παρούσας διπλωματικής εργασίας είναι να αναπτυχθεί ένα σύστημα που θα υποστηρίζει την εφαρμογή μεθόδων βελτιστοποίησης στην Ανάλυση Μεγάλων Δεδομένων (Big Data Analysis), συνδυάζοντας τις πολυκριτήριες μεθόδους ανάλυσης αποφάσεων TOPSIS, UTASTAR και UTADIS με μεθόδους μηχανικής μάθησης, όπως η k-means. Αρχικά, συγκεντρώθηκαν σύνολα δεδομένων από το διαδίκτυο (αποθετήριο UCI) και εν συνεχεία ακολούθησαν οι φάσεις προ-επεξεργασίας και διαμόρφωσης των τελικών αρχείων δεδομένων. Στα τελικά αρχεία δεδομένων, εφαρμόστηκαν οι αλγόριθμοι που έχουν υλοποιηθεί στο σύστημα, τόσο μεμονωμένα όσο και σε συνδυασμό, με στόχο την υποστήριξη εξαγωγής γνώσης από δεδομένα σε προβλήματα κατάταξης (ranking) και ταξινόμησης / συσταδοποίησης (classification / clustering) δεδομένων. Τέλος, έγινε αξιολόγηση των αποτελεσμάτων εφαρμογής των ανωτέρω μεθόδων με στόχο την εξαγωγή χρήσιμων συμπερασμάτων και προτάσεων για μελλοντική έρευνα.
Abstract
In the Big Data world, where information continuously and rapidly keeps increasing, research interest focuses on the discovery of new and more effective methods for data analysis. On this premise, studies are being conducted and combined from multiple research fields, such as Business Administration (Optimization, Multi-Criteria Aid, etc.), as well as new ways of implementation and collaboration with the development of new classifiers or ensemble classifiers. The purpose of this thesis is to develop a system that supports the application of optimization methods to Big Data Analysis, combining the Multi-Criteria Decision Aid methods TOPSIS, UTASTAR and UTADIS with machine learning methods, such as k-means. First off, various datasets were gathered from open data libraries on the web (UCI repository), followed by the required pre-processing procedures. The methods implemented on the system were applied on these datasets, both individually and in combination, with the purpose of supporting the greater knowledge extraction from data regarding ranking and classification/clustering problems. Lastly, the results of the aforementioned methods were evaluated for greater information gain and future research proposals.
Meeting ID: 88105445780
Password: 349978