Συντάχθηκε 09-12-2024 12:09
Ενημερώθηκε:
09-12-2024 12:12
Τόπος:
Σύνδεσμος τηλεδιάσκεψης
Έναρξη: 12/12/2024 09:30
Λήξη: 12/12/2024 10:30
ΠΟΛΥΤΕΧΝΕΙΟ ΚΡΗΤΗΣ
Σχολή Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών
Πρόγραμμα Προπτυχιακών Σπουδών
ΠΑΡΟΥΣΙΑΣΗ ΔΙΠΛΩΜΑΤΙΚΗΣ ΕΡΓΑΣΙΑΣ
Μαρίας – Κωνσταντίνας Γερμανού
με θέμα
Εφαρμογές Μεθόδων Μηχανικής Μάθησης στη Χωρική Ανάλυση Δεδομένων Ψευδαργύρου
Applications of Machine Learning Methods in Spatial Analysis of Zinc Data
Εξεταστική Επιτροπή
Καθ. Διονύσιος Χριστόπουλος (επιβλέπων)
Καθ. Μιχαήλ Λαγουδάκης
Καθ. Εμμανουήλ Βαρουχάκης (Σχολή ΜΗΧΟΠ)
Περίληψη
Η παρούσα διπλωματική εργασία διερευνά την ενσωμάτωση γεωστατιστικών μεθόδων με σύγχρονες τεχνικές μηχανικής μάθησης για τη βελτίωση της χωρικής μοντελοποίησης δεδομένων, με έμφαση στην πρόβλεψη συγκεντρώσεων ψευδαργύρου. Στόχος είναι η αξιολόγηση της αποτελεσματικότητας αυτών των μεθόδων στη βελτίωση των χωρικών προβλέψεων, την ακριβέστερη ποσοτικοποίηση της αβεβαιότητας και την εξαγωγή πολύτιμων πληροφοριών για σύνθετες χωρικές εξαρτήσεις. Οι βασικές μέθοδοι που χρησιμοποιήθηκαν περιλαμβάνουν το Ordinary Kriging (OK), την παλινδρόμηση με Γκαουσσιανές στοχαστικές διαδικασίες, Gaussian Process Regression (GPR), και τους αυτοοργανούμενους χάρτες, Self-Organizing Maps (SOMs). Οι μέθοδοι αυτές επιλέχθηκαν για τις συμπληρωματικές τους δυνατότητες στη χωρική μοντελοποίηση. Το OK αποτελεί μια ισχυρή βασική μεθοδολογία η οποία αξιοποιεί τη μοντελοποίηση βαριογραμμάτων για την αποτύπωση χωρικών συσχετισμών και την παροχή συνεπών και ερμηνεύσιμων προβλέψεων. Ωστόσο, οι υποθέσεις γραμμικότητας περιορίζει την προσαρμοστικότητά της σε δεδομένα με μη γραμμικές ή ετερογενείς χωρικές δομές. Το GPR αποτελεί μια ευέλικτη, μη παραμετρική προσέγγιση, ικανή να μοντελοποιήσει σύνθετες χωρικές σχέσεις. Χρησιμοποιώντας τον εκθετικό ARD πυρήνα, το GPR απέδωσε ανισοτροπικές χωρικές εξαρτήσεις, αποτυπώνοντας τις συσχετίσεις μεταξύ τοποθεσιών ως συνάρτηση της απόστασής τους. Η βελτιστοποίηση των παραμέτρων του πυρήνα μέσω της μεθόδου μεθόδου Μέγιστης Πιθανοφάνειας (MLE) εξασφάλισε αξιόπιστες προβλέψεις σε μη δειγματοληπτημένες τοποθεσίες, με ταυτόχρονη εκτίμηση αβεβαιότητας. Επιπλέον, το SOM προσέθεσε αξία με την τοπική ομαδοποίηση δεδομένων σε νευρωνικούς κόμβους, επιτρέποντας προβλέψεις kriging βασισμένες σε γειτονικές πληροφορίες. Αυτή η προσέγγιση βελτίωσε την ανίχνευση τοπικών ανωμαλιών και λεπτομερών χωρικών μοτίβων, παρόλο που η συνολική ακρίβεια παρέμεινε συγκρίσιμη με εκείνη του OK. Τα αποτελέσματα υπογραμμίζουν ότι οι μέθοδοι OK, GPR και SOM αποτελούν ένα αποτελεσματικό και ευέλικτο πλαίσιο για την ανάλυση χωρικών δεδομένων. Το OK προσφέρει μια αξιόπιστη προσέγγιση για γενική χωρική παρεμβολή, το GPR ενισχύει την ευελιξία για τη μοντελοποίηση μη γραμμικών τάσεων, και το SOM παρέχει τοπικές βελτιώσεις μέσω ομαδοποί¬ησης. Συνδυαστικά, οι μέθοδοι αυτές εξισορροπούν την ακρίβεια προβλέψεων, την ποσοτικοποίηση αβεβαιότητας και την ανάλυση τοπικών μοτίβων, αποτελώντας ένα ολοκληρωμένο εργαλείο για την αντιμετώπιση απαιτητικών προκλήσεων χωρικής μοντελοποίησης. Συμπερασματικά, η διπλωματική αποδεικνύει πως η συνδυαστική χρήση γεωστατιστικών μεθόδων και τεχνικών μηχανικής μάθησης μπορεί να επεκτείνει τα όρια της χωρικής ανάλυσης. Η συνεχής βελτίωση μεθοδολογικών προσεγγίσεων και η βελτιστοποίηση παραμέτρων καθιστούν αυτές τις τεχνικές πιο κατάλληλες για τη λήψη αποφάσεων σε περιβαλλοντική παρακολούθηση και την διαχείριση πόρων. Μελλοντική έρευνα μπορεί να επικεντρωθεί στην περαιτέρω εξέλιξη αυτών των μεθόδων ή στην ανάπτυξη νέων υβριδικών μοντέλων που να ανταποκρίνονται στις αυξανόμενες ανάγκες χωρικής ανάλυσης δεδομένων.
Abstract
This thesis explores the integration of geostatistical methods with advanced machine learning techniques for improving spatial data modeling with emphasis on the prediction of zinc concentration. It also aims to establish the effectiveness of these methods in refining uncertainty quantification and providing insights into complex spatial dependencies. The core methodologies that are employed include Ordinary Kriging (OK), Gaussian Process Regression (GPR), and Self-Organizing Maps (SOMs), selected for their complementary strengths in spatial modeling. OK is a powerful geostatistical baseline that uses variogram modeling to capture spatial correlations, thus providing consistent and interpretable predictions. However, because of the assumptions of linearity it offers limited adaptability for non-linear or heterogeneous spatial structures. GPR introduces a very flexible, non-parametric approach for modeling complex spatial relationships. GPR with an Automatic Relevance Determination Exponential Kernel captures anisotropic spatial dependencies by modeling correlations between locations as a function of their separation distance. The optimized parameters of the kernel through Maximum Likelihood Estimation, ensure accurate predictions of zinc concentrations at unsampled locations and estimates of prediction uncertainty. Moreover, SOMs adds value by providing localized neuron-based data clustering leading to neighborhood-specific kriging predictions and enhancing localized anomaly detection capability (although its overall accuracy is similar to that of OK). These results highlight that OK, GPR, and SOM provide an efficient and flexible framework for analyzing spatial data. The combination of these approaches, harmoniously balances predictive accuracy, uncertainty quantification, and detection of local patterns, thus offering a comprehensive toolkit to address challenging tasks of spatial modeling. In conclusion, this thesis demonstrates how geostatistical techniques in combination with machine learning techniques can push the frontiers of spatial analysis. In addition, refining methodological approaches and optimization of parameters will make such techniques amenable to better decision-making for environmental monitoring and resource management. Future work could also focus on further enhancements of these methods or explore novel hybrid models for answering challenges in spatial data analysis.