Έμβλημα Πολυτεχνείου Κρήτης
Το Πολυτεχνείο Κρήτης στο Facebook  Το Πολυτεχνείο Κρήτης στο Instagram  Το Πολυτεχνείο Κρήτης στο Twitter  Το Πολυτεχνείο Κρήτης στο YouTube   Το Πολυτεχνείο Κρήτης στο Linkedin

Νέα / Ανακοινώσεις / Συζητήσεις

Παρουσίαση Διπλωματικής Εργασίας κ.Τσιχλη Ηλία - Σχολή ΗΜΜΥ

  • Συντάχθηκε 02-04-2021 09:19 Πληροφορίες σύνταξης

    Ενημερώθηκε: -

    Τόπος: Η παρουσίαση θα γίνει με τηλεδιάσκεψη
    Σύνδεσμος τηλεδιάσκεψης
    Έναρξη: 06/04/2021 14:00
    Λήξη: 06/04/2021 15:00

    ΠΟΛΥΤΕΧΝΕΙΟ ΚΡΗΤΗΣ
    Σχολή Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών
    Πρόγραμμα Προπτυχιακών Σπουδών

    ΠΑΡΟΥΣΙΑΣΗ ΔΙΠΛΩΜΑΤΙΚΗΣ ΕΡΓΑΣΙΑΣ
    ΗΛΙΑΣ ΤΣΙΧΛΗΣ

    θέμα
    Τεχνικές Βαθείας Μάθησης για Πολυφασματική Ανάλυση Δορυφορικών Εικόνων
    Deep Learning Techniques for Multispectral Satellite Image Analysis 


    Εξεταστική Επιτροπή
    Αναπληρωτής Καθηγητής Μιχαήλ Λαγουδάκης (επιβλέπων)
    Καθηγητής Μιχαήλ Ζερβάκης
    Αναπληρωτής Καθηγητής Παναγιώτης Παρτσινέβελος (Σχολή ΜΗΧΟΠ)

    Περίληψη
    Στον τομέα της Μηχανικής Μάθησης, η ανάγκη κατανόησης της λειτουργίας των βαθιών νευρωνικών δικτύων γίνεται όλο και πιο σημαντική. Είναι γεγονός ότι η προσοχή των ερευνητών επικεντρώνεται κυρίως στο σύνολο δεδομένων που χρησιμοποιείται κατά τη διάρκεια της εκπαίδευσης νευρωνικών δικτύων, καθώς και στην ποιότητα της εξόδου που παράγουν. Ωστόσο, αυτή η εστίαση δεν έχει χρησιμοποιηθεί ειδικά για την καλύτερη κατανόηση της εσωτερικής λειτουργίας τους. Η έρευνα στην παρούσα διπλωματική εργασία αποσκοπεί στον προσδιορισμό του τρόπου με τον οποίο αυτή η εστίαση μπορεί να βελτιώσει τη γνώση του τρόπου λειτουργίας των βαθιών νευρωνικών δικτύων. Συγκεκριμένα, δίνεται έμφαση στις αρχιτεκτονικές δύο γνωστών και ευρέως χρησιμοποιούμενων νευρωνικών δικτύων, VGG16 και ResNet50. Σε αυτό το πλαίσιο, για να εξετασθεί η υπόθεση ότι τα νευρωνικά δίκτυα μπορούν να γίνουν κατανοητά μακροσκοπικά, η παρούσα εργασία εξετάζει τη δημιουργία ενός κατάλληλου, δυναμικού συνόλου δεδομένων για την εκπαίδευση των δύο δικτύων, αλλά και τον προσδιορισμό των βασικών συσχετισμών που καθορίζουν την απόφαση ταξινόμησης. Συγκεκριμένα, έχει αναπτυχθεί ένα εργαλείο προγραμματισμού που έχει τη δυνατότητα να εξάγει δυναμικά δορυφορικές εικόνες από τη βάση δεδομένων OpenStreetMap για να σχηματίσει σύνολα εκπαίδευσης για το πρόβλημα της σωστής ταξινόμησης εικόνων που περιέχουν στοιχεία ανανεώσιμων πηγών ενέργειας (φωτοβολταϊκά, ανεμογεννήτριες, φράγματα). Επιπλέον, χρησιμοποιήθηκαν θερμικοί χάρτες για να εξηγήσουν τη λειτουργία των νευρωνικών δικτύων που εκπαιδεύτηκαν με αυτά τα σύνολα δεδομένων σε συνδυασμό με μια νέα μετρική απόδοσης, η οποία φαίνεται να είναι κατάλληλη για το σκοπό της βαθύτερης διερεύνησης των ταξινομήσεων νευρωνικών δικτύων. Ένα βασικό εύρημα από αυτήν την εργασία είναι ότι, κατά τη διάρκεια της εκπαίδευσης και της ταξινόμησης, αναπτύσσονται ορισμένοι δόκιμοι ή αδόκιμοι συσχετισμοί μεταξύ των χαρακτηριστικών εισόδου και στόχου. Δίνουμε έμφαση στο κατά πόσον αυτές οι πληροφορίες μπορούν να φανούν χρήσιμες, κατά την επιλογή ενός κατάλληλου ταξινομητή για την επίλυση συγκεκριμένων προβλημάτων. Τα αποτελέσματα αυτής της εργασίας δείχνουν ότι η έρευνα, η εξέλιξη και η επιλογή μιας βαθιάς αρχιτεκτονικής νευρωνικών δικτύων για την επίλυση σύγχρονων προβλημάτων ταξινόμησης είναι επιλογές που μπορούν να καθοδηγηθούν αξιοποιώντας πληροφορίες που εξάγονται σύμφωνα με το προαναφερόμενο βασικό εύρημα.

    Abstract 
    In the field of Machine Learning, the need to understand the operation of deep neural networks is becoming more and more important. It is well established that researchers’ attention focuses mainly on the dataset used during neural network training, as well as on the quality of the output they produce. However, this focus has not been utilized specifically for better understanding of their internal operation. The research in this diploma thesis aims to determine how this focus can improve the knowledge of how deep neural networks operate. Specifically, emphasis is placed on the architectures of two well-known and widely-used neural networks, VGG16 and ResNet50. In this context, to test the hypothesis that neural networks can be understood macroscopically, this thesis examines the creation of an appropriate, dynamic dataset for training the two networks, but also the identification of the key correlations that determine the classification decision. Specifically, a programming tool has been developed that has the ability to dynamically export satellite images from the OpenStreetMap database to form training sets for the problem of correctly classifying images containing elements of renewable energy sources (photovoltaics, wind turbines, dams). Additionally, heatmaps were used to explain the operation of the neural networks trained with these datasets in conjunction with a novel performance metric, which seems to be appropriate for the purpose of a deeper investigation into neural network classifications. A key finding from this work is that, during training and classification, certain proper or improper correlations between input and target characteristics are being developed. Our emphasis is placed on whether this information can be useful, for choosing an appropriate classifier to solve specific problems. The results of this work indicate that research, evolution, and selection of a deep neural network architecture to solve modern classification problems are choices that can be guided using information extracted according to the mentioned key finding.

    Meeting ID: 83820702629
    Password: 723215



© Πολυτεχνείο Κρήτης 2012