Συντάχθηκε 29-05-2020 10:48
Τόπος: Η παρουσίαση θα γίνει με τηλεδιάσκεψη
Σύνδεσμος τηλεδιάσκεψης
Έναρξη: 02/06/2020 13:00
Λήξη: 02/06/2020 14:00
ΠΟΛΥΤΕΧΝΕΙΟ ΚΡΗΤΗΣ
Σχολή Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών
ΠΑΡΟΥΣΙΑΣΗ ΔΙΠΛΩΜΑΤΙΚΗΣ ΕΡΓΑΣΙΑΣ
ΘΕΟΔΩΡΟΣ ΠΑΠΑΔΟΜΑΝΩΛΑΚΗΣ
θέμα
Διάγνωση Όγκου Εγκεφάλου από MRI, Δεδομένα του Ασθενούς και Αλγόριθμους Μηχανικής Μάθησης
Head Tumor Diagnostics Using MRI, Patient’s Pathology Data and Machine Learning Algorithms
Εξεταστική Επιτροπή
Καθηγητής Μιχαήλ Ζερβάκης (επιβλέπων)
Καθηγητής Γεώργιος Σταυρακάκης
Δρ. Ελευθερία Σεργάκη
Περίληψη
Υπόβαθρο και στόχοι της μελέτης: Η μαγνητική τομογραφία (MRI) του εγκεφάλου μαζί με τα δεδομένα παθολογίας των ασθενών μπορούν να βοηθήσουν σε μεγάλο βαθμό τους ακτινολόγους και τους γιατρούς στην παροχή ακριβέστερης διάγνωσης και θεραπείας. Λόγω της απρόβλεπτης εμφάνισης και του σχήματος τους, η κατάτμηση των όγκων του εγκεφάλου από δεδομένα πολλαπλών τρόπων απεικόνισης είναι ένα από τα πιο δύσκολα καθήκοντα στην ανάλυση ιατρικής εικόνας. Η χειροκίνητη ανίχνευση και ταξινόμηση του όγκου του εγκεφάλου από έναν ειδικό θεωρείται ακόμη η πιο αποδεκτή μέθοδος, αλλά είναι πολύ χρονοβόρα, ειδικά λόγω του μεγάλου όγκου δεδομένων που πρέπει να αναλυθούν χειροκίνητα. Ο σκοπός της παρούσας μελέτης είναι να εκπαιδεύσει και να αξιολογήσει αλγόριθμους τεχνητής νοημοσύνης, δηλαδή μηχανική μάθηση (Machine Learning) όπως Support Vector Machine (SVM) και αλγόριθμους νευρωνικών δικτύων όπως αλγόριθμοι CNN, για να ταξινομήσει τις εικόνες μαγνητικής τομογραφίας εγκεφάλων μεταξύ υγιών και μη υγιών.
Μέθοδοι: Το σύνολο των εικόνων που χρησιμοποιείται αναφέρονται σε ενήλικους, άντρες και γυναίκες, περιλαμβάνοντας 291 περιπτώσεις από τις οποίες 81 υγιείς και 210 που έχει παρατηρηθεί εγκεφαλικός όγκος. Όλες οι εικόνες έχουν εποπτευθεί οπτικά από τον νευροχειρούργο συνεργάτη μας Δρ. Κρασουδάκη. Οι υγιείς μαγνητικές τομογραφίες παρέχονται από το Γενικό Νοσοκομείο Χανίων «Άγιος Γεώργιος» και οι μη υγιείς παρέχονται από το Multimodal Image Segmentation Challenge (BRATS). Όλες οι εικόνες μαγνητικής τομογραφίας είναι τύπου Τ2, του αξονικού επιπέδου (T2 MRI). Το παραπάνω σύνολο δεδομένων χωρίζεται σε υποσύνολα. Το υποσύνολο που χρησιμοποιείται για την εκπαίδευση των αλγορίθμων αποτελείται από 191 μη υγιείς/66 υγιείς περιπτώσεις, και το υποσύνολο για την αξιολόγηση των αλγορίθμων αποτελείται από 19 μη υγιείς/15 υγιείς περιπτώσεις (56%/44%). Πολλά διαφορετικά σενάρια με διάφορες μεθοδολογίες αναπτύχθηκαν σε αυτην την εργασία. Το κάθε ένα περιέχει συνδυασμούς αλγορίθμων τεχνητής νοημοσύνης, χρησιμοποιώντας διάφορα είδη χαρακτηριστικών και διάφορα μεγέθη συνόλων δεδομένων σαν είσοδο, π.χ ισορροπημένα ή μη ισορροπημένα σύνολα (74% μη υγιής/26% υγιής περιπτώσεις). Επίσης αναπτύχθηκαν διάφορες τεχνικές εκπαίδευσης των αλγορίθμων. Μετρήσεις απόδοσης όπως η ακρίβεια και η ευαισθησία υπολογίζονται για την αξιολόγηση της αποτελεσματικότητας των μεθόδων που αναπτύξαμε. Στο υποσύνολο εκπαίδευσης των αλγορίθμων εφαρμόστηκε Standardization και 10-fold split για grid search χρησιμοποιώντας cross-validation. Το ισορροπημένο σύνολο δεδομένων περιέχει 66 υγιείς και 66 μη υγιής περιπτώσεις ενώ το μη ισορροπημένο σύνολο δεδομένων περιέχει 191 μη υγιείς και 66 υγιείς περιπτώσεις. Η εκπαίδευση των αλγορίθμων πραγματοποιήθηκε χρησιμοποιώντας τις gray scale τιμές των pixel ολόκληρων των εικόνωνς ως είσοδο, χρησιμοποιώντας επίσης τους συντελεστές του discrete wavelet transform τριών επιπέδων ολόκληρων των εικόνων και εναλακτικά χρησιμοποιώντας την τιμή wavelet entropy που υπολογίστηκε από τους συντελεστές του discrete wavelet transform τριών επιπέδων, ολόκληρης της εικόνας (και των τεταρτημορίων που διαιρείται η εικόνα). Σε όλες τις περιπτώσεις η εκπαίδευση των αλγορίθμων πραγματοποιήθηκε με ή χωρίς την εφαρμογή principal components analysis (προκειμένου να μειωθεί η διαστασημότητα των συντελεστών σε 15). Στην περίπτωση του ισορροπημένου συνόλου εφαρμόστηκε η τεχνική augmentation, προκειμένου να δημιουργηθεί ένα σύνολο δεδομένων με 400 υγιείς και 400 μη υγιείς περιπτώσεις για την εκπαίδευση του αλγορίθμου CNΝ.
Αποτελέσματα: Ο αλγόριθμος που υλοποιήθηκε με βάση το CNN, εκπαιδεύτηκε από το ισορροπημένο σύνολο δεδομένων, χρησιμοποιώντας τους συντελεστές discrete wavelet transform ολόκληρων των εικόνων, είχε τα καλύτερα αποτελέσματα με τιμές: 100% Sensitivity, 97% Accuracy, 93% Specificity, 95% Precision, 0% FNR and 6% FPR. Ο αλγόριθμος που υλοποιήθηκε με βάση το SVM, εκπαιδεύτηκε από το ισορροπημένο σύνολο δεδομένων, χρησιμοποιώντας τις τιμές των pixel ολόκληρων των εικόνων ως είσοδο είχε τα επόμενα καλύτερα αποτελέσματα με τιμές: 100% Sensitivity, 91% Accuracy, 80% Specificity, 86% Precision, 0% FNR and 20% FPR. Και στους δύο αλγόριθμους, δεν εφαρμόζεται η τεχνική PCA. Επιπλέον, παρατηρείται ότι για το σενάριο όπου η εκπαίδευση υλοποιήθηκε χρησιμοποιώντας το μη ισορροπημένο σύνολο δεδομένων, τα χαρακτηριστικά που εξήχθησαν από τις εικόνες διαιρεμένες σε τέταρτα παρείχαν καλύτερα αποτελέσματα από αυτά που εξήχθησαν ολόκληρης της εικόνας.
Abstract
Background and study aims: Magnetic Resonance Imaging (MRI) of the brain along with patients’ pathology data can greatly assist radiologists and doctors in providing a more precise diagnosis and therapy. Because of their unpredictable appearance and shape, segmenting brain tumors from multi-modal imaging data is one of the most challenging tasks in medical image analysis. Manual detection and classification of brain tumor by an expert is still considered the most acceptable method, but it is too time-consuming, especially because of the large amount of data that have to be analyzed manually. The purpose of the present study is to train and validate AI algorithms, i.e. Machine Learning (ML) such as Support Vector Machine (SVM) and deep learning algorithms such as CNN algorithms, to classify MRI images of brains between non tumorous and tumorous.
Materials and methods: The image dataset selected contains total 291 male and female adult persons, from which 210 tumorous and 81 non-tumorous cases that a neurosurgeon partner, has segmented all visually. The healthy MRI scans are provided by “St. George” general hospital of Chania, Greece and the unhealthy MRI scans are provided from the Multimodal Image Segmentation Challenge (BRATS). All the MRI images are T2 weighted, from the axial plane. The above dataset divided into subsets. The training sub dataset amounts to 191 tumorous/66 non tumorous cases, and the validation sub dataset which amounts to 19 tumorous/15 non-tumorous cases (56%/44%). Many different scenarios of different methodologies, each one including combination of AI algorithms, using different kind of features as input, and different size of data sets, i.e. balanced or unbalanced data set (74% tumorous/26% non-tumorous), and different training techniques, were implemented in this thesis. Performance metrics such as accuracy, sensitivity and specificity are computed to evaluate the effectiveness of each implemented methodology. Standardization of the training set and 10-fold split for grid search using cross-validation was applied. The balanced dataset amounts to 66 tumorous and 66 non tumorous cases. The unbalanced set amounts to 191 tumorous /non tumorous 66 cases. Training implemented using the gray scale pixel values of the raw whole images as data features values, also using three-level discrete wavelet transform coefficients of the raw whole images and alternatively using the measure of wavelet entropy calculated from three-level discrete wavelet transform coefficients of each whole row image (and of the quarters in which the image is divided). In all cases training implemented with or without applying Principal Component Analysis (in order to reduce the dimensionality of coefficients to 15). The augmentation technique was applied in the case of balanced dataset, in order to generate dataset of 400 tumorous images and 400 non tumorous images, for training the CNN algorithm.
Results: Τhe implemented algorithm based on CNN, trained by balanced dataset, using the discrete wavelet transform coefficients of the whole row images, provided the highest scores: 100% Sensitivity, 97% Accuracy, 93% Specificity, 95% Precision, 0% FNR and 6% FPR and the algorithm implemented based on SVM, trained by balanced dataset, using the pixel values of row whole images as features provided the second highest scores: 100% Sensitivity, 91% Accuracy, 80% Specificity, 86% Precision, 0% FNR and 20% FPR. In both algorithms, no PCA technic is applied. Moreover, it is observed that for the scenario where the training implemented using unbalanced dataset, the features extracted of the images divided in quarters provided better results than that extracted of the whole image.
Τηλεδιάσκεψη στο ZOOM:
https://tuc-gr.zoom.us/j/99286042785?pwd=dGxHVGlqS0lxTlBocnRBTlZxL1M0Zz09
ID 992 8604 2785