ΠΟΛΥΤΕΧΝΕΙΟ ΚΡΗΤΗΣ
Σχολή Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών
Πρόγραμμα Προπτυχιακών Σπουδών
ΠΑΡΟΥΣΙΑΣΗ ΔΙΠΛΩΜΑΤΙΚΗΣ ΕΡΓΑΣΙΑΣ
ΣΠΗΛΙΩΤΗΣ ΓΕΩΡΓΙΟΣ
με θέμα
Εφαρμογή και Αξιολόγηση Μεθόδων Τεχνητής Νοημοσύνης σε Προβλήματα Ιατρικής Διάγνωσης
Application of Artificial Intelligent Methodology in Medical Diagnosis
Τρίτη 24 Απριλίου 2018, 2 μ.μ.
Αίθουσα 137.Π39, Κτίριο Επιστημών, Πολυτεχνειούπολη
Εξεταστική Επιτροπή
Καθηγητής Μιχαήλ Ζερβάκης (επιβλέπων)
Καθηγητής Κωνσταντίνος Καλαϊτζάκης
Δρ. Ελευθερία Σεργάκη
Περίληψη
Η Μαγνητική Τομογραφία (MRI) αποτελεί έναν ευρέως διαδεδομένο, μη-επεμβατικό, τρόπο ιατρικής απεικόνισης που παρέχει ακριβή πληροφορία για τους ανθρώπινους ιστούς, την ανατομία και την παθογένεια. Όταν χρησιμοποιείται για την απεικόνιση του ανθρώπινου εγκεφάλου παρέχει εικόνες υψηλής αντίθεσης, κάτι που βοηθάει στο να ξεχωρίσουμε τους τρεις βασικούς εγκεφαλικούς ιστούς: το εγκεφαλονωτιαίο υγρό (CSF), τη Φαιά ουσία (GM) και την Λευκή ουσία (WM). Αυτή η πληροφορία βοηθάει σημαντικά τους ιατρούς προκειμένου να παρέχουν ακριβέστερη διάγνωση και θεραπεία. Λόγω του απρόβλεπτου σχήματός τους, η κατάτμηση των εγκεφαλικών όγκων με βάση δεδομένα από διαφορετικού τύπου απεικονίσεις, συνιστά ένα από τα πιο απαιτητικά προβλήματα ανάλυσης ιατρικών εικόνων. Η χειροκίνητη εύρεση και κατηγοριοποίηση εγκεφαλικών όγκων από κάποιον ειδικό εξακολουθεί να θεωρείται ως η πλέον αποδεκτή μέθοδος, παρόλο που είναι αρκετά χρονοβόρα, κυρίως λόγω του μεγάλου αριθμού των δεδομένων που περιλαμβάνει και τα οποία πρέπει να αναλυθούν από το χρήστη.
Σε αυτήν την διπλωματική εργασία εξετάζουμε, βελτιώνουμε και συνδυάζουμε συγκεκριμένες βιβλιογραφικές μεθόδους, παρουσιάζοντας τέσσερις νέες μεθοδολογίες Computer-Aided Diagnosis (CAD) για την εύρεση εγκεφαλικών όγκων από MRI, τύπου Τ2, του αξονικού επιπέδου (T2 MRI). Οι μεθοδολογίες αυτές βασίζονται στην προ-επεξεργασία εικόνων και στην κατηγοριοποίησή τους, χρησιμοποιώντας νευρωνικά δίκτυα (NN) ή έναν υβριδικό συνδυασμό νευρωνικών δικτύων και ασαφούς λογικής (ANFIS).
Με σκοπό να συγκρίνουμε τις υπάρχουσες προτεινόμενες μεθόδους της βιβλιογραφίας ως προς την αυτοματοποιημένη κατηγοριοποίηση εγκεφαλικών όγκων, χρησιμοποιούμε ένα μεγάλο αριθμό από Μαγνητικές Τομογραφίες εγκεφαλικών όγκων, στις οποίες η περιοχή του όγκου είναι οριοθετημένη. Αυτές οι εικόνες παρέχονται ελεύθερα από τη βάση δεδομένων Multimodal Brain Tumor Image Segmentation (BRATS) MICCAI 2015.
Οι εικόνες που χρησιμοποιήσαμε για εκπαίδευση και αξιολόγηση αναφέρονται σε ενήλικους, άντρες και γυναίκες, περιλαμβάνοντας 24 υγιείς περιπτώσεις και 202 περιπτώσεις στις οποίες έχει παρατηρηθεί εγκεφαλικός όγκος. Όλες οι εικόνες έχουν εποπτευτεί οπτικά από τον έμπειρο νευροχειρούργο συνεργάτη μας. Οι εικόνες για τις υγιείς περιπτώσεις προμηθεύτηκαν από το Γενικό Νοσοκομείο Χανίων «Αγ. Γεώργιος» και από την βάση δεδομένων του Harvard General Hospital. Τα δεδομένα μας αποτελούνται από 5% υψηλού βαθμού, 82% χαμηλού βαθμού γλοιώματα, 3% μη-υγιείς αλλά μη αναγνωρίσιμες περιπτώσεις και 10% υγιείς περιπτώσεις.
Στο στάδιο της προ-επεξεργασίας εφαρμόζουμε έναν αλγόριθμο απαλοιφής για να απομονώσουμε την περιοχή του εγκεφάλου. Στην συνέχεια, χρησιμοποιούμε ένα υψιπερατό Gaussian φίλτρο για καλύτερη ευκρίνεια και ένα median φίλτρο για απαλοιφή του θορύβου. Στο στάδιο της μετεπεξεργασίας χρησιμοποιούμε το Otsu κατώφλι για κατάτμηση της εικόνας καθώς και μορφολογικούς συντελεστές για τον ορισμό της περιοχής ενδιαφέροντος (ROI).
Στην πρώτη προτεινόμενη μέθοδο, η εξαγωγή χαρακτηριστικών έγινε με τη χρήση Grey-level co-occurrence πίνακα (GLCM) και υπολογίστηκαν 13 στατιστικά χαρακτηριστικά. Στην δεύτερη μέθοδο η εξαγωγή χαρακτηριστικών έγινε με την χρήση Discrete Wavelet Transform (DWT) και ελαχιστοποίηση διαστάσεων με την μέθοδο Principal Components Analysis (PCA). Στην τρίτη μέθοδο οι δύο παραπάνω μέθοδοι συνδυάστηκαν και ο GLCM πίνακας υπολογίστηκε μετά την χρήση DWT, PCA, για την εξαγωγή των στατιστικών χαρακτηριστικών. Στην τελευταία μέθοδο ο Mean-Shift αλγόριθμος εφαρμόζεται για καλύτερα αποτελέσματα κατάτμησης της εικόνας και το στάδιο της εξαγωγής χαρακτηριστικών γίνεται σύμφωνα με την Τρίτη μέθοδο. Τα εξαγόμενα χαρακτηριστικά για κάθε μια από τις τέσσερις μεθόδους επεξεργάζονται από ένα νευρωνικό δίκτυο απλής τροφοδότησης με αλγόριθμο οπισθοδιάδοσης για την εκπαίδευσή του και για τις μεθόδους που περιέχουν GLCM πίνακα με ένα προσαρμοστικό νευρο-ασαφές σύστημα συμπερασμού (ANFIS).
Τα πειραματικά αποτελέσματα των προτεινόμενων μεθόδων επαληθεύτηκαν και αξιολογήθηκαν με βάση ένα σετ εικόνων για αξιολόγηση συγκριτικά με τις τιμές της ευαισθησίας, της ακρίβειας και της συνολικής ορθότητας, με τα καλύτερα αποτελέσματα να πετυχαίνουν 98.8%, 62.5% και 95.6% αντίστοιχα.
Abstract
Magnetic Resonance Imaging (MRI) is a widely used medical imaging modality that provides accurate information about the human tissue, anatomy and pathology, of a non-invasive form. If used to scan a human brain it can provide images of high contrast, therefore distinguishing between the three major brain tissues: Cerebro-Spinal Fluid (CSF), Grey Matter (GM) and White Matter (WM). In this way MRI can greatly assist radiologists and doctors in providing a more precise diagnosis and therapy. Because of their unpredictable appearance and shape, segmenting brain tumors from multi-modal imaging data is one of the most challenging tasks in medical image analysis. Manual detection and classification of brain tumor by an expert is still considered the most acceptable method, but it is too time-consuming, especially because of the large amount of data that have to be analysed manually.
In this thesis we examine, optimize and finally combine specific state-of-the-art methods comprising of four consistent methods for Computer-Aided Diagnosis (CAD) processes for detection of a brain tumor from MRI, of T2 weighted modality, from the axial plane (T2 MRI). The four proposed methodologies are based on image pre-processing and classification by utilizing neural networks (NN) or a hybrid combination of neural networks and fuzzy logic (ANFIS).
In order to gauge the current innovation status in automated brain tumor segmentation and to compare various proposed methods in bibliography, we use a large dataset of brain tumor MR scans, in which the relevant tumor structures have been delineated. These are provided freely from the database Multimodal Brain Tumor Image Segmentation (BRATS) MICCAI 2015.
Our dataset of the training and testing data set, referred to male and female adult persons, includes 24 non-tumorous cases and 202 tumorous cases that all have been segmented visually by our experienced neurosurgeon partner. The healthy MRI scans are from “St. George” general hospital of Chania, Crete and from Harvard General Hospital database. Our data set contains about 5% high-grade, 82% low-grade glioma cases, 3% unhealthy but not recognizable cases and 10% healthy cases.
At the pre-processing stage we apply a skull-stripping algorithm to isolate the brain region. Subsequently, we use a high-pass Gaussian filter for sharpening and a median filter for noise reduction. In post-processing stage, for image segmentation we use Otsu’s threshold as well as we implement morphological operators for region of interest (ROI) definition.
In our first proposed method, feature extraction is made using Grey-level co-occurrence matrix (GLCM) and 13 statistical features are calculated. In the second method, feature extraction is made by using Discrete Wavelet Transform (DWT) and dimensionality reduction is implemented using Principal Components Analysis (PCA). In the third Method, all the above methods are combined and GLCM matrix is applied after the DWT and PCA stages, so to provide the necessary statistical features. In our last method, the Mean-Shift algorithm is implemented at the post-processing stage for better segmentation results and features extraction is made according to the third Method. The features extracted from every proposed CAD method are processed at first with a feed-forward artificial neural network (ANN) with back-propagation training algorithm and then with an adaptive neuro-fuzzy inference system (ANFIS) for the methods with GLCM matrix.
The experimental results of the proposed methods have been validated and evaluated for performance over a testing set of images based on sensitivity, specificity and accuracy with the best results reaching 98.8% sensitivity, 62.5% specificity and 95.6% accuracy.