Έμβλημα Πολυτεχνείου Κρήτης
Το Πολυτεχνείο Κρήτης στο Facebook  Το Πολυτεχνείο Κρήτης στο Instagram  Το Πολυτεχνείο Κρήτης στο Twitter  Το Πολυτεχνείο Κρήτης στο YouTube   Το Πολυτεχνείο Κρήτης στο Linkedin

Νέα / Ανακοινώσεις / Συζητήσεις

Παρουσίαση Διπλωματικής Εργασίας κ. Χαλεπάκη-Ντελλή Δημήτριου-Απόστολου - Σχολή ΗΜΜΥ

  • Συντάχθηκε 01-07-2015 08:08 από Esthir Gelasaki Πληροφορίες σύνταξης

    Email συντάκτη: egelasaki<στο>tuc.gr

    Ενημερώθηκε: -

    Ιδιότητα: υπάλληλος.

    ΠΟΛΥΤΕΧΝΕΙΟ ΚΡΗΤΗΣ
    Σχολή Ηλεκτρονικών Μηχανικών και Μηχανικών Υπολογιστών
    Πρόγραμμα Προπτυχιακών Σπουδών

    ΠΑΡΟΥΣΙΑΣΗ ΔΙΠΛΩΜΑΤΙΚΗΣ ΕΡΓΑΣΙΑΣ

    ΔΗΜΗΤΡΙΟΥ-ΑΠΟΣΤΟΛΟΥ ΧΑΛΕΠΑΚΗ-ΝΤΕΛΛΗ
    με θέμα

    Δίκτυα Έκφρασης για Γονιδιακούς Δείκτες Καρκίνου
    Expression Networks for Cancer Gene Markers

    Παρασκευή 3 Ιουλίου 2015, 2μμ
    Αίθουσα 137.Π39, Κτίριο Επιστημών, Πολυτεχνειούπολη

    Εξεταστική Επιτροπή

    Καθηγητής Μιχάλης Ζερβάκης (επιβλέπων)
    Αναπληρωτής Καθηγήτρια Κατερίνα Μανιά
    Κύριος Ερευνητής Δημήτρης Καφετζόπουλος (ΙΤΕ)


    Περίληψη

    Τα κύτταρα περιέχουν χιλιάδες βιολογικά μόρια, όπως γονίδια, RNA, πρωτεΐνες και μεταβολίτες, που αλληλεπιδρούν με πολύπλοκους τρόπους. Τα δίκτυα παρουσιάζουν ένα ισχυρό πλαίσιο για να αντιπροσωπεύσουν αυτές τις περίπλοκες σχέσεις και αλληλεπιδράσεις, οι οποίες είναι υπεύθυνες για διάφορες κυτταρικές λειτουργίες με τις επιδράσεις των μεμονωμένων κόμβων των μορίων. Στην παρούσα διπλωματική εργασία πραγματοποιείται η εκμάθηση δομής Bayesian δικτύων από δεδομένα γονιδιακής έκφρασης που προέρχονται από δείγματα παθολογίας του καρκίνου του μαστού και υγιή δείγματα. Τα Bayesian δίκτυα παρέχουν μια καλή και εύχρηστη αναπαράσταση για την έκφραση της από κοινού κατανομής πιθανότητας και για τον συμπερασμό. Η αναπαράσταση και η χρήση της θεωρίας πιθανοτήτων κάνουν τα Bayesian δίκτυα κατάλληλα για το συνδυασμό του πεδίου γνώσης και δεδομένων, την έκφραση αιτιωδών σχέσεων, την αποφυγή υπερκάλυψης ενός μοντέλου σε δεδομένα εκπαίδευσης, και την εκμάθηση από μη ολοκληρωμένα σύνολα δεδομένων. Συγκεκριμένα, για να γίνει η εκμάθηση μιας τέτοιας δομής, χρησιμοποιήθηκαν οι αλληλεπιδράσεις των 77 γονιδίων που είναι μια γονιδιακή υπογραφή που σχετίζεται με την παθολογία του καρκίνου του μαστού. Κατασκευάστηκαν δομές ξεχωριστά για τα καρκινικά και τα υγιή δείγματα ενώ η εκμάθηση των δομών έγινε σύμφωνα με τον αλγόριθμο εκμάθησης δομής Κ2, θεωρώντας τις μεταβλητές διακριτές αλλά και συνεχείς. Για την περαιτέρω μελέτη έγινε ένωση των δομών δικτύων που κατασκευάστηκαν από τις διαφορετικές μεταβλητές. Οι δομές που προέκυψαν μελετήθηκαν ως προς τις ιδιότητες Μικρού Κόσμου και Ελεύθερης Κλίμακας, που εμφανίζονται στην πλειονότητα των δικτύων του πραγματικού κόσμου. Επίσης αναζητήθηκαν σημαντικοί κόμβοι, συμπλέγματα (σύμφωνα με τον αλγόριθμο MCODE) και δομικές ενότητες (σύμϕωνα με τον αλγόριθμο jActiveModules) στις δομές, τα οποία αξιολογήθηκαν στατιστικά και βιολογικά. Η στατιστική ανάλυση των δικτύων έδειξε ότι εμφανίζουν την ιδιότητα Ελεύθερης Κλίμακας που συνάδει με τη βιολογική τους διάσταση όπως επίσης και ότι υπάρχουν σημαντικοί κόμβοι, συμπλέγματα και δομικές ενότητες στα δίκτυα. Η ανάλυση των Bayesian δικτύων ανέδειξε δυναμικά υποδίκτυα διαφοροποίησης με κεντρικούς κόμβους τα οποία προσφέρουν νέα γνώση σχετικά με τη λειτουργία βιολογικών μονοπατιών που εμπλέκονται στον καρκίνο του μαστού, μέσα από τις αλληλεπιδράσεις των μορίων. Οι κεντρικοί κόμβοι των Bayesian δικτύων αποτελούν πιθανούς γονιδιακούς δείκτες για τον καρκίνο του μαστού.





    Abstract

    Cells contain thousands of organic molecules, such as genes, RNA, proteins and metabolites which interact in complex ways. The networks provide a powerful framework to represent these complex relationships and interactions, which are responsible for various cellular functions with the effects of individual nodes of the molecules. In this thesis is curried out the learning of Bayesian network structure from gene expression data from breast cancer pathology and healthy samples. The Bayesian networks provide a neat and compact representation for expressing joint probability distribution and for inference. The representation and the use of probability theory makes Bayesian networks suitable for combining domain knowledge and data, expressing causal relationships, avoiding overfitting a model to training data, and learning from incomplete datasets. Specifically, to learn such a structure, have been used interactions of 77 genes, which is a gene signature associated with the pathology of breast cancer. Structures were constructed separately for both cancer and control samples, while learning structures were made according to the structure learning algorithm K2, considering the discrete and continuous variables. For further study we used the unions of the networks structures built by different variables. The resulting structures studied in properties of Small-World and Scale-Free, shown in most real world networks. Furthermore, important nodes as well as complexes (according to the algorithm MCODE) and modules (according to the algorithm jActive Modules) were searched out in the structures which were statistically and biologically evaluated. Statistical analysis showed that the networks have the property of Scale-Free, which is consistent with their biological dimension and that there are important hubs, clusters and modules in the networks. The Bayesian networks analysis dynamically highlighted differentiation subnetworks with central hubs which offer new knowledge of the biological pathways operation involved in cancer breast through the molecule interactions. The hubs of the Bayesian networks are potential gene markers for breast cancer.

© Πολυτεχνείο Κρήτης 2012