Έμβλημα Πολυτεχνείου Κρήτης
Το Πολυτεχνείο Κρήτης στο Facebook  Το Πολυτεχνείο Κρήτης στο Instagram  Το Πολυτεχνείο Κρήτης στο Twitter  Το Πολυτεχνείο Κρήτης στο YouTube   Το Πολυτεχνείο Κρήτης στο Linkedin

Νέα / Ανακοινώσεις / Συζητήσεις

Ανακοίνωση Παρουσίασης Διπλωματικής Εργασίας Κουτσού Σεραφείμ Σχολής ΗΜΜΥ

  • Συντάχθηκε 17-06-2013 14:18 από Eleni Stamataki Πληροφορίες σύνταξης

    Email συντάκτη: estamataki<στο>tuc.gr

    Ενημερώθηκε: -

    Ιδιότητα: σύνταξη/αποχώρηση υπάλληλος.
    Σχολή Ηλεκτρονικών Μηχανικών και Μηχανικών Υπολογιστών
    Πρόγραμμα Προπτυχιακών Σπουδών

    ΠΑΡΟΥΣΙΑΣΗ ΔΙΠΛΩΜΑΤΙΚΗΣ ΕΡΓΑΣΙΑΣ

    ΣΕΡΑΦΕΙΜ ΚΟΥΤΣΟΥ

    με θέμα

    Κατηγοριοποίηση Ιατρικών Κειμένων με βάση το προφίλ του Χρήστη.
    Medical Document Classification based on user profile.

    Πέμπτη 20 Ιουνίου 2013, 12πμ
    Αίθουσα 145.Π58, Κτίριο Επιστημών, Πολυτεχνειούπολη

    Εξεταστική Επιτροπή

    Καθηγητής Ευριπίδης Πετράκης (επιβλέπων)
    Καθηγητής Μιχάλης Ζερβάκης
    Αναπληρωτής Καθηγητής Αλέξανδρος Ποταμιάνος


    Περίληψη

    Το Internet χρησιμοποιείται ως η κύρια πηγή για ιατρική πληροφορία. Ο αριθμός των σχετικών σελίδων σχεδόν διπλασιάζεται κάθε χρόνο. Οι χρήστες που αναζητούν ιατρική πληροφορία είναι είτε ειδικοί (γιατροί, νοσηλευτές) ή απλοί χρήστες. Η χρήση με αυτόματο τρόπο μεθόδων κατηγοριοποίησης είναι απαραίτητη και για τις δύο κατηγορίες χρηστών. Σε αυτή την εργασία, ερευνούμε την κατηγοριοποίηση ξεχωριστών ιατρικών κειμένων σε δύο κλάσεις, σε ειδικούς και απλούς χρήστες, χρησιμοποιώντας τεχνικές μηχανικής μάθησης(δέντρο απόφασης), πολυκριτήρια ανάλυση και αναγνώριση της κειμενικής δυσκολίας με συγκεκριμένες φόρμουλες. Τα ιατρικά κείμενα αναπαριστώνται από όρους που εξάγονται από την ΑΜΤΕχ, μια μέθοδο για εξαγωγή ιατρικών όρων, την ΜΜΤχ, την επίσημη μέθοδο της Εθνικής Ιατρικής Βιβλιοθήκης των Η.Π.Α αλλά και από όρους που αναθέτει το ειδικευμένο προσωπικό της Βιβλιοθήκης. Σε αυτά τα διανύσματα όρων εφαρμόζουμε πολυκριτήρια ανάλυση και το δέντρο απόφασης για να κατατάξουμε τα κείμενα στις παραπάνω κλάσεις. Επίσης δοκιμάζουμε και τα readability formulas τα οποία αποδεικνύονται μη αποτελεσματικά καθώς μετρούν την δυσκολία του ύφους του κειμένου σε αντίθεση με το δυσκολία του περιεχομένου. Χρησιμοποιώντας την πολυκριτήρια ανάλυση, έχουμε καλά αποτελέσματα σε όλες τις απεικονίσεις του κειμένου από την κάθε μεθόδου ξεχωριστά.

    Abstract

    Internet is used as one of the major sources in health information. The number of related pages available on the Internet almost doubles every year. This is also the case for medical information, which is now available from a variety of sources. Users of the medical domain can be either health care professionals (experts) or consumers (novice users).The use of automated information classification methods is essential for both experts and consumers. In this thesis, we investigate the classification of separate medical documents into two classes; consumers and experts, using machine learning methods and more specifically Decision Tree analysis, multiple criteria decision analysis (MCDA) and readability formulas. The medical documents are represented by terms extracted from AMTEx, a medical document indexing method, MMTx, the method being developed by U.S National Library of Medicine, or the MeSH method, under which documents are indexed by human experts. Decision Trees and MCDA are applied to these term vectors in order to classify medical documents into the aforementioned classes. In this respect, we are trying several readability formulas which are subsequently proven ineffective. The readability formulas usually measure difficulty of writing style instead of difficulty of
    content. Incorporating MCDA analysis tools, the categorization ability is vastly improved in all of the document representation approaches

    Συνημμένα:

© Πολυτεχνείο Κρήτης 2012