Έμβλημα Πολυτεχνείου Κρήτης
Το Πολυτεχνείο Κρήτης στο Facebook  Το Πολυτεχνείο Κρήτης στο Instagram  Το Πολυτεχνείο Κρήτης στο Twitter  Το Πολυτεχνείο Κρήτης στο YouTube   Το Πολυτεχνείο Κρήτης στο Linkedin

Νέα / Ανακοινώσεις / Συζητήσεις

Παρουσίαση διπλωματικής εργασίας Κωνσταντίνου Καράλα - Σχολή ΗΜΜΥ

  • Συντάχθηκε 09-09-2013 14:55 από Balasi Panagiota Πληροφορίες σύνταξης

    Email συντάκτη:

    Ενημερώθηκε: 09-09-2013 15:13

    Ιδιότητα: -.

    ΠΟΛΥΤΕΧΝΕΙΟ ΚΡΗΤΗΣ
    Σχολή Ηλεκτρονικών Μηχανικών & Μηχανικών Υπολογιστών

    ΠΑΡΟΥΣΙΑΣΗ ΔΙΠΛΩΜΑΤΙΚΗΣ ΕΡΓΑΣΙΑΣ

    ΚΩΝΣΤΑΝΤΙΝΟΣ ΚΑΡΑΛΑΣ

    με θέμα

    Ανάλυση Διάθεσης με Συνεχή Γλωσσικά Μοντέλα
    Sentiment Analysis Using Continuous-Space Language Models


    Πέμπτη 12 Σεπτεμβρίου 2013, 13.00 μ.μ.
    Αίθουσα 2041, Κτίριο Επιστημών, Πολυτεχνειούπολη

    Εξεταστική Επιτροπή

    Καθηγητής Βασίλης Διγαλάκης (επιβλέπων)
    Αναπληρωτής Καθηγητής Μιχαήλ Λαγουδάκης
    Καθηγητής Μιχαήλ Πατεράκης


    Περίληψη

    Η εύρεση του συναισθήματος στο γραπτό λόγο, είναι ένας τρόπος για να ανιχνεύσουμε τις στάσεις, τις διαθέσεις και τις απόψεις των ανθρώπων. Το ενδιαφέρον πάνω σε αυτόν τον τομέα έχει παρουσιάσει ραγδαία αύξηση την τελευταία δεκαετία, καθώς με την ανάπτυξη του διαδικτύου προσφέρθηκε ένα πλήθος διαθέσιμων πηγών για έρευνα. Παράλληλα, υπάρχουν πολλαπλά οφέλη τόσο σε ατομικό επίπεδο, όσο και για τις επιχειρήσεις γενικότερα. Οι μεν καταναλωτές μπορούν να παρακολουθούν προϊόντα, ειδήσεις ή ακόμη και πρόσωπα που τους ενδιαφέρουν συλλέγοντας χρήσιμες πληροφορίες, ενώ οι δε επιχειρήσεις έχουν πλέον τη δυνατότητα να αφουγκράζονται ευκολότερα και με μεγαλύτερη ακρίβεια τα παράπονα και τη ζήτηση του καταναλωτικού κοινού.
    Σε αυτή τη διπλωματική εργασία, εξετάζεται η κατηγοριοποίηση του συναισθήματος σε θετικό ή αρνητικό χρησιμοποιώντας γλωσσικά μοντέλα που δημιουργήθηκαν από συνεχείς κατανομές και πιο συγκεκριμένα τα Gaussian Mixture Models. Μελετήθηκε η επίδραση διαφόρων συναρτήσεων στάθμισης από το πεδίο της Ανάκτησης Πληροφορίας πάνω στα αρχικά δεδομένα, ενώ τα χαρακτηριστικά διανύσματα προέκυψαν μέσα από τεχνικές μείωσης διαστάσεων με δύο τρόπους: είτε εφαρμόζοντας SVD, είτε χρησιμοποιώντας μεθόδους επιλογής των πιο σημαντικών χαρακτηριστικών διανυσμάτων. Επίσης εξετάστηκε το πως επηρεάζουν την προσέγγισή μας διάφοροι stemming αλγόριθμοι. Προσπαθούμε να διαπιστώσουμε πως επιδρά το μοντέλο μας πάνω σε μια δημοσίως διαθέσιμη συλλογή από κριτικές ταινιών, σε σχέση με προηγούμενες μεθόδους μηχανικής μάθησης από το διακριτό χώρο. Η μέθοδός μας πετυχαίνει απόδοση μεγαλύτερη του 82%, ένα ποσοστό αρκετά υψηλό για τα συγκεκριμένα δεδομένα.

    Από τη Γραμματεία ΗΜΜΥ
    Π. Μπαλάση

© Πολυτεχνείο Κρήτης 2012