Συντάχθηκε 04-04-2016 14:47
από Esthir Gelasaki
Email συντάκτη: egelasaki<στο>tuc.gr
Ενημερώθηκε:
-
Ιδιότητα: υπάλληλος.
ΠΟΛΥΤΕΧΝΕΙΟ ΚΡΗΤΗΣ
Σχολή Ηλεκτρονικών Μηχανικών και Μηχανικών Υπολογιστών
Πρόγραμμα Προπτυχιακών Σπουδών
ΠΑΡΟΥΣΙΑΣΗ ΔΙΠΛΩΜΑΤΙΚΗΣ ΕΡΓΑΣΙΑΣ
ΠΑΝΑΓΙΩΤΗ ΣΙΔΕΡΗ
με θέμα
Σύνθεση Φωνής με Στατιστικά Μοντέλα
Speech Synthesis with Statistic Models
Εξεταστική Επιτροπή
Καθηγητής Βασίλης Διγαλάκης (επιβλέπων)
Αναπληρωτής Καθηγητής Μιχαήλ Λαγουδάκης
Καθηγητής Ιωάννης Στυλιανού (σχολή Επιστήμης Υπολογιστών, Πανεπιστήμιο Κρήτης)
Περίληψη
Στην εργασία αυτή διερευνούμε τη χρήση των Γραμμικών Δυναμικών Μοντέλων (LDMs)
στη σύνθεση φωνής. Υπάρχουν διάφορες οικογένειες τεχνικών πάνω στη σύνθεση φωνής, εκ των
οποίων, μία από τις πιο δημοφιλείς είναι τα στατιστικά παραμετρικά μοντέλα (SPSS) τα οποία και
περιγράφουμε. Στην οικογένεια των SPSS ανήκουν και τα Γραμμικά Δυναμικά Μοντέλα στα οποία
και επικεντρωθήκαμε λόγω αξιοπιστίας και δυνατοτήτων. Καταφέραμε να αποδείξουμε ότι η
σύνθεση φωνής με αυτό το μοντέλο είναι εφικτή και αξιολογήσαμε την ποιότητα της συνθετικής
φωνής που παράξαμε, μέσω αντικειμενικών μετρικών. Επιπλέον για την υλοποίηση της εργασίας
αυτής χρησιμοποιήσαμε το Straight vocoder, ο οποίος αποτελεί τεχνολογία αιχμής πάνω στο πεδίο
της μελέτης μας. Τέλος παραθέσαμε τα συμπεράσματα σχετικά με την ποιότητα του μοντέλου αλλά
και τα προβλήματα που αντιμετωπίσαμε στην διαδικασία αυτή.
Τόπος: Λ - Κτίριο Επιστημών/ΗΜΜΥ, 2042
Έναρξη: 06/04/2016 14:00
Λήξη: 06/04/2016 15:00