Έμβλημα Πολυτεχνείου Κρήτης
Το Πολυτεχνείο Κρήτης στο Facebook  Το Πολυτεχνείο Κρήτης στο Instagram  Το Πολυτεχνείο Κρήτης στο Twitter  Το Πολυτεχνείο Κρήτης στο YouTube   Το Πολυτεχνείο Κρήτης στο Linkedin

Νέα / Ανακοινώσεις / Συζητήσεις

Ανακοίνωση Παρουσίασης Διπλωματικής Εργασίας Ξηρουχάκη Νικόλαου Τμήματος ΗΜΜΥ

  • Συντάχθηκε 27-10-2011 14:36 από Eleni Stamataki Πληροφορίες σύνταξης

    Email συντάκτη: estamataki<στο>tuc.gr

    Ενημερώθηκε: -

    Ιδιότητα: σύνταξη/αποχώρηση υπάλληλος.
    ΠΟΛΥΤΕΧΝΕΙΟ ΚΡΗΤΗΣ
    Τμήμα Ηλεκτρονικών Μηχανικών & Μηχανικών Υπολογιστών

    ΠΑΡΟΥΣΙΑΣΗ ΔΙΠΛΩΜΑΤΙΚΗΣ ΕΡΓΑΣΙΑΣ

    ΞΗΡΟΥΧΑΚΗΣ ΝΙΚΟΛΑΟΣ

    με θέμα

    “Αναγνώριση Μουσικών Διασκευών”
    “Cover Song Identification”
    Δευτέρα 31 Οκτωβρίου 2011, 12:00-13:00
    Αίθουσα E3 002, Πολυτεχνειούπολη


    Εξεταστική Επιτροπή
    Αν. Καθ. Ποταμιάνος Αλέξανδρος (επιβλέπων)
    Καθ. Διγαλάκης Βασίλειος
    Αν. Καθ. Πετράκης Ευριπίδης


    Περίληψη

    Με την ραγδαία αύξηση του μεγέθους των μουσικών βάσεων δεδομένων απαιτούνται αυτόματες μέθοδοι αναζήτησης βασισμένες στο περιεχόμενο των μουσικών σημάτων για την γρήγορη ανάκτηση μουσικών κομματιών ή πληροφοριών για αυτά. Τέτοιες μέθοδοι αναζήτησης μπορεί να είναι βασισμένες σε μια τακτική όπου η είσοδος στο σύστημα να είναι ένα ηχητικό σήμα, με αποτέλεσμα η εξαγωγή και η σύγκριση μουσικών χαρακτηριστικών και γενικότερα η ανάλυση της μουσικής ομοιότητας να είναι ένα ενδιαφέρον ερευνητικό θέμα. Στο πλαίσιο αυτό, η παρούσα εργασία επικεντρώνεται στην περιγραφή ενός συστήματος που προσπαθεί να αναγνωρίσει διασκευές ενός τραγουδιού που έχει δοθεί ως είσοδος. Τέτοιες διασκευές διαφέρουν σε πολλά μουσικά χαρακτηριστικά, όμως διατηρούν μια ορισμένη ‘ομοιότητα’. Έτσι με τη διερεύνηση ενός τέτοιου συστήματος παρέχεται μια ανάλυση για το ποια χαρακτηριστικά του μουσικού σήματος θεωρούνται σημαντικά για την μέτρηση της μουσικής ομοιότητας. Για το σκοπό αυτό οι αναπαραστάσεις των τραγουδιών θα πρέπει να είναι αμετάβλητες στην ενοργάνωση και στο ρυθμό. Αυτό επιτυγχάνεται με τη χρήση 12-διάστατων χαρακτηριστικών chroma των οποίων στη συνέχεια υπολογίζεται ο μέσος όρος με τη χρήση των χρονικών στιγμών κάθε παλμού (beat) μέσα στο κομμάτι. Σύγκριση τραγουδιών γίνεται με την ετεροσυσχέτηση (cross correlation) των παραπάνω αναπαραστάσεων λαμβάνοντας υπόψη όλες τις πιθανές μεταθέσεις κλειδιού όπως και δύο ρυθμών, πιθανώς με διαφορετικό μετρικό επίπεδο. Η δοκιμή αυτού του συστήματος σε μια μουσική συλλογή που περιέχει 80 διαφορετικά τραγούδια εκ των οποίων το καθένα έχει δύο διαφορετικές εκδόσεις και κάνοντας αναζήτηση για όλες τις περιπτώσεις είχε ως αποτέλεσμα 52.5% επιτυχία. Για μουσική συλλογή 15 ζευγών τραγουδιών, το σύστημα έβρισκε τη σωστή διασκευή σε 10 από τις 15 περιπτώσεις κατά μέσο όρο. Μια τέτοια έρευνα δεν συνεισφέρει μόνο στην αναζήτηση, ανάκτηση και οργάνωση μουσικών συλλογών, αλλά μπορεί και να επηρεάσει την εμπορική διαχείριση πνευματικών δικαιωμάτων στη μουσική. Ενώ η παρούσα εργασία εστιάζει κυρίως στο έργο της αυτόματης αναγνώρισης μουσικών διασκευών, αναλύει και συστήματα όπως: χρονικός εντοπισμός παλμών-beat μέσα στο μουσικό σήμα, αυτόματη μουσική ταύτιση με χρήση audio fingerprint και αυτόματη εύρεση ρεφραίν.





    Abstract

    With the vast increase in size of music databases, automatic content-based search methods are required for facilitating fast retrieval of music or information about music. Such search methods may be based on an audio-query tactic making the extraction and comparison of musical features and thus the analysis of musical similarity an interesting field of research. In this context, the present work focuses on describing a system which tries to identify cover versions of a query-song. Such songs are usually different in many musical attributes but can still be defined as 'similar'. Hence, investigating such a system may provide an analysis of which features are considered relevant for music similarity. To this end song representations need to be invariant to instrumentation and tempo. This is achieved by making use of 12-dimensional chroma features which are then averaged by the song's beat times. Comparison of songs is then carried out by cross-correlating the above representations taking into account all possible key transpositions as well as two possible global tempi. By testing this system on a music collection consisting of 80 songs with 2 versions of each, querying each one of them resulted in a 52.5% accuracy, whilst for a collection containing 15 pairs of song's a correct cover was found 10 times out of all cases. Such work does not only contribute in searching retrieving and organizing music collections but may also influence commercial copyright management of music licenses. While the present work mainly focuses on the task of automatic cover song identification it also makes a preliminary analysis of automatic fingerprint matching as well as automatic chorus detection systems.



© Πολυτεχνείο Κρήτης 2012