Συντάχθηκε 20-10-2016 12:56
από Esthir Gelasaki
Email συντάκτη: egelasaki<στο>tuc.gr
Ενημερώθηκε:
-
Ιδιότητα: υπάλληλος.
ΠΟΛΥΤΕΧΝΕΙΟ ΚΡΗΤΗΣ
Σχολή Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών
Πρόγραμμα Προπτυχιακών Σπουδών
ΠΑΡΟΥΣΙΑΣΗ ΔΙΠΛΩΜΑΤΙΚΗΣ ΕΡΓΑΣΙΑΣ
Mουρτζανού Τριαντάφυλλου
με θέμα
Ενσωματωμένο Σύστημα Επεξεργασίας Ψηφιακού Ήχου
Embedded System for Digital Audio Processing
Εξεταστική Επιτροπή
Καθηγητής Απόστολος Δόλλας (επιβλέπων)
Καθηγητής Διονύσιος Πνευματικάτος
Καθηγητής Μιχάλης Ζερβάκης
Περίληψη
Στον ψηφιακό ήχο η πιο διαδεδομένη μορφή αποθήκευσης της μουσικής χωρίς συμπίεση είναι η cd ποιότητα στα 44.1khz και 16bit.Για αρκετούς μουσικόφιλους η ποιότητα του cd δε μπορεί να προσφέρει τη μέγιστη ακουστική εμπειρία που μπορεί να λάβει ο ακροατής και υποστηρίζουν την ανωτερότητα των αρχείων υψηλής ανάλυσης, μεγαλύτερης συχνότητας δειγματοληψίας δηλαδή και εύρους bit,ανοίγοντας έτσι μια δημόσια συζήτηση η οποία ξεκίνησε στα τέλη της δεκαετίας του ‘90 με την εμφάνιση των πρώτων μουσικών αρχείων σε ποιότητα Dvd και συνεχίζεται μέχρι και σήμερα.
Η παρούσα διπλωματική στοχεύει στη βελτίωση της cd ποιότητας με την εφαρμογή μαθηματικών μοντέλων Interpolation πάνω στο αρχικό δειγματοληπτημένο σήμα χωρίς την αλλαγή του ρυθμού δειγματοληψίας ώστε στη συνέχεια να σχεδιαστεί μια Hardware υλοποίηση η οποία θα το προσφέρει αυτό σε πραγματικό χρόνο. Αφού μελετήθηκαν οι δυνατότητες που έχει το ανθρώπινο αυτί και το ρόλο που παίζει ο τομέας της ψυχοακουστικής κατά την ακουστική εμπειρία, σχεδιάστηκαν και μοντελοποιήθηκαν δύο μέθοδοι Interpolation,η Linear και η Cubic Spline.
Aφού υλοποιήθηκαν και μελετήθηκε πειραματικά η συμπεριφορά των δύο μεθόδων τόσο οπτικά με το φασματογράφημα και τις κυματομορφές τόσο και ακουστικά με την επιλογή μουσικών δειγμάτων με διαφορετικά χαρακτηριστικά, αξιολογήσαμε τις μεθόδους, συγκρίναμε τις διαφορές για διαφορετικούς ρυθμούς δειγματοληψίας και αναφέραμε τα θετικά και αρνητικά που παρουσιάζουν σε κάθε περίπτωση. Η μέθοδος με το Cubic Spline η οποία είναι κ η βασική μέθοδος Interpolation σε αυτή τη διπλωματική, έδωσε ενδιαφέρον αποτελέσματα σε σύγκριση με το αρχικό σήμα, ενώ αντίθετα η Linear μέθοδος ήταν σχεδόν πάντα κατώτερη του αρχικού.
Στη συνέχεια προσαρμόστηκε η μέθοδός μας για τη πιθανή υλοποίηση σε Hardware η οποία και σχεδιάστηκε και αξιολογήθηκε.
Abstract [προαιρετικά]
In digital sound, the most common format to store music without compress is the cd quality on 44.1Khz sample rate and 16bit depth. For many audiophiles, the cd quality can't offer the maximum listening experience that the listener can get and they support the superiority of high-resolution audio files. So, a strong debate which started at the end of the 90's when the first Dvd Quality music files were released is still open to discuss where new arguments appear constantly from both sides.
This thesis diploma aims to improve the standard cd-quality with the application of interpolation mathematical methods on the original .wav file, without resampling the rate so that can be applied in a Hardware implementation. Having studied the capabilities of the human ear and the role played by psychoacoustics during the audio experience, two methods of interpolation were designed and modeled, Linear and Cubic Spline.
Once implemented and experimentally studied the behavior of two methods both visually with spectrogram and waveforms so and the audibility with musical samples selection with different characteristics, we evaluated the methods, we compared the differences for different sampling rates and discussed the positives and negatives that have to each case. The Cubic Spline which is the main interpolation method in this work, gave us interesting results in compare to the original file, while on the other hand the Linear method was almost always worse than the original.
Then our method adjusted for possible implementation in Hardware, which was designed and evaluated.
Τόπος: Λ - Κτίριο Επιστημών/ΗΜΜΥ, 2041
Έναρξη: 24/10/2016 13:00
Λήξη: 24/10/2016 14:00