Έμβλημα Πολυτεχνείου Κρήτης
Το Πολυτεχνείο Κρήτης στο Facebook  Το Πολυτεχνείο Κρήτης στο Instagram  Το Πολυτεχνείο Κρήτης στο Twitter  Το Πολυτεχνείο Κρήτης στο YouTube   Το Πολυτεχνείο Κρήτης στο Linkedin

Νέα / Ανακοινώσεις / Συζητήσεις

Παρουσιαση Διπλωματικης Εργασιας Σωτηρη Θωμα

  • Συντάχθηκε 27-04-2012 09:34 από Garantonaki Argyro Πληροφορίες σύνταξης

    Email συντάκτη:

    Ενημερώθηκε: -

    Ιδιότητα: -.
    ΠΟΛΥΤΕΧΝΕΙΟ ΚΡΗΤΗΣ
    Τμήμα Ηλεκτρονικών Μηχανικών & Μηχανικών Υπολογιστών

    ΠΑΡΟΥΣΙΑΣΗ ΔΙΠΛΩΜΑΤΙΚΗΣ ΕΡΓΑΣΙΑΣ

    ΘΩΜΑ ΣΩΤΗΡΗ

    με θέμα

    “Σχεδίαση και υλοποίηση σε FPGA ενός 3D στερεοσκοπικού αλγορίθμου πραγματικού χρόνου”
    “Design of a real time, 3D stereo vision algorithm and its FPGA-based implementation”

    Πέμπτη 3 Μαίου 2012, 13.30 μμ

    Αίθουσα B1004, Παλιό Κτίριο ΗΜΜΥ, Πολυτεχνειούπολη

    Εξεταστική Επιτροπή

    Καθηγητής Απόστολος Δόλλας (επιβλέπων)
    Αν. Καθηγητής Ιωάννης Παπαευσταθίου
    Καθηγητής Μιχάλης Ζερβάκης


    Περίληψη

    Η ικανότητα ανίχνευσης αντικειμένων και ανθρώπων σε πραγματικό χρόνο μπορεί να ωφελήσει πολλές εφαρμογές που εμπεριέχουν αλληλεπίδραση με πραγματικά περιβάλλοντα. Για παράδειγμα, αυτοκίνητα μπορούν να φρενάρουν αυτόματα όταν εντοπίσουν πεζούς ή αντικείμενα, αγροτικά οχήματα μπορούν να πλοηγηθούν αυτόνομα σε αγρούς αποφεύγοντας εμπόδια, συστήματα ασφαλείας μπορούν να ανιχνεύουν ανθρώπους καθώς εισέρχονται και εξέρχονται από κτίρια ή διαφορετικές περιοχές. Η τρισδιάστατη όραση και η πιο αποδοτική υλοποίηση της που είναι η στερεοσκοπική όραση, μπορεί να βοηθήσει αυτές τις εφαρμογές. Η στερεοσκοπική όραση χρησιμοποιεί δύο κάμερες τοποθετημένες η μια δίπλα στην άλλη, για να παράξει πολύ γρήγορα εκτιμήσεις των αποστάσεων από διάφορα σημεία σε μια σκηνή. Αυτές οι αποστάσεις μπορούν να αποτελέσουν ένα πρώτο στοιχείο για την αναγνώριση των αντικειμένων που ξεχωρίζουν από το υπόβαθρο και να ερμηνεύσουν το σχήμα τους, διευκολύνοντας έτσι άλλα προβλήματα της μηχανικής όρασης, όπως είναι η κατάτμηση και αναγνώριση αντικειμένων.
    Στην παρούσα διπλωματική εργασία περιγράφουμε την σχεδίαση ενός στερεοσκοπικού αλγορίθμου και την υλοποίηση του σε FPGA, εκμεταλλευόμενοι αποτελεσματικά τους πόρους αυτής της πλατφόρμας. Η σχεδίαση μας πέτυχε υψηλό ρυθμό επεξεργασίας ακόμα και για μεγάλες αναλύσεις ενώ ελέγχθηκε και ένα hardware πρωτότυπο με διάφορα datasets για μεσαίες αναλύσεις.


    Abstract

    The ability to track objects and people in real time would greatly benefit many applications that interact with real environments. For example cars could brake automatically when detecting pedestrians or objects in harms way. Agricultural equipment could autonomously navigate fields avoiding obstacles. Security systems could track people moving through buildings or different areas. 3D Vision and its most effective implementation, stereo vision, could assist these applications. Stereo vision uses two cameras side by side to produce virtually instantaneous estimates of the distances to elements in a scene. These distances can provide a primary cue for identifying objects that stand out from the background and interpreting their shape, thus assisting object segmentation and identification.
    In the present work we describe a 3D stereo vision design and its implementation that exploits effectively the resources of an FPGA. Our place-and-route design achieved a high processing rate for large resolutions, while the hardware prototype system was fully tested and validated over several data sets with medium resolutions.

© Πολυτεχνείο Κρήτης 2012