Έμβλημα Πολυτεχνείου Κρήτης
Το Πολυτεχνείο Κρήτης στο Facebook  Το Πολυτεχνείο Κρήτης στο Instagram  Το Πολυτεχνείο Κρήτης στο Twitter  Το Πολυτεχνείο Κρήτης στο YouTube   Το Πολυτεχνείο Κρήτης στο Linkedin

Νέα / Ανακοινώσεις / Συζητήσεις

Παρουσίαση Διπλωματικής Εργασίας κ. Ανδρέα Καλλιντέρη - Σχολή ΗΜΜΥ

  • Συντάχθηκε 18-02-2025 14:47 Πληροφορίες σύνταξης

    Ενημερώθηκε: -

    Τόπος:
    Σύνδεσμος τηλεδιάσκεψης
    Έναρξη: 07/03/2025 09:00
    Λήξη: 07/03/2025 10:00

    ΠΟΛΥΤΕΧΝΕΙΟ ΚΡΗΤΗΣ
    Σχολή Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών
    Πρόγραμμα Προπτυχιακών Σπουδών

    ΠΑΡΟΥΣΙΑΣΗ ΔΙΠΛΩΜΑΤΙΚΗΣ ΕΡΓΑΣΙΑΣ

    Ανδρέα Καλλιντέρη

    με θέμα
    Δημιουργία Παραμετροποιήσιμων Ρομποτικών Περιβαλλόντων Ενισχυτικής Μάθησης
    Building Configurable Reinforcement Learning Robotic Environments

    Εξεταστική Επιτροπή
    Καθηγητής Γεώργιος Χαλκιαδάκης (επιβλέπων)
    Καθηγητής Θρασύβουλος Σπυρόπουλος 
    Καθηγητής Μιχαήλ Λαγουδάκης

    Περίληψη
    Η δημιουργία τυποποιημένων υλοποιήσεων περιβάλλοντος και ενός API για OpenAI/Gym, έχει επηρεάσει την πρόσφατη έρευνα για ενισχυτική μάθηση. Ωστόσο, το περιορισμένο αριθμό και δυνατότητες τρέχον σύνολο περιβαλλόντων αποτελεί εμπόδιο για την περαιτέρω εξέλιξη των αλγορίθμων ενισχυτικής μάθησης. 
    Στην παρούσα διπλωματική εργασία, έχουμε αναπτύξει και παρέχουμε μια ποικιλία νέων περιβαλλόντων και πλαισίων για ρομποτική ενισχυτική μάθηση, συμπεριλαμβανομένων των Gymnasium/Mujoco-v5, Gymnasium-Robotics/Maze-v5, και Gymnasium-MaMuJoCo. 
    Επίσης, παρέχουμε σύνολα δεδομένων για χρήση από offline RL μεθόδους σε περιβάλλοντα Gymnasium/MuJoCo με το Minari API. Οι συνεισφορές αυτές μπορούν να επιτρέψουν στους ερευνητές να αναπτύξουν και να δοκιμάσουν νέους αλγορίθμους σε ένα πιο ρεαλιστικό περιβάλλον, το οποίο θα οδηγήσει σε πιο ισχυρούς και γενικευμένους αλγορίθμους ενισχυτικής μάθησης.

    Abstract 
    The creation of standardized environments and an API for OpenAI/Gym has had a transformative impact on reinforcement learning research.
    However, the current set of standardized environments needs to be extended so as to contribute to further advancements in reinforcement learning algorithms.
    In this thesis, we have developed and provided a plethora of novel environments and frameworks for robotic reinforcement learning, including Gymnasium/Mujoco-v5, Gymnasium-Robotics/Maze-v5, and Gymnasium-Robotics/MaMuJoCo.
    These advancements can potentially enable researchers to develop and test new algorithms in a more realistic and challenging environment, which will ultimately lead to more robust and generalizable reinforcement learning algorithms.

    Meeting ID: 931 9703 9006
    Password: 561314



© Πολυτεχνείο Κρήτης 2012