Συντάχθηκε 06-08-2020 13:30
Ενημερώθηκε:
17-08-2020 09:37
Τόπος: Εξ’ αποστάσεως – Ανοιχτή στο κοινό – link: https://tuc-gr.zoom.us/j/94930224038?pwd=NUR3dHNWblpmbm10cXQ1emJPaStiZz09
Σύνδεσμος τηλεδιάσκεψης
Έναρξη: 25/08/2020 11:00
Λήξη: 25/08/2020 12:00
Τίτλος: Στατιστική ανάλυση δεδομένων παραγωγής ηλεκτρικής ενέργειας.
Συμβουλευτική επιτροπή:
Χριστόπουλος Διονύσιος, Σχολή ΜΗΧΟΠ (Επιβλέπων)
Γαλετάκης Μιχαήλ, Σχολή ΜΗΧΟΠ
Παυλίδης Ανδρέας, Σχολή ΜΗΧΟΠ
Περίληψη:
Οι χρονοσειρές αποτελούν ένα σημαντικό ποσοστό του συνολικού όγκου των δεδομένων που συλλέγουν εταιρείες και επιχειρηματικοί όμιλοι. Μία από τις πιο χρήσιμες εφαρμογές της ανάλυσης χρονοσειρών είναι η δημιουργία πρόβλεψης για μελλοντικές χρονικές στιγμές. Η διαδικασία αυτή έχει αποτυπωθεί μέσω μαθηματικών μοντέλων, τα οποία είναι γνωστά ως μοντέλα πρόβλεψης χρονοσειρών. Η σημασία των προβλέψεων είναι μεγάλη αφού μέσω αυτών γίνεται εφικτή η εξαγωγή χρήσιμων συμπερασμάτων με σημαντικό οικονομικό αντίκτυπο.
Η παρούσα εργασία ασχολείται διεξοδικά με την περιγραφή βασικών μοντέλων χρονοσειρών και εν τέλει την δημιουργία πρόβλεψης με τα μοντέλα αυτά. Τα διαθέσιμα δεδομένα προς επεξεργασία είναι η παραγωγή ηλεκτρικής ισχύος στην χώρα του Βελγίου για την χρονική περίοδο μεταξύ της 1ης Ιανουαρίου 2019 έως και τις 30 Σεπτεμβρίου 2019. Τα δεδομένα παραγωγής έχουν χρονικό βήμα ανά 15 λεπτά. Για την επεξεργασία επιλέχθηκαν δύο χρονικές περίοδοι: μία καλοκαιρινή και μία χειμερινή. Η επεξεργασία εφαρμόζεται και στην χρονοσειρά των μέσων όρων ανά εξάωρο. Για την μελέτη των δεδομένων χρησιμοποιήθηκε το εποχιακό αυτοπαλινδρομούμενο μοντέλο κινούμενου μέσου όρου (SARIMA). Επιπρόσθετα χρησιμοποιήθηκε και η μέθοδος του εκθετικά σταθμισμένου κινούμενου μέσου όρου (EWMA).
Η αξιολόγηση των αποτελεσμάτων των προβλέψεων γίνεται μέσω στατιστικών μέτρων επιβεβαίωσης. Χρησιμοποιούνται συγκεκριμένα ο συντελεστής συσχέτισης του Pearson (RPe), η ρίζα του μέσου τετραγωνικού σφάλματος (RMSE) και το μέσο σφάλμα (ME). Όσον αφορά την μέθοδο του EWMA, η επεξεργασία έγινε με χρονικό βήμα ανά 15 λεπτά και για τις δύο (καλοκαιρινή και χειμερινή) χρονικές περιόδους. Η χρονοσειρά εκπαίδευσης περιλαμβάνει συνολικά 28 ημέρες. Πραγματοποιήθηκαν προβλέψεις για την επόμενη ημέρα καθώς και για ένα σύνολο μίας εβδομάδας μετά τις 28 ημέρες εκπαίδευσης. Οι προβλέψεις με την μέθοδο EWMA οδήγησαν σε μέσο τετραγωνικό σφάλμα που κυμαίνεται από 13,45 % έως 14,01 % ως ποσοστό της αντίστοιχης μέσης στάθμης για τις δύο περιόδους.
Στην επεξεργασία με το μοντέλο SARIMA χρησιμοποιήθηκε τόσο η χρονοσειρά με βήμα ανά 15 λεπτά (και για τις δύο χρονικές περιόδους) όσο και η χρονοσειρά με βήμα ανά εξάωρο. Στην περίπτωση της χρονοσειράς ανά εξάωρο έγινε πρόβλεψη για μία, δύο ημέρες μετά και για μία βδομάδα μετά το πέρας του συνόλου εκπαίδευσης. Το ποσοστό της ρίζας του μέσου τετραγωνικού σφάλματος κυμαίνεται από 3,69 % (για βήμα πρόβλεψης μίας ημέρας) έως 4,43 % (για πρόβλεψη μία βδομάδα μετά). Στην χρονοσειρά με βήμα ανά 15 λεπτά έγινε πρόβλεψη για 12 ώρες, μία ημέρα και δύο ημέρες στο μέλλον. Τα αποτελέσματα της επεξεργασίας έδωσαν ποσοστό της ρίζας του μέσου τετραγωνικού σφάλματος που κυμαίνεται από 19,75 % (για 12 ώρες στο μέλλον) έως 58,89 % (για δύο ημέρες στο μέλλον) για την χειμερινή περίοδο. Για την καλοκαιρινή περίοδο το αντίστοιχο σφάλμα κυμαίνεται από 15,62 % (για 12 ώρες στο μέλλον) έως 44,22 % (για δύο ημέρες στο μέλλον).
Προκύπτει πως στην πρόβλεψη που έγινε για την χρονοσειρά με βήμα ανά 15 λεπτά η μέθοδος EWMA δίνει πιο αξιόπιστα αποτελέσματα πρόβλεψης από το μοντέλο SARIMA. Επιπλέον η πρόβλεψη με το μοντέλο SARIMA για την καλοκαιρινή περίοδο παρουσιάζει μικρότερα ποσοστά σφαλμάτων από την χειμερινή περίοδο. Τέλος, στην περίπτωση της χρονοσειράς με βήμα ανά εξάωρο το μοντέλο SARIMA επιτυγχάνει προβλέψεις με πολύ καλή ακρίβεια.