Συντάχθηκε 17-10-2023 12:12
Τόπος:
Σύνδεσμος τηλεδιάσκεψης
Έναρξη: 17/10/2023 17:00
Λήξη: 17/10/2023 18:00
ΠΟΛΥΤΕΧΝΕΙΟ ΚΡΗΤΗΣ
Σχολή Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών
Πρόγραμμα Προπτυχιακών Σπουδών
ΠΑΡΟΥΣΙΑΣΗ ΔΙΠΛΩΜΑΤΙΚΗΣ ΕΡΓΑΣΙΑΣ
Γεωργίου - Νεκταρίου Νίκου
με θέμα
Μια πειραματική ανάλυση των αναστολών στο Twitter κατά την πρώτη περίοδο του COVID19
An experimental analysis of Twitter suspension during the first COVID19 period
Εξεταστική Επιτροπή
Αναπληρωτής Καθηγητής Ιωαννίδης Σωτήριος (Επιβλέπων)
Καθηγητής Λαγουδάκης Μιχαήλ
Καθηγητής Ζερβάκης Μιχαήλ
Περίληψη
Η παρούσα μελέτη έχει ως στόχο την καταγραφή των συναισθημάτων των ανθρώπων στα tweets τους σχετικά με το COVID-19 και στην εξέταση τυχόν προσπαθειών διάδοσης ψευδών ειδήσεων και παραπληροφόρησης στο Twitter. Η έρευνά μας βασίζεται σε ένα σύνολο δεδομένων που συλλέχθηκε μέσω του Twitter API, το οποίο περιέχει περίπου 200 εκατομμύρια tweets από δύο δημοφιλή hashtags που σχετίζονται με το COVID-19. Εφαρμόζουμε ανάλυση συναισθήματος χρησιμοποιώντας το μοντέλο XLM-RoBERTa-large σε διάφορα θέματα που σχετίζονται με την πανδημία COVID-19. Στη συνέχεια, πραγματοποιούμε ανάλυση δεδομένων για να εντοπίσουμε ενδιαφέροντα μοτίβα και χαρακτηριστικά σε αυτό το μεγάλο dataset. Η έρευνά μας επίσης επικεντρώθηκε σε λογαριασμούς Twitter που έχουν ανασταλεί και χρησιμοποιούμε τον αλγόριθμο Latent Dirichlet Allocation για να εντοπίσουμε τα θεμάτα συζήτησης τους. Επιπλέον κατασκευάζουμε τον γράφο αναδημοσιεύσεων για να αναλύσουμε τις συνδέσεις τους στο κοινωνικό δίκτυο, επιτρέποντάς μας να εντοπίσουμε τυχόν συντονισμένες ενέργειες για την αναδημοσίευση του ίδιου περιεχομένου σε μεγάλες ποσότητες. Τα αποτελέσματα έδειξαν μια τάση στα συναισθήματα προς όρους όπως COVID-19, συνωμοσία και lockdown. Παρατηρούμε ότι παρόλο που οι ανεσταλμένοι χρήστες αποτελούσαν μόνο το 0,74% των συνολικών χρηστών, δημιούργησαν το 7,52% των συνολικών αναρτήσεων.
Abstract
This study aims to capture the overall sentiment of people’s tweets regarding COVID-related subjects and to examine any attempts to spread fake news and misinformation on Twitter. Our research is based on a dataset collected through the Twitter API, containing approximately 200 million tweets from two popular COVID-related hashtags. We conduct sentiment analysis using the XLM-RoBERTa-large model on several topics related to the COVID-19 pandemic. Next, we perform data analysis to identify interesting patterns and characteristics of this vast dataset. Our research also targets suspended Twitter accounts and by using the Latent Dirichlet Allocation algorithm we identify their topics of discussion. We construct the retweet social graph to analyze their social network connections, enabling us to detect any coordinated actions to retweet the same content in large quantities. The results showed a trend in sentiment towards terms like COVID-19, conspiracy, and lockdown. We observe that although suspended users made up only 0.74% of the dataset, they generated 7.52% of the total posts.
Meeting ID: 934 9205 3012
Password: 219023