Συντάχθηκε 08-07-2019 14:48
Ομιλητής: Νικόλαος Αλαχιώτης
Τίτλος: RΑiSD-X: Ένα σύστημα υπερυψηλής ταχύτητας για την εύρεση ιχνών θετικής επιλογήςσε χιλιάδες γονιδιωματικές ακολουθίες
RAiSD-X: An ultrafast acceleration system to detect traces of positive selection in thousands of genomes
Περίληψη
Η εύρεση γενετικών τόπων που έχουν αποκριθεί σε εξελικτικές πιέσεις, όπως η θετική επιλογή, επιτρέπει την καλύτερη κατανόηση του τρόπου επιβίωσης και προσαρμογής οργανισμών σε ένα περιβάλλον. Πέρα από θεωρητική σημασία, έχει επίσης και σημαντικές πρακτικές εφαρμογές, καθώς μπορεί να κατευθύνει τον εντοπισμό μεταλλάξεων σε παθογόνους μικροοργανισμούς που αντιστέκονται σε φάρμακα και να οδηγήσει στο σχεδιασμό πιο αποτελεσματικών θεραπειών. Σημαντικές εξελίξεις σε τεχνολογίες αλληλούχησης DNA κατά την τελευταία δεκαετία, έχουν οδηγήσει στη συλλογή γονιδιωματικών δεδομένων με πρωτοφανή ρυθμό και κατά συνέπεια σε συνεχώς αυξανόμενες απαιτήσεις για υπολογιστική ισχύ και μνήμη. Ωστόσο, οι περισσότερες διαθέσιμες μέθοδοι ανίχνευσης θετικής επιλογής δεν έχουν σχεδιαστεί για να χειρίζονται μεγάλο αριθμό από ολόκληρες γονιδιωματικές ακολουθίες και επιβάλλουν τρόπους ανάλυσης που μειώνουν το συνoλικό χρόνο εκτέλεσης με συνεπαγόμενο κόστος και τη μείωση της ακρίβειας, το οποίο είναι άκρως ανησυχητικό για μελλοντικές αναλύσεις μεγάλης κλίμακας. Για το σκοπό αυτό, παρουσιάζεται το σύστημα υπερυψηλής ταχύτητας RΑiSD-X, το οποίο συνδυάζει α) μια καινοτόμο μέθοδο για την εύρεση θετικής επιλογής, η οποία έχει σχεδιαστεί ειδικά για να εξυπηρετήσει και να καθοδηγήσει το σχεδιασμό μιας αποδοτικής αρχιτεκτονικής ειδικού σκοπού σε τεχνολογία FPGA, β) ένα σύνολο αλγοριθμικών λύσεων που μειώνουν την υπολογιστική πολυπλοκότητα του προβλήματος και παράλληλα ορχηστρώνουν την εκτέλεση υπολογισμών στο υλικό και γ) μια επεκτάσιμη αρχιτεκτονική επιτάχυνσης, η οποία βασίζεται στο μοντέλο αποσυνδεμένης πρόσβασης-εκτέλεσης (decoupled access-execute). To RAiSD-X επιτυγχάνει μέχρι και 1760 φορές πιο γρήγορες αναλύσεις από ένα επεξεργαστή γενικού σκοπού ο οποίος εκτελεί την πιο ευρέως χρησιμοποιούμενη μέθοδο ανίχνευσης θετικής επιλογής, καθώς και μέχρι 100 φορές ταχύτερες αναλύσεις από το πιο αποδοτικό παράλληλο πρόγραμμα για τον ίδιο σκοπό, όταν χρησιμοποιεί 20 επεξεργαστικούς πυρήνες. Τέλος, το RAiSD-X χρησιμοποιήθηκε για την ανάλυση ολόκληρου του ανθρώπινου γονιδιώματος, αναλύοντας το γενετικό υλικό 2504 ανθρώπων σε λιγότερο από 3 ώρες, με τη χρήση μόλις 100ΜΒ μνήμης.
Abstract
Detecting traces of positive selection in genomes carries theoretical significance and has practical applications, from shedding light on the forces that drive adaptive evolution to the design of more effective drug treatments. The size of genomic datasets currently grows at an unprecedented pace, fueled by continuous advances in DNA sequencing technologies, leading to ever-increasing compute and memory requirements for meaningful genomic analyses. The majority of existing methods for positive selection detection either are not designed to handle whole genomes or scale poorly with the sample size; they inevitably resort to a run-time versus accuracy trade-off, raising an alarming concern for the feasibility of future large-scale scans. To this end, I am going to present RAiSD-X, a high-performance system that combines a) a novel detection method for positive selection, which was specifically devised to facilitate the design of an efficient accelerator hardware architecture for FPGAs, b) a series of algorithmic solutions that reduce computational complexity and orchestrate computation on the accelerator hardware, and c) a versatile decoupled access -execute accelerator architecture. RAiSD-X achieves up to 1760 times faster processing than a general-purpose processor that executes the most widely used detection method, as well as up to 100 times faster processing than the most heavily optimized parallel software for the same purpose, when executing on 20 processing cores. Importantly, RAiSD-X can exhaustively scan 2504 whole human genomes in less than 3 hours, allocating as low as 100MB of main memory.
Τόπος: Λ - Κτίριο Επιστημών/ΗΜΜΥ, 141Π-36,141Π-37, Αίθουσα Συνεδριάσεων Σχολής ΗΜΜΥ, Πολυτεχνειούπολη
Έναρξη: 10/07/2019 12:00
Λήξη: 10/07/2019 13:00