Το φετινό βραβείο Lasker Basic Medical Research Award απονεμήθηκε στους Demis Hassabis και John Jumper για τη συμβολή τους στη δημιουργία του συστήματος τεχνητής νοημοσύνης AlphaFold, το οποίο προβλέπει την τρισδιάστατη δομή των πρωτεϊνών με βάση την αλληλουχία πρώτης τάξης των αμινοξέων.
Τα αποτελέσματά τους λύνουν ένα πρόβλημα που απασχολεί εδώ και καιρό την επιστημονική κοινότητα και ανοίγουν την πόρτα στην επιτάχυνση της έρευνας σε ολόκληρο τον βιοϊατρικό τομέα. Οι πρωτεΐνες παίζουν καθοριστικό ρόλο στην ανάπτυξη ασθενειών: στη νόσο Αλτσχάιμερ, διπλώνονται και συσσωματώνονται. Στον καρκίνο, η ρυθμιστική τους λειτουργία χάνεται. Στις εγγενείς μεταβολικές διαταραχές, είναι δυσλειτουργικές. Στην κυστική ίνωση, εισέρχονται σε λάθος χώρο στο κύτταρο. Αυτοί είναι μόνο μερικοί από τους πολλούς μηχανισμούς που προκαλούν ασθένειες. Λεπτομερή μοντέλα δομής πρωτεϊνών μπορούν να παρέχουν ατομικές διαμορφώσεις, να καθοδηγήσουν το σχεδιασμό ή την επιλογή μορίων υψηλής συγγένειας και να επιταχύνουν την ανακάλυψη φαρμάκων.
Οι πρωτεϊνικές δομές προσδιορίζονται γενικά με κρυσταλλογραφία ακτίνων Χ, πυρηνικό μαγνητικό συντονισμό και κρυοηλεκτρονική μικροσκοπία. Αυτές οι μέθοδοι είναι δαπανηρές και χρονοβόρες. Αυτό έχει ως αποτέλεσμα τις υπάρχουσες βάσεις δεδομένων τρισδιάστατης δομής πρωτεϊνών με μόνο περίπου 200.000 δομικά δεδομένα, ενώ η τεχνολογία αλληλούχισης DNA έχει παράγει περισσότερες από 8 εκατομμύρια πρωτεϊνικές αλληλουχίες. Τη δεκαετία του 1960, οι Anfinsen et al. ανακάλυψαν ότι η μονοδιάστατη αλληλουχία αμινοξέων μπορεί αυθόρμητα και επαναλαμβανόμενα να αναδιπλωθεί σε μια λειτουργική τρισδιάστατη διαμόρφωση (Σχήμα 1Α) και ότι οι μοριακοί «συνοδοί» μπορούν να επιταχύνουν και να διευκολύνουν αυτή τη διαδικασία. Αυτές οι παρατηρήσεις οδηγούν σε μια 60ετή πρόκληση στη μοριακή βιολογία: την πρόβλεψη της τρισδιάστατης δομής των πρωτεϊνών από την μονοδιάστατη αλληλουχία αμινοξέων. Με την επιτυχία του Προγράμματος Ανθρώπινου Γονιδιώματος, η ικανότητά μας να λαμβάνουμε μονοδιάστατες αλληλουχίες αμινοξέων έχει βελτιωθεί σημαντικά και αυτή η πρόκληση έχει γίνει ακόμη πιο επείγουσα.
Η πρόβλεψη πρωτεϊνικών δομών είναι δύσκολη για διάφορους λόγους. Πρώτον, όλες οι πιθανές τρισδιάστατες θέσεις κάθε ατόμου σε κάθε αμινοξύ απαιτούν πολλή εξερεύνηση. Δεύτερον, οι πρωτεΐνες αξιοποιούν στο έπακρο τη συμπληρωματικότητα στη χημική τους δομή για να διαμορφώνουν αποτελεσματικά τα άτομα. Δεδομένου ότι οι πρωτεΐνες συνήθως έχουν εκατοντάδες «δότες» δεσμών υδρογόνου (συνήθως οξυγόνο) που θα πρέπει να βρίσκονται κοντά στον «δέκτη» δεσμών υδρογόνου (συνήθως άζωτο συνδεδεμένο με υδρογόνο), μπορεί να είναι πολύ δύσκολο να βρεθούν διαμορφώσεις όπου σχεδόν κάθε δότης βρίσκεται κοντά στον δέκτη. Τρίτον, υπάρχουν περιορισμένα παραδείγματα για την εκπαίδευση πειραματικών μεθόδων, επομένως είναι απαραίτητο να κατανοήσουμε τις πιθανές τρισδιάστατες αλληλεπιδράσεις μεταξύ αμινοξέων με βάση μονοδιάστατες αλληλουχίες χρησιμοποιώντας πληροφορίες σχετικά με την εξέλιξη των σχετικών πρωτεϊνών.
Η φυσική χρησιμοποιήθηκε για πρώτη φορά για την μοντελοποίηση της αλληλεπίδρασης των ατόμων στην αναζήτηση της καλύτερης διαμόρφωσης και αναπτύχθηκε μια μέθοδος για την πρόβλεψη της δομής των πρωτεϊνών. Οι Karplus, Levitt και Warshel τιμήθηκαν με το βραβείο Νόμπελ Χημείας του 2013 για την εργασία τους στην υπολογιστική προσομοίωση πρωτεϊνών. Ωστόσο, οι μέθοδοι που βασίζονται στη φυσική είναι υπολογιστικά ακριβές και απαιτούν κατά προσέγγιση επεξεργασία, επομένως δεν μπορούν να προβλεφθούν ακριβείς τρισδιάστατες δομές. Μια άλλη προσέγγιση «βασισμένη στη γνώση» είναι η χρήση βάσεων δεδομένων γνωστών δομών και αλληλουχιών για την εκπαίδευση μοντέλων μέσω τεχνητής νοημοσύνης και μηχανικής μάθησης (AI-ML). Οι Hassabis και Jumper εφαρμόζουν στοιχεία τόσο της φυσικής όσο και της AI-ML, αλλά η καινοτομία και το άλμα στην απόδοση της προσέγγισης προέρχονται κυρίως από την AI-ML. Οι δύο ερευνητές συνδύασαν δημιουργικά μεγάλες δημόσιες βάσεις δεδομένων με υπολογιστικούς πόρους βιομηχανικής ποιότητας για να δημιουργήσουν το AlphaFold.
Πώς ξέρουμε ότι έχουν «λύσει» το παζλ της δομικής πρόβλεψης; Το 1994, καθιερώθηκε ο διαγωνισμός Κριτικής Αξιολόγησης της Πρόβλεψης Δομής (CASP), ο οποίος πραγματοποιείται κάθε δύο χρόνια για την παρακολούθηση της προόδου της δομικής πρόβλεψης. Οι ερευνητές θα μοιράζονται την μονοδιάστατη αλληλουχία της πρωτεΐνης της οποίας τη δομή έχουν πρόσφατα αναλύσει, αλλά τα αποτελέσματά της δεν έχουν ακόμη δημοσιευτεί. Ο προγνωστικός παράγοντας προβλέπει την τρισδιάστατη δομή χρησιμοποιώντας αυτήν την μονοδιάστατη αλληλουχία και ο αξιολογητής κρίνει ανεξάρτητα την ποιότητα των προβλεπόμενων αποτελεσμάτων συγκρίνοντάς τα με την τρισδιάστατη δομή που παρέχεται από τον πειραματιστή (παρέχεται μόνο στον αξιολογητή). Το CASP διεξάγει πραγματικές τυφλές αξιολογήσεις και καταγράφει περιοδικές μεταβολές στην απόδοση που σχετίζονται με μεθοδολογική καινοτομία. Στο 14ο Συνέδριο CASP το 2020, τα αποτελέσματα πρόβλεψης του AlphaFold έδειξαν ένα τέτοιο άλμα στην απόδοση που οι διοργανωτές ανακοίνωσαν ότι το πρόβλημα της τρισδιάστατης πρόβλεψης δομής είχε λυθεί: η ακρίβεια των περισσότερων προβλέψεων ήταν κοντά σε αυτή των πειραματικών μετρήσεων.
Η ευρύτερη σημασία έγκειται στο ότι το έργο των Hassabis και Jumper καταδεικνύει πειστικά πώς η Τεχνητή Νοημοσύνη (AI-ML) θα μπορούσε να μεταμορφώσει την επιστήμη. Η έρευνά τους δείχνει ότι η AI-ML μπορεί να δημιουργήσει σύνθετες επιστημονικές υποθέσεις από πολλαπλές πηγές δεδομένων, ότι οι μηχανισμοί προσοχής (παρόμοιοι με αυτούς του ChatGPT) μπορούν να ανακαλύψουν βασικές εξαρτήσεις και συσχετίσεις στις πηγές δεδομένων και ότι η AI-ML μπορεί να κρίνει μόνο του την ποιότητα των αποτελεσμάτων της. Η AI-ML ουσιαστικά ασχολείται με την επιστήμη.
Ώρα δημοσίευσης: 23 Σεπτεμβρίου 2023




