Τα τελευταία δύο χρόνια, η μηχανική μάθηση έφερε επανάσταση στην πρόβλεψη της δομής των πρωτεϊνών. Τώρα αμερικανοί βιολόγοι δείχνουν ότι μπορούν να τη χρησιμοποιήσουν για ταχύτερη και ακριβέστερη δημιουργία πρωτεϊνών από ό,τι ήταν μέχρι πρότινος δυνατό.
«Οι πρωτεΐνες είναι θεμελιώδεις στη βιολογία, αλλά γνωρίζουμε ότι όλες οι πρωτεΐνες που βρίσκονται σε κάθε φυτό, ζώο και μικρόβιο αποτελούν πολύ λιγότερο από το 1% του δυνατού. Με τα νέα εργαλεία λογισμικού είμαστε σε θέση να αντιμετωπίζουμε μακροχρόνιες προκλήσεις στην ιατρική, την ενέργεια και την τεχνολογία», δηλώνει ο David Baker, καθηγητής βιοχημείας στην Ιατρική Σχολή του Πανεπιστημίου της Ουάσιγκτον και αποδέκτης του Βreakthrough Prize in Life Sciences για το 2021.
Οι πρωτεΐνες αναφέρονται συχνά ως «δομικά στοιχεία της ζωής», επειδή είναι απαραίτητες για τη δομή και τη λειτουργία όλων των ζωντανών όντων. Συμμετέχουν ουσιαστικά σε κάθε διαδικασία που λαμβάνει χώρα μέσα στα κύτταρα, συμπεριλαμβανομένης της ανάπτυξης, της διαίρεσης και της επιδιόρθωσης. Οι πρωτεΐνες αποτελούνται από μακριές αλυσίδες χημικών μορίων που ονομάζονται αμινοξέα, η αλληλουχία των οποίων καθορίζει το τρισδιάστατο σχήμα τους. Αυτό το περίπλοκο σχήμα είναι ζωτικής σημασίας για τη λειτουργία τους .
Πρόσφατα, ισχυροί αλγόριθμοι μηχανικής μάθησης, συμπεριλαμβανομένων των AlphaFold και RoseTTAFold, εκπαιδεύτηκαν για τη λεπτομερή πρόβλεψη του σχήματος των φυσικών πρωτεϊνών με βάση αποκλειστικά τις αλληλουχίες αμινοξέων τους. Η μηχανική μάθηση είναι ένας τύπος τεχνητής νοημοσύνης που επιτρέπει στους υπολογιστές να μαθαίνουν από δεδομένα χωρίς να είναι ρητά προγραμματισμένοι και μπορεί να χρησιμοποιηθεί για τη μοντελοποίηση σύνθετων επιστημονικών προβλημάτων που είναι πολύ δύσκολο να κατανοήσουν οι άνθρωποι.
AI-hallucinated συμμετρικοί δακτύλιοι. Image: Ian Haydo
Για να προχωρήσει πέρα από τις πρωτεΐνες που βρίσκονται στη φύση, η ομάδα του Baker χώρισε την πρόκληση του σχεδιασμού πρωτεϊνών σε τρία μέρη και χρησιμοποίησε νέες λύσεις λογισμικού, συμπεριλαμβανομένου του ProteinMPNN.
Η πρώτη πρόκληση ήταν να δημιουργηθεί ένα νέο σχήμα πρωτεΐνης. Η ομάδα ανέπτυξε δύο στρατηγικές για το σχεδιασμό νέων πρωτεϊνικών δομών. Η πρώτη, που ονομάστηκε "hallucination", είναι παρόμοια με το DALL-E (που αναπτύχθηκε από την OpenAI για τη δημιουργία ψηφιακών εικόνων από περιγραφές φυσικής γλώσσας) ή με άλλα AI εργαλεία που παράγουν αποτελέσματα βάσει απλών προτροπών. Η δεύτερη, που ονομάζεται "inpainting", είναι ανάλογη με το χαρακτηριστικό αυτόματης συμπλήρωσης που βρίσκεται στις σύγχρονες γραμμές αναζήτησης.
Η δεύτερη πρόκληση ήταν η επιτάχυνση της διαδικασίας. Η ομάδα επινόησε έναν νέο αλγόριθμο για τη δημιουργία αλληλουχιών αμινοξέων που ονομάζεται ProteinMPNN, που «τρέχει» σε περίπου ένα δευτερόλεπτο. Αυτό είναι περισσότερο από 200 φορές ταχύτερο από το προηγούμενο καλύτερο λογισμικό, τα αποτελέσματά του είναι ανώτερα από αυτά που παράγουν προηγούμενα εργαλεία και δεν απαιτεί προσαρμογή από ειδικούς για να λειτουργήσει.
«Τα νευρωνικά δίκτυα εκπαιδεύονται εύκολα αν έχουμε πολλά δεδομένα, αλλά με πρωτεΐνες, δεν έχουμε τόσα όσα θα θέλαμε. Έπρεπε να μπούμε και να εντοπίσουμε ποια χαρακτηριστικά σε αυτά τα μόρια είναι τα πιο σημαντικά. Ήταν ένα κομμάτι δοκιμής και λάθους», συμπληρώνει ο επιστήμονας Justas Dauparas, μεταδιδακτορικός συνεργάτης στο Ινστιτούτο για τον Σχεδιασμό Πρωτεϊνών.
Τρίτον, η ομάδα χρησιμοποίησε το AlphaFold, ένα εργαλείο που αναπτύχθηκε από το DeepMind της Alphabet, για να αξιολογήσει ανεξάρτητα εάν οι αλληλουχίες αμινοξέων που προέκυψαν ήταν πιθανό να αναδιπλωθούν στα επιδιωκόμενα σχήματα. «Διαπιστώσαμε ότι οι πρωτεΐνες που δημιουργούνται με τη χρήση του λογισμικού ProteinMPNN είναι πολύ πιο πιθανό να αναδιπλωθούν όπως προβλέπουμε. Μπορούμε να δημιουργήσουμε πολύ περίπλοκα δίκτυα πρωτεϊνών χρησιμοποιώντας αυτές τις μεθόδους», προσθέτει ο Basile Wicky, μεταδιδακτορικός συνεργάτης στο Institute for Protein Design.
Μεταξύ των νέων πρωτεϊνών που δημιουργήθηκαν ήταν και δακτύλιοι νανοκλίμακας που οι ερευνητές πιστεύουν ότι θα μπορούσαν στο μέλλον να αποτελέσουν τμήματα για προσαρμοσμένες νανομηχανές.
«Αυτή είναι η αρχή της μηχανικής μάθησης στον σχεδιασμό πρωτεϊνών. Τους επόμενους μήνες, θα εργαστούμε για να βελτιώσουμε αυτά τα εργαλεία και να δημιουργήσουμε ακόμη πιο δυναμικές και λειτουργικές πρωτεΐνες», καταλήγει ο Baker.
Τα παραπάνω συμπεράσματα δημοσιεύτηκαν πρόσφατα σε τρεις εργασίες στο περιοδικό Science.
Πηγή:UW Medicine
from Dnews: Τελευταία νέα και ειδήσεις https://ift.tt/U1m2hFl
via IFTTT
from kaliterilamia.gr https://ift.tt/FkOBHt4
via IFTTT