Salesforce ProGen to model języka AI, który wyróżnia się największą dostępną bazą danych o białkach. Został on szerzej opisany w ostatnim wydaniu Nature Biotech, gdzie przedstawiono, jak sztuczna inteligencja może przyczynić się do rozwiązania potencjalnych problemów związanych z chorobami człowieka oraz środowiskiem. Artykuł opisuje również pierwszą znaną strukturę 3D sztucznego białka, które zostało zaprojektowane w pełni przez AI.

Salesforce ProGen w swoim działaniu kieruje się tą samą ideą, co wielojęzyczne chatboty, które niedawno weszły do powszechnego użytku. Salesforce ProGen umożliwia naukowcom i badaczom wykorzystanie sztucznej inteligencji, jako narzędzia do projektowania wysoce dostosowanych białek o pożądanych właściwościach. Zespół Salesforce AI Research wykorzystuje obecnie ProGen do identyfikacji potencjalnych metod leczenia zaburzeń neurologicznych i autoimmunologicznych, takich jak reumatoidalne zapalenie stawów oraz stwardnienie rozsiane.

 

Sztuczne białka tak dobre, jak naturalne, a nawet lepsze

Co ciekawe, korzystając z ProGen, naukowcy przetestowali laboratoryjnie sztucznie stworzone białka i porównali je z tymi naturalnymi pod kątem funkcji antybakteryjnej. Odbyło się to we współpracy z Tierra Biosciences i laboratorium profesora Jamesa Frasera na Uniwersytecie Kalifornijskim w San Francisco. Wyniki pokazały, że aż 73% sztucznie wygenerowanych białek ProGen było funkcjonalnych, natomiast odsetek funkcjonalnych białek naturalnych wyniósł 59%.

 

– ProGen stanowi przykład tego, jakie zastosowanie może mieć sztuczna inteligencja w naukach biologicznych i opiece zdrowotnej – mówi Nikhil Naik, dyrektor ds. badań, Salesforce. – Badania pokazują, jak przydatne mogą być modele językowe w projektowaniu nowatorskich białek, które można wykorzystać w rzeczywistych problemach – dodaje ekspert Salesforce.

 

Korzystając z modelu językowego ProGen firmy Salesforce, naukowcy i badacze mogą teraz wykorzystywać AI jako narzędzie do projektowania wysokiej jakości precyzyjnie dostosowanych białek o pożądanych właściwościach, takich jak np. zdolność do łączenia się z innymi cząsteczkami czy też możliwość funkcjonowania w wysokich temperaturach.

Współpraca ProGen z Salesforce Research zaowocowała także pierwszą znaną strukturą 3D sztucznego białka zaprojektowanego w pełni przez AI.

 

Jak to działa?

ProGen, to model językowy, który może generować sekwencje białek o przewidywalnej funkcji w dużych rodzinach białek, co przypomina tworzenie gramatycznie i semantycznie poprawnych zdań w języku naturalnym. Model został wytrenowany na 280 milionach sekwencji białek z ponad 19 000 rodzin i jest wzbogacony o znaczniki kontrolne określające ich właściwości. ProGen może być dalej dostrajany do sekwencji i znaczników kontrolnych, aby poprawić wydajność generowania białek z rodzin o wystarczającej liczbie próbek homologicznych.