Ogólnodostępna, wspomagana technologią sztucznej inteligencji baza danych zawierająca informacje na temat niemal każdego białka w ludzkim ciele może mieć znaczący wkład w rozwój nauki.
Białka są obecne we wszystkich żywych organizmach i obejmują wiele kluczowych związków biologicznych, takich jak enzymy, hormony i przeciwciała. Zrozumienie struktury białek ma kluczowe znaczenie dla rozwoju medycyny. Do tej pory udało się rozpracować jedynie niewielki procent z nich.
Naukowcy z londyńskiej firmy DeepMind wykorzystali technologię sztucznej inteligencji o nazwie AlphaFold do przewidzenia struktury niemal każdego białka wytwarzanego w naszych organizmach. Wraz z Europejskim Laboratorium Biologii Molekularnej (European Molecular Biology Laboratory, EMBL) zaprezentowali swoje osiągnięcie w czasopiśmie „Nature”.„Uważamy, że jest to jak dotąd najpełniejszy i najdokładniejszy obraz ludzkiego proteomu. Jesteśmy przekonani, że prace te stanowią najbardziej znaczący do tej pory wkład sztucznej inteligencji w rozwój wiedzy naukowej”, powiedział dr Demis Hassabis, współzałożyciel i dyrektor generalny firmy DeepMind, w rozmowie dla BBC. „Myślę też, że jest to świetna ilustracja i przykład korzyści, jakie sztuczna inteligencja może przynieść społeczeństwu. Nie możemy się doczekać, aby zobaczyć, jak wykorzysta to społeczność naukowa”. Prof. Edith Heard, dyrektor generalna EMBL, powiedziała: „Będzie to miało przełomowe znaczenie dla naszego zrozumienia funkcjonowania życia”.
Zespół badawczy opublikował najbardziej wyczerpującą i dokładną internetową bazę danych zawierającą 20 000 białek pochodzących z ludzkiego genomu. Baza zawiera również ponad 350 000 białek występujących u ludzi i innych organizmów, od bakterii i drożdży po myszy. W najbliższej przyszłości liczba ta wzrośnie do milionów białek. Przy użyciu technologii AlphaFold udało się precyzyjnie przewidzieć budowę przestrzenną białek na podstawie sekwencji ich aminokwasów. Aminokwasy są związkami organicznymi, które łączą się ze sobą, tworząc białka.Przez lata analizowanie niemal każdego białka zakodowanego w ludzkim genomie i przewidywanie jego prawdopodobnej struktury przestrzennej było zarówno czasochłonne, jak i kosztowne. Co więcej, oprogramowanie nie oferowało dostatecznej dokładności. Do tej pory udało nam się pozyskać informacje strukturalne na temat tylko 17 % wszystkich ludzkich białek. Przy użyciu technologii AlphaFold udało się przewidzieć pozycje strukturalne 58 % aminokwasów w proteomie. Pozycje prawie 36 % z nich zostały przewidziane z dużą pewnością.
Znajomość struktury przestrzennej może dostarczyć ważnych informacji na temat białka, np. o tym, jak oddziałuje ono z innymi białkami i substancjami chemicznymi. Struktura ta pomaga społeczności naukowej w odkrywaniu, w jaki sposób poszczególne mutacje zmieniają funkcję białka.
Dzięki zaawansowanemu systemowi sztucznej inteligencji naukowcy będą mogli przyspieszyć swoje prace w różnych dziedzinach – od neuronauki po medycynę. „Udostępnienie przewidywań z systemu AlphaFold międzynarodowej społeczności naukowej daje tak wiele nowych możliwości badawczych, od badania mało znanych chorób po nowe enzymy na potrzeby biotechnologii”, skomentował Ewan Birney, zastępca dyrektor generalnej EMBL i dyrektor EMBL-EBI, w komunikacie prasowym. „Jest to wspaniałe nowe narzędzie naukowe, które dopełnia istniejące technologie i pozwoli nam lepiej poznać nasz świat”.
„Zastosowania tej technologii ogranicza właściwie tylko nasza wyobraźnia […] baza danych AlphaFold poszerzy nasze zrozumienie funkcjonowania białek i ich roli w podstawowych procesach życiowych”, powiedziała prof. Heard w artykule opublikowanym na łamach „The Guardian”. „To zrozumienie ułatwi nam odkrywanie molekularnych mechanizmów życia i przyspieszy nasze działania na rzecz ochrony i leczenia ludzkiego zdrowia, a także zdrowia naszej planety”.