Klasyczna statystyka czy metody oparte na uczeniu maszynowym? W ramach wspieranych przez Unię Europejską projektów naukowcy przeprowadzają pierwsze w historii obiektywne porównanie konwencjonalnych i nowych metod, które służą dekodowaniu dyfuzji anomalnej.
Niemal 80 lat po tym, jak szkocki botanik Robert Brown opisał ciągły przypadkowy ruch mikroskopijnych cząsteczek w płynie, Albert Einstein opracował teoretyczne podwaliny wyjaśniające to zjawisko. Od tamtego czasu naukowcy odkryli wiele układów, które w znaczący sposób odbiegają od praw rządzących ruchami Browna. Zjawisko to, określane mianem dyfuzji anomalnej, występuje w wielu układach, począwszy od transportu molekuł w jądrze komórkowym, aż po strategie żerowania zwierząt czy wahania kursów giełdowych.
Z czasem naukowcy opracowali liczne metody pozwalające na zrozumienie tego zjawiska, opierające się na statystyce klasycznej. Postępy, które dokonały się w ostatnich latach w zakresie uczenia maszynowego, pozwoliły na opracowanie bardziej zaawansowanych narzędzi i metod opartych na danych, umożliwiających charakteryzację dyfuzji anomalnej na podstawie pojedynczych trajektorii.
Teraz naukowcy wspierani w ramach finansowanych ze środków Unii Europejskiej projektów NOQIA, OPTOlogic oraz ComplexSwimmers przeprowadzili pierwsze obiektywne porównanie tradycyjnych i nowatorskich metod wykorzystywanych w celu dekodowania dyfuzji anomalnej w różnych realistycznych scenariuszach. Wyniki ich badań zostały opublikowane na łamach czasopisma naukowego „Nature Communications”.W celu porównania zróżnicowanych metod, zespół badawczy zebrał społeczność naukową i zorganizował otwarty konkurs zatytułowany Anomalous Diffusion challenge (wyzwanie AnDi). Zadaniem biorących w nim udział zespołów było zastosowanie opracowanych przez siebie algorytmów do analizy ustalonego zestawu danych, obejmującego różne warunki.
W skład wyzwania AnDi wchodziły trzy zadania. Pierwsze zadanie polegało na wywnioskowaniu wykładnika dyfuzji anomalnej, drugie wymagało od uczestników sklasyfikowania modelu dyfuzji, natomiast ostatnie polegało na segmentacji trajektorii. Każde zadanie było dodatkowo podzielone na trzy zadania cząstkowe odpowiadające wymiarom trajektorii: 1D, 2D oraz 3D.
Według opublikowanych wyników, choć żadna z metoda nie okazała się najlepsza we wszystkich scenariuszach, metody oparte na uczeniu maszynowym sprawdziły się lepiej niż metody konwencjonalne we wszystkich zadaniach. „Dla każdego wymiaru byliśmy w stanie zidentyfikować grupę metod o porównywalnej wydajności, które znacznie zwiększyły precyzję wykładnika dyfuzji anomalnej w stosunku do wartości podstawowej, jaką daje klasyczna estymacja MSD”, wyjaśniają autorzy badania. MSD oznacza w tym wypadku średnie przemieszczenie kwadratowe. „Wszystkie te podejścia były oparte na uczeniu maszynowym, stąd możemy wywnioskować, że oparte na tej technologii metody mogą sprawdzać się lepiej niż te oparte na statystyce klasycznej. Dzieje się tak prawdopodobnie dlatego, że mogą uzyskiwać pewne informacje z trajektorii złożonych modeli, których analiza przy użyciu klasycznych metod statystycznych nastręcza wielu trudności”.
Wyniki tego badania podkreślają znaczenie wysiłków podejmowanych przez społeczność naukową na rzecz rozwoju nauki. W nadziei, że podjęte w wyniku projektu działania zostaną wykorzystane przez innych badaczy w celu osiągnięcia szerszego konsensusu naukowego, zespół opracował interaktywne narzędzie do przechowywania zestawów danych i wyników wyzwania. Naukowcy mogą teraz weryfikować nowe metody zgodnie z zasadami wyzwania i porównywać uzyskane wyniki z rezultatami innych zespołów biorących udział w konkursie. Wyzwanie AnDi pozostanie otwarte dla wszystkich chętnych, a na żądanie będą dostępne także nowe informacje na temat lepszych wyników.
Dr Carlo Manzo, starszy autor badania, omówił jego wyniki w wypowiedzi na potrzeby informacji prasowej opublikowanej w serwisie „EurekAlert!”: „Wyniki tego badania jeszcze bardziej podkreślają kluczową rolę, jaką odgrywa dyfuzja anomalna w definiowaniu funkcji biologicznych w wielu skalach, jednocześnie pozwalając nam na spojrzenie z nowej perspektywy na stan całej dziedziny i zapewniając punkt odniesienia dla badaczy, którzy zajmą się nią w przyszłości”. Dr Manzo jest naukowcem odbywającym wizyty naukowe na Instytucie Nauk Fotonicznych w Barcelonie, który koordynuje projekty NOQIA (NOvel Quantum simulators – connectIng Areas) oraz OPTOlogic (Optical Topologic Logic). Koordynatorem projektu ComplexSwimmers (Biocompatible and Interactive Artificial Micro- and Nanoswimmers and Their Applications) jest Uniwersytet w Göteborgu.
Więcej informacji: