Laboratorium Bioinformatyki i Analiz in silico (LBA)

LBA z uwagi na posiadane kompetencje w modelowaniu za pomocą technik sztucznej inteligencji (AI) i uczenia maszynowego (ML) będzie stanowić pomost pomiędzy wszystkimi laboratoriami w celu integracji danych do stworzenia holistycznego modelu analizowanego problemu.

Przykładowym scenariuszem może być łączenie danych z obrazowania różnymi technikami (MRI/PET) ze strukturą chemiczną związków i wynikami badań oraz symulacji farmakokinetycznych w celu oceny potencjalnego działania terapeutycznego nowych struktur chemicznych.

Wyniki badań obrazowania mogą stanowić dodatkowy punkt końcowy badań biologicznych, który może być przewidywany przez modele AI/ML na podstawie struktury chemicznej związku oraz w oparciu o dodatkowe informacje jak np. przewidziane lub zmierzone parametry farmakokinetyczne czy fizykochemiczne. Jako że obrazowanie można powiązać ze stanem fizjologicznym i patologicznym badanego modelu biologicznego, może stanowić to surogat bezpośredniego pomiaru efektu farmakologicznego i/lub toksycznego po podaniu substancji leczniczej.

 W ten sposób możliwe będzie zobiektywizowanie i uzupełnienie pomiaru trudnych do kwantyfikacji efektów jak np. zdolności poznawcze. Podany przykład nie wyczerpuje możliwości interakcji LBA z innymi laboratoriami, ponieważ modele AI/ML są zdolne do integracji wszelkiej dostępnej charakterystyki badanych substancji leczniczych i modelowania różnych punktów końcowych, a w związku z tym do budowania unikatowych modeli QSAR/QSPR zaprojektowanych od początku do końca na podstawie dostępnej infrastruktury badawczej.

Aktualnie na Wydziale Farmaceutycznym, gdzie działa LBA, pracuje heterogeniczny system obliczeniowy oparty na 20 klasycznych stacjach roboczych PC wyposażonych w różne generacje procesorów firm Intel i AMD – wiek wykorzystywanych maszyn waha się od 2 do 15 lat. Łącznie dostępnych jest ok. 400 wątków obliczeniowych. Stacje robocze są włączone w system typu grid służący do zarządzania obliczeniami: poszukiwania wolnych zasobów, zautomatyzowanego uruchamiania prac obliczeniowych i sortowania oraz oceny wyników modelowania. 

System pracuje w środowisku Linux i do opisanego wyżej zarządzania obliczeniami wykorzystuje autorskie oprogramowanie napisane w języku skryptowym bash. System pracuje w trybie model-agnostic tj. uruchamiane są różne procesy i w zależności od potrzeb doinstalowywane niezbędne komponenty. Aktualnie dostępne są środowiska R i Python a także oprogramowanie z dziedziny informatyki chemicznej (Orca).

Na jednej stacji roboczej mogą pracować różne systemy modelowania. Zaimplementowano system zarządzania priorytetami obliczeniowymi i wyboru jednostek obliczeniowych dla konkretnego zadania obliczeniowego. Transfer danych jest oparty na protokole SSH zapewniając poufność przesyłanych danych. Wdrożono również techniki wirtualizacji pozwalające na uruchamianie na jednej maszynie kilku systemów operacyjnych naraz.

System ma architekturę otwartą tj. pozwala na dynamiczne dołączanie i odłączanie stacji roboczych, a nawet fizyczną delokalizację jednostek obliczeniowych. Planowane do zakupu stacje robocze zostaną właśnie w taki sposób dołączone do działającego już narzędzia jako znaczące rozszerzenie możliwości obliczeniowych.

Publikacje naukowe  z wykorzystaniem infrastruktury CDT-CARD Curated Database and Preliminary AutoML QSAR Model for 5 HT1A Receptor