Google ma darmowe narzędzie dla lekarzy i naukowców. Pomoże zobaczyć to, czego nie widzi ludzkie oko
Tomografia komputerowa, jakkolwiek pomocna by nie była, stanowi wyzwanie dla radiologów. Metoda obrazowania dostarcza niezwykle ważnych danych, lecz ich analiza zajmuje sporo czasu - i to nie tylko lekarzom. Pomocną dłoń wyciągnął Google, tworząc narzędzie pozwalające skondensować ogromne skany w... ciągi liczb.
Tomografia komputerowa (TK) to jedna z najczęściej wykorzystywanych metod diagnostyki obrazowej. Choć kojarzy się z diagnostyką raka oraz schorzeń neurologicznych, to z pomocą tej metody lekarze mogą skutecznie poszukiwać zatorów i krwawień, obrazować urazy czy "zajrzeć" w płuca lub jamę brzuszną. To jednak ma swoją cenę, gdyż skany wykonane z pomocą tomografii komputerowej są ogromne, osiągając w cyfrowym wariancie (standard DICOM) nawet kilkaset megabajtów.
Google ma narzędzie do zamiany diagnostyki obrazowej w ciąg liczb. To ma większe znaczenie niż wiele osób myśli
Ponadto skany TK są wolumetryczne - pozwalają w trójwymiarowej przestrzeni uchwycić zarówno tkanki, jak i płyny, ich interpretacja jest bardziej skomplikowana i czasochłonna dla radiologów w porównaniu do dwuwymiarowych zdjęć rentgenowskich. Biorąc pod uwagę potencjalny rozmiar i strukturę, analiza tych obrazów to także wyzwanie dla sztucznej inteligencji, która potencjalnie może wesprzeć naukowców przy diagnostyce i "zobaczyć" to, co umknęło ludzkim oczom.
Tu z ciekawą propozycją wyszli inżynierowie Google'a, którzy opracowali narzędzie do przetwarzania obrazowania medycznego, CT Foundation. CT Foundation przetwarza serię zdjęć 2D w standardzie DICOM na "mały i bogaty" ciąg numeryczny, który można następnie wykorzystać do szybkiego trenowania modeli AI przy niewielkiej ilości danych.
Ciąg numeryczny zawiera w sumie 1408 liczb, które podsumowują wszystkie ważne informacje z danego skanu TK, takie jak informacje o narządach, tkankach i obecności nieprawidłowości. Interfejs API CT Foundation przetwarza surowe obrazy DICOM, sortując poszczególne "plasterki", składając je w trójwymiarowy model, a następnie uruchamiając wnioskowanie modelu AI, który interpretuje widoczne na skanie elementy ludzkiego ciała, a następnie zwraca ciąg 1408 liczb z zakodowanymi informacjami.
Model AI, który odpowiada za wnioskowanie i interpretację skanów w CT Foundation to VideoCoCa, przetwarzający wideo na tekst. Do treningu CT Foundation wykorzystano pół miliona pozbawionych danych osobowych skanów wykonanych przy użyciu tomografii komputerowej oraz sporządzoną dla każdego skanu dokumentację medyczną.
Osadzenia te można następnie wykorzystać jako dane wejściowe dla dalszych modeli klasyfikatorów, takich jak regresja logistyczna lub perceptrony wielowarstwowe. Korzystając z osadzeń, można tworzyć wydajne modele w zadaniach klasyfikacyjnych z mniejszą ilością danych w porównaniu do inicjowania szkolenia z ogólnego modelu 3D. Ponieważ użytkownik końcowy musi jedynie wytrenować ostateczny klasyfikator, który ma stosunkowo niewielki rozmiar, oszczędza również znacznie na obliczeniach w porównaniu do dostrajania ogólnego modelu 3D
- czytamy we wpisie na blogu Google'a poświęconemu CT Foundation.
Stworzenie CT Foundation było możliwe dzięki poprzednim pracom inżynierów nad modelem AI do wykrywania raka płuc, a także partnerstwem z holenderską firmą Aidence zajmującą się tworzeniem rozwiązań dla radiologów wykorzystujących AI oraz indyjską firma Apollo Radiology International, które przeprowadzało testy skuteczności AI Google'a.
Jak zastrzega Google, CT Foundation został opracowany wyłącznie do celów badawczych i "jako taki nie może być wykorzystywany w opiece nad pacjentami i nie jest przeznaczony do diagnozowania, leczenia, łagodzenia, leczenia lub zapobiegania chorobom". Inżynierowie i naukowcy zainteresowani narzędziem, mogą poprzez specjalny formularz przesłać prośbę do Google o bezpłatne udostępnienie API CT Foundation.