Przełomowe badanie opublikowane w czasopiśmie Science wykazało, że zaawansowane systemy sztucznej inteligencji mogą przewyższać lekarzy na oddziałach ratunkowych w stawianiu diagnoz i ustalaniu planów leczenia. Autorzy badania podkreślają jednak, że ten skok technologiczny nie oznacza końca roli ludzkiego lekarza. Zamiast tego wskazuje na pilną potrzebę zaostrzenia standardów regulacyjnych i przejścia w stronę modeli współpracy, w których sztuczna inteligencja wspiera ocenę kliniczną, a nie ją zastępuje.

Badanie: sztuczna inteligencja kontra lekarze

Pracami kierował Arjun Manraj, adiunkt bioinformatyki w Harvard Medical School. W eksperymencie porównano modele dużych języków (LLM) OpenAI z serii o1 z grupą kontrolną certyfikowanych praktyków. W testach wykorzystano kombinację standardowych przypadków klinicznych i rzeczywistych danych uzyskanych od losowo wybranych pacjentów na oddziale ratunkowym centrum medycznego w Massachusetts.

Wyniki były imponujące. W zadaniach sięgających od wstępnej selekcji pacjentów po końcową diagnozę i etapy leczenia sztuczna inteligencja dorównywała lub przewyższała możliwości ludzi. Korzyści płynące z modelu były najbardziej zauważalne we wczesnej fazie segregacji, krytycznej fazie, gdy decyzje muszą być podejmowane na podstawie ograniczonych informacji. Chociaż dokładność zarówno lekarzy, jak i sztucznej inteligencji poprawiła się w miarę udostępniania nowych danych, model językowy wykazał doskonałą zdolność radzenia sobie z niepewnością, skutecznie radząc sobie z fragmentaryczną lub nieustrukturyzowaną dokumentacją medyczną, typową dla rzeczywistych sytuacji awaryjnych.

“Krótko mówiąc, model uzyskał lepsze wyniki niż nasza duża grupa kontrolna lekarzy. Zobaczysz to szczegółowo, ale należy zauważyć, że grupa składała się z certyfikowanych lekarzy, a przypadki były prawdziwe i zaangażowane” – powiedział Manraj podczas wirtualnej konferencji prasowej.

Dlaczego to ma znaczenie: poza nagłówkami

Choć nagłówki mediów mogą sprawiać wrażenie, że sztuczna inteligencja jest „lepsza” od lekarzy, kontekst jest bardziej zróżnicowany. Badanie to stanowi znaczącą ewolucję w stosunku do wcześniejszych podejść algorytmicznych, które wcześniej pozostawały w tyle za klinicystami. Tym, co czyni to badanie wyjątkowym, jest jego skala i bezpośrednie bezpośrednie porównanie w realistycznych warunkach klinicznych.

Jednak odkrycia te rodzą krytyczne pytania dotyczące przyszłości opieki zdrowotnej:

  • Ograniczenia tekstowej sztucznej inteligencji: Rzeczywista praca kliniczna w dużej mierze opiera się na sygnałach wizualnych i słuchowych — takich jak ton głosu pacjenta, kolor skóry czy chód — których obecne LLM oparte na tekście nie są w stanie zinterpretować. W badaniu zauważono, że przyszłe prace powinny skupiać się na tym, jak ludzie i maszyny mogą współpracować przy użyciu tych sygnałów nietekstowych.
  • Bezpieczeństwo i równość: w bieżącym badaniu nie oceniano, czy pomoc wspomagana przez sztuczną inteligencję jest bezpieczna, sprawiedliwa i opłacalna. Czynniki te są niezbędne do powszechnego przyjęcia technologii.
  • Luki w przepisach: Jak przestrzegł Manrai: „Nie sądzę, że nasze odkrycia oznaczają, że sztuczna inteligencja zastąpi lekarzy… Myślę, że oznacza to, że widzimy głęboką zmianę w technologii, która zmieni medycynę, i musimy teraz ocenić tę technologię, przeprowadzając rygorystyczne prospektywne badania kliniczne”.

Zażądaj ścisłego nadzoru

Badanie to służy jako katalizator szerszych debat na temat polityki zdrowotnej. Ashley M. Hopkins i Eric Corneliss, badacze z Flinders University w Australii, opublikowali komentarz w czasopiśmie „Science” wraz z artykułem, w którym argumentowali za koniecznością zapewnienia, aby systemy sztucznej inteligencji spełniały te same rygorystyczne standardy, co ludzie.

„Nie pozwalamy lekarzom wykonywać zawodu bez nadzoru i oceny, a sztuczna inteligencja musi spełniać porównywalne standardy” – stwierdziła Corneliss. Oznacza to, że organy regulacyjne, szpitale i świadczeniodawcy muszą współpracować w celu ustalenia solidnych ram testowania przed wprowadzeniem tych narzędzi do praktyki klinicznej. Celem jest zapewnienie, że sztuczna inteligencja poprawi opiekę nad pacjentami bez wprowadzania nowych zagrożeń i nierówności.

Wniosek

Badanie to stanowi punkt zwrotny w technologii medycznej, pokazując, że w pewnych kontekstach sztuczna inteligencja może wykonywać złożone zadania diagnostyczne skuteczniej niż lekarze. Jednak konsensus wśród ekspertów jest jasny: sztuczna inteligencja to potężne narzędzie współpracy, a nie zamiennik. Bezpośrednim priorytetem dla branży opieki zdrowotnej jest opracowanie rygorystycznych standardów oceny i protokołów bezpieczeństwa w celu odpowiedzialnego wdrożenia tej technologii, zapewniając w ten sposób jej skuteczną obsługę zarówno lekarzom, jak i pacjentom.