Prema nedavnoj studiji istraživača iz Mass General Brigham, generativna vještačka inteligencija (AI) pokazuje značajne nedostatke kada je u pitanju donošenje kliničkih odluka. Istraživanje je pokazalo da modeli velikih jezika (LLM) ne mogu postaviti odgovarajuću diferencijalnu dijagnozu u više od 80 posto slučajeva, što ukazuje na to da AI još uvijek nije spremna za sigurnu kliničku upotrebu.
Studija, objavljena u medicinskom časopisu JAMA Network Open, analizirala je rad 21 LLM-a, uključujući najnovije verzije Claudea, DeepSeeka, Geminija, GPT-a i Groka. Istraživači su koristili alat pod nazivom PrIME-LLM, koji procjenjuje sposobnosti modela u različitim fazama kliničkog rasuđivanja, uključujući provođenje inicijalne dijagnoze i planiranje liječenja.
Marc Succi, koautor studije, naglasio je da čak i uz poboljšanja, standardni modeli velikih jezika ne ispunjavaju kriterije za nenadziranu primjenu u kliničkim situacijama. On je istakao da vještačka inteligencija ne može replicirati diferencijalnu dijagnozu, koja je ključna za identifikaciju zdravstvenih stanja.
Istraživački tim je simulirao razvoj kliničkih slučajeva postepeno unoseći informacije, počevši od osnovnih podataka kao što su dob pacijenta i simptomi, do nalaza fizičkog pregleda i laboratorijskih rezultata. Ova studija jasno ukazuje na to da je potrebna dalja istraživanja i razvoj AI tehnologija prije njihovog korištenja u kliničkom okruženju.










