Генеративные модели ИИ, такие как ChatGPT, демонстрируют потенциал в области диагностической визуализации, но их эффективность по сравнению с человеческим опытом остается под «пристальным вниманием».
Исследовательская группа из Высшей школы медицины Университета Осака под руководством доктора Дайсуке Хориучи и доцента Дайджу Уэда недавно провела исследование, чтобы оценить диагностическую точность ChatGPT в сравнении с профессиональными рентгенологами.
В исследовании приняли участие 106 рентгенологических случаев опорно-двигательного аппарата, в которых GPT-4 и GPT-4 со «зрением» были протестированы вместе с ординатором-рентгенологом и сертифицированным рентгенологом. Хотя GPT-4 показал сопоставимые результаты по сравнению с резидентом-рентгенологом, он не смог сравниться с точностью сертифицированного врача-рентгенолога.
Хориучи подчеркнул, что, хотя ChatGPT многообещающе подходит в качестве вспомогательного инструмента для диагностической визуализации, его текущая точность недостаточна, чтобы заменить радиологов.