“조만간 의사도 능가할 듯”...AI, 전문의급 오류 감지 성능 발휘
영상의학과 전문의와 비슷한 오류 감지율 보여
2016년 세계적인 바둑 고수들을 연파하며 존재감을 드러냈던 인공지능(AI)이 이제는 의료 분야에서도 뛰어난 기능을 발휘할 전망이다.
독일 쾰른대 병원 연구팀에 따르면 오픈AI(OpenAI)사가 개발한 인공지능 모델인 GPT-4가 보고서에 입력된 오류를 감지하는데 있어 영상의학과 전문의들과 거의 동일한 성능을 발휘한 것으로 나타났다.
연구팀의 영상의학과 전공의인 로만 게르츠 박사는 “이번 연구에서 드러난 AI의 오류 감지 효율성은 영상의학과 내 워크플로우(작업 흐름)를 최적화하는 데 도움이 될 수 있다는 것을 암시하고 있다”며 “이를 통해 보고서를 정확하고 신속하게 사용할 수 있도록 보장함으로써 적시에 신뢰할 수 있는 진단을 제공할 수 있는 영상의학과의 역량을 강화할 수 있을 것”이라고 말했다.
게르츠 박사는 “이번 연구는 정확성, 속도 및 비용 효율성에 대한 영상의학 보고서를 검토하는 과정에서 GPT-4를 인간의 성과와 직접 비교한 최초의 연구”라고 덧붙였다.
연구팀은 2023년 6월~12월에 한 병원에서 엑스레이와 컴퓨터단층촬영(CT) 스캔 및 자기공명영상(MRI) 자료를 기반으로 한 200개의 영상의학 보고서를 수집했다. 연구팀은 의도적으로 100개의 보고서에 누락, 철자 오류, 혼란스러운 구절 및 기타 실수를 포함해 150개의 오류를 삽입했다.
그런 다음 GPT-4와 영상의학과 전문의 6명(영상의학과 선임 전문의 2명, 전문의 2명, 전공의 2명)에게 보고서를 별로로 검토하고 오류를 찾아내도록 요청했다.
그 결과 전반적으로 GPT-4의 오류 감지율은 83%였고 선임 전문의는 89%, 전문의 및 전공의는 80%로 나타났다. 전문의와 비교했을 때 GPT-4의 평균 성과에 유의한 차이가 없는 것으로 밝혀졌다.
또한 AI 프로그램은 가장 빠른 인간 판독 전문가보다 보고서당 처리 시간이 더 짧았으며 가장 비용 효율적인 영상의학 전문의보다 보고서당 평균 보정 비용이 더 낮았다. 게르츠 박사는 “이번 연구는 AI가 영상의학과 보고서의 정확성과 보고서 반환 속도를 높임으로써 환자 치료를 개선할 수 있음을 보여준다”고 말했다.
그는 “이번 연구는 영상의학과 서비스에 대한 수요 증가와 운영비용 절감에 대한 압력과 같은 중요한 의료 문제를 해결할 수 있는 방법을 제시하고 있다”며 “특히 GPT-4와 같은 프로그램을 통해 AI가 어떻게 효율성을 높이고 오류를 최소화하고, 신뢰할 수 있는 저렴한 진단 서비스에 대한 보다 광범위한 접근을 보장함으로써 의료 서비스를 혁신할 수 있는지에 대한 구체적인 예를 제공하고 있다”고 덧붙였다.
이번 연구 결과(Potential of GPT-4 for Detecting Errors in Radiology Reports: Implications for Reporting Accuracy)는 ≪영상의학(Radiology)≫ 저널에 실렸다.
의사들 하는 꼴 보면 ai가 빨리 들여와서 의새들 정신차리게 해야 한다.