“조만간 의사도 능가할 듯”...AI, 전문의급 오류 감지 성능 발휘

영상의학과 전문의와 비슷한 오류 감지율 보여

입력 2024.04.17 08:35 입력 2024.04.17 08:35수정 2024.04.17 08:17 조회수 1,243

영상을 점검하는 AI 로봇 — 영상의학과 보고서에 들어있는 오류를 감지하는 AI 성능이 전문의와 비슷한 것으로 나타났다. [사진=게티이미지뱅크]

2016년 세계적인 바둑 고수들을 연파하며 존재감을 드러냈던 인공지능(AI)이 이제는 의료 분야에서도 뛰어난 기능을 발휘할 전망이다.

독일 쾰른대 병원 연구팀에 따르면 오픈AI(OpenAI)사가 개발한 인공지능 모델인 GPT-4가 보고서에 입력된 오류를 감지하는데 있어 영상의학과 전문의들과 거의 동일한 성능을 발휘한 것으로 나타났다.

연구팀의 영상의학과 전공의인 로만 게르츠 박사는 “이번 연구에서 드러난 AI의 오류 감지 효율성은 영상의학과 내 워크플로우(작업 흐름)를 최적화하는 데 도움이 될 수 있다는 것을 암시하고 있다”며 “이를 통해 보고서를 정확하고 신속하게 사용할 수 있도록 보장함으로써 적시에 신뢰할 수 있는 진단을 제공할 수 있는 영상의학과의 역량을 강화할 수 있을 것”이라고 말했다.

게르츠 박사는 “이번 연구는 정확성, 속도 및 비용 효율성에 대한 영상의학 보고서를 검토하는 과정에서 GPT-4를 인간의 성과와 직접 비교한 최초의 연구”라고 덧붙였다.

연구팀은 2023년 6월~12월에 한 병원에서 엑스레이와 컴퓨터단층촬영(CT) 스캔 및 자기공명영상(MRI) 자료를 기반으로 한 200개의 영상의학 보고서를 수집했다. 연구팀은 의도적으로 100개의 보고서에 누락, 철자 오류, 혼란스러운 구절 및 기타 실수를 포함해 150개의 오류를 삽입했다.

그런 다음 GPT-4와 영상의학과 전문의 6명(영상의학과 선임 전문의 2명, 전문의 2명, 전공의 2명)에게 보고서를 별로로 검토하고 오류를 찾아내도록 요청했다.

그 결과 전반적으로 GPT-4의 오류 감지율은 83%였고 선임 전문의는 89%, 전문의 및 전공의는 80%로 나타났다. 전문의와 비교했을 때 GPT-4의 평균 성과에 유의한 차이가 없는 것으로 밝혀졌다.

또한 AI 프로그램은 가장 빠른 인간 판독 전문가보다 보고서당 처리 시간이 더 짧았으며 가장 비용 효율적인 영상의학 전문의보다 보고서당 평균 보정 비용이 더 낮았다. 게르츠 박사는 “이번 연구는 AI가 영상의학과 보고서의 정확성과 보고서 반환 속도를 높임으로써 환자 치료를 개선할 수 있음을 보여준다”고 말했다.

그는 “이번 연구는 영상의학과 서비스에 대한 수요 증가와 운영비용 절감에 대한 압력과 같은 중요한 의료 문제를 해결할 수 있는 방법을 제시하고 있다”며 “특히 GPT-4와 같은 프로그램을 통해 AI가 어떻게 효율성을 높이고 오류를 최소화하고, 신뢰할 수 있는 저렴한 진단 서비스에 대한 보다 광범위한 접근을 보장함으로써 의료 서비스를 혁신할 수 있는지에 대한 구체적인 예를 제공하고 있다”고 덧붙였다.

이번 연구 결과(Potential of GPT-4 for Detecting Errors in Radiology Reports: Implications for Reporting Accuracy)는 ≪영상의학(Radiology)≫ 저널에 실렸다.

네이버에서 코메디닷컴을 구독하세요. 다음에서 코메디닷컴을 구독하세요.

권순일 기자

kstt77@kormedi.com

“조만간 의사도 능가할 듯”...AI, 전문의급 오류 감지 성능 발휘

영상의학과 전문의와 비슷한 오류 감지율 보여

관련 뉴스

함께 볼 만한 콘텐츠