“인공지능 챗GPT 등 2종, 美의사시험 합격 수준”

중국선 이미 AI '샤오이(小醫·꼬마 의사)', 의사면허시험 합격

인공지능(AI) 가운데 미국의사면허시험에 합격할 수 있는 실력을 갖춘 것이 2종 등장했다. [사진=게티이미지뱅크]

인공지능(AI) 두 가지가 미국의사면허시험(USMLE)에 합격할 수 있는 수준에 오른 것으로 나타났다.

미국 의학매체 ‘메드페이지 투데이’는 인공지능 챗봇 ‘챗GPT(ChatGPT)’와 ‘플랜팜(Flan-PaLM)’ 등 2종이 미국의사면허시험에 합격할 수 있는 높은 수준에 도달했다고 최근 보도했다. 2017년 11월엔 중국의 의료용 인공지능 ‘샤오이(小醫·꼬마 의사)’가 중국의사면허시험에 합격했다.

캘리포니아 마운틴뷰에 있는 의료분야 기업 ‘앤서블 헬스(Ansible Health)’ 빅터 쩡(Victor Tseng) 박사 연구팀은 특별 및 보강 교육을 시키지 않은 채, 3단계로 이뤄진 미국의사면허시험에서 챗GPT의 성능을 조사했다. 그 결과 챗GPT가 모든 시험에서 정확도 50% 이상을, 대부분의 분석에서 정확도 60%를 보이는 것으로 나타났다. 미국의사면허시험의 합격 점수는 매년 다르지만 대부분의 경우 약 60점(약 60%)을 맞으면 합격한다.

챗GPT는 사용자의 프롬프트를 기반으로 긴 형식의 글을 모방하는 인공지능 검색도구다. 오픈에이아이(OpenAI)가 개발했다. 이 연구 결과(Performance of ChatGPT on USMLE: Potential for AI-Assisted Medical Education Using Large Language Models)는 의학논문 사전 공개사이트 《메드아카이드(MedRxiv)》에 실렸다.

또 과학논문 사전 공개사이트 《아카이브(arXiv)》에 실린 연구 결과(Large Language Models Encode Clinical Knowledge)에 따르면 인공지능 ‘플랜팜’은 미국의사면허시험 질문에 대한 답변에서 67.6%의 정확도를 보였다. 이 정확도는 ‘펍메드 GPT(PubMed GPT)’의 최고 정확도보다 약 17%포인트 더 높다. 연구팀은 시험을 치르기 전에 ‘멀티메드QA(MultiMedQA)’라는 의료 문답 데이터베이스 모음을 사용해 플랜팜을 대폭 개선했다.

챗GPT가 연구 논문의 저자 목록에 등재되는 데 대해 우려를 나타내는 보건의료 전문가들이 많다. 최근 국제학술지 《네이처(Nature)》에 실린 논문을 보면 인공지능이 새로운 기술의 동료 또는 공동 저자로 논문에 등재될 가능성에 대한 전문가들의 불안감이 커지고 있다. 전문가들은 인공지능이 학술적으로 과연 얼마나 논문에 기여할 수 있을지 의구심을 드러내거나 아예 인공지능은 공동 저자가 될 수 없다며 반대 의견을 내놓고 있다. 하지만 연구자들은 인공지능 프로그램이 의학 교육∙연구, 더 나아가 임상적 의사결정에 유용한 도구가 될 수 있다는 내용의 논문을 속속 발표하고 있다.

    김영섭기자

    저작권ⓒ 건강을 위한 정직한 지식. 코메디닷컴 kormedi.com / 무단전재-재배포, AI학습 및 활용 금지

    댓글 0
    댓글 쓰기

    함께 볼 만한 콘텐츠

    관련 뉴스