베일 벗은 카카오 데이터 사업, “목표는 헬스케어 선순환 구축”
세브란스병원, 국립암센터 등에서 시범적용 후 종합병원 확대 예정
카카오헬스케어와 구글 클라우드의 협업 모델 청사진이 공개됐다. 예고된대로 구글 클라우드는 ‘연합 학습’을 통해 의료 데이터를 모을 수 있는 기술적 토대를 제공하고, 카카오헬스케어는 국내 주요 종합병원의 데이터를 가공해 모으는 형태다.
카카오헬스케어는 30일 연세의료원과 공동으로 ‘2023 글로벌 디지털 헬스케어 컨퍼런스’를 개최하고 이같은 내용을 발표하는 한편 의료 인공지능과 디지털 치료기기(DTx) 산업의 미래 전략을 논의했다.
이날 행사엔 구글 클라우드의 패트리샤 플로리시 이사가 원격으로 참석했다. 플로리시 이사는 강연에서 인공지능의 발전을 선도한 구글의 지난 10여년 간의 연구 성과를 소개하며 “현재 인공지능은 언어를 이해하는 것을 넘어 예측 능력을 의료계에 적극 활용할 수 있는 단계에 도달했다”고 말했다.
그는 “의료 데이터가 각 병원에 흩어져 보관되는 대한민국의 환경에서 AI를 적용하려면 데이터를 한 곳에 모으는 중앙 표준화 단계가 필수적”이라고 덧붙이며, 그 방법으로 구글 클라우드의 ‘연합 학습(Federated Learning)’을 제시했다.
연합 학습은 AI 모델을 통해 데이터를 암호화한 후 복사해 한 곳에 모으는 방법을 말한다. 현재 국내 개인정보보호 규제상 일반적인 의료데이터를 외부로 반출하기 위해선 데이터심의위원회(DRB)와 윤리심의위원회(IRB)의 이중 심의를 거쳐야 한다. 반면 연합 학습을 이용하면 데이터 원본 자체가 병원 외부로 반출되지 않기 때문에, 데이터 보호법에 입각하면서도 여러 기관의 데이터를 모을 수 있다.
플로리시 이사는 “연합 학습으로 의료 데이터를 모으는 모델이 충분히 정착하면, 데이터를 제공하는 양에 비례해 병원이 수익을 가져갈 수 있다”며 수익 모델을 언급하기도 했다.
카카오헬스케어 조용현 데이터플랫폼실장은 이에 대해 “환자의 데이터를 저장하고, 머신러닝을 통해 전이 여부를 분석하거나 재발 위험을 예측하는 서비스를 개발, 8월부터 세브란스병원에서 테스트하고 있다”고 밝혔다. 해당 서비스의 이름은 ‘HRS(Healthcare data Research & Suite)’로 알려졌다.
조 실장은 “현재 HRS의 목표는 추출-분석-다기관연결 작업에 소요되는 시간을 최대한 줄이는 것”이라며 “LLM(대규모 언어 모델)을 사용하면 데이터 정제에서 훨씬 빠른 작업이 가능할 것으로 전망한다”고 말했다. 그는 “세브란스병원과 국립암센터에서 베타 버전을 통해 유의미한 예측 모델을 수립하는 데 성공했으며, 향후 국내외 다양한 상급종합병원과의 협업을 목표로 하고 있다”고 덧붙였다.
한편, 카카오헬스케어 황희 대표는 이날 구글과의 협업을 통한 데이터레이크 구축 사업(프로젝트 델타)를 포함, △연속혈당측정기와 연계해 당뇨 환자가 실생활에서 모니터링할 수 있는 플랫폼 구축(프로젝트 감마) △정신건강의학 분야 특화 원격 환자 모니터링 사업(프로젝트 MU) △카카오톡 어플을 통해 병원 예약 전후 환자 관리가 가능한 ‘프로젝트 베타’ 등 향후 사업 로드맵을 제시하기도 했다.
황 대표는 “전국민이 사용하는 모바일 서비스를 기반으로 하는 카카오가 ‘헬스케어’에서 선순환을 만들 수 있도록 하겠다”며 “어떤 서비스를 해야 최대한 많은 사람들이 혜택을 받을 수 있을지를 고민해, 향후 사업 계획에 반영할 것”이라고 말했다.