서울대병원, 관절염 환자 X-ray 데이터 생성 알고리즘 개발
- 전문의도 구분하기 어려운 고해상도·고품질 무릎 관절염 X-ray 이미지 생성
- 의료 인공지능 연구의 걸림돌이었던 데이터 불균형과 프라이버시 문제 해결 기대
최근 전문가도 구분할 수 없을 정도의 무릎 관절염 합성 X-ray 데이터가 개발됐다. 가상의 고품질 X-ray 데이터는 그동안 의료 인공지능 연구의 걸림돌이었던 데이터의 불균형과 프라이버시 문제를 해결할 수 있을 것으로 기대된다.
서울대병원 정형외과 노두현 교수팀(최병선 전임의, 인공지능 연구소 안건 학생)은 인공지능인 생성적 적대 신경망을 이용해 전문의도 구분하기 어려운 고해상도·고품질 무릎 관절염 X-ray 이미지를 생성하는 모델을 개발했다고 31일 밝혔다.
생성적 적대 신경망(Generative Adversarial Network, GAN)은 대표적인 합성 데이터 기술로 사람의 눈에 매우 사실적이고 현실적인 이미지를 생성한다. GAN은 가짜 데이터를 생성하는 생성기(Generator)와 진짜와 가짜를 구분하는 판별기(discriminator)가 경쟁적으로 학습해 진짜 데이터에 가까운 가짜 데이터를 생성한다. 이 기술을 의료 데이터에 적용하면 민감정보를 포함한 실제 의료데이터를 대체해 개인 정보 문제에 대한 대안을 제시할 수 있다.
연구팀은 서울대병원에 내원한 환자 10,000명의 무릎 X-ray 이미지를 정제 및 분석했고 생성적 적대 신경망(GAN)을 개발했다. 그 후 생성된 이미지의 신뢰도 수치를 평가했다. 이번 연구에서는 신뢰할 수 있는 데이터를 만들기 위해 최소 2,000장 이상의 영상이 필요함을 확인했다. 생성된 이미지는 컴퓨터 알고리즘으로도 원본과 구분이 힘들었다.
[Figure] 생성적 적대 신경망. 생성자(Generator)는 이미지를 최대한 실제와 유사하게 만들도록 학습되고, 판별자(Discriminator)는 해당 이미지가 원래의 데이터로부터 나온 것인지 생성자로부터 생성된 것인지 구분한다. 최종적으로 최대한 실제와 유사하게 이미지를 만들도록 학습된 생성자를 통해 합성 의료데이터를 만들어낸다.
이후 정형외과 전문의 2명, 컴퓨터 비전 전문가 2명, 영상의학과 전문의 1명 등 다양한 전문가들이 생성된 이미지의 품질을 분석했다.
우선 이미지의 성능을 검증하기 위해 진짜 이미지와 생성된 이미지를 구별하는 튜링테스트(Turing test)를 진행했다. 각각 50개의 실제 및 생성된 이미지가 혼합된 100개의 이미지를 분류하는 테스트에서 전문가 5명의 분류 정확도는 34%, 44%, 46%, 57%, 50%로 나왔다. 테스트 결과는 전문의도 실제와 생성물을 확실하게 구별하기 힘들다는 것을 보여준다.
또한 연구팀은 생성된 이미지의 질적 분석도 실시했다. 질병 고유의 해부학적 특성이나 윤곽선, 뼈 테두리, 관절 등의 이미지 품질을 분석한 결과, 생성된 이미지는 실제 이미지와 비교해도 매우 사실적으로 보였다.
[사진 1] 실제 무릎 이미지(a, b)와 알고리즘 모델을 통해 생성된 이미지(c, d)
연구 결과는 심층학습(Deep Learning) 중 생성적 적대 신경망을 이용해 전문가도 구분하기 힘든 합성 익명 데이터를 만들었다는 점에서 의의가 있다. 이번 연구는 수만 개의 이미지 데이터를 빠르게 생성해 데이터 불균형을 해소하고, 가짜 의료데이터를 활용함으로써 프라이버시 문제를 해결할 수 있는 가능성을 보여준다. 이는 향후 미래 의료 인공지능 연구의 초석이 될 것으로 기대된다.
노두현 교수는 “본 기술을 활용해 향후 인공지능 기반 관절염 판독뿐만 아니라 디지털 트윈과 같은 다양한 인공지능 모델을 개발할 수 있을 것”이라고 강조했다.
해당 연구 공동 1저자로 참여한 최병선·안건 연구원은 “이 모델을 기반으로 의료기관에서 무릎 관절염의 악화를 시뮬레이션 할 수 있는 플랫폼을 사용하게 되면 환자 및 의료진에게 큰 도움이 될 것이다”라고 말했다.
이번 연구는 미국 정형외과 연구 학회의 공식 저널인 ‘정형외과학회지(Journal of Orthopaedic Research)’ 최근호에 게재됐다.