Oct 25, 2024
KoSAIM
Abstract
OSTEO
지식 증류 및 프록시 레이블을 활용한 흉부 X선 영상에서 골다공증 정도의 다중 클래스 분류 성능 향상
Junhyeok Park
Object
본 연구의 목적은 흉부 X선 영상(Chest X-Ray, CXR)을 기반으로 정상, 골다공증 및 골감소증을 분별하기 위한 딥러닝 모델의 성능을 향상하고, 다양한 외부 검증을 통해 평가하는 것을 목적으로 한다.
Methods

Figure 1: Teacher-Student 구조를 통한 학습과 Proxy-Labeled Data 적용 과정
본 연구에서는 CXR을 기반으로 골다공증, 골감소증, 정상을 분류하는 모델을 개발하기 위해 Teacher-Student 구조의 지식 증류 방법을 활용한다[1]. 또한, 준지도 학습 방법 중 하나인 Proxy-label Method를 활용하여 모델을 강건하게 만드는 것을 목적으로 한다[2].
Teacher-Student 구조에서 해당 Teacher 모델은 입력 영상에 약한 증강을, Student 모델은 강한 증강을 적용한 상태로 학습하며[3] Offline 구조인 Teacher 모델로부터 지수이동평균(Exponential Moving Average)을 통해 반복적으로 파라미터를 전달받아 Student 모델이 원활하게 학습될 수 있도록 하는 Knowledge Distillation(KD) 방법을 사용한다.[4] 해당 방법을 통해 환자의 특정 부위의 상태 뿐만 아니라 전체적인 상태를 고려할 수 있게 되며, 다양한 촬영기기에서 획득한 데이터에도 강건성을 가질 수 있게 된다.
또한 흉부X선 영상과 DEXA(Dual-Energy X-ray Absorptiometry; 이중에너지 X선 흡수계측법) 검진 결과가 짝을 이루어야 하는 데이터의 특성상 다기관 데이터 수집이 어려운 점을 고려하여, 준지도 학습의 Proxy-label Method 방법을 통해 Public Dataset인 CheXpert[5]를 추가로 활용하였다.(Figure 1. 참고) 해당 방법을 통해 다양한 환경에 대한 모델의 강건함을 향상시켰고, 외부 데이터셋을 통해 모델의 향상된 강건함을 검증하였다.
Results
병원 A의 클래스별 데이터 수를 맞춘 내부 검증 데이터(16.1% 남성; 평균 연령 58.7 ± 6.76)와 동일한 병원 A의 외래, 입원, 응급실, 건강검진 및 증진센터에서 다른 기간에 수집된 검증 데이터(11.1% 남성; 평균 연령, 59.01 ± 6.65), 2차 종합 병원 B(44.5% 남성; 평균 연령, 59.38 ± 7.31) 데이터, 보훈 병원 C(56.2% 남성; 평균 연령, 73.64 ± 6.74) 데이터 등의 검증 결과에서 3 Class에 대한 정확도가 각각 0.730, 0.732, 0.769, 0.668 으로 검증되었다.(Table 1. 참고)
Table 1: 골다공증 정도의 Ablation Study 결과
Hospital A (Internal) | Hospital A (External) | Hospital B | Hospital C | |
Baseline | 0.531 | 0.641 | 0.619 | 0.541 |
+ KD | 0.711 | 0.693 | 0.752 | 0.633 |
+ Proxy Label (Ours) | 0.730 | 0.732 | 0.769 | 0.668 |
Note:- KD, Knowledge Distillation
Conclusions
지식 증류 방법과 Proxy-label을 활용한 준지도 학습을 통해 골감소증과 골다공증의 CXR 이미지 분류를 위한 딥러닝 모델을 통해서, 다양한 외부 검증 데이터에서도 성능 향상을 나타냈고 이를 통해 접근성이 제한적인 DEXA 검사와 다르게 CXR을 사용하여 골감소증 및 골다공증 스크리닝에 이용될 수 있음을 확인하였다.
Reference
[1] Tarvainen, Antti, and Harri Valpola. "Mean teachers are better role models: Weight-averaged consistency targets improve semi-supervised deep learning results." Advances in neural information processing systems 30 (2017).
[2] Lee, Dong-Hyun. "Pseudo-label: The simple and efficient semi-supervised learning method for deep neural networks." Workshop on challenges in representation learning, ICML. Vol. 3. No. 2. 2013.
[3] Buslaev, Alexander, et al. "Albumentations: fast and flexible image augmentations." Information 11.2 (2020): 125.
[4] Li, Lujun, and Zhe Jin. "Shadow knowledge distillation: Bridging offline and online knowledge transfer." Advances in Neural Information Processing Systems 35 (2022): 635-649.
[5] Irvin, Jeremy, et al. "Chexpert: A large chest radiograph dataset with uncertainty labels and expert comparison." Proceedings of the AAAI conference on artificial intelligence. Vol. 33. No. 01. 2019.
* Keywords
Chest Radiograph, Bone Mass Density, Osteopenia