Oct 25, 2024
KoSAIM
Abstract
OSTEO
Enhanced Multi-Class Classification on Osteoporosis Severity in Chest X-Rays Using Knowledge Distillation and Proxy Labels
Junhyeok Park
Object
๋ณธ ์ฐ๊ตฌ์ ๋ชฉ์ ์ ํ๋ถ X์ ์์(Chest X-Ray, CXR)์ ๊ธฐ๋ฐ์ผ๋ก ์ ์, ๊ณจ๋ค๊ณต์ฆ ๋ฐ ๊ณจ๊ฐ์์ฆ์ ๋ถ๋ณํ๊ธฐ ์ํ ๋ฅ๋ฌ๋ ๋ชจ๋ธ์ ์ฑ๋ฅ์ ํฅ์ํ๊ณ , ๋ค์ํ ์ธ๋ถ ๊ฒ์ฆ์ ํตํด ํ๊ฐํ๋ ๊ฒ์ ๋ชฉ์ ์ผ๋ก ํ๋ค.
Methods

Figure 1: Teacher-Student ๊ตฌ์กฐ๋ฅผ ํตํ ํ์ต๊ณผ Proxy-Labeled Data ์ ์ฉ ๊ณผ์
๋ณธ ์ฐ๊ตฌ์์๋ CXR์ ๊ธฐ๋ฐ์ผ๋ก ๊ณจ๋ค๊ณต์ฆ, ๊ณจ๊ฐ์์ฆ, ์ ์์ ๋ถ๋ฅํ๋ ๋ชจ๋ธ์ ๊ฐ๋ฐํ๊ธฐ ์ํด Teacher-Student ๊ตฌ์กฐ์ ์ง์ ์ฆ๋ฅ ๋ฐฉ๋ฒ์ ํ์ฉํ๋ค[1]. ๋ํ, ์ค์ง๋ ํ์ต ๋ฐฉ๋ฒ ์ค ํ๋์ธ Proxy-label Method๋ฅผ ํ์ฉํ์ฌ ๋ชจ๋ธ์ ๊ฐ๊ฑดํ๊ฒ ๋ง๋๋ ๊ฒ์ ๋ชฉ์ ์ผ๋ก ํ๋ค[2].
Teacher-Student ๊ตฌ์กฐ์์ ํด๋น Teacher ๋ชจ๋ธ์ ์ ๋ ฅ ์์์ ์ฝํ ์ฆ๊ฐ์, Student ๋ชจ๋ธ์ ๊ฐํ ์ฆ๊ฐ์ ์ ์ฉํ ์ํ๋ก ํ์ตํ๋ฉฐ[3] Offline ๊ตฌ์กฐ์ธ Teacher ๋ชจ๋ธ๋ก๋ถํฐ ์ง์์ด๋ํ๊ท (Exponential Moving Average)์ ํตํด ๋ฐ๋ณต์ ์ผ๋ก ํ๋ผ๋ฏธํฐ๋ฅผ ์ ๋ฌ๋ฐ์ Student ๋ชจ๋ธ์ด ์ํํ๊ฒ ํ์ต๋ ์ ์๋๋ก ํ๋ Knowledge Distillation(KD) ๋ฐฉ๋ฒ์ ์ฌ์ฉํ๋ค.[4] ํด๋น ๋ฐฉ๋ฒ์ ํตํด ํ์์ ํน์ ๋ถ์์ ์ํ ๋ฟ๋ง ์๋๋ผ ์ ์ฒด์ ์ธ ์ํ๋ฅผ ๊ณ ๋ คํ ์ ์๊ฒ ๋๋ฉฐ, ๋ค์ํ ์ดฌ์๊ธฐ๊ธฐ์์ ํ๋ํ ๋ฐ์ดํฐ์๋ ๊ฐ๊ฑด์ฑ์ ๊ฐ์ง ์ ์๊ฒ ๋๋ค.
๋ํ ํ๋ถX์ ์์๊ณผ DEXA(Dual-Energy X-ray Absorptiometry; ์ด์ค์๋์ง X์ ํก์๊ณ์ธก๋ฒ) ๊ฒ์ง ๊ฒฐ๊ณผ๊ฐ ์ง์ ์ด๋ฃจ์ด์ผ ํ๋ ๋ฐ์ดํฐ์ ํน์ฑ์ ๋ค๊ธฐ๊ด ๋ฐ์ดํฐ ์์ง์ด ์ด๋ ค์ด ์ ์ ๊ณ ๋ คํ์ฌ, ์ค์ง๋ ํ์ต์ Proxy-label Method ๋ฐฉ๋ฒ์ ํตํด Public Dataset์ธ CheXpert[5]๋ฅผ ์ถ๊ฐ๋ก ํ์ฉํ์๋ค.(Figure 1. ์ฐธ๊ณ ) ํด๋น ๋ฐฉ๋ฒ์ ํตํด ๋ค์ํ ํ๊ฒฝ์ ๋ํ ๋ชจ๋ธ์ ๊ฐ๊ฑดํจ์ ํฅ์์์ผฐ๊ณ , ์ธ๋ถ ๋ฐ์ดํฐ์ ์ ํตํด ๋ชจ๋ธ์ ํฅ์๋ ๊ฐ๊ฑดํจ์ ๊ฒ์ฆํ์๋ค.
Results
๋ณ์ A์ ํด๋์ค๋ณ ๋ฐ์ดํฐ ์๋ฅผ ๋ง์ถ ๋ด๋ถ ๊ฒ์ฆ ๋ฐ์ดํฐ(16.1% ๋จ์ฑ; ํ๊ท ์ฐ๋ น 58.7 ยฑ 6.76)์ ๋์ผํ ๋ณ์ A์ ์ธ๋, ์ ์, ์๊ธ์ค, ๊ฑด๊ฐ๊ฒ์ง ๋ฐ ์ฆ์ง์ผํฐ์์ ๋ค๋ฅธ ๊ธฐ๊ฐ์ ์์ง๋ ๊ฒ์ฆ ๋ฐ์ดํฐ(11.1% ๋จ์ฑ; ํ๊ท ์ฐ๋ น, 59.01 ยฑ 6.65), 2์ฐจ ์ข ํฉ ๋ณ์ B(44.5% ๋จ์ฑ; ํ๊ท ์ฐ๋ น, 59.38 ยฑ 7.31) ๋ฐ์ดํฐ, ๋ณดํ ๋ณ์ C(56.2% ๋จ์ฑ; ํ๊ท ์ฐ๋ น, 73.64 ยฑ 6.74) ๋ฐ์ดํฐ ๋ฑ์ ๊ฒ์ฆ ๊ฒฐ๊ณผ์์ 3 Class์ ๋ํ ์ ํ๋๊ฐ ๊ฐ๊ฐ 0.730, 0.732, 0.769, 0.668 ์ผ๋ก ๊ฒ์ฆ๋์๋ค.(Table 1. ์ฐธ๊ณ )
Table 1: ๊ณจ๋ค๊ณต์ฆ ์ ๋์ Ablation Study ๊ฒฐ๊ณผ
Hospital A (Internal) | Hospital A (External) | Hospital B | Hospital C | |
Baseline | 0.531 | 0.641 | 0.619 | 0.541 |
+ KD | 0.711 | 0.693 | 0.752 | 0.633 |
+ Proxy Label (Ours) | 0.730 | 0.732 | 0.769 | 0.668 |
Note:- KD, Knowledge Distillation
Conclusions
์ง์ ์ฆ๋ฅ ๋ฐฉ๋ฒ๊ณผ Proxy-label์ ํ์ฉํ ์ค์ง๋ ํ์ต์ ํตํด ๊ณจ๊ฐ์์ฆ๊ณผ ๊ณจ๋ค๊ณต์ฆ์ CXR ์ด๋ฏธ์ง ๋ถ๋ฅ๋ฅผ ์ํ ๋ฅ๋ฌ๋ ๋ชจ๋ธ์ ํตํด์, ๋ค์ํ ์ธ๋ถ ๊ฒ์ฆ ๋ฐ์ดํฐ์์๋ ์ฑ๋ฅ ํฅ์์ ๋ํ๋๊ณ ์ด๋ฅผ ํตํด ์ ๊ทผ์ฑ์ด ์ ํ์ ์ธ DEXA ๊ฒ์ฌ์ ๋ค๋ฅด๊ฒ CXR์ ์ฌ์ฉํ์ฌ ๊ณจ๊ฐ์์ฆ ๋ฐ ๊ณจ๋ค๊ณต์ฆ ์คํฌ๋ฆฌ๋์ ์ด์ฉ๋ ์ ์์์ ํ์ธํ์๋ค.
Reference
[1] Tarvainen, Antti, and Harri Valpola. "Mean teachers are better role models: Weight-averaged consistency targets improve semi-supervised deep learning results." Advances in neural information processing systems 30 (2017).
[2] Lee, Dong-Hyun. "Pseudo-label: The simple and efficient semi-supervised learning method for deep neural networks." Workshop on challenges in representation learning, ICML. Vol. 3. No. 2. 2013.
[3] Buslaev, Alexander, et al. "Albumentations: fast and flexible image augmentations." Information 11.2 (2020): 125.
[4] Li, Lujun, and Zhe Jin. "Shadow knowledge distillation: Bridging offline and online knowledge transfer." Advances in Neural Information Processing Systems 35 (2022): 635-649.
[5] Irvin, Jeremy, et al. "Chexpert: A large chest radiograph dataset with uncertainty labels and expert comparison." Proceedings of the AAAI conference on artificial intelligence. Vol. 33. No. 01. 2019.
* Keywords
Chest Radiograph, Bone Mass Density, Osteopenia


