Effectiveness of Evaluation Metrics using Boundary F1 Score for Image Registration between CT Image and MR Image
MR 영상과 CT 영상 간 영상 정합을 위한 Boundary F1 Score를 이용한 평가 지표의 유효성
TaeEun Kim, DaeYoung Son, EunHee Seo, ChangMin Dae
언어
한국어(KOR)
URL
https://www.earticle.net/Article/A483305
※ 기관로그인 시 무료 이용이 가능합니다.
4,000원
원문정보
초록
영어
There have been many studies to evaluate how the image registration between computed tomography (CT) image and magnetic resonance image (MRI) accurately performed: Use of fiducial marker, target registration error, mean square error, mutual information, etc. In this study, we used dice score (Dice), intersection over union (IoU), and boundary F1 score (BF score) as the evaluation metrics for the image registration between CT image and MRI. To acquire both modality images, the 3D printed head phantom with polylactic acid (PLA) was employed with fixation in water chamber. The phantom in the water chamber filled with water was scanned by MR scanner. The both images have 512 × 512 matrix, the 20 slides which can show the same axial level were selected. To acquire both modality images, the 3D printed head phantom with polylactic acid (PLA) was employed with fixation in water chamber. The phantom in the water chamber filled with water was scanned by MR scanner. The both images have 512×512 matrix, the 20 slides which can show the same axial level were selected. The translation image registration was applied with the 50 histogram bins, 1.25×10-3 initial radius, 1.5×10-6 epsilon, 1.05 growthfactor, 200 iterations(substantial group; SG). To prepare the control group, we intentionally spoiled the registration conditions to generate poor results (poor group; PG) for the image registration. The mean Dice, mean IoU, and mean BF score were calculated for the PG, SG, and normal overlapping between CT image and MRI. The average Dice and average IoU metrics increased by 154.7% and 159.2% in SG compared to NO(SG/NO), and there was no significant difference compared to the average Dice and average IoU increase rates of PG to NO(PG/NO), which were 138.3% and 142.8%, respectively. (p>0.05) The average BF Score increased by 134.0% in SG compared to NO(SG/NO), showing a significant difference when compared to the average BF Score increase rate of PG to NO(PG/NO), which was 64.9%. (p<0.05) Dice, IoU, and BF score are normally used to evaluate the performance of the deep learning in the field of the computer vision such as semantic segmentation, object detection. In this study, the only BF score showed the significant variation for evaluating the performance of the image registration. The image registration between CT image and MRI is the most general and famous technique as the PET-CT. If the effective evaluation metrics for the image registration is added, it will be helpful to achieve the accurate image registration with other evaluation metrics in actual clinical application.
한국어
자기공명영상(MRI) 과 컴퓨터 단층촬영(CT) 간 정확한 영상 정합을 위한 방법을 고안하고 그것을 평가하기 위한 많은 연구가 있었다. MRI, CT를 이용한 영상 정합은 PET-CT, PET-MR이 일반적으로 유용하게 쓰이고 있다. 영상 정합을 위한 연구들은 Fiducial Marker사용, Target Registration오차, Mean Square오차, Mutual Information 등을 주로 사용해 왔다. 하지만 의료 영상이 아닌 Semantic Segmentation, Object Detection 같은 컴퓨터 비전 영상에서는 주사위 점수(Dice Score, Dice), 교차점(Intersection Over Union, IoU), 경계 F1 점수(Boundary F1 Score, BF Score)가 정합의 성능을 평가하는 데 주로 사용되고 있다. 본 연구에서는 MRI, CT 간 영상 정합을 위한 평가 지표로 Dice, IoU, BF Score를 사용해 영상 정합을 위한 효과적인 평가 지표를 알아보고자 했다. 두 장비 이미지 를 모두 획득하기 위해 폴리락트산(PLA)이 포함된 3D 프린팅 머리 팬텀을 Water Chamber에 고정 후 각각 Ingenia CX MRI (3.0T) 와 Brilliance iCT (256 MDCT)에서 스캔하였다. 두 영상 모두 512×512 Matrix가 되게 Parameter 를 설정하였고, 동일한 축 레벨을 나타낼 수 있는 20개의 슬라이드를 선택했다. 결과값 도출을 위한 프로그램은 MATLAB 2024a를 사용했고, 변환 이미지 등록은 50개의 Histogram Bins, 1.25×10-3 Initial Radius, 1.5×10-6 Epsilon, 1.05 Growth Factor, 200 Iterations 설정했고, 이를 실질 그룹(Substantial Group; SG)이라 했다. 의도적 으로 등록 조건을 망쳐 이미지 등록에 대한 결과가 좋지 않은 그룹(Poor Group; PG)을 추가로 설정했다. 이 두 개의 실험군과 비교할 대조군으로 CT, MRI영상을 붙여 생성한 일반 중첩(Normal Overlapping; NO)을 만들어 각각 비교 하였고, CT, MRI 영상 간 PG, SG 및 NO에 대해 평균 Dice, 평균 IoU 및 평균 BF Score를 계산했다. 통계는 Medcalc의 Paired T-test를 사용하여 각 결과 값을 비교하였다. 평균 Dice, 평균 IoU의 Metrics는 NO 대비 SG에서 각각 154.7%, 159.2% 증가하였고, NO 대비 PG의 평균 Dice, 평균 IoU의 Metrics증가율인 138.3%, 142.8%와 비교 시 유의미한 차이를 보이지 않았다. (p>0.05) 평균 BF Score는 NO 대비 SG에서 134.0% 증가하였고, NO 대비 PG의 평균 BF Score 증가율인 64.9%와 비교 시 유의미한 차이를 보였다. (p<0.05) 본 연구에서는 영상 정합에 사용하 는 평가지표인 Dice, IoU, BF Score를 의료 영상에 접합시켜 측정했고, BF Score가 영상 정합 성능 평가에 있어 유의미한 변화를 보였다. 영상 정합을 위한 효과적인 평가 지표가 추가된다면 실제 임상 적용 시 다른 평가 지표와 함께 정확한 영상 정합을 달성하는 데 도움이 될 것이다.
목차
Abstract Ⅰ. 서론 Ⅱ. 실험 재료 및 방법 1. 실험 팬텀 및 사용 장비 2. 영상 정합 및 그룹 설정 Ⅲ. 결과 Ⅳ. 고찰 및 결론 Reference 요약
키워드
Dice scoreIntersection over unionBoundary F1 scoreDice scoreIntersection over unionBoundary F1 score
저자
TaeEun Kim [ 김태은 | Department of Radiology, Seoul National University Bundang Hospital ]
Corresponding Author
DaeYoung Son [ 손대영 | Department of Radiology, Seoul National University Bundang Hospital ]
EunHee Seo [ 서은희 | Department of Radiology, Seoul National University Bundang Hospital ]
ChangMin Dae [ 대창민 | Department of Radiology, Seoul National University Bundang Hospital ]