Earticle

현재 위치 Home

Issues

한국차세대컴퓨팅학회 논문지 [THE JOURNAL OF KOREAN INSTITUTE OF NEXT GENERATION COMPUTING]

간행물 정보
  • 자료유형
    학술지
  • 발행기관
    한국차세대컴퓨팅학회 [Korean Institute of Next Generation Computing]
  • pISSN
    1975-681X
  • 간기
    격월간
  • 수록기간
    2005 ~ 2026
  • 등재여부
    KCI 등재
  • 주제분류
    공학 > 컴퓨터학
  • 십진분류
    KDC 566 DDC 004
Vol.22 No.1 (10건)
No
1

전기자동차 충전 인프라의 급속한 확장과 더불어, 다양한 제조사와 이기종 장비 환경, 공개 네트워크 연결 특성으로 인해 전기자동차 충전 시스템의 보안 위협이 증가하고 있다. 기존 OCPP 1.6 및 ISO 15118 프로토콜은 정적 인 증, 세션 관리 미흡, 인증서 관리와 관련한 다양한 취약점을 노출하였으며, OCPP 제로데이 취약점 발견, 글로벌 EV 충전 네트워크 데이터 유출 사건 등 실제 보안 사고가 다수 보고되고 있다. 이에 따라, 본 논문은 EVCS 환경을 위한 효율적이고 적응적인 평판 기반 적응형 인증 프로토콜을 제안한다. 제안한 프로토콜은 ISO 15118-20과 OCPP 2.0.1의 통합 구조를 기반으로, 차량의 과거 충전 이력, 이상 행동 탐지 빈도, 시간 기반 신뢰도 감쇠, 위치 기반 위험도 등 상황에 따른 지표를 종합하여 평판 점수를 산출하고, 이를 3단계로 분류하여 인증 강도를 동적으로 조절한다. 차량, 충전기, 중앙 관리 시스템의 각 구간에서 상황에 따라 인증 단계를 동적으로 적용하며, 실시간 세션 연속성 및 데이터 무결성을 확보할 수 있다. 또한, 정형 검증 도구인 Scyther를 이용하여 제안하는 인증 기법이 잘 알려진 공격으로부터 안전함을 입증하였다.

The rapid expansion of electric vehicle charging infrastructure, combined with the heterogeneity of equipment from multiple manufacturers, diverse device environments, and reliance on public networks, has led to increasing security threats against Electric Vehicle Charging Systems (EVCS). Legacy protocols such as OCPP 1.6 and ISO 15118 have exposed various vulnerabilities related to static authentication, inadequate session management, and certificate management, with numerous real-world security incidents reported, including OCPP zero-day vulnerability discoveries and data breaches of global EV charging networks. In response, this paper proposes an efficient and adaptive reputation-based adaptive authentication protocol for the EVCS environment. The proposed protocol is based on an integrated architecture combining ISO 15118-20 and OCPP 2.0.1. It computes a reputation score by synthesizing contextual indicators derived from each vehicle's charging history, anomaly detection frequency, time-based trust decay, and location-based risk assessment. The reputation score is classified into three levels to dynamically modulate authentication strength. The protocol dynamically applies authentication procedures appropriate to each communication segment—between the electric vehicle, charging equipment, and central management system—thereby ensuring real-time session continuity and data integrity. Formal verification using the Scyther tool demonstrates that the proposed authentication technique is secure against well-known attacks.

2

딥러닝 기반 의료 영상 진단 모델의 신뢰성을 확보하기 위해 설명 가능한 AI 기술이 필수적으로 요구되고 있다. 다 양한 XAI 방법 중, 반사실적 설명은 직관적인 해석을 제공하지만, 기존 생성 모델 기반 방법론은 학습이 불안정하 고 특정 아키텍처에 의존하는 문제를 가진다. 이러한 불안정성과 의존성은 다양한 최신 분류기 모델에 대한 설명 생 성기의 적용을 어렵게 하고 신뢰성을 저해한다. 이 문제를 해결하기 위해, 본 연구는 분류기의 인코더를 판별기의 인 코더와 공유하는 새로운 반사실 설명 생성 프레임워크를 제안한다. 이 구조는 판별기가 픽셀 레벨이 아닌 분류기의 의 미론적 특징 공간 내에서 현실성을 판별하도록 유도하여, GAN 학습을 안정화시키고 일반화 성능을 확보한다. 흉부 X-ray(CheXpert) 데이터셋을 이용한 실험에서, 제안 프레임워크가 ResNet, ResneXt, DenseNet, ConvNeXt 등 다양한 분류기에서 학습 안정성을 크게 향상시키고, 높은 타당성(Validity)과 현실성(FID)을 달성함을 확인하 였다.

While Deep Learning models show high accuracy in medical image diagnosis, their 'black box' nature limits clinical adoption, making eXplainable AI (XAI) essential. Among XAI methods, Counterfactual Explanations offer intuitive interpretations, but existing generative approaches suffer from training instability and architecture-dependency. This instability and dependency hinder the application of explainers to various modern classifiers and reduce their reliability. To address this, this paper proposes a novel counterfactual generation framework that shares the classifier's encoder with the discriminator's encoder. This architecture stabilizes GAN training by forcing the discriminator to assess realism within the classifier's semantic feature space, rather than at the pixel level, thus ensuring generalization. Experiments on the CheXpert (Chest X-ray) dataset demonstrate that the proposed framework significantly improves training stability and achieves high validity and realism (FID) across various classifiers, including ResNet, ResNeXt, DenseNet, and ConvNeXt.

3

제조 산업에서 용접 결함 검사는 용접부의 신뢰성과 품질을 확보하기 위한 핵심 공정 중 하나이다. 그러나 기존의 수동 검사 방식은 검사자의 주관성, 장시간 검사로 인한 피로 누적, 그리고 숙련도 차이에 따라 검사 결과의 신뢰성 이 저하될 수 있다는 한계를 지닌다. 이러한 문제를 해결하기 위하여 본 연구에서는 인공지능(AI) 기반 컴퓨터 비전 기술을 활용한 용접 품질 자동 평가 방법을 제안한다. 구체적으로는 픽셀 수준의 세분화(segmentation)를 통해 용 접 결함을 자동으로 탐지 및 분류하고자 하였으며, 이를 위해 다양한 딥러닝 모델의 성능을 비교·분석하였다. 합성곱 신경망(CNN) 기반 모델과 트랜스포머 구조를 포함한 YOLOv5x-seg, Mask R-CNN, DeepLabv3+ 모델을 적 용하였다. 용접 결함 유형은 기공(Porosity), 융합 부족(Lack of Fusion), 용입 불량(Incomplete Penetration), 언더컷(Undercut)의 네 가지 주요 결함과 Normal Weld(정상 용접부)로 정의하였다. 먼저, 폴리곤(polygon) 형 태로 정밀하게 주석(annotation)된 용접 결함 이미지 데이터셋을 구축하였으며, 이를 각 딥러닝 모델의 학습 및 검 증에 활용하였다. 실험 결과, YOLOv5x-seg 모델은 mAP@0.5 기준 82.6%의 정확도를 기록하여 가장 우수한 성능을 나타냈으며, 다른 모델 대비 높은 결함 탐지율과 분할 성능을 확인하였다. 본 연구 결과를 통해 딥러닝 기반 용접 결함 세분화 기법이 기존의 수동검사 방식을 효과적으로 대체할 수 있음을 확인하였으며, 향후 산업 현장에서 의 실시간 용접 품질 모니터링 및 자동화 검사 시스템 구현에 대한 가능성을 입증하였다.

Weld defect inspection is a critical process for ensuring the reliability and quality of welded structures in the manufacturing industry. However, conventional inspection methods suffer from several inherent limitations, including inspector subjectivity, time-consuming procedures, fatigueinduced errors, and performance variability depending on the level of expertise. To address these challenges, this study proposes an automated weld quality evaluation method based on artificial intelligence (AI) and computer vision techniques. Pixel-level image segmentation is employed to automatically detect and classify weld defects, and the performance of various deep learning models is systematically compared. Both convolutional neural network (CNN)-based models and transformer-based architectures are implemented, including YOLOv5x-seg, Mask R-CNN, and DeepLabv3+. The proposed framework targets four major types of weld defects—porosity, lack of fusion, incomplete penetration, and undercut—along with normal welds. A weld defect image dataset with precise polygon-based annotations is constructed and utilized for model training and evaluation. Experimental results demonstrate that the YOLOv5x-seg model achieves the best overall performance, attaining a mean average precision of 82.6% at an IoU threshold of 0.5 (mAP@0.5), while outperforming the other models in both defect detection accuracy and segmentation quality. These results indicate that deep learning-based weld defect segmentation can effectively replace conventional manual inspection methods. Moreover, the proposed approach shows strong potential for real-time weld quality monitoring and the deployment of automated inspection systems in industrial environments.

4

본 논문에서는 함정용 ICCP(Impressed Current Cathodic Protection) 정류기에 적용되어 온 구역 단위 대표 전위 기반 제어 구조의 공간 분해능 및 제어 단위 한계를 분석하고, 이를 개선하기 위한 채널 단위 독립 제어 기반 분산 제어 아키텍처를 제안한다. 제안 구조는 기준전극–양극 쌍을 최소 제어 단위로 정의하고, 기준전위 수집–제 어 연산–전류 출력 경로를 분리하여 채널별 병렬 제어 루프가 독립적으로 동작하도록 설계되었다. 제안 구조의 타 당성은 고객 요구사항에 기반한 합/부 판정 체계를 통해 검증하였으며, 실환경에서 반복 재현이 어려운 전위 비대칭 및 국부 외란 조건을 HIL 기반 시험 환경으로 구성하여 구조적 독립성과 제어 동작 특성을 확인하였다. 본 연구는 기존 구조 대비 수치적 성능 비교가 아니라, 제어 단위 재정의를 통한 분산 제어 아키텍처의 설계 타당성을 구조적 으로 입증하였다는 점에서 의의를 가진다.

This paper analyzes the spatial resolution and control-unit limitations of the conventional zonebased representative potential control structure applied to naval ICCP rectifiers and proposes a channel-level independent distributed control architecture to address these limitations. In the proposed structure, each reference electrode–anode pair is defined as a minimal control unit, and the processes of potential acquisition, control computation, and current output are logically separated to enable parallel and independent control loops for each channel. The validity of the proposed architecture is verified through a requirement-based pass/fail evaluation framework. A hardwarein- the-loop (HIL) test environment was constructed to emulate asymmetric potential distributions and localized disturbance conditions that are difficult to reproduce in real operational environments. Experimental results confirm the structural independence and operational characteristics of the channel-level control loops. Rather than focusing on numerical performance optimization against the conventional structure, this study demonstrates the structural design validity of a distributed control architecture achieved through the redefinition of the control unit.

5

RGB-T 시각적 객체 추적은 가시광(RGB) 영상과 열적외선(TIR)을 병행해 조명·기상 변화 속에서도 대상을 지속 적으로 추적하는 기술이다. 본 연구에서는 이중 스트림 RGB-T 기반 추적기인 BAT에 밀집 Mixture-of- Experts(MoE) 게이팅을 결합한 모달리티 인지 추적기 BATMoE를 제안한다. 제안한 방법은 어텐션 투영 단계의 Q/K/V와 피드포워드 네트워크(FFN)에 MoE 구조를 적용한다. 풀링된 교차 모달 특징에 조건화된 온도 조절 softmax 게이트를 통해 모든 전문가를 밀집하게 혼합하며, 전문가 활용의 편향을 방지하기 위해 균형 정규화 항을 추가하였다. 이러한 설계는 열 교차 현상(Thermal Crossover)이나 저조도 환경과 같은 불리한 조건에서 더 신뢰 도 높은 모달리티의 기여도를 동적으로 강화하면서도, 다른 모달리티의 보완적 정보를 유지할 수 있도록 한다. LaSHeR 데이터 세트에서 수행한 실험 결과, BATMoE는 동일한 학습 및 평가 설정 하에서 기존 BAT 대비 Precision@20과 Success(AUC) 지표 모두에서 일관된 성능 향상을 보였다. 특히 Thermal Crossover, Low Illumination, Partial Occlusion과 같이 모달리티 간 신뢰도 차이가 크게 발생하는 조건에서 성능 개선이 두드 러졌으며, 속성별 분석을 통해 이러한 경향을 확인하였다. 반면 Fast Motion이나 Motion Blur와 같이 RGB와 TIR 모달리티가 동시에 약화하는 조건에서는 성능 향상이 제한적으로 나타났다. 이러한 결과는 MoE 기반 조건 적 응적 구조가 RGB-T 시각적 객체 추적에서 효과적인 융합 메커니즘이 될 수 있음을 보여준다.

We present BATMoE, a modality-aware RGB–T visual object tracker that integrates dense Mixtureof- Experts (MoE) gating into a dual-stream baseline tracker, BAT. The proposed approach applies MoE structures to both the attention projection layers (Q/K/V) and the feed-forward networks within the Transformer encoder. A temperature-controlled softmax gate, conditioned on pooled cross-modal features, densely combines all experts, while a balancing regularization term is introduced to prevent biased expert utilization. This design allows the tracker to dynamically emphasize the more reliable modality under adverse conditions, such as thermal crossover or low illumination, while preserving complementary information from the other modality. Experimental results on the LaSHeR dataset demonstrate that BATMoE consistently outperforms the baseline BAT under identical training and evaluation settings, achieving improvements in both Precision@20 and Success (AUC). Attribute-wise analysis reveals particularly notable gains in conditions where modality reliability varies significantly, including Thermal Crossover, Low Illumination, and Partial Occlusion. In contrast, performance improvements are limited under Fast Motion and Motion Blur scenarios, where both RGB and TIR modalities tend to degrade simultaneously. These results indicate that MoE-based condition-adaptive modeling provides an effective fusion mechanism for RGB–T visual object tracking.

6

엣지 디바이스 환경에서 실시간 화재 탐지를 위해서는 높은 정확도와 함께 제한된 연산 자원 내에서의 효율적인 모 델 구동이 요구된다. 그러나 기존 YOLOv12 기반 객체 탐지 모델은 높은 연산량과 복잡도로 인해 엣지 환경 적용 에 제약이 있다. 이를 해결하기 위해 본 논문에서는 K-means clustering과 FPGM을 결합한 FPKM 기반 구조적 가지치기 방법을 제안하고, 구조적 가지치기 이후 발생할 수 있는 채널 불일치 문제를 해결하기 위한 모델 재구성 전략을 함께 적용하였다. 특히 Residual, Concatenate, Split 구조가 포함된 네트워크에서도 연산 정합성을 유지 하도록 설계하였다. 실험 결과, FPKM은 30%, 50%, 70% 전 구간에서 FLOPs와 추론 시간을 감소시키면서도 성능 저하는 제한적으로 유지하였다. GPU(RTX 2080 Ti) 환경에서 50% 가지치기 시 추론 시간은 4.4 ms에서 2.6 ms로 약 41% 단축되었으며, mAP50은 79.5%에서 77.3%로 2.2% 감소하였다. CPU 환경에서도 baseline 54.3 ms, 5.8 G FLOPs에서 32.5 ms, 3.7 G FLOPs(50%)로 감소하여 약 40% 수준의 연산 효율 개선을 확인하였다. 이를 통해 제안한 방법이 GPU뿐 아니라 CPU 기반 엣지 환경에서도 효과적인 경량화 기법임 을 확인하였다.

Real-time fire detection in edge-device environments requires high detection accuracy as well as efficient model operation under limited computational resources. However, the original YOLOv12- based object detection model has limitations for edge deployment due to its high computational complexity and model size. To address this issue, we propose an FPKM-based structural pruning method that combines K-means clustering with Filter Pruning via Geometric Median (FPGM), along with a reconstruction strategy to resolve channel mismatch problems caused by structural pruning. The reconstruction framework is designed to preserve tensor consistency and computational stability even in networks containing branching structures such as Residual, Concatenate, and Split connections. Experimental results show that the proposed FPKM method reduces both FLOPs and inference time across pruning ratios of 30%, 50%, and 70%, while maintaining only limited performance degradation. In the GPU (RTX 2080 Ti) environment, at a 50% pruning ratio, inference time was reduced from 4.4 ms to 2.6 ms (approximately 41% reduction), while mAP50 decreased from 79.5% to 77.3% (a 2.2% drop). In the CPU environment, the baseline model required 54.3 ms and 5.8 G FLOPs, whereas the 50% pruned model achieved 32.5 ms and 3.7 G FLOPs, demonstrating about 40% improvement in computational efficiency. These results confirm that the proposed method is effective not only in GPU environments but also in CPU-based edge scenarios, making it suitable for real-time fire detection on edge devices.

7

본 연구는 한국어 검색 증강 생성(RAG) 시스템에서 청킹 전략이 검색 품질과 답변 정확도에 미치는 영향을 분석하 였다. KorQuAD 데이터셋 기반 612개 위키피디아 문서와 1,500개 질의응답 쌍을 활용하여 고정 크기 청킹과 문 장 단위 청킹을 비교 평가하였다. 실험 결과, 200자 고정 청킹이 답변 정확도 68.8%로 가장 우수한 성능을 보였 다. 청크 크기 증가에 따라 의미 유사도는 향상되었으나, 300자 이후 답변 정확도는 감소하여 검색 성능 향상이 생 성 성능으로 직결되지 않는 검색–답변 괴리 현상이 확인되었다. 문장 단위 청킹은 가장 낮은 성능을 기록하였다. 본 연구는 한국어 추출형 질의응답 기반 RAG 시스템에서 검색 품질과 생성 성능 간의 괴리를 실증적으로 규명하 고, 청킹 전략 설계를 위한 정량적 기준을 제시한다.

This study analyzes the impact of chunking strategies on retrieval quality and answer accuracy in Korean retrieval-augmented generation (RAG) systems. Using 612 Wikipedia documents from the KorQuAD dataset and 1,500 question–answer pairs, fixed-size chunking strategies and sentencelevel chunking were comparatively evaluated. Experimental results show that 200-character fixedsize chunking achieves the highest answer accuracy of 68.8%. While semantic similarity improves as chunk size increases, answer accuracy declines beyond 300 characters, revealing a retrieval– generation discrepancy in which improved retrieval performance does not directly translate into better generation outcomes. Sentence-level chunking exhibits the lowest performance among the evaluated strategies. This study empirically elucidates the gap between retrieval quality and generation performance in Korean extractive question-answering–based RAG systems and provides quantitative design guidelines for effective chunking strategies.

8

대규모 언어 모델의 발전은 외부 도구 그리고 API와의 상호작용 방식을 크게 변화시켰다. 대표적인 접근법으로는 Tool-Calling, MCP(Model Context Protocol), RAG-MCP 세 가지 접근법으로 구분된다. 그러나 도구 수가 증가할수록 프롬프트 팽창(prompt bloat)이나 선택 정확도 저하와 같은 구조적 한계가 나타난다. 본 연구에서는 BFCL(Berkeley Function Calling Leaderboard) 데이터셋을 기반으로 구축된 데이터셋에 LLaMA3-8b- Instruct 모델을 적용하여 세 접근법을 비교하였다. 특히 도구 집합의 규모를 50, 100, 150개로 변화시키며 호출 정확도, 파라미터 삽입 정확도, 토큰 소비량, 지연 시간을 측정하였다. 이러한 측정 결과를 바탕으로 각 방식의 성능 및 비용상의 특성을 규명하고, LLM(Large Language Model) 기반 시스템 설계 시 도구 호출 방식의 합리적인 선택을 위한 정량적 기준을 제시하고자 한다.

The development of large language models has significantly changed the way they interact with external tools and APIs. Representative approaches can be classified into three categories: Tool-Calling, Model Context Protocol (MCP), and RAG-MCP. However, as the number of tools increases, structural limitations such as prompt bloat and a decline in selection accuracy emerge. This study compares the three approaches by applying the LLaMA3-8b-Instruct model on the Berkeley Function Calling Leaderboard (BFCL) dataset. In particular, We varied the toolset size to 50, 100, and 150 tools, and measured tool invocation accuracy, parameter filling accuracy, token consumption, and latency. Through this analysis, we identify the performance and cost characteristics of each method and provide quantitative criteria for rationally selecting tool integration strategies in LLM-based system design.

9

본 논문에서는 하부 조명 AOI 환경에서 촬영된 나사 헤드부 영상의 특성을 고려하여, 비지도 이상 표현과 지도학습 기반 판정을 결합한 표면 이상 검출 및 분류 프레임워크를 제안한다. 제안 기법은 도메인 특화 전처리를 통해 분석 영역을 나사 헤드부 표면으로 정렬한 후, Dinomaly 기반 비지도학습을 통해 정상 분포 대비 구조적 편차를 이상 맵 형태로 추출한다. 생성된 이상 맵을 RGB 영상과 결합하여 지도학습 기반 분류기에 입력함으로써, 임계값 설정 에 의존하지 않는 안정적인 정상/이상 판정을 수행한다. 실험 결과, 제안 기법은 다양한 CNN 및 Transformer 백 본 전반에서 일관되게 우수한 성능을 보였다. 특히 Dinomaly 기반 이상 맵은 단독 입력만으로도 평균 F1-score 99.17%을 기록하여 기존 기법보다 강인한 성능을 보였으며, RGB와 이상 맵을 결합한 다중 채널 구성에서는 평균 정확도 및 F1-score 99.40%를 달성하여 최상의 분류 안정성을 확인하였다. 이를 통해 이상 맵이 단순한 시각화를 넘어 분류 성능을 실질적으로 향상시키는 고신뢰 특징 표현임을 정량적·정성적으로 확인하였다.

This study presents a surface anomaly detection and classification framework that integrates unsupervised anomaly representation with supervised learning-based decision-making, tailored to the specific characteristics of screw head images acquired under low-light automated optical inspection (AOI) conditions. The proposed methodology employs domain-specific preprocessing to accurately align the region of interest with the screw head surface, followed by the extraction of structural deviations from the normative distribution as anomaly maps via Dinomaly-based unsupervised learning. These anomaly maps are subsequently fused with RGB images and supplied to a supervised classifier, facilitating robust OK/NG classification independent of threshold selection. Experimental evaluations reveal consistently superior performance across diverse CNN and Transformer architectures. Notably, the Dinomaly-generated anomaly map, when utilized in isolation, surpasses existing approaches, achieving an average F1-score of 99.17%. In a multi-channel setting that integrates both RGB and anomaly maps, the proposed framework attains average accuracy and F1-score values of 99.40%, underscoring its exceptional classification stability. These results quantitatively and qualitatively substantiate that the anomaly map serves as a high-confidence feature representation, advancing beyond mere visualization to significantly enhance classification outcomes.

10

본 연구는 만성콩팥병(CKD) 환자의 투석 진행을 조기에 예측하기 위해 분당서울대학교병원에서 수집한 실제 임상 데이터를 활용한 머신러닝 기반 예측 모델을 개발하였다. CKD 1~3단계 환자 13,642명을 대상으로, 분류 모델을 통해 3년 이내 투석 필요 여부를 예측하고 회귀 모델을 통해 투석까지 남은 기간을 산출하였다. 또한 투석 시작일이 아닌 투석 필요 시점(Dialysis-Need Time)을 정의하여 임상적으로 조기 개입이 필요한 시점을 정량화하였다. 시 도한 머신러닝 모델 중 LightGBM 모델이 가장 우수한 성능을 나타냈으며, 분류 모델에서 AUROC 0.87를 달성 하였고 투석 필요 시점을 중앙값 약 1.24년의 오차로 예측하였다. 본 연구는 CKD 환자 관리와 조기 대응을 위한 임상 의사결정 지원 도구로 활용될 가능성이 높다.

This study developed a machine learning-based predictive model using real-world clinical data collected from Seoul National University Bundang Hospital to enable early prediction of dialysis progression in patients with chronic kidney disease (CKD). Using data from 13,642 patients with CKD stages 1–3, a classification model was developed to predict the likelihood of dialysis initiation within three years, and a regression model was constructed to estimate the time remaining until dialysis. Furthermore, we propose the concept of "Dialysis-Need Time," a clinically meaningful timepoint reflecting when preparatory intervention becomes warranted, independent of the actual dialysis initiation date. Among the evaluated algorithms, the LightGBM model achieved the highest predictive performance, attaining an AUROC of 0.87 in the classification task and estimating the dialysis-need time with a median error of approximately 1.24 years. These findings suggest strong potential for the proposed framework as a clinical decision support tool for proactive management and early intervention in CKD care.

 
페이지 저장