Earticle

현재 위치 Home

Issues

한국차세대컴퓨팅학회 논문지 [THE JOURNAL OF KOREAN INSTITUTE OF NEXT GENERATION COMPUTING]

간행물 정보
  • 자료유형
    학술지
  • 발행기관
    한국차세대컴퓨팅학회 [Korean Institute of Next Generation Computing]
  • pISSN
    1975-681X
  • 간기
    격월간
  • 수록기간
    2005 ~ 2026
  • 등재여부
    KCI 등재
  • 주제분류
    공학 > 컴퓨터학
  • 십진분류
    KDC 566 DDC 004
Vol.21 No.4 (10건)
No
1

본 연구는 송이버섯의 자루(줄기)의 길이와 갓 펴짐 정도를 수치화하고, 이를 바탕으로 등급을 자동으로 분류하는 딥러닝 기반 시스템을 제안한다. 송이버섯의 형태적 특성인 자루 길이, 갓 펴짐 정도를 수치화하여 선별하는 알고리 즘을 개발하였으며, 이 시스템은 Dino-SAM2 모델을 활용한 인스턴스 세그멘테이션 네트워크와 ResNet-50 기반 분류 네트워크로 구성된다. 인스턴스 세그멘테이션 네트워크를 통해 송이버섯의 자루 길이 측정과 갓 펴짐 정도를 정량적으로 평가하며, Dino-SAM2가 생성한 마스크에 특정 문자열이 포함되지 않은 경우에는 자루 길이와 갓 펴짐 정도를 수치화할 수 없다. 이러한 마스크 생성 실패 상황에 대응하기 위해 ResNet-50 기반 분류 네트워크를 보조 시스템으로 활용하여 송이버섯의 전체적 형태를 기반으로 품질을 판단한다. 두 가지 접근법의 결과를 통합하여 1등 급, 2등급, 3등급(개산), 3등급(성장 정지), 등외 5가지 등급으로 분류한다. 시스템의 성능 평가 결과, Dino-SAM2 가 마스크 생성 성공 시 90%의 높은 정확도를 보였으며, 마스크 생성 실패 시에도 ResNet-50을 통한 방어 메커니 즘을 통해 전체 시스템의 성능 79%를 달성하였다. 이는 단일 모델 의존성을 줄이고 실패 상황에 대한 강건성을 제 공하는 효과적인 방어 전략임을 입증한다. 본 연구는 송이버섯 선별 작업의 효율성과 객관성을 높이는 데 기여할 것으로 기대한다.

This study proposes a deep learning-based system that quantifies the stalk length and cap opening degree of pine mushrooms and automatically classifies them based on these measurements. We developed an algorithm that quantifies and sorts the morphological characteristics of pine mushrooms, including stalk length and cap opening degree. The system consists of an instance segmentation network utilizing the Dino-SAM2 model and a classification network based on ResNet-50. The instance segmentation network quantitatively evaluates the stalk length and cap opening degree of pine mushrooms, but when the mask generated by Dino-SAM2 does not include specific strings, the stalk length and cap opening degree cannot be quantified. To address these mask generation failures, a ResNet-50-based classification network is used as an auxiliary system to assess the quality based on the overall shape of the mushroom. By integrating the results from both approaches, mushrooms are classified into five grades: Grade 1, Grade 2, Grade 3 (open cap), Grade 3 (growth arrest), and Non-standard. Performance evaluation shows that the system achieved 90% accuracy when Dino-SAM2 successfully generated masks, and even in cases of mask generation failure, the defensive mechanism through ResNet-50 helped achieve an overall system performance of 79%. This demonstrates an effective defensive strategy that reduces dependence on a single model and provides robustness in failure situations. This research is expected to contribute to improving the efficiency and objectivity of pine mushroom sorting operations.

2

본 연구는 웹 애플리케이션의 보안 취약점을 효율적으로 점검하기 위한 코드 생성 AI 활용 방법론을 제시한다. 기존 의 수동 점검 방식은 많은 시간과 인력이 소요되며, 사람의 실수로 인해 일부 취약점이 누락될 가능성이 있다. 또한, 기존의 자동화 도구는 정형화된 공격 패턴을 탐지하는 데에는 효과적이지만, 새로운 유형의 취약점이나 복잡한 맥락 을 고려한 보안 점검에는 한계가 존재한다. 이를 해결하기 위해, 본 연구에서는 코드 생성 AI를 활용한 자동화된 취 약점 점검 시스템을 개발하고, 이를 실제 환경에서 검증하였다. 제안된 시스템은 자연어로 작성된 보안 검사 요청을 실행 가능한 코드로 변환하여 점검을 수행하며, 기존의 정적 분석 및 동적 분석 기법과 결합하여 보다 정밀한 취약 점 탐지가 가능하도록 설계되었다. 실험 결과, 제안된 방법론은 기존의 수동 점검 대비 점검 시간을 약 40% 단축시 키고, 인력 비용을 절감하는 효과를 보였다. 또한, 표준화된 프로세스를 통해 일관성 있는 테스트 수행이 가능하여 보안 점검의 신뢰성을 높일 수 있었다. 특히, 코드 생성 AI가 기존 코드 패턴을 학습하고 새로운 보안 점검 시나리 오에 적용할 수 있기 때문에, 반복적인 취약점 점검 작업이 자동화되면서 개발자와 보안 전문가의 부담을 줄이는 데 기여하였다. 그러나, 복잡한 비즈니스 로직이나 특정 도메인에 특화된 보안 취약점의 경우, 여전히 전문가의 수동 점검이 필요하다는 한계가 있다. AI 모델이 훈련되지 않은 새로운 유형의 취약점이나 논리적 오류를 탐지하는 데 어 려움을 겪을 수 있기 때문이다. 따라서, 본 연구에서 제안한 코드 생성 AI 기반 자동화 점검 시스템은 보안 전문가 의 작업을 보조하는 도구로 활용될 수 있으며, 향후 AI 모델의 학습 데이터 확장과 정밀도를 높이는 연구가 추가적 으로 필요할 것이다.

This study proposes a methodology for using code-generation AI to efficiently detect security vulnerabilities in web applications. Manual assessments are time-consuming and prone to human error, while existing automated tools struggle with detecting new or context-specific vulnerabilities. To address these challenges, we developed an AI-powered system that converts natural language security requests into executable code and integrates static and dynamic analysis techniques for improved accuracy and efficiency.Experimental results showed that the proposed system reduced assessment time by 40% and significantly lowered labor costs while ensuring standardized and consistent security testing. By learning existing code patterns, the AI automates repetitive security checks, reducing the workload for developers and security professionals. However, complex business logic and domain-specific vulnerabilities still require expert review, as AI may struggle with detecting novel threats or logical flaws. Therefore, this system is best used as a complementary tool rather than a replacement. Future improvements should focus on expanding code generation AI training data and enhancing detection capabilities.

3

무인기 기술의 발전에 따라 군사뿐만 아니라 다양한 민간 분야에서도 무인기 탐지 및 위치 추정 기술의 중요성이 부 각되고 있다. 딥러닝 기술의 발전으로 무인기 탐지 성능은 크게 향상되었으나, 정밀한 위치 추정에 대한 연구는 상 대적으로 미진하다. 본 연구에서는 RGB와 LiDAR로 구성된 다중 모달리티 센서팩을 설계하고, 이를 기반으로 한 데이터 세트를 수집하여 무인기 위치 추정을 위한 두 가지 시스템을 제안한다. 첫 번째 시스템은 LiDAR 포인트 클 라우드를 RGB 이미지에서의 객체 탐지 결과에 투영하여 위치를 추정하며, 두 번째는 RGB와 LiDAR 데이터를 결 합해 3D 객체를 직접 탐지한 후 위치를 산출한다. 연산 복잡도가 다소 증가하나, 두 번째 시스템은 UTM 좌표계 기준으로 동방(x) 0.77m, 북방(y) 2.07m, 평균 2.21m의 RMSE를 기록하며 더욱 우수한 정확도를 보였다. 본 연구는 다중 모달리티 기반의 무인기 위치 추정 기술이 실현 가능하고 효과적임을 보여주며, 향후 군사 및 민간 분 야에서의 실질적 응용 가능성을 제시한다.

As UAV technology rapidly evolves, the need for accurate detection and localization has become critical — not only for military and defense but also for a wide range of civilian applications. While recent advances in deep learning have significantly improved UAV detection, precise localization remains a less explored area. In this study, we design a multi-modal sensor pack combining RGB and LiDAR and build a custom dataset to develop and evaluate two UAV localization systems. The first system projects 3D LiDAR point clouds onto 2D object detections from RGB images. The second system fuses RGB and LiDAR inputs for 3D object detection, directly estimating UAV positions in 3D space. Although the second approach is more computationally intensive, it achieves better accuracy, with RMSE values of 0.77 m (x-axis), 2.07 m (y-axis), and 2.21 m overall in UTM coordinates. These findings confirm the promise of multi-modal UAV localization for both military and civilian applications.

4

본 연구는 고교야구 투수의 경기 기록 데이터를 활용하여 프로야구 지명 여부를 예측하는 머신러닝 기반 분류 모델 을 개발하는 것을 목표로 한다. 이를 위하여 최근 생성 모델링 분야에서 주목받는 Diffusion 모델의 원리를 도입하 고, 학습 데이터에 점진적으로 노이즈를 주입한 후 다층 퍼셉트론(MLP) 기반 네트워크를 통해 이를 제거하는 과정 을 학습하는 조건부 노이즈 예측 모델을 설계하였다. 본 모델은 소프트맥스(Softmax) 함수를 출력층에 적용한 다 중 클래스 분류 구조로, 고교 투수의 프로 지명 가능성을 '유력', '가능', '어려움'의 세 가지 범주로 예측한다. 모델 입력에는 평균자책점(ERA), 피안타율(BAA), 9이닝당 탈삼진 수(K/9)를 포함한 주요 투수 지표뿐만 아니라, 구 속, 이닝 소화율, 경기 출장 수 등 다양한 정량적 통계 지표가 활용된다. 나아가, Diffusion 모델의 구조적 특성을 통해 예측 과정에서의 불확실성을 정량화하고, 이를 기반으로 보다 신뢰성 있는 예측 결과를 도출할 수 있는 가능성 을 탐색하였다. 제안된 모델은 향후 프로야구 스카우팅 및 선수 평가 과정에서 객관적인 의사결정을 지원하는 도구로 활용될 수 있다.

This study aims to develop a predictive model to determine the likelihood of high school baseball pitchers being drafted into professional leagues based on their performance records. To achieve this, we propose a multi-class classification model that leverages the principle of diffusion modeling, wherein noise is gradually added to the training data during training, and a multi-layer perceptron (MLP) network is trained to denoise the input. The model incorporates a Softmax activation function at the output layer to classify pitchers into one of three categories: highly likely, possible, or unlikely to be drafted. The input features used in the model include core pitching statistics such as Earned Run Average (ERA), Batting Average Against (BAA), and Strikeouts per Nine Innings (K/9), as well as other quantitative indicators like pitching velocity, number of appearances, and innings pitched ratio. Furthermore, the model explores the potential of diffusion-based approaches to quantify and calibrate prediction uncertainty, offering a new perspective on how generative modeling techniques can enhance the reliability of classification outcomes. The proposed model can be utilized as a tool to support objective decision-making in future professional baseball scouting and player evaluation processes.

5

본 연구는 공매도의 성공 여부를 정의하고, 투자자별 거래 행태와 재무적 특성 차이를 분석하였다. 공매도 비중이 높은 종목들을 대상으로 공매도 발생 이전의 시계열 데이터를 구축하고, 이후 시계열 변화와 회귀분석을 통해 두 집 단 간 차이를 분석하였다. 분석 결과, 공매도 성공 종목에서는 기관 투자자가 일관된 순매수세를 보이며 전략적인 매매 행태를 보인 반면, 외국인 투자자는 보유와 점진적 매도 전략을 취하는 것으로 나타났다. 개인 투자자는 주가 하락에 대한 대응 전략을 취한 것으로 해석된다. 더불어 공매도 성공 종목은 고평가된 주가 흐름을 보이는 경향이 있어, 공매도가 고평가 종목을 선별하는 수단으로 기능할 수 있음을 시사한다. 이러한 결과는 공매도 성과 및 주가 하락 가능성 예측에 있어, 투자자 별 거래 패턴과 재무적 고평가 신호가 단서가 될 수 있음을 보여준다. 본 연구는 공매도 실행 이전 시점에 초점을 맞추어 정량적 분석을 수행하였다는 점에서 의미 있는 통찰을 제공한다.

This study defined the success of short selling and analyzed the differences in transaction behavior and financial characteristics of each investor. Time series data before the occurrence of short selling were constructed for stocks with a high proportion of short selling, and the differences between the two groups were analyzed through time series changes and regression analysis. As a result of the analysis, it was found that in successful short selling, institutional investors showed a consistent net buying trend and strategic trading behavior, while foreign investors took holding and gradual selling strategies. It is interpreted that individual investors have taken strategies to respond to falling stock prices. In addition, successful short selling tends to show an overvalued stock price trend, suggesting that short selling can function as a means of selecting highly valued stocks. These results show that each investor's trading pattern and financial overvalued signal can be a clue in predicting the performance of short selling and the possibility of a stock price decline. This study provides meaningful insights in that it conducted a quantitative analysis focusing on the timing before the execution of short selling.

6

최근 대규모 언어 모델(LLM)의 추론 능력이나 생성 능력을 이용하여 다양한 분야에서 활용되고 있고, 특히 사회적 교류가 활발히 발생하는 협상 상황에서의 LLM의 능력이 응용되고 있다. 대부분의 기존 연구들에서는 협상의 참여 자로서 모델을 활용하는 반면, 해당 논문에서는 추가적인 학습 없이 협상에서 반드시 필요한 존재인 중재자로써의 역할을 원활하게 수행할 수 있는지 확인해보고자 GPT-4, LLAMA와 같은 LLM을 이용해 그 결과를 분석해보았 다. 그 결과, 특별한 학습 없이도 대화의 흐름을 분석하는데는 문제가 없지만, 협상 부분에서의 추가적인 지식을 위 해서 RAG 등의 다양한 추가 구조를 활용할 수 있음을 확인했다.

Recently, the reasoning and generation capabilities of large-scale language models(LLM) have been used in various fields, especially in negotiation situations where social exchanges occur actively. While most of the existing studies used the model as a participant in negotiations, this paper analyzed the results using various LLMs to see if they could smoothly perform their role as mediators, which are essential beings in negotiations, without additional learning. As a result, it was confirmed that there is no problem in analyzing the flow of conversation without special learning, but various additional structures such as RAG can be used for additional knowledge in the negotiation part.

7

동시적 위치 추정 및 지도 작성(Simultaneous Localization And Mapping, SLAM)은 주변 환경의 지도를 구 축하며 현재 위치를 추정하는 기술로, 자율주행 로봇, 드론, 증강현실(AR) 등 다양한 분야에 활용된다. 그러나 센 서 종류와 환경에 따라 성능이 저하될 수 있는데, 예를 들어 비전 기반 SLAM은 질감이 부족한 환경에서, 라이다 기반 SLAM은 구조물이 드문 공간에서 한계를 가진다. 본 연구에서는 이러한 센서의 한계를 보완하기 위해 비전과 라이다를 융합하고, 엔코더 기반의 오도메트리(odometry)를 결합한 SLAM 기법을 제안한다. 또한, 명시적인 보정 (calibration) 과정 없이 호모그래피(homography)를 적용하여 각 센서의 좌표계를 정렬하는 방법도 함께 제안한 다. 실내외 다양한 장애물이 존재하는 환경에서 실험한 결과, 평균 위치 오차는 약 3.7cm로 측정되어 효과적으로 잘 작동함을 확인하였다.

Simultaneous Localization and Mapping(SLAM) is a technique that builds a map of the surrounding environment while estimating the current position, and it is widely used in various fields such as autonomous driving, drones, and augmented reality(AR). However, its performance can degrade depending on the type of sensor and the environment. For example, vision-based SLAM struggles in textureless environments, while LiDAR-based SLAM has limitations in areas lacking sufficient structural features. To overcome these limitations, this study proposes a SLAM method that fuses visual and LiDAR data and integrates encoder-based odometry. In addition, a homography-based approach is introduced to align the coordinate systems of each sensor without an explicit calibration process. Experiments conducted in various indoor and outdoor environments with obstacles confirmed that the proposed method operates effectively, achieving an average localization error of approximately 3.7cm.

8

본 연구는 실시간 EEG 기반 태스크 집중 예측 정보를 활용하여 앰비언트 정보 시각화 디자인 가이드라인을 탐구하 는 것을 목적으로 한다. 20~30대 성인 25명(남 13명, 여 12명)을 대상으로 휴식 및 영상 시청(자연경관, 토론) 조건에서 19채널 EEG 데이터를 수집하였다. 반복측정 분산분석을 통해 태스크 유형과 뇌엽 위치별 주파수 밴드 차이를 검정하고, 유의한 결과와 선행연구를 바탕으로 특성 집합을 선정하였다. 참가자별 개인화된 XGBoost 모델 을 적용한 결과, 집중 요구 수준에 따른 상태 분류에서 평균 f1-score는 2-클래스 0.99, 3-클래스 0.97, 5-클래스 0.94로 높은 성능을 보였다. 또한 일상적 활용 상황을 고려하여 뇌파 채널 수와 피처 종류를 제약한 조건에서도 성 능 변화를 분석하였다. 마지막으로, 이러한 결과를 토대로 실시간 집중 예측 정보를 앰비언트 시각화에 적용하기 위 한 디자인 가이드라인(정보 디자인, 활용 맥락, 개인화 파이프라인 제공)을 제안하였다.

This paper explored the design space of ambient information visualization by leveraging real-time task engagement prediction from EEG data. We collected 19-channel EEG signals from 25 adults in their 20s and 30s (13 male, 12 female) under rest and video-viewing conditions (natural scenery and debates). Repeated-measures ANOVA was used to examine frequency-band features by task type and cortical lobe, and feature sets were selected based on significant results and prior research. Personalized XGBoost models were then trained for each participant to classify task states with varying engagement demands on a per-second basis. The models achieved average f1-scores of 0.99 (2-class), 0.97 (3-class), and 0.94 (5-class). We also analyzed performance changes under constrained EEG channel and feature conditions to reflect practical use scenarios. Finally, we propose design guidelines for applying real-time task engagement to ambient visualization, focusing on information design, usage context, and personalized pipelines.

9

다낭성 신장 질환(PKD)은 신장에 다수의 낭종이 형성되어 치명적인 합병증을 유발할 수 있는 질환으로, 완치가 불 가능하여 정확한 진단과 약물을 이용한 평생 관리가 필요하다. 그러나 환자 별 다양한 요인으로 인해 진단이 복잡하 여 신부전으로 진행될 위험이 높다. 본 연구에서는 ResNet-152 모델을 기반으로 한 세 가지 방법을 통해 PKD 환 자의 자동 진단을 수행하였다. 첫번째 방법은 단일 모달(MR 이미지) 기반 학습에서는 정확도 61.9%, F1-score 0.624를 달성하였고, 둘째는 이미지와 마스크를 결합한 설정에서는 정확도 69.9%, F1-score 0.711로 성능이 향 상되었다. 마지막으로, 이미지, 마스크, 임상 데이터를 통합한 멀티모달 접근 방식은 정확도 73.9%, F1-score 0.754로 가장 우수한 성능을 보였다 이러한 결과는 PKD 진단에 있어 다양한 정보를 통합하는 멀티모달 학습이 진 단 정확도를 높이는 데 효과적임을 시사한다.

Autosomal Dominant Polycystic Kidney Disease(ADPKD) is a common genetic disorder leading to kidney failure, affecting millions globally. This study presents a non-invasive approach to diagnose genetic mutations using T2-weighted MR images and patient clinical data, advancing precision medicine. We analyzed 441 ADPKD cases from multiple institutions, categorized into PKD1 Truncating (n=232) and other PKD mutations (n=209). MR images were preprocessed for uniformity, including masking, resampling to a 0.78×0.78×0.78 mm³ voxel size, normalization, and resizing to (256, 256, 64). Three models were evaluated using accuracy, F1-score, and AUC: a Unimodal Model with MR images only, a Unimodal Model with MR images and masks, and a Multimodal Model integrating MR images, masks, and patient clinical data (age and height). The Multimodal Model, employing a 3D ResNet-152 and Multilayer Perceptron(MLP), achieved the highest performance with 73.9% accuracy and a 0.754 F1-score. These results demonstrate the effectiveness of integrating multiple data modalities for enhanced classification of ADPKD genetic mutations, offering a promising tool for non-invasive diagnosis and improved clinical decision-making.

기술 소개

10

본 기술은 정부(과학기술정보통신부)의 재원으로 정보통신기획평가원의 지원을 받아 수행된 연구로 ”분산된 데이터에 대한 논리적 데이터 통합과 복합분석을 지원하는 데이터 패브릭 기술개발(RS-2023-00222191)”에 관한 것이다.

 
페이지 저장