2026 (10)
2025 (62)
2024 (55)
2023 (53)
2022 (56)
2021 (51)
2020 (52)
2019 (50)
2018 (53)
2017 (67)
2016 (61)
2015 (54)
2014 (54)
2013 (56)
2012 (56)
2011 (55)
2010 (53)
2009 (44)
2008 (32)
2007 (40)
2006 (44)
2005 (30)
일반적인 도로 환경에 비해 도심 이면 교차로는 사고 위험이 특히 높은 것으로 알려져 있다. 본 논문에서는 이러한 도심 이면 교차로에 설치한 CCTV 영상으로부터 위험 상황을 인지하는 모델을 제안한다. 제안하는 모델은 크게 다 음 2가지 특징을 가진다. 먼저, 교차로의 경우 차로별로 카메라 시점에 따른 왜곡 방향이 다르기 때문에 진행 차량 의 정확한 속도 추정을 위해서는 차로별로 독립적인 BEV (Bird’s Eye View)로의 좌표계 변환이 필요하다. 다음 으로는 기존의 동영상 분류 방법보다 우수한 성능으로 위험 상황을 인지하기 위해 속도 추정 결과를 바탕으로 교차 로에서의 위험 상황을 판단한다. 제안하는 모델의 성능을 검증하기 위해 교차로 모의 실험 환경을 구축하고 교통사 고 영상 데이터셋을 수집한다. 영상 데이터는 ‘안전’, ‘주의’, 그리고 ‘위험’으로 총 세 가지 교차로 상황의 클래스로 구분하고, 학습 및 성능 검증을 위해 각 클래스 별로 72개의 영상 데이터를 선별하여 사용한다. 논문에서 제안하는 위험 상황 인지 판단 모델 학습을 위해 YOLO v8 모델을 사용하여 영상 속 차량의 이동 궤적을 추적하고, 카메라 화각에 따른 왜곡을 보정하기 위해 차로별 독립 BEV 변환을 수행하고 차량의 위치와 속도를 추정한다. 제안하는 모 델의 현실 세계 적용 가능성을 확인하기 위해 실제 도로에서의 차량 주행 영상을 바탕으로 속도를 추정한 실험 결과 를 함께 제시하고 있다. 본 논문에서는 추정한 차량의 속도와 위치를 기반으로 MLP (Multi-Layer Perceptron) 분류기를 적용한 위험 상황 인지 모델을 제안한다. 또한, 제안하는 모델의 성능 평가를 위한 비교군으로 추정한 차 량의 속도와 위치를 기반으로 GRU (Gate Recurrent Unit) 분류기를 적용한 모델과 속도 추정없이 Inception v3 기반의 비디오 분류 모델을 사용하여 제안 모델을 평가한다. 제안하는 모델과 기존 모델의 성능을 비교한 본 논문의 실험 결과 YOLO와 MLP를 사용한 모델이 89%의 정확도와 5ms의 추론 속도를 보여주어 정확도와 실시 간성 측면에서 다른 비교 모델인 YOLO와 GRU 기반의 모델과 비디오 분류 모델에 비해 가장 뛰어남을 확인할 수 있다.
Compared to typical road environments, urban backstreet intersections are known to have a particularly high risk of accidents. This paper proposes a model for recognizing risk situations from CCTV video installed at such urban backstreet intersections. The proposed model has two main features. First, since the distortion direction due to the camera viewpoint varies by lane at intersections, lane-specific independent coordinate transformations to Bird’s Eye Views (BEV) are necessary for accurate vehicle speed estimation. Second, to detect risk situations with better performance than existing video classification methods, the model determines risk situations at intersections based on the estimated speed results. To validate the performance of the proposed model, a simulated intersection environment was constructed, and a traffic accident video dataset was collected. The video data are classified into three intersection situations: ‘safe’, ‘caution’, and ‘danger’, with 72 video samples selected per class for training and performance validation. For training the risk detection model proposed in this paper, YOLO v8 is employed to track vehicles in the videos. Then, lane-specific independent BEV transformations are performed to correct distortion based on the camera angle. After that, the model can estimate vehicle positions and speeds. To confirm the real-world applicability of the proposed model, experimental results based on actual road driving video are presented, where vehicle speed estimation is demonstrated. Utilizing the estimated speeds and positions, a hazard recognition model based on a Multi-Layer Perceptron (MLP) classifier is proposed. For performance evaluation, the model is benchmarked against a Gate Recurrent Unit (GRU)-based model and an Inception v3-based video classification model. The experimental findings reveal that the YOLO and MLP-based model achieves an accuracy of 89% and an inference speed of 5ms, demonstrating superior performance in both accuracy and real-time processing compared to the GRU-based and video classification models.
인공지능 기술의 발달로 자율주행, 의료 영상 분석 등 다양한 분야에서 인공지능이 널리 활용되고 있지만, 이와 동 시에 적대적 공격에 대한 위협이 점차 증가하고 있다. 적대적 공격은 사람에게는 감지되지 않는 미세한 변화를 통해 인공지능 모델의 예측을 왜곡시키며, 특히 인공지능의 신뢰성이 중요한 분야에서 심각한 문제를 초래할 수 있다. 이 러한 문제를 해결하기 위해, 본 연구에서는 샘플링 기반 일관성 탐지 기법을 활용한 새로운 적대적 공격 탐지 방안 을 제안한다. 입력된 영상의 주변부를 샘플링하여 분류한 결과의 일관성을 확인하고 이를 통해 입력된 영상의 공격 여부를 판단한다. MNIST 데이터 세트에서의 실험을 통해 제안한 탐지 기법이 FGSM, BIM, PGD, DeepFool, C&W 등 다양한 적대적 공격을 성공적으로 탐지할 수 있음을 실험하였고, 특히 C&W 공격에 대해 98%의 탐지 성능을 확인하였다.
Advances in AI technology are enabling its widespread use in various fields, such as autonomous driving and medical image analysis. However, they are also increasing the threat of adversarial attacks. Adversarial attacks subtly distort the predictions of AI models in ways undetectable to humans, potentially leading to severe consequences, particularly in fields where AI reliability is essential. To address these issues, this research proposes a new method for detecting adversarial attacks using a sampling-based consistency detection technique. By sampling around the input image, the consistency of the classification results is checked to determine whether the input image has been attacked. Experimental results on the MNIST dataset show that the proposed detection method can effectively detect adversarial attacks, achieving a 98% detection rate for C&W attacks.
ARM 기반 환경에서 희소 다항식 곱셈과 SIMD를 활용한 CRYSTALS-Dilithium 서명 알고리즘 최적화 및 성능 비교
한국차세대컴퓨팅학회 한국차세대컴퓨팅학회 논문지 Vol.21 No.1 2025.02 pp.38-48
양자 컴퓨팅 발전에 따른 Shor 알고리즘 및 Grover 알고리즘의 등장으로 인해 기존 공개키암호 알고리즘이 위협받 고 있다. 이에 따라 미국 국립표준기술연구소에서는 양자내성암호 표준화 공모전을 통하여, 양자 컴퓨팅 발전으로 인한 보안 위협에 대비하고 있다. 표준화 공모전을 통해 선정된 4종의 표준화 대상 양자내성암호들은 보안성 및 민 첩성 측면에서 각기 다양한 방식으로 연구되고 있으며, 이 중 격자 기반의 전자서명 알고리즘인 CRYSTALSDilithium은 다항식 곱셈을 위하여 NTT 연산을 이용하고 있으나, 최근 희소 다항식 곱셈을 적용하여 알고리즘 성 능을 향상시킬 수 있다는 연구 결과가 발표된 바 있다. 해당 논문에서는 Cortex-M4, Apple M2 기반 실험 환경을 구축하여 검증을 진행했으나, 다른 ARM 계열 CPU 환경에서도 속도를 향상시킬 수 있는지에 대한 성능 검증은 이 루어지지 않았다. 이에, 본 논문에서는 다른 ARM 계열 CPU 환경에서도 희소 다항식 곱셈을 적용할 경우에 대한 CRYSTALS-Dilithium의 성능을 검증하고자 Dilithium2, Dilithium3, Dilithium5 알고리즘 각각에 대해 세 가지 코드(레퍼런스 코드, 희소 다항식 곱셈 알고리즘, SIMD를 적용한 희소 다항식 곱셈 알고리즘)를 구현하고 이 에 대한 성능을 검증하였다.
The emergence of Shor and Grover algorithms following the development of quantum computing is threatening existing public key encryption algorithms. As a result, the National Institute of Standards and Technology (NIST) is preparing for security threats caused by the development of quantum computing through a competition for standardization of post quantum cryptography. The four types of standardized post quantum cryptography. selected through the standardization contest are being studied in various ways in terms of security and agility, and CRYSTALS-Dilithium, a grid- based digital signature algorithm, uses NTT operation for polynomial multiplication, but recently a research result has been published that shows that algorithm performance can be improved by applying sparse polynomial multiplication [8]. In this paper, Cortex-M4 and Apple M2 based experimental environments were built and verified, but performance verification has not been made on whether speed can be improved in other ARM-based CPU environments. Therefore, in this paper, three codes (reference code, sparse polynomial multiplication algorithm, and sparse polynomial multiplication algorithm with SIMD) were implemented and their performance was verified for each of the Dilithium2, Dilithium3, and Dilithium5 algorithms to verify the performance of CRYSTALSDilithium when applying sparse polynomial multiplication in other ARM-based CPU environments.
쿼리와 패시지 간의 연관성을 평가하는 것은 정보 검색에서 중요한 과제이다. 이 분야에서 GPT-4와 같은 거대 언 어 모델(LLM)의 성능은 사용되는 프롬프트의 품질에 크게 의존한다. 프롬프트 설계 방식은 주로 수동으로 이루어 지며, 그 효과는 일정하지 않다. 본 논문에서는 쿼리와 패시지간의 연관성 판단을 위한 프롬프트를 자동으로 생성하 는 자동 프롬 프트 생성 프레임워크(APGF)를 제안한다. APGF는 훈련 데이터셋을 활용하고, 점수 기반의 목적 함 수를 사용하여 훈련 과정에서 프롬프트를 자동으로 개선한다. APGF의 효과는 인간 평가자의 평과결과와 APGF가 평가한 결과가 얼마나 유 사한가를 그 기준으로 하여 평가된다. APGF가 생성한 프롬프트는 수동으로 작성된 프롬 프트보다 인간 평가자 판단과 더 높은 일치도를 보이는 연관성 평가를 제공함을 확인할 수 있었다. 이 접근법은 프롬 프트 최적화를 위한 자동화 솔루션을 제공하며, 정보 검색 시스템의 효과성과 효율성을 향상시키는 진전을 나타낸다.
Evaluating the relevance between a query and a passage is a critical task in Information Retrieval. The efficacy of Large Language Models (LLMs) like GPT-4 in this domain is largely dependent on the quality of the prompts employed. Current methods of prompt crafting are often manual and vary in effectiveness. In this paper, we introduce the Automated Prompt Generation Framework (APGF), designed to automatically generate optimized prompts for GPT-4, with a specific focus on query-passage relevance tasks. APGF leverages a training dataset and employs a score-based objective function to automate the process of prompt selection during training. We evaluate APGF’s effectiveness through a direct comparison with a human- judged relevance set. The results indicate that APGF-generated prompts yield relevance assessments that more closely align with human judgments than do prompts crafted by a human judge. Our approach offers an automated solution for prompt optimization and presents an advancement in the effectiveness and efficiency of Information Retrieval systems.
차량 탐지와 분류 기술은 교통 관리와 도로 안전 향상을 위한 핵심 기술로, 교통 흐름 분석과 도로 설계 최적화에 중요한 역할을 한다. 기존의 영상 처리 기반 기술은 조명 변화, 악천후, 복잡한 도로 환경에서 성능 한계를 보였지 만, 딥러닝 기술의 발전으로 이러한 문제를 해결할 수 있다. 본 연구는 YOLOv8 객체 탐지 알고리즘과 SORT (Simple Online and Realtime Tracking) 기반 궤적 추적을 결합한 차량 탐지 및 분류 시스템을 제안한다. 이 시스템은 말레이시아 고속도로 데이터를 활용하여 다양한 기상 조건(맑은 날, 저조도, 비 오는 환경)에서 실험적으 로 검증했다. 실험 결과, 평균 탐지 정확도 99.7%, 분류 정확도 99.5%, 속도 계산 오차 1.5~2.4km/h를 기록하 였으며, 본 시스템이 실시간 교통 흐름 관리와 분석에 적합한 신뢰성 높은 솔루션임을 입증했다.
Vehicle detection and classification technologies are pivotal for traffic management and road safety enhancement, enabling traffic flow analysis and road optimization. Traditional image-based methods often face challenges such as lighting variations, adverse weather, and complex road environments. Leveraging advancements in deep learning, this study proposes a vehicle detection and classification system combining YOLOv8 object detection and SORT (Simple Online and Realtime Tracking) trajectory tracking. Using Malaysian highway data, the system's performance was experimentally validated across various conditions, including clear, low-light, and rainy environments. The results demonstrated an average detection accuracy of 99.7%, classification accuracy of 99.5%, and a speed calculation error ranging from 1.5 to 2.4 km/h, establishing the system as a reliable solution for real-time traffic management and analysis.
에어컴프레서는 다양한 제조공장에서 널리 사용되고 있는 원동기이며, 공기역학을 기반으로 하는 다수의 제조 장비 에 동력을 제공하고 있어, 예기치 못한 고장이 발생할 경우 전체 제조라인의 가동이 중단될 수 있다. 본 연구에서는 컴프레서에 통신이 가능한 진동센서를 부착하여 컴프레서 가동 시 발생되는 진동 데이터를 클라우드 상에 축적하고 수집된 데이터로부터 컴프레서의 운영 상태 진단을 위한 특징들을 추출하였다. ‘합성곱신경망(Convolutionl Neural Networks)’을 활용하여 수집된 데이터와 추출된 특징들을 학습시켜 컴프레서의 상태 건전성을 자동으로 예측할 수 있도록 인공지능 알고리즘을 고안하였다. 이후 합성곱신경망의 최적화 파라미터별로 컴프레서의 건전성 예측 정확도에 어떠한 영향을 미치는지 실험하였다. 실험결과, 합성곱신경망을 통한 컴프레서의 진동 데이터 분석에 서는 ‘모멘텀’ 최적화 기법의 판정 정확도가 가장 우수하였다. 데이터 셋의 특성에 따라 적절한 신경망 최적화 기법 이 합성곱신경망 학습 효율과 예측 정확도를 결정짓는 매우 중요한 요소임을 확인할 수 있었다.
The air compressor is a common rotating machine that is widely used in various manufacturing plants, and provides power to a number of manufacturing devices based on aerodynamics in the plant, so if an unexpected failure occurs, the entire manufacturing line can be shut down. In this study, a vibration sensor capable of communication was attached to the compressor, the vibration data generated during compressor operation was accumulated on the cloud, and features for diagnosing the operating status of the compressor were extracted from the collected data. An artificial intelligence algorithm was designed to automatically predict the health-condition of the air- compressor by learning the collected data and extracted features using ‘Convolutional Neural Network (CNN). And then we tested how each CNN optimization parameter affected the compressor's health prediction accuracy. As a result of the experiment, in analyzing compressor vibration data through CNN, the ‘momentum’ optimization algorithm had the best accuracy, and depending on the characteristics of the data set. We found that appropriate neural network optimization techniques are a very important factor in determining CNN learning efficiency and prediction accuracy.
Contextual Stack Navigator : 시각적 탐색 지원을 위한 공간적 맥락 인지형 계층적 뷰 관리 인터페이스
한국차세대컴퓨팅학회 한국차세대컴퓨팅학회 논문지 Vol.21 No.1 2025.02 pp.91-100
본 연구는 데이터 시각화 과정에서 사용자의 관심 뷰(View)를 관리하고, 공간적 맥락을 유지할 수 있도록 지원하는 새로운 탐색 보조 도구인 CSN(Contextual Stack Navigator)을 제안한다. 기존 스냅샷 기반 방법은 데이터 탐 색 과정에서 생성된 뷰 간의 관계를 효과적으로 파악하기 어렵고, 맥락 정보의 부족으로 인해 사용자의 인지적 부담 을 증가시키는 한계가 있었다. 이를 극복하기 위해 CSN은 탐색 과정에서 생성된 뷰를 계층적 구조로 저장하고, 시 각적 단서를 통해 사용자에게 명확한 맥락 정보를 제공한다. CSN은 데이터 표현 방식에 제한받지 않고 다양한 데 이터 분석에 적용 가능하며, 탐색 과정에서의 직관적 상호작용과 유연한 데이터 분석을 지원한다. 본 연구에서는 CSN의 유용성을 검증하기 위해 저수준 작업 분류(Low-level Task Taxonomies)에 기반한 사례 연구를 수행하 였으며, 이를 통해 CSN이 기존의 스냅샷 방식 대비 탐색 효율성과 맥락 유지 측면에서 효과적임을 입증하였다. 본 연구 결과는 복잡한 데이터 분석 환경에서 시각적 탐색과 인사이트 도출을 효과적으로 지원할 것으로 기대된다.
This study proposes a novel navigation aid tool called Contextual Stack Navigator (CSN), designed to manage users' views during data visualization and preserve spatial context. Traditional snapshot- based methods have limitations in effectively identifying relationships between views generated during data exploration, often increasing users' cognitive load due to the lack of contextual information. To address these challenges, CSN stores views generated during the exploration process in a hierarchical structure and provides users with clear contextual cues. CSN is not constrained by data representation types, making it applicable to a wide range of data analysis scenarios while supporting intuitive interactions and flexible data exploration. To validate the utility of CSN, we conducted case studies based on Low-level Task Taxonomies, demonstrating that CSN is more effective than traditional snapshot methods in terms of exploration efficiency and context retention. These findings suggest that CSN can effectively support visual exploration and insight generation in complex data analysis environments.
본 논문은 사전 학습된 벡터 양자화 변분 오토인코더(VQ-VAE)의 성능을 향상시키기 위한 유전 알고리즘 기반의 미세 조정 프레임워크를 제안한다. VQ-VAE 모델은 복잡한 데이터 분포에 대한 이산 잠재 표현 학습에서 우수한 성능을 보여왔으나, 코드북의 저활용 토큰들, 특히 지역 특징을 표현하는 토큰들의 불완전한 특징 포착으로 인해 그 성능이 제한적이었다. 이러한 한계를 극복하기 위해 본 연구에서는 코드북 유전 알고리즘(CGA)을 제안하여 저활용 토큰들을 선택적으로 최적화하고 이들의 표현 능력을 향상시키는 방법을 제시한다. 실험을 통해 제안된 방법이 계산 효율성을 유지하면서도 지역 특징의 표현을 효과적으로 개선하여, 다양한 데이터셋에서 더 균형 잡힌 코드북 활용도 와 향상된 재구성 품질을 달성할 수 있음을 입증했다.
This paper proposes a genetic algorithm-based fine-tuning framework to improve the performance of pre-trained Vector Quantized Variational Autoencoders (VQ-VAE). While VQ-VAE models have demonstrated excellent performance in learning discrete latent representations for complex data distributions, their performance has been limited by underutilized codebook tokens, particularly those representing local features, resulting in incomplete feature capture. To overcome these limitations, we propose a Codebook Genetic Algorithm (CGA) that selectively optimizes underutilized tokens and enhances their representational capabilities. Through experiments, we demonstrate that our proposed method effectively improves the representation of local features while maintaining computational efficiency, achieving more balanced codebook utilization and enhanced reconstruction quality across various datasets.
사건관련전위(ERP)의 딥러닝기반 경두개 자기자극(TMS)을 이용한 감정인식에 관한 연구
한국차세대컴퓨팅학회 한국차세대컴퓨팅학회 논문지 Vol.21 No.1 2025.02 pp.111-121
경두개 자기자극(Transcranial magnetic stimulation, TMS)은 대뇌피질을 자극하는 비침습형 측정방법으로 뇌의 특정위치에 코일을 통한 강력한 전류의 순간적 강한 자기장을 가하므로써, 이를 통하여, 뇌의 특정영역의 신경 세포를 활성화 혹은 억제시키는 뇌 자극술이다. 특히, 배외측 전전두엽 피질(Dorsolateral prefrontal cortex, DLPFC)에 적용된 저주파의 반복적으로 가해지는 TMS 자극법은 감정처리와 관련되어 유효성이 검증되면서 의학, 심리학 등 다양한 정신질환 및 심리치료에서 활용되고 있다. 이러한 TMS의 유효성을 바탕으로, 본 연구에서는 사 용자가 감정문장을 읽는 동안, TMS를 사용하여 뇌의 특정영역에 자극을 가한 후, TMS 전후 감정변화에 대하여 알아보고자 한다. 즉, TMS 자극 전/후의 감정에 대한 반응을 사건관련전위(Event-related potential, ERP)방 법으로 뇌파를 기록하고, 감정과 관련된 ERP 성분(Component)을 검출 후, 이를 기계학습 활용하여 그 성능을 평 가하고자 한다. 먼저, 6개의 감정(분노, 흥분, 두려움, 지루함, 슬픔, 행복)과 중립의 감정문장을 제시하고, 이를 2번으로 나누어, 총 280개를 사용하여 데이터를 수집하였다. 측정된 뇌파는 방해파 제거 등의 전처리 과정을 거친 후, 감정과 관련된 ERP 성분인 후기 정적 복합체(Late positive complex, LPC)를 검출하였다. 마지막으로, 100ms당 1개의 스펙트로그램(Spectrogram)으로 이미지를 생성하고, 이에 대한 성능 평가를 진행하였다. 그 결 과, TMS 자극 전/후 비교해보면, TMS 자극 후가 자극 전보다 감정인식 성능이 높게 나타났으며, 합성신경망 (Convolutional Neural network, CNN)을 사용할 때, 4개의 감정에 대해서 86.39%의 가장 높은 성능을 얻었 다. 본 연구는 TMS 처치를 통한 뇌 인지기능조절을 통한 감정반응의 효과를 확인하였고, 감정조절과 뇌 반응에 효 과적이라는 것을 확인할 수 있었다.
Transcranial magnetic stimulation(TMS) is a non-invasive measurement method that stimulates the cerebral cortex to examine human brain function. For this reason, many fields, ranging from medicine and psychology to computer science, focus on identifying and recognizing human emotions to better understand individual states and comprehend specific situations. This study aims to determine emotional responses by controlling brain cognitive functions through TMS. In particular, low-frequency repetitive TMS applied to the dorsolateral prefrontal cortex(DLPFC) has been verified as effective in emotional processing. Hence, it is used in various mental illnesses, psychotherapy, medicine, and psychology. In this paper, we investigate the effects of low-frequency repetitive TMS applied over the DLPFC while reading emotional sentences. In addition, we record EEG(electroencephalogram) using Event-related potential(ERP) to examine brain responses before and after TMS stimulation, detect ERP components related to emotion, and evaluate with machine learning. First, we selected 280 emotional sentences as standardized elicitation samples for self-induced emotion from EEG signals using ERP that described six discrete emotions, i.e., anger, excited, fear, bored, sadness, happiness, and neutral in the baseline. We focus on the emotionrelated ERP component, Late Positive Complex(LPC), extracted by raw EEG signals. Then, we generate the EEG signals to spectrogram as images per 100 ms. As a result, we confirm that emotion recognition after TMS stimulation is higher than before. Also, we achieved the best recognition accuracy of 86.39% after TMS treatment compared to before TMS treatment using CNN. In conclusion, our study means that TMS treatment is effective for emotion control and brain response. In the future, it will be possible to consider individual variance differences or conduct research using various deep-learning methods.
0개의 논문이 장바구니에 담겼습니다.
선택하신 파일을 압축중입니다.
잠시만 기다려 주십시오.