2025 (92)
2024 (176)
2023 (176)
2022 (157)
2021 (160)
2020 (179)
2019 (190)
2018 (190)
2017 (195)
2016 (193)
2015 (211)
2014 (200)
2013 (200)
2012 (205)
2011 (203)
2010 (192)
2009 (162)
2008 (104)
2007 (45)
2006 (40)
2005 (24)
2004 (16)
2003 (13)
2002 (11)
지능형 엣지 컴퓨팅 기기를 위한 온디바이스 AI 비전 모델의 경량화 방식 분석
국제인공지능학회(구 한국인터넷방송통신학회) 한국인터넷방송통신학회 논문지 제24권 제1호 2024.02 pp.1-8
※ 원문제공기관과의 협약기간이 종료되어 열람이 제한될 수 있습니다.
실시간 처리 및 프라이버시 강화를 위해 인공지능 모델을 엣지에서 동작시킬 수 있는 온디바이스 AI 기술이 각광받고 있다. 지능형 사물인터넷 기술이 다양한 산업에 적용되면서 온디바이스 AI 기술을 활용한 서비스가 크게 증가 하고 있다. 그러나 일반적인 딥러닝 모델은 추론 및 학습을 위해 많은 연산 자원을 요구하고 있다. 따라서 엣지에 적용되 는 경량 기기에서 딥러닝 모델을 동작시키기 위해 양자화나 가지치기와 같은 다양한 경량화 기법들이 적용되어야 한다. 본 논문에서는 다양한 경량화 기법 중 가지치기 기술을 중심으로 엣지 컴퓨팅 기기에서 딥러닝 모델을 경량화하여 적용 할 수 있는 방안을 분석한다. 특히, 동적 및 정적 가지치기 기법을 적용하여 경량화된 비전 모델의 추론 속도, 정확도 그리고 메모리 사용량을 시험한다. 논문에서 분석된 내용은 실시간 특성이 중요한 지능형 영상 관제 시스템이나 자율 이동체의 영상 보안 시스템에 적용될 수 있다. 또한 사물인터넷 기술이 적용되는 다양한 서비스와 산업에 더욱 효과적으 로 활용될 수 있을 것으로 기대된다.
On-device AI technology, which can operate AI models at the edge devices to support real-time processing and privacy enhancement, is attracting attention. As intelligent IoT is applied to various industries, services utilizing the on-device AI technology are increasing significantly. However, general deep learning models require a lot of computational resources for inference and learning. Therefore, various lightweighting methods such as quantization and pruning have been suggested to operate deep learning models in embedded edge devices. Among the lightweighting methods, we analyze how to lightweight and apply deep learning models to edge computing devices, focusing on pruning technology in this paper. In particular, we utilize dynamic and static pruning techniques to evaluate the inference speed, accuracy, and memory usage of a lightweight AI vision model. The content analyzed in this paper can be used for intelligent video control systems or video security systems in autonomous vehicles, where real-time processing are highly required. In addition, it is expected that the content can be used more effectively in various IoT services and industries.
국제인공지능학회(구 한국인터넷방송통신학회) 한국인터넷방송통신학회 논문지 제24권 제1호 2024.02 pp.9-16
※ 원문제공기관과의 협약기간이 종료되어 열람이 제한될 수 있습니다.
알약 구매 후 조제약 봉투나 포장지를 잃어버린 경우 약의 효능을 알기 어렵고 많은 사람들이 시중에서 판매하는 약을 구매하여 복용한 후 보관 시 용도를 구분해서 보관하지 않는 경우가 많다. 또한 알약 부작용에 대한 정보의 접근성 이 낮아 약을 오남용하는 상황이 발생하기도 한다. 기존의 알약 정보를 검색하여 정보를 알려 주는 대부분의 서비스 및 어플리케이션들은 사용자가 알약의 상세정보를 직접 입력하거나 선택해야 하는 번거로움이 존재한다. 본 논문에서는 이러한 불편한 상황들은 개선하고 보다 나은 서비스를 제공하기 위해 약학정보원에서 제공하는 알약 22,000종의 사진에 대해 제형과 색상을 학습시킨 딥러닝 모델을 구축하였다. 구축된 정보를 활용하여 촬영된 사진으로 알약을 검색하고 알 약 정보를 알려주며 사용자의 약 복용을 관리해주는 기능을 갖는 시스템을 개발하였다.
It is difficult to know the efficacy of pills if the pill bag or wrapper is lost after purchasing the pill. Many people do not classify the use of commercial pills when storing them after purchasing and taking them, so the inaccessibility of information on the side effects of pills leads to misuse of pills. Even with existing applications that search and provide information about pills, users have to select the details of the pills themselves. In this paper, we develope a pill recognition application by building a model that learns the formulation and colour of 22,000 photos of pills provided by a Pharmaceutical Information Institution to solve the above situation. We also develope a pill medication management function.
딥러닝 기반 가상 피팅 기능을 갖는 중고 의류 거래 시스템 구현
국제인공지능학회(구 한국인터넷방송통신학회) 한국인터넷방송통신학회 논문지 제24권 제1호 2024.02 pp.17-22
※ 원문제공기관과의 협약기간이 종료되어 열람이 제한될 수 있습니다.
본 논문은 딥러닝을 기반으로 한 가상 피팅 기능을 갖춘 중고 의류 거래 시스템의 구현을 소개한다. 제안된 시스 템은 사용자가 중고 의류를 온라인으로 시각적으로 착용하고 핏을 확인할 수 있는 기능을 제공한다. 이를 위해, 합성곱 (CNN) 알고리즘을 사용하여 사용자의 신체 형상과 의류의 디자인을 고려한 가상 착용 모습을 생성한다. 이를 통해 구매 자는 온라인에서 실제로 의류를 입기 전에 핏을 미리 확인할 수 있으며, 이는 구매 결정에 도움을 준다. 또한, 판매자는 시스템을 통해 정확한 의류 사이즈와 핏을 제시할 수 있어 구매자의 만족도를 높일 수 있다. 본 논문은 CNN 모델의 학습 절차, 시스템의 구현 방법, 사용자 피드백 등을 자세히 다루고, 실험 결과를 통해 제안된 시스템의 유효성을 입증한다.
This paper introduces the implementation of a secondhand clothing trading system equipped with virtual fitting functionality based on deep learning. The proposed system provides users with the ability to visually try on secondhand clothing items online and assess their fit. To achieve this, it utilizes the Convolutional Neural Network (CNN) algorithm to create virtual representations of users considering their body shape and the design of the clothing. This enables buyers to pre-assess the fit of clothing items online before actually wearing them, thereby aiding in their purchase decisions. Additionally, sellers can present accurate clothing sizes and fits through the system, enhancing customer satisfaction. This paper delves into the CNN model's training process, system implementation, user feedback, and validates the effectiveness of the proposed system through experimental results.
국제인공지능학회(구 한국인터넷방송통신학회) 한국인터넷방송통신학회 논문지 제24권 제1호 2024.02 pp.23-30
※ 원문제공기관과의 협약기간이 종료되어 열람이 제한될 수 있습니다.
본 논문에서는 광대역 특성을 가지는 능동위상배열 안테나의 설계, 검증 및 분석에 대하여 기술하였다. 능동위상 배열 안테나를 항공기 혹은 미사일에 적용하려면 배열 안테나의 소형화 및 광각 빔조향 특성을 확보하는 것은 피할 수 없는 안테나 설계 고려 사항이 될 수 있다. 특히 전자적으로 광각 빔조향 시 능동반사계수 특성은 시스템의 생존 및 성능 측면에서 최소화되어야 하는 설계 파라미터이다. 광대역 특성 및 광각 빔조향에 적합한 복사 소자로 본 논문에서는 Step Flared Notch(SFN)를 적용한 배열 구조를 설계하고 구좌표계 θ 각도 기준 최대 40° 빔조향에 따른 능동반사계수 를 최소화하였다. 복사소자의 대역폭은 Ka대역에서 능동반사 기준으로 3GHz를 확인하였다. 또한 실제 제작된 8by8 배열 안테나는 근접전계 시험을 통해 복사소자의 단일 패턴을 측정하고, 수학적으로 합성하여 탐색기 시스템에 사용하는 송/수신빔을 예측하여 성능을 분석하였다.
This paper dedcribes the design. verification, and analysis techniques for an advanced phased array antenna. When applying an active phased array antenna to an aircraft or missile, miniaturization of the array antenna and wide-angle beam steering characteristics can be unavoidable antenna design considerations. In particular, the active reflection coefficient characteristics when electronically steering a wide-angle beam is a design parameter that must be minimized in terms of system survival and system performance. As a radiator suitable for broadband characteristics and wide-angle beam steering, this paper designed an array structure using SFN and minimized the active reflection coefficient according to beam steering of up to 40° based on the spherical coordivate system angle. The bandwidth of the radiator was confirmed to be 3GHz based on active reflection in the Ka-band. In addition, the performance of the actually manufactured 8by8 array antenna wsa analyzed by measuring the single pattern of the radiator through a near-field test, mathematically synthesizing it, and predicting the Tx/TRx beam used in the seeker system.
개인용 모바일 환경의 AI 워크로드 수행을 위한 메모리 참조 분석 및 시스템 설계 방안
국제인공지능학회(구 한국인터넷방송통신학회) 한국인터넷방송통신학회 논문지 제24권 제1호 2024.02 pp.31-36
※ 원문제공기관과의 협약기간이 종료되어 열람이 제한될 수 있습니다.
최근 AI 기술을 활용하는 모바일 앱이 늘고 있다. 개인용 모바일 환경에서는 메모리 용량의 제약으로 인해 대용 량 데이터로 구성된 워크로드의 학습 시 극심한 성능 저하가 발생할 수 있다. 본 논문에서는 이러한 현상을 규명하기 위해 AI 워크로드의 메모리 참조 트레이스를 추출하고 그 특성을 분석하였다. 그 결과 AI 워크로드는 메모리 쓰기 연산 시 약한 시간지역성과 불규칙한 인기편향성 등으로 인해 잦은 스토리지 접근을 발생시켜 모바일 기기의 성능을 저하시킬 수 있음을 확인하였다. 이러한 분석을 토대로 본 논문에서는 AI 워크로드의 메모리 쓰기 연산을 영속 메모리 기반의 스왑 장치를 이용해서 효율적으로 관리할 수 있는 방안에 대해 논의하였다. 시뮬레이션을 통해 본 연구에서 제안한 구조 가 기존의 모바일 시스템 대비 80% 이상 입출력 시간을 개선할 수 있음을 보였다.
Recently, mobile apps that utilize AI technologies are increasing. In the personal mobile environment, performance degradation may occur during the training phase of large AI workload due to limitations in memory capacity. In this paper, we extract memory reference traces of AI workloads and analyze their characteristics. From this analysis, we observe that AI workloads can cause frequent storage access due to weak temporal locality and irregular popularity bias during memory write operations, which can degrade the performance of mobile devices. Based on this observation, we discuss ways to efficiently manage memory write operations of AI workloads using persistent memory-based swap devices. Through simulation experiments, we show that the system architecture proposed in this paper can improve the I/O time of mobile systems by more than 80%.
국제인공지능학회(구 한국인터넷방송통신학회) 한국인터넷방송통신학회 논문지 제24권 제1호 2024.02 pp.37-42
※ 원문제공기관과의 협약기간이 종료되어 열람이 제한될 수 있습니다.
본 논문은 NP-완전으로 최적 해를 구하는 다항시간 알고리즘이 알려져 있지 않은 절단 폭 최소화 문제에 대해 다항시간 알고리즘을 제안하였다. 주어진 그래프 G=(V,E), m=|V|, n=|E|에 대한 최소 절단 폭 CWf(G) = max v∈V CWf(v)를 찾기 위해 제안된 알고리즘은 첫 번째로, 최대차수 정점 vi를 기준으로 N G[vi] 정점들을 vi 를 통과하 는 간선수가 최소가 되도록 양분하는 열 절단면을 찾고, 좌ㆍ우의 N G[vi]들 간의 통과 간선수가 최소가 되는 행 절단면으 로 분할하였다. 두 번째로, 각 부 그래프 내부의 정점들을 선형으로 연결하고, 부 그래프들 간 간선을 연결하여 하나의 선형 배열을 만들었다. 마지막으로, 정점을 이동시켜 최소 절단폭을 갖는 최적화 과정을 수행하였다. 다양한 그래프들을 대상으로 실험한 결과, 수행 복잡도가 O(n2)인 제안된 알고리즘을 모든 데이터들에 대해 최적 해를 찾을 수 있었다.
This paper suggests polynomial time algorithm for cutwidth minimization problem that classified as NP-complete because the polynomial time algorithm to find the optimal solution has been unknown yet. To find the minimum cutwidth CWf(G) = max v∈V CWf(v) for given graph G=(V,E), m=|V|, n=|E|, the proposed algorithm divides neighborhood N G[vi] of the maximum degree vertex vi in graph G into left and right and decides the vertical cut plane with minimum number of edges pass through the vertex vi firstly. Then, we split the left and right N G[vi] into horizontal sections with minimum pass through edges. Secondly, the inner-section vertices are connected into line graph and the inter-section lines are connected by one line layout. Finally, we perform the optimization process in order to obtain the minimum cutwidth using vertex moving method. Though the proposed algorithm requires O(n2) time complexity, that can be obtains the optimal solutions for all of various experimental data
모바일 어플리케이션의 설득효과 연구 : 공익 콘텐츠를 중심으로
국제인공지능학회(구 한국인터넷방송통신학회) 한국인터넷방송통신학회 논문지 제24권 제1호 2024.02 pp.43-48
※ 원문제공기관과의 협약기간이 종료되어 열람이 제한될 수 있습니다.
본 연구는 최근 소비자의 경험을 자극하여 설득효과를 높이고 있는 모바일 어플리케이션의 효과를 살펴보고자 하였다. 특히 상업적 목적이 아닌, 공익적 목적의 콘텐츠들이 사용자의 태도와 신념에 어떠한 영향을 미치는지 확인하고 자, 모바일 어플리케이션의 특성으로 상호작용성과 공익성을 선정하여 그 관계를 살펴보았다. 실제 어플리케이션 중 하 나를 연구대상으로 선정하여 이를 체험한 피험자들의 반응을 조사하였다. 그 결과, 모바일 어플리케이션의 상호작용성과 공익성은 콘텐츠태도와 제품신념에 직‧간접적인 영향력을 미치는 것으로 나타났으며, 콘텐츠태도가 신념에 영향을 줄 수 있음을 확인하였다. 이러한 연구결과는 수용자의 콘텐츠 태도를 강화함으로써 인식구조에 영향을 미칠 수 있음을 보여준다.
This study sought to examine the effectiveness of mobile applications, which have recently increased persuasion effects by stimulating consumer experiences. In particular, to determine how content for public interest affects users' attitudes and beliefs, we selected interactivity and public interest as characteristics of mobile applications and examined their relationship. One of the actual applications was selected for research and the reactions of subjects who experienced it were investigated. As a result, the interactivity and public interest of mobile applications were found to have a direct and indirect influence on content attitude and beliefs, and it was confirmed that content attitude can affect beliefs. These research results show that cognitive structure can be influenced by reinforcing the audience's attitude toward content.
불균형 블랙박스 동영상 데이터에서 충돌 상황의 다중 분류를 위한 손실 함수 비교
국제인공지능학회(구 한국인터넷방송통신학회) 한국인터넷방송통신학회 논문지 제24권 제1호 2024.02 pp.49-54
※ 원문제공기관과의 협약기간이 종료되어 열람이 제한될 수 있습니다.
데이터 불균형은 분류 문제에서 흔히 마주치는 문제로, 데이터셋 내의 클래스간 샘플 수의 현저한 차이에서 기인 한다. 이러한 데이터 불균형은 일반적으로 분류 모델에서 과적합, 과소적합, 성능 지표의 오해 등의 문제를 야기한다. 이를 해결하기 위한 방법으로는 Resampling, Augmentation, 규제 기법, 손실 함수 조정 등이 있다. 본 논문에서는 손실 함수 조정에 대해 다루며 특히, 불균형 문제를 가진 Multi-Class 블랙박스 동영상 데이터에서 여러 구성의 손실 함수(Cross Entropy, Balanced Cross Entropy, 두 가지 Focal Loss 설정: α = 1 및 α = Balanced, Asymmetric Loss)의 성능을 I3D, R3D_18 모델을 활용하여 비교하였다.
Data imbalance is a common issue encountered in classification problems, stemming from a significant disparity in the number of samples between classes within the dataset. Such data imbalance typically leads to problems in classification models, including overfitting, underfitting, and misinterpretation of performance metrics. Methods to address this issue include resampling, augmentation, regularization techniques, and adjustment of loss functions. In this paper, we focus on loss function adjustment, particularly comparing the performance of various configurations of loss functions (Cross Entropy, Balanced Cross Entropy, two settings of Focal Loss: α = 1 and α = Balanced, Asymmetric Loss) on Multi-Class black-box video data with imbalance issues. The comparison is conducted using the I3D, and R3D_18 models.
빅데이터 기반 미세먼지 이상 탐지 머신러닝 시스템 설계 및 구현
국제인공지능학회(구 한국인터넷방송통신학회) 한국인터넷방송통신학회 논문지 제24권 제1호 2024.02 pp.55-58
※ 원문제공기관과의 협약기간이 종료되어 열람이 제한될 수 있습니다.
본 논문은 빅데이터 기반 미세먼지 이상 탐지 머신러닝 시스템 설계 및 구현을 제안한다. 제안하는 시스템은 빅데이터로 구성된 미세먼지 및 기상 정보를 통해 미세먼지 대기환경지수를 분류하는 시스템이다. 이 시스템은 머신러닝 기반의 대기환경지수 분류 카테고리별 이상치에 따른 이상치 탐지 알고리즘 설계를 통해 미세먼지를 분류한다. 카메라에 서 수집된 영상의 심도 데이터는 미세먼지 농도에 따른 영상을 수집한 후 미세먼지 가시마스크를 생성합니다. 그리고 모노 심도 추정 알고리즘을 통한 학습 기반 핑거프린팅 기법으로 모노스코프 카메라에서 수집된 미세먼지의 가시거리를 추론하여 미세먼지 농도를 도출합니다. 본 방법의 실험 및 분석을 위해 미세먼지 농도 데이터와 지역별, 시간별 CCTV 영상 데이터를 매칭하여 학습 데이터를 생성한 후 모델을 생성하여 실제 환경에서 테스트한다.
In this paper, we propose a design and implementation of big data-based fine dust anomaly detection machine learning system. The proposed is system that classifies the fine dust air quality index through meteorological information composed of fine dust and big data. This system classifies fine dust through the design of an anomaly detection algorithm according to the outliers for each air quality index classification categories based on machine learning. Depth data of the image collected from the camera collects images according to the level of fine dust, and then creates a fine dust visibility mask. And, with a learning-based fingerprinting technique through a mono depth estimation algorithm, the fine dust level is derived by inferring the visibility distance of fine dust collected from the monoscope camera. For experimentation and analysis of this method, after creating learning data by matching the fine dust level data and CCTV image data by region and time, a model is created and tested in a real environment.
불법 주정차 단속을 위한 딥러닝 기반 이미지 인식 모델
국제인공지능학회(구 한국인터넷방송통신학회) 한국인터넷방송통신학회 논문지 제24권 제1호 2024.02 pp.59-64
※ 원문제공기관과의 협약기간이 종료되어 열람이 제한될 수 있습니다.
최근 다양한 산업 분야에서 드론과 인공지능 기술이 융합된 연구 사례가 진행되고 있다. 본 논문에서는 딥러닝 기반 객체 인식과 객체 판별 알고리즘을 이용하여 불법 주정차 차량 인식 모델을 제안한다. 객체 인식 알고리즘은 YOLOv8를 사용하였으며, 객체 판별 알고리즘은 ResNet18을 사용하였다. 제안된 모델은 일반 도로 상황에서 수집한 이미지 데이터를 이용하여 모델 학습을 수행하였고, 학습된 모델은 이미지 기반 불법 주정차를 판별하는데 높은 정확도 를 보였다. 이를 통해 제안된 모델은 다양한 이미지로부터 불법 주정차 차량을 식별하기 위한 일반화 성능을 갖추고 있음을 확인하였다.
Recently, research on the convergence of drones and artificial intelligence technologies have been conducted in various industrial fields. In this paper, we propose an illegal parking vehicle recognition model using deep learning-based object recognition and classification algorithms. The model of object recognition and classification consist of YOLOv8 and ResNet18, respectively. The proposed model was trained using image data collected in general road environment, and the trained model showed high accuracy in determining illegal parking. From simulation results, it was confirmed that the proposed model has generalization performance to identify illegal parking vehicles from various images.
국제인공지능학회(구 한국인터넷방송통신학회) 한국인터넷방송통신학회 논문지 제24권 제1호 2024.02 pp.65-74
※ 원문제공기관과의 협약기간이 종료되어 열람이 제한될 수 있습니다.
최근 자율주행 분야에서는 영상 처리 기술이 중요한 역할을 하고 있다. 그 중에서도 영상 식별 기술은 자율주행 차량의 안전성과 성능에 매우 중요한 역할을 한다. 이에 따라 본 논문에서는 융복합 영상 식별 시스템을 개발하여 자율 주행 차량의 안전성과 성능을 향상시키는 것을 목표로 한다. 본 연구에서는 다양한 영상 식별 기술을 활용하여 차량 주변 환경의 객체를 인식하고 추적하는 시스템을 구축한다. 이를 위해 머신 러닝과 딥 러닝 알고리즘을 활용하며, 이미지 처리 및 분석 기술을 통해 실시간으로 객체를 식별하고 분류한다. 또한, 본 연구에서는 영상 처리 기술과 차량 제어 시스 템을 융합하여 자율주행 차량의 안전성과 성능을 높이는 것을 목표로 한다. 이를 위해, 식별된 객체의 정보를 차량 제어 시스템에 전달하여 자율주행 차량이 적절하게 반응하도록 한다. 본 연구에서 개발된 융복합 영상 식별 시스템은 자율주 행 차량의 안전성과 성능을 크게 향상시킬 것으로 기대된다. 이를 통해 자율주행 차량의 상용화가 더욱 가속화될 것으로 기대된다.
In recent years, image processing technology has played a critical role in the field of autonomous driving. Among them, image recognition technology is essential for the safety and performance of autonomous vehicles. Therefore, this paper aims to develop a hybrid image recognition system to enhance the safety and performance of autonomous vehicles. In this paper, various image recognition technologies are utilized to construct a system that recognizes and tracks objects in the vehicle's surroundings. Machine learning and deep learning algorithms are employed for this purpose, and objects are identified and classified in real-time through image processing and analysis. Furthermore, this study aims to fuse image processing technology with vehicle control systems to improve the safety and performance of autonomous vehicles. To achieve this, the identified object's information is transmitted to the vehicle control system to enable appropriate autonomous driving responses. The developed hybrid image recognition system in this paper is expected to significantly improve the safety and performance of autonomous vehicles. This is expected to accelerate the commercialization of autonomous vehicles.
언리얼엔진과 액션 카메라 시점을 활용한 1인칭 공포 게임 개발
국제인공지능학회(구 한국인터넷방송통신학회) 한국인터넷방송통신학회 논문지 제24권 제1호 2024.02 pp.75-81
※ 원문제공기관과의 협약기간이 종료되어 열람이 제한될 수 있습니다.
본 논문에서는 1인칭 3D 게임을 개발하여 액션 카메라의 특징을 활용한 현실적인 카메라 연출을 통해 플레이어 에게 극한의 공포를 제공하는 데 중점을 두고 있다. 새로운 카메라 연출 기법으로 광각 렌즈를 사용한 시점 왜곡과 이동 시 카메라 흔들림을 도입하여 기존 게임보다 더 높은 몰입도를 제공하고자 한다. 게임의 주제느 공포 방 탈출이며, 플레 이어는 총기를 소지하고 시작한다. 그러나 총기 사용으로 인한 게임의 난도가 낮다는 우려를 극복하기 위해 몬스터 추격 과 탄창 수 감소 등의 부담감을 부여하여 플레이어에게 총기 사용을 조절하도록 하였다. 본 논문은 사실적인 연출을 통해 플레이어들의 공포 효과를 극대화 한 새로운 방식의 3D게임을 개발하였다는 데 그 의의가 있다.
This paper focuses on developing a first-person 3D game to provide extreme fear to players through realistic camera direction utilizing the features of action cameras. As a new camera production technique, we introduce perspective distortion using a wide-angle lens and camera shake when moving to provide higher immersion than existing games. The theme of the game is horror room escape, and the player starts with a firearm, but in order to overcome the concern that the game's difficulty is low due to the use of firearms, the player is asked to control the use of firearms by imposing burdens such as chasing monsters and reducing the number of magazines. The significance of this paper is that we developed a new type of 3D game that maximizes the fear effect of players through realistic production.
한정된 레이블 데이터를 이용한 효율적인 철도 표면 결함 감지 방법
국제인공지능학회(구 한국인터넷방송통신학회) 한국인터넷방송통신학회 논문지 제24권 제1호 2024.02 pp.83-88
※ 원문제공기관과의 협약기간이 종료되어 열람이 제한될 수 있습니다.
본 연구에서는 Railroad surface 데이터를 활용하여 Semi-Supervised learning방식으로 railroad surface의 defect를 검출해내는 방안을 제안한다. Resnet50에 ImageNet으로 pretrained된 모델을 이용한다. Label이 없는 데 이터에서 무작위로 데이터를 선정, 선정한 데이터에 label을 부여한 뒤 이 데이터로 모델을 학습시킨다. 학습된 모델을 이용하여 나머지 데이터의 결과값을 예측한 후, 그 예측값이 일정한 threshold보다 큰 것을 골라내고, threshold보다 큰 값들을 값이 큰 순서대로 정렬하여, 일정한 크기만큼 training data에 추가한다. 이 때, 각 class에 속할 확률이 높은 쪽으로 pseudo-labeling을 수행한다. 초기에 label이 부여된 데이터 개수에 따른 전체적인 class 분류 성능을 확인하는 실험 또한 진행하였고, 전체 training data대비 10% 미만의 labeled data로 최대 98%의 정확도를 얻는 성능을 보였다.
In this research, we propose a Semi-Supervised learning based railroad surface defect detection method. The Resnet50 model, pretrained on ImageNet, was employed for the training. Data without labels are randomly selected, and then labeled to train the ResNet50 model. The trained model is used to predict the results of the remaining unlabeled training data. The predicted values exceeding a certain threshold are selected, sorted in descending order, and added to the training data. Pseudo-labeling is performed based on the class with the highest probability during this process. An experiment was conducted to assess the overall class classification performance based on the initial number of labeled data. The results showed an accuracy of 98% at best with less than 10% labeled training data compared to the overall training data.
문서 데이터 정보화를 위한 지능형 문서처리 플랫폼에 관한 연구
국제인공지능학회(구 한국인터넷방송통신학회) 한국인터넷방송통신학회 논문지 제24권 제1호 2024.02 pp.89-95
※ 원문제공기관과의 협약기간이 종료되어 열람이 제한될 수 있습니다.
요즘 기업의 경쟁력은 조직이 축적한 조직의 지식들을 모든 조직원들이 잘 공유하고 활용하는 능력에 달려있다. 이것을 증명이라도 하듯이 지금 세상은 LLM(거대언어모델)의 기반의 생성형 AI 기술을 이용한 쳇GPT서비스에 대해 집중하고 있다. 하지만, 쳇GPT 서비스를 업무에 적용하기에는 아직 환각성 문제가 많아 어려운 상태이다. 이 문제를 해결하기 위해 sLLM(경량거대언어모델) 기술이 대안으로 제시되고 있다. sLLM을 구성하기 위해서는 기업데이터가 필수 적으로 필요하다. 기업데이터는 조직의 ERP Data와 조직이 보존하고 있는 기업의 오피스 문서 지식 데이터이다. ERP Data는 sLLM과 직접 연결하여 활용할 수 있으나 오피스 문서는 파일 형태로 저장되어 있어서 데이터 형태로 변환하여 야 sLLM과 연결하여 활용할 수 있다. 뿐만 아니라 파일 형태로 저장되어져 있는 오피스 문서들을 조직을 지식 정보로 활용하기에는 기술적 제약 사항이 너무 많다. 본 연구는 오피스 문서를 파일 형태가 아닌 DB 형태로 저장하는 방법을 제시함으로서 기업이 기 축적 된 오피스 문서를 조직의 지식 시스템으로 잘 활용할 수 있게 하고, 기업의 sLLM에 오피스 문서를 데이터 형태로 제공하여 AI 기술과 접목하여 기업 경쟁력을 향상 시키는데 기여하고자 한다.
Nowadays, the competitiveness of a company depends on the ability of all organizational members to share and utilize the organizational knowledge accumulated by the organization. As if to prove this, the world is now focusing on ChetGPT service using generative AI technology based on LLM (Large Language Model). However, it is still difficult to apply the ChetGPT service to work because there are many hallucinogenic problems. To solve this problem, sLLM (Lightweight Large Language Model) technology is being proposed as an alternative. In order to construct sLLM, corporate data is essential. Corporate data is the organization's ERP data and the company's office document knowledge data preserved by the organization. ERP Data can be used by directly connecting to sLLM, but office documents are stored in file format and must be converted to data format to be used by connecting to sLLM. In addition, there are too many technical limitations to utilize office documents stored in file format as organizational knowledge information. This study proposes a method of storing office documents in DB format rather than file format, allowing companies to utilize already accumulated office documents as an organizational knowledge system, and providing office documents in data form to the company's SLLM. We aim to contribute to improving corporate competitiveness by combining AI technology.
RFSoC의 양성자 시험 로직 개발 및 SEU 측정 평가
국제인공지능학회(구 한국인터넷방송통신학회) 한국인터넷방송통신학회 논문지 제24권 제1호 2024.02 pp.97-101
※ 원문제공기관과의 협약기간이 종료되어 열람이 제한될 수 있습니다.
본 논문에서는 Xilinx 사의 RFSoC FPGA에 대해 양성자 빔 조사 시험 로직 구현과 시험 결과를 제시한다. RFSoC는 FPGA 기능 외에도 CPU, ADC, DAC가 집적화되어 있는 칩으로 소형경량화를 목적으로 둔 방위산업 및 우주 산업에서 주목받고 있는 칩이다. 이러한 칩을 우주 환경에서 사용하려면 방사선 영향에 대한 분석이 필요하며 방사선 경감 대책이 필요하게 되었다. 양성자 조사 시험을 통해 RFSoC의 방사선 영향을 측정할 수 있는 로직을 설계하였다. Memory에 저장된 값을 정상 값과 비교하는 로직을 구현하고 RFSoC에 양성자를 조사하여 Block memory 영역에서 발생하는 SEU를 측정하였다. 다른 영역에서의 SEU 발생을 완화하기 위해 TMR, SEM을 적용하여 설계하였다. 시험 결과를 통해 본 시험 구성에 대해 검증하고 향후 위성용 로직 설계를 검증할 수 있는 환경을 구축하고자 한다.
In this paper, we present the implementation of proton beam irradiation test logic and test results for Xilinx's RFSoC FPGA. In addition to the FPGA function, RFSoC is a chip that integrates CPU, ADC, and DAC and is attracting attention in the defense and space industries aimed at reducing the size of the chip. In order to use these chips in a space environment, an analysis of radiation effects was required and radiation mitigation measures were required. Through the proton irradiation test, the logic to measure the radiation effect of RFSoC was designed. Logic for comparing values stored in memory with normal values was implemented, and protons were irradiated to RFSoC to measure SEU generated in the block memory area. To alleviate the occurrence of SEU in other areas, TMR and SEM were applied and designed. Through the test results, we intend to verify this test configuration and establish an environment in which logic design for satellites can be verified in the future.
직사각형 슬롯을 갖는 C-ITS용 패치 안테나에 대한 연구
국제인공지능학회(구 한국인터넷방송통신학회) 한국인터넷방송통신학회 논문지 제24권 제1호 2024.02 pp.103-107
※ 원문제공기관과의 협약기간이 종료되어 열람이 제한될 수 있습니다.
본 논문은 직사각형 슬롯과 스트립 도체를 이용한 삼각 패치 안테나에 대한 연구이다. 직사각형 슬롯을 갖는 삼각 패치 안테나 특성을 확인하기 위해 슬롯 길이와 간격을 조정하였고, 복사 패치의 형태를 삼각형, 직사각형, 육각형 으로 변화시켜 임피던스 매칭을 하였다. 안테나 파라미터 특성으로 확인하기 위해 HFSS 시뮬레이터를 이용하였다. 제안 한 안테나 크기는 26 mm × 26 mm이다. 제안한 안테나에서 시뮬레이션을 통해 얻게 된 VSWR 2이하인 주파수 대역 은 5.27 ~ 6.24 GHz이며, 주파수 대역폭은 970 MHz이다. 실제로 제작한 안테나의 주파수 대역은 5.24 ∼ 6.38 GHz 이고, 주파수 대역폭은 1140 MHz이다. 복사패턴을 확인한 주파수는 5.855 GHz, 5.890 GHz, 5.925 GHz이다. 최대 이득은 5.01 dBi이다. 모든 복사패턴에서 지향성 특징을 갖는 것을 확인할 수 있었다.
This paper is a study on a triangle patch antenna using a rectangle slot and strip conductor. The length and spacing of the slot were adjusted to confirm the characteristics of the triangle patch antenna with rectangle slot, and the area and shape of the radiation patch were changed to triangle, rectangle, and hexagon for impedance matching. The HFSS simulator was used to check the antenna parameter characteristics, and the antenna size was 26 mm ×26 mm. In this proposed antenna, the simulation frequency range with VSWR of 2 or less was 5.27 to 6.24 GHz. The bandwidth was 970 MHz. The frequency range of the fabricated antenna was 5.24 to 6.38 GHz, and the bandwidth 1140 MHz. The maximum radiation gain is 5.01 dBi. It was confirmed that all radiation patterns had directional characteristics.
결합된 플라즈몬-도파관 공진 구조로 구성된 바이오센서의 구현
국제인공지능학회(구 한국인터넷방송통신학회) 한국인터넷방송통신학회 논문지 제24권 제1호 2024.02 pp.109-114
※ 원문제공기관과의 협약기간이 종료되어 열람이 제한될 수 있습니다.
결합된 플라즈몬-도파관 공진 (PWR) 구조에서 전파하는 TE, TM 전송 모드들의 바이오 센싱 특성을 조사하였 다. 수치해석을 위하여 모드 전송선로 이론 (MTLT)을 사용되었다. 기존의 Ag-기반 표면 플라즈몬 공명 바이오센서의 감도를 향상시키기 위하여, 제안된 PWR 바이오센서는 N쌍의 MgF2-Si3N4 층으로 구성된 다층구조로 설계하였다. 그 바이오센서의 각도 감도가 광범위한 생물학적 용액 (굴절률 1.33~1.37)에 대하여 수치적으로 분석되었다. 더욱이, 암세 포와 혈장 농도를 감지하는 센서의 가용성을 조사하였다. 결국, 그 결과들은 제안된 바이오센서가 소변에서 다양한 종류 의 암 세포와 다양한 포도당 농도를 효율적으로 감지할 수 있음을 보여주었다.
The bio-sensing properties of TE and TM guided modes in the coupled plasmon-waveguide resonance (PWR) configuration are investigated. The modal transmission-line theory (MTLT) is used for numerical analysis. The proposed PWR bio-sensor is composed of multi-layered configuration with N pairs of MgF2-Si3N4 layers to enhance the sensitivity of a conventional Ag-based surface plasmon resonance bio-sensor. The angular sensitivity of bio-sensor is numerically analyzed for a wide range of biological solutions (refractive index 1.33~1.37). Furthermore, the availability of sensor to detect cancer cells and blood plasma concentration is evaluated. Finally, the results indicate that the proposed bio-sensor is capable efficiently to detect various kinds of cancer cells and different glucose concentrations in urine.
인공지능과 위험관리에 대한 사례 연구 - RAI Toolkit을 중심으로
국제인공지능학회(구 한국인터넷방송통신학회) 한국인터넷방송통신학회 논문지 제24권 제1호 2024.02 pp.115-123
※ 원문제공기관과의 협약기간이 종료되어 열람이 제한될 수 있습니다.
본 연구의 목적은 인공지능과 위험관리라는 2가지 키워드를 통해 어떻게 인공지능 서비스의 장점 활용과 한계요 인을 동시에 극복하는데 기여 하고자 한다. 이를 위해 2가지 사례인 (1) 인공지능을 활용한 위험 모니터링 프로세스 제시 와 (2) 인공지능 서비스의 개발 및 운영에서 등장하는 한계요인을 최소화하기 위한 운영 툴킷에 대해 소개 하였다. 이 사례 분석을 통해 다음과 같은 시사점이 제안하고자 한다. 첫째, 인공지능 서비스는 우리 삶에 깊숙이 관여하고 있으며 이로 인해 등장하는 한계 요인을 최소화하는 장치가 필요하다. 둘째, 인공지능을 활용한 위험관리 모니터링은 적합하고 신뢰성이 있는 데이터 확보가 우선적으로 고려되어야 한다. 셋째, 인공지능 서비스의 개발과 운영시 등장하는 한계를 극복하기 위해서는 업무 단계별로 위험관리 프로세스를 적용하여 상시 모니터링이 요구된다 라는 것이다. 본 연구는 발 전하고 있는 인공지능이 제공하고 한계요인을 최소화 할 수 있는 방안에 대한 연구이며 향후 관련 시장의 성장과 발달에 서 위험관리에 대한 연구에 기여 할 수 있다.
The purpose of this study is to contribute to how the advantages of artificial intelligence (AI) services and the associated limitations can be simultaneously overcome, using the keywords AI and risk management. To achieve this, two cases were introduced: (1) presenting a risk monitoring process utilizing AI and (2) introducing an operational toolkit to minimize the emerging limitations in the development and operation of AI services. Through case analysis, the following implications are proposed. First, as AI services deeply influence our lives, the process are needed to minimize the emerging limitations. Second, for effective risk management monitoring using AI, priority should be given to obtaining suitable and reliable data. Third, to overcome the limitations arising in the development and operation of AI services, the application of a risk management process at each stage of the workflow, requiring continuous monitoring, is essential. This study is a research effort on approaches to minimize limitations provided by advancing artificial intelligence (AI). It can contribute to research on risk management in the future growth and development of the related market, examining ways to mitigate limitations posed by evolving AI technologies.
국제인공지능학회(구 한국인터넷방송통신학회) 한국인터넷방송통신학회 논문지 제24권 제1호 2024.02 pp.125-132
※ 원문제공기관과의 협약기간이 종료되어 열람이 제한될 수 있습니다.
본 연구의 목적은 지역 특성에 맞는 드론 활용 모델 발굴 및 드론 활성화를 위한 수요조사 기반으로 드론 실증도 시 구축 방향 제시 및 드론 활용 지원체계에 대한 활용방안을 제안하고자 하였다. 첫째, 설문자의 결과에 따르면, 드론 실증사업에 대한 이해도와 도입 필요성도 높고 특히 도시문제 해결에 많은 영향력을 주는 것으로 평가되었다. 둘쨰, 우선 순위와 장단기적 접근 분석 결과를 보면, 우선순위는 재난 관련 업무이고 중장기적 전략을 통한 접근이 필요한 것으로 평가되었다. 셋째, 사업 진행시 예산이 가장 중요한 이슈로 등장 햇다는 것이다. 실무자와 전문가들은 드론 기반 기술들 이 예산과 기술이 준비 되었을때는 업무에 적극적으로 도입할 수 있다는 의사를 보유하고 있었다. 현재 적용이 제대로 이루어지지 않는 부분에 대해서는 예산 부족 문제가 가장 크게 지적되었으며, 이 부분이 해결되는 것이 필요하다고도 조사되었다. 넷째, 일부 영역에서 사업 발굴시 수요조사의 필요성이 조사되었다. 실증을 위한 수요조사는 반드시 필요하 며, 공공에서 주도할 필요성이 조사되었다. 드론 기반 실증도시 구축에 있어서 대부분의 응답자가 수요조사가 필요하다 고 답하였으며, 공공에서 주도하는 것도 필요하다고 조사되었다. 다섯째, 분야별 접근 방식에 대해서는 안전 재해관리 영역이 가장 적용이 필요한 부분으로 제시되었다.
The purpose of this study is to discover a drone utilization model tailored to local characteristics, propose directions for building a drone demonstration city based on demand surveys for drone activation, and suggest ways to utilize and support a drone application system. First, according to the survey results, there was a high understanding of and necessity for drone demonstration projects, particularly in addressing urban issues, which were deemed to have a significant impact. Second, based on the analysis of priorities and short- and long-term approaches, disaster-related tasks were evaluated as a priority, requiring an approach through medium- to long-term strategies. Third, it was noted that budgetary considerations emerged as the most critical issue during project implementation. Practitioners and experts expressed willingness to actively introduce drone-based technologies into their work when budget and technology were ready. Budgetary constraints were identified as the most significant obstacle to proper implementation, emphasizing the need for resolution. Fourth, the necessity of demand surveys during project development was identified in certain areas. Demand surveys were deemed essential for drone-based demonstration city construction, and a survey indicated that public leadership in this regard was also necessary. Fifth, concerning approaches in specific areas, the field of safety and disaster management was highlighted as the most crucial for application.
지자체에서 활용할 수 있는 생성형 AI를 이용한 1:1 맞춤형 노인 스마트폰 교육 서비스 설계
국제인공지능학회(구 한국인터넷방송통신학회) 한국인터넷방송통신학회 논문지 제24권 제1호 2024.02 pp.133-139
※ 원문제공기관과의 협약기간이 종료되어 열람이 제한될 수 있습니다.
초고령사회로 인한 정보격차를 줄이기 위해 지자체에서 고령자를 대상으로 스마트폰 사용법 교육을 진행하고 있다. 하지만 1 대 다수 교육의 한계, 고령자의 학습 효과 미비 등의 문제점이 있어 스마트폰 교육에 어려움을 겪고 있다. 본 연구는 이러한 문제점을 바탕으로 고령자 대상으로 반복적으로 학습할 수 있는 교육환경 등을 고려하여 오프라 인 교육 현장에서 직접 사용할 수 있는 교육용 서비스를 제안하였다. 해당 연구의 앱은 생성형 AI를 이용하여 사용자가 실제 사용에서 어려워하는 부분을 파악해 사용자별로 다른 문제를 제공해 개인 맞춤형 실습이 이루어질 수 있도록 설계 하였다. 기존의 지자체 교육과 연계해 사용한다면 1:1 교육, 시간, 그리고 내용 면에서 효율적인 스마트폰 교육이 이루어 질 것으로 기대된다.
In response to the challenges posed by a super-aged society, local authorities are conducting educational programs on smartphone usage tailored for the elderly. However, obstacles such as the limitations of one-to-many education and suboptimal learning outcomes for the elderly have hindered the efficacy of smartphone education. This study suggests an educational service intended for direct application in offline settings, considering the identified problems. Through the utilization of generative AI, the proposed app identifies specific challenges encountered by users during actual smartphone use, offering personalized exercises to facilitate customized and repetitive learning experiences for individual users. When integrated with existing local government education initiatives, this app is anticipated to enhance the efficiency of smartphone education by providing personalized, one-on-one training that is efficient in terms of time and content.
얼굴 영역 추출 시 여유값의 설정에 따른 개성 인식 모델 정확도 성능 분석
국제인공지능학회(구 한국인터넷방송통신학회) 한국인터넷방송통신학회 논문지 제24권 제1호 2024.02 pp.141-147
※ 원문제공기관과의 협약기간이 종료되어 열람이 제한될 수 있습니다.
최근 개인의 성향을 반영한 맞춤형 서비스가 각광 받고 있다. 이와 관련하여 개인의 개성을 인식하고 활용하고자 하는 연구가 지속적으로 이루어지고 있다. 각 개인의 개성을 인식하고 평가하는 방법은 다수가 있지만, OCEAN 모델이 대표적으로 사용된다. OCEAN 모델로 각 개인의 개성을 인식할 때 언어적, 준언어적, 비언어적 정보를 이용하는 멀티 모달리티 기반 인공지능 모델이 사용될 수 있다. 본 논문에서는 비언어적 정보인 사용자의 표정을 기반으로 OCEAN을 인식하는 인공지능 모델에서 영상 데이터에서 얼굴 영역을 추출할 때 지정하는 얼굴 영역 여유값(Margin)에 따른 개성 인식 모델 정확도 성능을 분석한다. 실험에서는 2D Patch Partition, R2plus1D, 3D Patch Partition, 그리고 Video Swin Transformer에 기반한 개성 인식 모델을 사용하였다. 얼굴 영역 추출 시 여유값을 60으로 사용했을 때 1-MAE 성능이 0.9118로 가장 우수하였다. 따라서 개성 인식 모델의 성능을 최적화하기 위해서는 적절한 여유값을 설정해야 함을 확인하였다.
Recently, there has been growing interest in personalized services tailored to an individual's preferences. This has led to ongoing research aimed at recognizing and leveraging an individual's personality traits. Among various methods for personality assessment, the OCEAN model stands out as a prominent approach. In utilizing OCEAN for personality recognition, a multi modal artificial intelligence model that incorporates linguistic, paralinguistic, and non-linguistic information is often employed. This paper examines the impact of the margin value set for extracting facial areas from video data on the accuracy of a personality recognition model that uses facial expressions to determine OCEAN traits. The study employed personality recognition models based on 2D Patch Partition, R2plus1D, 3D Patch Partition, and Video Swin Transformer technologies. It was observed that setting the facial area extraction margin to 60 resulted in the highest 1-MAE performance, scoring at 0.9118. These findings indicate the importance of selecting an optimal margin value to maximize the efficiency of personality recognition models.
국제인공지능학회(구 한국인터넷방송통신학회) 한국인터넷방송통신학회 논문지 제24권 제1호 2024.02 pp.149-154
※ 원문제공기관과의 협약기간이 종료되어 열람이 제한될 수 있습니다.
본 논문은 단일 링크드 리스트의 사이클을 검출하는데 특화된 Floyd의 거북이와 토끼 경주법이 다중 입력, 다중 출력을 갖는 무 방향 그래프, 방향 그래프, 트리 등에 대해서는 사이클 검출 실패의 단점을 보완한 알고리즘을 제안하였 다. 제안된 알고리즘은 단순히 단일 간선을 갖는 원천(source)과 싱크(sink)를 가지치기하는 단일 간선 노드 전정 사이 클 검출 방법을 적용하였다. 제안된 알고리즘을 다양한 리스트, 무 방향 그래프, 방향 그래프, 트리 등에 적용한 결과 모든 경우에 대해 사이클을 검출하는데 성공하였다. 따라서 제안된 알고리즘은 사이클 검출 분야에서 가장 단순하고 빠 른 장점을 갖고 있다.
This paper proposes an algorithm that remedy Floyd’s the tortoise and the hare algorithm (THA) shortcomings which is specialized in singly linked list (SLL), so this algorithm fails to detect the cycle in undirected graph, digraph, and tree with multiple inputs or outputs. The proposed algorithm simply pruning the source and sink with only one edge using cycle detection of single edge node pruning. As a result of the experimental of various list, undirected graph, digraph, and tree, the proposed algorithm can be successively detect the cycle all of them. Thus, the proposed algorithm has the simplest and fastest advantage in the field of cycle detection.
국제인공지능학회(구 한국인터넷방송통신학회) 한국인터넷방송통신학회 논문지 제24권 제1호 2024.02 pp.155-161
※ 원문제공기관과의 협약기간이 종료되어 열람이 제한될 수 있습니다.
본 논문에서는 기존의 CNN 기반 얼굴 감정 분석 모델에 랜드마크 정보를 특징 벡터로 추가하여 새로운 모델을 제안한다. CNN 기반 모델을 이용한 얼굴 감정 분류 연구는 다양한 방법으로 연구되고 있으나 인식률이 매우 저조한 편이다. 본 논문에서는 CNN 기반 모델의 성능을 향상시키기 위하여 CNN 모델에 ASM으로 구한 랜드마크 기반 완전 연결 네트워크를 결합함으로써 얼굴 표정 분류 정확도를 향상시키는 알고리즘을 제안한다. CNN 모델에 랜드마크를 포 함시킴으로써 인식률이 VGG 0.9%, Inception 0.7% 개선되었으며, 랜드마크에 FACS 기반 액션 유닛 추가를 통하여 보다 VGG 0.5%, Inception 0.1%만큼 향상된 결과를 얻을 수 있음을 실험으로 확인하였다.
In this paper, we propose a new model by adding landmark information as a feature vector to the existing CNN-based facial emotion classification model. Facial emotion classification research using CNN-based models is being studied in various ways, but the recognition rate is very low. In order to improve the CNN-based models, we propose algorithms that improves facial expression classification accuracy by combining the CNN model with a landmark-based fully connected network obtained by ASM. By including landmarks in the CNN model, the recognition rate was improved by several percent, and experiments confirmed that further improved results could be obtained by adding FACS-based action units to the landmarks.
IoT 기반 도시철도 재난 예지 및 경보 시스템 아키텍처 설계
국제인공지능학회(구 한국인터넷방송통신학회) 한국인터넷방송통신학회 논문지 제24권 제1호 2024.02 pp.163-174
※ 원문제공기관과의 협약기간이 종료되어 열람이 제한될 수 있습니다.
현재 도시철도 운용기관은 터널 내에서의 비상 상황에 신속히 대처하기 위해 운용 중인 비상전화를 다양한 부가 서비스 지원이 가능한 IP 기반의 “선로변 통합 인터페이스 통신설비”로 개량중에 있다. 본 연구는 이를 기반으로 터널 내 이상상황 감지를 위한 IoT 센서네트워크 환경을 구축하고 수집된 정보를 관제센터로 전달하여 재난 상황을 사전에 예지하는 시스템 아키텍처 설계에 관한 다양한 이해관계자의 요구를 분석하고, 시스템의 요구사항을 정의하며, 서비스 모델의 제시를 통해 재난대응 시나리오 모델을 제공하였다. 이를 통해 도시철도 재난에 대한 대응 관점을 사후 대처에서 사전 예방으로 전환하여 도시철도 안전운행 확보 및 중대 산업재해 예방을 도모한다.
Currently, the urban railway operating agency is improving the emergency telephone in operation into an IP-based “trackside integrated interface communication facility” that can support a variety of additional services in order to quickly respond to emergency situations within the tunnel. This study is based on this Analyze the needs of various stakeholders regarding the design of a system architecture that establishes an IoT sensor network environment to detect abnormal situations in the tunnel and transmits the collected information to the control center to predict disaster situations in advance, and defines the system requirements. In addition, a scenario model for disaster response was provided through the presentation of a service model. Through this, the perspective of responding to urban railway disasters changes from reactive response to proactive prevention, thereby ensuring safe operation of urban railways and preventing major industrial accidents.
딥러닝 기반의 주의환기 보상전략 시스템이 발달장애인의 데이터 라벨링 작업 생산성에 미치는 효과분석
국제인공지능학회(구 한국인터넷방송통신학회) 한국인터넷방송통신학회 논문지 제24권 제1호 2024.02 pp.175-180
※ 원문제공기관과의 협약기간이 종료되어 열람이 제한될 수 있습니다.
본 논문에서는 딥러닝 기반의 주의환기 보상전략 시스템이 발달장애인의 데이터 라벨링 작업 생산성에 미치는 효과를 분석하였다. 연구 결과, 중재가 적용된 후 연구대상자 모두 자율작업 대비 작업 생산성에서 유의미한 향상이 관찰 되었다. 특히 인공지능 기반의 중재가 적용되었을 때, 직무지도원 중재에 비해 상당한 향상을 보였다. 이러한 결과는 인공지능 기술이 발달장애인의 데이터 라벨링 작업 생산성 향상에 긍정적인 영향을 미칠 수 있음을 의미한다. 본 연구는 발달장애인의 데이터 라벨링 작업에 인공지능 기술을 접목한 최초의 연구이며, 발달장애인의 직업훈련과 작업 생산성 증진을 위한 딥러닝 기술의 적용 가능성을 탐색하는 데 중요한 시사점을 제공하리라 본다.
This paper investigates the effect of a deep learning-based system on data labeling task productivity by individuals with developmental disabilities. It was found that interventions, particularly those using AI, significantly improved productivity compared to self-serving task. AI interventions were notably more effective than job coach-led approaches. This research underscores the positive role of AI in enhancing task efficiency for those with developmental disabilities. This study is the first to apply AI technology to the data labeling tasks of individuals with developmental disabilities and highlighting deep learning's potential in vocational training and productivity enhancement for this group.
회전된 객체 분류를 위한 CNN 기법들의 성능 비교 분석
국제인공지능학회(구 한국인터넷방송통신학회) 한국인터넷방송통신학회 논문지 제24권 제1호 2024.02 pp.181-187
※ 원문제공기관과의 협약기간이 종료되어 열람이 제한될 수 있습니다.
이미지 공간에서 무작위로 회전된 객체에 대한 분류 성능이 우수한 기법으로는 군 등변 CNN과 steerable 필터 를 이용한 CNN 등이 있다. 본 논문에서는 이들의 수학적 구조를 설명하고 구현 방법을 소개한다. 기존의 CNN을 포함 한 세 개의 모델에 대하여 동일한 필터 수를 갖도록 구현한 다음, 무작위로 회전된 를 이용하여 실험하고 이들 의 성능을 비교분석한다. 실험 결과에 의하면 steerable CNN은 CNN보다 6.5% 이상의 인식률 향상을 보여준다. 특히, steerable CNN은 학습할 파라미터의 수가 상대적으로 적어서 훈련 데이터셋의 크기를 줄여도 성능 열화가 비교적 크지 않음을 실험 결과로 확인한다.
There are two kinds of well-known CNN methods, the group equivariant CNN and the CNN using steerable filters, which have excellent classification performances for randomly rotated objects in image space. This paper describes their mathematical structures and introduces implementation methods. We implement them, including the existing CNN, which have the same number of filters, then compare and analyze their performances by simulating them with the randomly rotated . According to the experimental results, the steerable CNN, which shows a classification improvement over the others, has a relatively small number of parameters to learn, so performance degradation is relatively small even when the size of the training dataset is reduced.
다초점 촬영과 초점후처리 기능을 가진 스마트폰 카메라 앱
국제인공지능학회(구 한국인터넷방송통신학회) 한국인터넷방송통신학회 논문지 제24권 제1호 2024.02 pp.189-196
※ 원문제공기관과의 협약기간이 종료되어 열람이 제한될 수 있습니다.
이미지 처리 기법을 통해 이미 촬영된 사진의 초점을 다른 곳으로 이동시키는 것은 현재까지 거의 불가능하다. 본 논문은 촬영된 사진 이미지를 사후에 다른 곳으로 초점을 이동시킬 수 있는 기술에 도전하였다. 본 논문은 이 목적을 달성하기 위해 카메라가 사진을 촬영할 당시부터 여러 초점을 가진 사진을 촬영하여 한 장의 JPEG 파일 속에 저장해두 었다가, 사용자가 원하는 위치에 초점을 맞춘 사진을 끌어내는 방식을 제안하고 구현하였다. 본 논문은 가까운 곳부터 먼 곳까지 렌즈의 초점 거리를 빠르게 이동시키면서 여러 사진을 촬영하는 기법과 카메라의 뷰파인더에 보이는 객체들을 인식하여 객체별로 초점이 맞추어진 여러 사진을 촬영하는 2가지 기법을 구현하였다. 촬영된 여러 사진들은 한 장의 JPEG에 저장하여 기존의 사진 뷰어들과 호환성을 유지하도록 하였다. 이 때 이 JPEG 파일은 여러 이미지를 저장할 수 있도록 이전의 연구에서 제안한 All-in-JPEG 형식을 활용하였다. 본 논문은 이 기술들을 OnePIC 이름의 안드로이 드 앱으로 구현하여 실용성을 검증하였다.
Currently, it is almost impossible to move the focus of a previously taken photo to a different location. This paper challenges a technology that can move the focus of a captured photo to another location after shooting. To achieve this goal, this paper proposed and implemented a method for taking photos with various focuses at the moment the camera took pictures and storing them in a single JPEG file to extract photos focused on the user’s preferred location. In this paper, two methods are implemented: taking various photos by quickly moving the focal length of the lens from close to far away, and taking various photos focused on each object by recognizing objects in the camera viewfinder. Various photos taken are stored in a single JPEG to maintain compatibility with traditional photo viewers. At this time, this JPEG file used the All-in-JPEG format proposed in previous research to store a variety of images. This paper verified its practicality by implementing these technologies in an Android app named OnePIC.
보행자 및 차량 검지를 위한 레이더 영상 융복합 시스템 연구
국제인공지능학회(구 한국인터넷방송통신학회) 한국인터넷방송통신학회 논문지 제24권 제1호 2024.02 pp.197-205
※ 원문제공기관과의 협약기간이 종료되어 열람이 제한될 수 있습니다.
자율주행 자동차 개발 및 상용화에 있어서 주행안전도 확보가 가장 중요한 시점에서 이를 위해 전방 및 주행차량 주변에 존재하는 다양한 정적/동적 차량의 인식과 검출 성능을 고도화 및 최적화하기 위한 AI, 빅데이터 기반 알고리즘 개발 등이 연구되고 있다. 하지만 레이더와 카메라의 고유한 장점을 활용하여 동일한 차량으로 인식하기 위한 연구 사례 들이 많이 있지만, 딥러닝 영상 처리 기술을 이용하지 않거나, 레이더의 성능상의 문제로 짧은 거리만 동일한 표적으로 감지하고 있다. 따라서 레이더 장비와 카메라 장비에서 수집할 수 있는 데이터셋을 구성하고, 데이터셋의 오차를 계산하 여 동일한 표적으로 인식하는 융합 기반 차량 인식 방법이 필요하다. 본 논문에서는 레이더와 CCTV(영상) 설치 위치에 따라 동일한 객체로 판단하기에 데이터 오차가 발생하기 때문에 설치한 위치에 따라 위치 정보를 연동할 수 있는 기술 개발을 목표로 한다.
Development of AI and big data-based algorithms to advance and optimize the recognition and detection performance of various static/dynamic vehicles in front and around the vehicle at a time when securing driving safety is the most important point in the development and commercialization of autonomous vehicles. etc. are being studied. However, there are many research cases for recognizing the same vehicle by using the unique advantages of radar and camera, but deep learning image processing technology is not used, or only a short distance is detected as the same target due to radar performance problems. Therefore, there is a need for a convergence-based vehicle recognition method that configures a dataset that can be collected from radar equipment and camera equipment, calculates the error of the dataset, and recognizes it as the same target. In this paper, we aim to develop a technology that can link location information according to the installation location because data errors occur because it is judged as the same object depending on the installation location of the radar and CCTV (video).
수소 연료전지 엔지니어 양성을 위한 메타버스 교육훈련 플랫폼에 관한 연구
국제인공지능학회(구 한국인터넷방송통신학회) 한국인터넷방송통신학회 논문지 제24권 제1호 2024.02 pp.207-212
※ 원문제공기관과의 협약기간이 종료되어 열람이 제한될 수 있습니다.
수소연료전지의 중요성은 계속 강조되며, 이 분야에서의 교육 및 훈련 수요가 증가하고 있다. 다양한 교육 환경 중에서 메타버스 교육은 특히 원격 학습에 대응하기 위해 글로벌 교육산업에서 새로운 변화의 시대를 열고 있다. 메타버 스가 교육에 가져온 가장 중요한 변화는 단방향, 강사 중심 및 정적인 가르침 접근에서 다방향 및 동적인 접근으로의 전환이다. 메타버스는 수소 연료전지 엔지니어 교육에서도 효과적으로 활용될 것으로 예상되며, 교육과 훈련이 언제 어 디서나 가능하게 함으로써 교육의 효과를 향상시킬 뿐만 아니라 엔지니어링 교육에 관련된 비용을 줄일 수 있을 것으로 기대된다. 본 연구에서는 이러한 아이디어에 영감을 받아 연료 전지 교육 플랫폼을 설계하고 있다. 메타버스를 활용하여 이론 학습 및 훈련을 결합한 플랫폼을 만들었다. 본 연구에서는 학습 참여자의 참여도를 높이기 위한 교육 훈련 콘텐츠 개발, 사용성 향상을 위한 사용자 인터페이스 구성, 가상 세계에서 물체와 상호 작용하는 환경 생성, 디지털 트윈 형태의 수렴 서비스 지원 등의 주요 요소를 개발했다.
The importance of hydrogen fuel cells continues to be emphasized, and there is a growing demand for education and training in this field. Among various educational environments, metaverse education is opening a new era of change in the global education industry, especially to adapt to remote learning. The most significant change that the metaverse has brought to education is the shift from one-way, instructor-centered, and static teaching approaches to multi-directional and dynamic ones. It is expected that the metaverse can be effectively utilized in hydrogen fuel cell engineer education, not only enhancing the effectiveness of education by enabling learning and training anytime, anywhere but also reducing costs associated with engineering education.In this research, inspired by these ideas, we are designing a fuel cell education platform. We have created a platform that combines theoretical and practical training using the metaverse. Key aspects of this research include the development of educational training content to increase learner engagement, the configuration of user interfaces for improved usability, the creation of environments for interacting with objects in the virtual world, and support for convergence services in the form of digital twins.
0개의 논문이 장바구니에 담겼습니다.
선택하신 파일을 압축중입니다.
잠시만 기다려 주십시오.