Earticle

현재 위치 Home

Issues

한국인터넷방송통신학회 논문지 [The Journal of the Institute of Internet, Broadcasting and Communication]

간행물 정보
  • 자료유형
    학술지
  • 발행기관
    국제인공지능학회(구 한국인터넷방송통신학회) [The International Association for Artificial Intelligence]
  • pISSN
    2289-0238
  • eISSN
    2289-0246
  • 간기
    격월간
  • 수록기간
    2001 ~ 2025
  • 주제분류
    공학 > 전자/정보통신공학
  • 십진분류
    KDC 326 DDC 380
제22권 제5호 (27건)
No

인터넷

1

본 논문은 최대 매칭 문제(MCM)를 다루었다. MCM은 일반적으로 증대경로 기법으로 구한다. 일반 그래프에 대한 MCM을 구하는 증대경로 알고리즘으로는 O( ) 복잡도, 이분 그래프에 대해서는 O(m log n) 복잡도를 갖고 있다. 반면에, 본 논문에서는 주어진 그래프가 일반 그래프나 이분그래프의 그래프 종류에 상관없이 항상 O(n) 복잡도 로 MCM을 구하는 알고리즘을 제안하였다. 제안된 알고리즘은 “최대 매칭을 구하기 위해서는 가능한 많은 정점 쌍의 간선을 선택해야만 한다.”는 기본 원리에 근거하여 최소차수 정점 u와 NG(u)들 중 최소차수 정점 ν간 간선 {u, v}를 v(G) = k 회 단순히 선택하는 간단한 방법이다. 제안된 알고리즘을 일반그래프와 이분그래프의 다양한 실험 데이터들에 적용한 결과 v(G) 를 정확하게 구할 수 있음을 보였다.

This paper deals with the maximum cardinality matching(MCM) problem. The augmenting path technique is well known in MCM. MCM is obtained by O( ) time complexity augmenting path algorithm for the general graph, and O(m log n)  algorithm for the bipartite graph. On the other hand, this paper suggests O(n) linear time algorithm. The proposed algorithm based on the basic principle of as possible as largest selected inter-vertex edges in order to obtain the MCM. This paper simply selects edge {u, v} that the minimum degree vertex u and minimum degree vertex v in NG(u) v(G) = k times iteration. For various general and bipartite graphs experimental data, this algorithm can be get the v(G) exactly.

통신

2

지하 공동구 화재재난 감지를 위한 음향수집 프로토타입 장치 및 시스템 모듈 개발

이병진, 박철우, 이미숙, 정우석

국제인공지능학회(구 한국인터넷방송통신학회) 한국인터넷방송통신학회 논문지 제22권 제5호 2022.10 pp.7-15

※ 원문제공기관과의 협약기간이 종료되어 열람이 제한될 수 있습니다.

지하 공동구 화재 발생에 따른 직·간접적 피해는 사회 전반에 매우 큰 영향을 미치므로 이를 사전에 예방 및 관리하기 위한 노력이 필요하다. 화재의 발생 원인 중 케이블 자체에서 발생하는 경우는 단락, 누전, 과전류에 의한 발화 및 도체 접속부 과열, 절연체의 졀연 파괴에 의한 스파크 발생으로 인한 발화가 대부분이다. 지하 공동구의 특성에 의해 발생하는 이러한 원인을 조기에 찾아내기 위해서 지하 공동구는 영상분석을 활용한 감지 시스템을 통해 재난 및 안전사 고 방지를 위한 상시 관리를 하기 위한 노력을 하고 있으며, 이 중에서 CCTV 기반의 딥러닝 영상분석 기술을 적용한 화재 감지 시스템 개발사례가 보고되고 있다. 하지만 CCTV의 경우는 사각지대가 존재하기 때문에 이를 좀 더 보완하기 위해서 스파크 발생으로 불꽃이 발생하기 전 스파크 소리를 사전에 감지해 화재 예방을 할 수 있는 고성능의 음향 기반 딥러닝 모델을 개발하고자 한다. 본 연구에서 마이크 센서를 이용하여 지하 공동구 환경에서 음향을 수집을 할 수 있는 방안을 프로토타입 모듈 개발과 실험을 통해 제안하며, 결로가 많은 지하 공동구 환경에서 음향 센서를 배치하고 기능 이상 없이 실시간으로 정보 수집 여부에 대한 가능성을 검증한다.

Since the direct and indirect damage caused by the fire in the underground utility tunnel will cause great damage to society as a whole, it is necessary to make efforts to prevent and control it in advance. The most of the fires that occur in cables are caused by short circuits, earth leakage, ignition due to over-current, overheating of conductor connections, and ignition due to sparks caused by breakdown of insulators. In order to find the cause of fire at an early stage due to the characteristics of the underground utility tunnel and to prevent disasters and safety accidents, we are constantly managing it with a detection system using image analysis and making efforts. Among them, a case of developing a fire detection system using CCTV-based deep learning image analysis technology has been reported. However, CCTV needs to be supplemented because there are blind spots. Therefore, we would like to develop a high-performance acoustic-based deep learning model that can prevent fire by detecting the spark sound before spark occurs. In this study, we propose a method that can collect sound in underground utility tunnel environments using microphone sensor through development and experiment of prototype module. After arranging an acoustic sensor in the underground utility tunnel with a lot of condensation, it verifies whether data can be collected in real time without malfunction.

인터넷방통융합

3

본 논문에서는 지능형 엣지 컴퓨팅을 지원할 수 있는 경량 임베디드 기기를 설계하고, 영상 기기로부터 입력되는 이미지에서 객체를 실시간으로 빠르게 검출할 수 있음을 보인다. 제안하는 시스템은 산업 현장이나 군 지역과 같이 사전 에 설치된 인프라가 없는 환경에 적용되는 지능형 영상 관제 시스템이나 드론과 같은 자율이동체에 탑재된 영상 보안 시스템에 적용될 수 있다. 지능형 비전 인지 시스템이 확산 적용되기 위해 온디바이스 AI(On-Device Artificial intelligence) 기술 적용 필요성이 증대되고 있다. 영상 데이터 취득 장치에서 가까운 엣지 기기로의 컴퓨팅 오프 로딩은 클라우드를 중심으로 수행되는 인공지능 서비스 대비 적은 네트워크 및 시스템 자원으로도 빠른 서비스 제공이 가능하 다. 또한, 다양한 해킹 공격에 취약한 공격 표면의 감소와 민감한 데이터의 유출을 최소화 할 수 있어 다양한 산업에 안전하게 적용될 수 있을것으로 기대된다.

In this paper, we design a lightweight embedded device that can support intelligent edge computing, and show that the device quickly detects an object in an image input from a camera device in real time. The proposed system can be applied to environments without pre-installed infrastructure, such as an intelligent video control system for industrial sites or military areas, or video security systems mounted on autonomous vehicles such as drones. The On-Device AI(Artificial intelligence) technology is increasingly required for the widespread application of intelligent vision recognition systems. Computing offloading from an image data acquisition device to a nearby edge device enables fast service with less network and system resources than AI services performed in the cloud. In addition, it is expected to be safely applied to various industries as it can reduce the attack surface vulnerable to various hacking attacks and minimize the disclosure of sensitive data.

4

사용자 리뷰에서 표정 인식을 이용한 감정 표현 기법

최원관, 황만수, 김능회

국제인공지능학회(구 한국인터넷방송통신학회) 한국인터넷방송통신학회 논문지 제22권 제5호 2022.10 pp.23-28

※ 원문제공기관과의 협약기간이 종료되어 열람이 제한될 수 있습니다.

오늘날 디지털 플랫폼의 발달과 팬데믹 상황에 더불어 온라인 시장은 급속도로 성장하였다. 이로 인해 기존의 오프라인 시장과 다르게 온라인 시장에서의 특수성으로 인해 사용자들은 온라인 리뷰를 확인하게 되었고, 여러 연구들의 선례를 통해 리뷰가 사용자의 구매 의도를 정하는 데 중요한 역할을 하는 것을 확인할 수 있었다. 하지만 기존의 리뷰 작성 방식에서는 작성자의 감정이 글의 어투나 단어와 같은 요소들을 통해 표현됨으로써 다른 사용자가 작성자의 감정을 쉽게 파악하기 어려웠으며 작성자가 감정을 표현하기 위해 강조하고 싶은 부분이 있다면 작성자가 일일이 강조하고 싶은 부분의 굵기를 굵게 하거나 감정에 따라 색상을 바꾸는 등 여러 번거로운 작업의 수고가 필요하였다. 따라서, 본 논문에 서는 기존의 이러한 점을 보완하기 위해 카메라를 이용하여 표정 인식을 통해 사용자의 감정을 확인하고 기존의 감정과 색상에 관한 연구를 활용하여 각 감정에 맞는 색상을 자동으로 설정하고 사용자의 의도에 따라 사용자 리뷰에서 색상을 부여하는 기법을 제안하고자 한다.

Today, the online market has grown rapidly due to the development of digital platforms and the pandemic situation. Therefore, unlike the existing offline market, the distinctiveness of the online market has prompted users to check online reviews. It has been established that reviews play a significant part in influencing the user's purchase intention through precedents of several studies. However, the current review writing method makes it difficult for other users to understand the writer's emotions by expressing them through elements like tone and words. If the writer also wanted to emphasize something, it was very cumbersome to thicken the parts or change the colors to reflect their emotions. Therefore, in this paper, we propose a technique to check the user's emotions through facial expression recognition using a camera, to automatically set colors for each emotion using research on existing emotions and colors, and give colors based on the user's intention.

5

연료전지 교육 플랫폼 Meta-Fuelcell 개발에 관한 연구

즈엉투이짱, 곽경민, 신현준, 노영주

국제인공지능학회(구 한국인터넷방송통신학회) 한국인터넷방송통신학회 논문지 제22권 제5호 2022.10 pp.29-35

※ 원문제공기관과의 협약기간이 종료되어 열람이 제한될 수 있습니다.

본 논문에서는 신재생에너지 산업생태계의 한 영역을 담당하는 연료전지 산업에서 요구되는 인력을 양성함에 있어서, 기업의 교육비 부담 감축과 교육 효과 향상을 위하여 메타버스에 탑재한 연료전지 교육 프레임워크를 제안하였 다. 본 Meta-Fuel cell 플랫폼은 Unity 3D 웹을 활용하여 1인칭 시점의 플랫폼을 구성하여 이론교육과 실습교육을 진행할 수 있도록 구성하였다. 이 플랫폼은 ppt 발표, 동영상 실행 등등 다양한 단위 교육 콘텐츠를 수용할 수 있도록 설계하였고 프로토타입을 구현하였다. 현재, 본 플랫폼에는 이론교육을 위한 ppt 및 동영상 시연 외에 실습을 위한 소프 트웨어 콘텐츠 “STACK-Up”이 통합되어 있다. 이론교육 부문은 신재생에너지, 수소경제, 연료전지 등의 수소에 관한 교양지식 서비스를 제공한다. 소프트웨어 “STACK-Up”은 건물용 연료전지 핵심부품인 스택의 분해-조립 공정을 실습 할 수 있는 서비스를 제공한다. Meta-Fuelcell 플랫폼은 교육자에게는 대면 교육의 한계점을 개선하여 교육 장소, 시간, 인원 등의 제약이 없는 비대면 교육의 기회를 제공하고, 학습자에게는 교육 주제, 순서 등을 선택권을 부여하며 메타버스 공간에서 학습할 수 있는 흥미로운 경험을 제공한다. 본 플랫폼은 연료전지 인력양성 사업에 실험적으로 적용하며 개선 을 진행하고 있다.

This paper proposes a fuel cell education framework installed on a Metaverse environment, which is to reduce the burden of education costs and improve the effect of education or learning. This Meta-Fuel cell platform utilizes the Unity 3D Web and enables not only theoretical education but also hands-on training. The platform was designed and developed to accommodate a variety of unit education contents, such as ppt documents, videos, etc. The platform, therdore, integrates ppt and video demonstrations for theoretical education, as well as software content "STACK-Up" for hands-on training. Theoretical education section provides specialized liberal arts knowledge on hydrogen, including renewable energy, hydrogen economy, and fuel cells. The software "STACK-Up" provides a hands-on practice on assembling the stack parts. Stack is the very core component of fuel cells. The Meta-Fuelcell platform improves the limitations of face-to-face education. It provides educators with the opportunities of non-face-to-face education without restrictions such as educational place, time, and occupancy. On the other hand, learners can choose educational themes, order, etc. It provides educators and learners with interesting experiences to be active in the metaverse space. This platform is being applied experimentally to a education project which is to develop advanced manpower in the fuel cell industry. Its improvement is in progress.

6

신장 질환 맞춤형 AI 운동요법 제공 시스템 구현

박기조, 이병훈, 김경석

국제인공지능학회(구 한국인터넷방송통신학회) 한국인터넷방송통신학회 논문지 제22권 제5호 2022.10 pp.37-42

※ 원문제공기관과의 협약기간이 종료되어 열람이 제한될 수 있습니다.

본 논문에서는 신장 질환자를 대상으로 맞춤형 운동요법을 제공하기 위해 딥러닝과 같은 AI 방식을 적용한다. 딥러닝 적용을 위해 신장 질환을 판별할 수 있는 데이터셋을 학습시켜 신장 질환 여부를 판단하고 사용자의 신체정보와 질환여부에 따른 근력량인 1RM 또한 딥러닝을 통해 산출할 수 있도록 구성하였다. 산출된 근력량 1RM은 신체 부위별 산출 식을 통해 부위별 저항성 운동으로 변환하여 사용자의 신체정보에 맞춘 유산소 운동량과 함께 제공되도록 구성하였 다. 본 논문에서 제안한 방식으로 지속적인 연구가 진행될 경우 다양한 질환에 대해 맞춤형 운동요법을 제공할 수 있을 것이다.

In this paper, AI methods such as deep learning are applied to provide customized exercise therapy for patients with kidney disease. In order to apply deep learning, a dataset that can determine kidney disease is trained to determine whether it is a kidney disease, and 1RM, which is the user's physical information and muscle strength according to whether it is a disease, can also be calculated through deep learning. The calculated muscle strength of 1RM was converted into resistant exercise for each part through a calculation equation for each part of the body, and was configured to be provided with an aerobic exercise amount tailored to the user's body information. If continuous research is conducted in the manner proposed in this paper, customized exercise therapy can be provided for various diseases.

7

최근 모바일 기기의 성능이 급격히 향상되고 다양한 앱이 등장하면서 대화형 작업뿐 아니라 실시간 작업을 동반 하는 앱이 늘고 있다. 한편, 실시간 작업은 데드라인 제약 조건이 있어 종래의 시분할 시스템이 추구하던 자원 관리 정책 으로는 실시간 제약 조건을 만족하는 데에 한계가 있다. 본 논문에서는 모바일 기기에서 대화형 작업과 실시간 작업이 동시에 실행될 때 CPU, 메모리, 스토리지로 이어지는 종단간 자원 관리를 어떻게 함으로써 실시간 작업의 제약 조건을 만족하면서 자원의 효율적인 관리가 가능한지에 대해 알아본다. 본 논문에서는 복잡한 자원관리 정책의 제안보다 각 자 원들이 실시간 작업의 조건을 만족하기 위해 필요한 기본 개념에 대해 살펴보는 데에 초점을 맞춘다. CPU의 경우 실시 간 작업을 위한 전담코어 할당, 메모리의 경우 워킹셋의 일정 비율을 보장하는 방식, 스토리지의 경우 고속 스토리지를 사용하고 문맥교환을 생략하는 방식 등 기본적인 지원 방안을 알아보고 이를 어떻게 효율화할 수 있는지에 대해 알아본다.

With the recent performance improvement of mobile devices as well as the emergence of various applications, not only interactive tasks but also real-time tasks are rapidly increasing. As real-time tasks have deadline requirements, resource management policies used in the conventional time-sharing systems have limitations in satisfying real-time constraints. In this paper, we examine how to efficiently manage resources while satisfying the constraints of real-time tasks through end-to-end resource management of CPU, memory, and storage when interactive and real-time tasks are executed concurrently on a mobile device. Instead of suggesting complicated resource management policies, we focus on examining the basic concepts necessary for each resource management. Specifically, we first look at basic policies such as assigning dedicated CPU cores for real-time tasks, allocating a certain working set of real-time tasks in memory, and using fast storage without context switch in I/O. We then consider how these basic policies can be adopted efficiently.

8

최근 클라우드 시스템에서 병렬가속기를 사용하는 사례가 늘면서 가속기 내에서 멀티태스킹을 통해 자원 이용률 을 높이는 것이 중요한 이슈로 부각되고 있다. 본 논문에서는 병렬가속기 내 자원 사용 패턴을 컴퓨팅 중심과 메모리 중심으로 분류하여 워크로드를 배치하는 방식이 자원 이용률 측면에서 충분한 효과를 나타내지 못함을 보이고, 워크로드 별 상세 자원 이용률에 기반한 새로운 스레드 블록 스케줄링 기법을 제안한다. 제안한 기법은 기존 방식과 달리 프로파 일링과 스케줄링을 분리하여 스케줄링시의 오버헤드를 줄이고 병목 자원이 일치하지 않는 워크로드들을 최대한 중복 배치하여 자원 이용률을 높인다. 다양한 가상머신 시나리오에 대한 시뮬레이션 실험을 통해 제안한 기법이 병렬가속기의 처리량을 평균 130.6%, 최대 161.4%까지 개선함을 보인다.

With the recent widespread adoption of general-purpose GPUs (GPGPUs) in cloud systems, maximizing the resource utilization through multitasking in GPGPU has become an important issue. In this article, we show that resource allocation based on the workload classification of computing-bound and memory-bound is not sufficient with respect to resource utilization, and present a new thread block scheduling policy for GPGPU that makes use of fine-grained resource utilizations of each workload. Unlike previous approaches, the proposed policy reduces scheduling overhead by separating profiling and scheduling, and maximizes resource utilizations by co-locating workloads with different bottleneck resources. Through simulations under various virtual machine scenarios, we show that the proposed policy improves the GPGPU throughput by 130.6% on average and up to 161.4%.

9

NFT 디지털아트 작품 사례분석

윤희선, 정진헌

국제인공지능학회(구 한국인터넷방송통신학회) 한국인터넷방송통신학회 논문지 제22권 제5호 2022.10 pp.55-61

※ 원문제공기관과의 협약기간이 종료되어 열람이 제한될 수 있습니다.

본 연구에서는 NFT, 블록체인, 메타버스의 이론적 내용을 살펴보고, 현재 대중적 인지도가 높은 NFT 아트의 다양한 표현방식을 분석하였다. 사례연구 내용으로는 2D 그래픽, 3D 그래픽, 모션그래픽 작품을 오픈씨 전체랭킹 100 개의 프로젝트를 분석하였다. 메타버스 공간과 NFT 기술은 디지털 아트 창작자뿐 아니라 기존의 예술작가 모두에게 새로운 공급과 수요의 시장을 만들어 줄 것이다. 가상 자산인 코인에 대한 관심과 거래가 증가함에 따라 NFT 시장에서 의 디지털 아트의 거래 수요는 점차 늘어가고 있다. 이후 창작자들을 위하여 NFT 디지털 아트의 그래픽스타일을 2D그 래픽, 3D그래픽, 2D 모션그래픽 3D 모션그래픽 4가지로 분류하여, 연구하였다. 추후 디지털아트 NFT 창작들에게 그래 픽스타일의 방향성을 제시해 줄 수 있을 것이라 사료된다.

With the rapid development of information technology, Metaverse and Non-Fungible Token (hereinafter referred to as NFT) technology will not only create new supply and demand markets for digital art creators, but also for existing art writers. As interest in and trading of virtual assets and coins increases, so does the demand for digital art trading in the NFT market. This study examines the theoretical content of NFTs, blockchains, and Metaverse, and analyzes various expressions of NFT art that are currently popular. As the case study, 100 projects were selected and analyzed in the overall OpenSea ranking, which included 2D graphics, 3D graphics and motion graphics works. Then, from the perspective of creators, the graphic styles of NFT digital art are divided into 4 types: 2D graphics, 3D graphics, 2D dynamic graphics, 3D dynamic graphics, and analyzed and studied. It is hoped that in the future, this study can suggest the direction of creating graphic styles to digital art NFT creators.

10

자율주행 기술은 최근 심층 강화학습의 도입으로 큰 발전을 이루고 있다. 심층 강화 학습을 효과적으로 사용하기 위해서는 적절한 활성화 함수를 선택하는 것이 중요하다. 그 동안 많은 활성화 함수가 제시되었으나 적용할 환경에 따라 다른 성능을 보여주었다. 본 논문은 고속도로에서 자율주행을 학습하기 위해 강화 학습을 사용할 때 어떤 활성화 함수를 사용하는 것이 효과적인지 12개의 활성화 함수 성능을 비교 평가한다. 이를 위한 성능 평가 방법을 제시하였고 각 활성 화 함수의 평균 보상 값을 비교하였다. 그 결과 GELU를 사용할 경우 가장 높은 평균 보상을 얻을 수 있었으며 SiLU는 가장 낮은 성능을 보여주었다. 두 활성화 함수의 평균 보상 차이는 20%였다.

Autonomous driving technology has recently made great progress with the introduction of deep reinforcement learning. In order to effectively use deep reinforcement learning, it is important to select the appropriate activation function. In the meantime, many activation functions have been presented, but they show different performance depending on the environment to be applied. This paper compares and evaluates the performance of 12 activation functions to see which activation functions are effective when using reinforcement learning to learn autonomous driving on highways. To this end, a performance evaluation method was presented and the average reward value of each activation function was compared. As a result, when using GELU, the highest average reward could be obtained, and SiLU showed the lowest performance. The average reward difference between the two activation functions was 20%.

11

본 논문에서는 LoG(Laplacian of Gaussian) 기반의 윤곽선 검출 기법을 통한 새로운 미세먼지 측정 방법을 제안한다. 미세먼지 측정을 위하여 CCTV 기반의 영상 이미지를 수집하고, RoI(Region of Interest)를 통해 이미지 범위를 지정한다. 지정된 영역에 GMM(Gaussian Mixture Model)을 적용하여 군집화 후, LoG 알고리즘을 통해 윤곽 선을 검출하고 검출된 윤곽선 강도를 측정한다. 측정된 윤곽선의 강도 데이터를 기반으로 미세먼지의 농도를 결정한다. 본 논문에서 제안하는 알고리즘의 효용성을 입증하기 위하여 본교 연구실 주위에 설치된 CCTV 영상 이미지를 6~7월 한 달간 수집하여 적용한 결과, 측정된 결과값은 미세먼지 농도와 범위를 계산하기에 충분함을 본 실험을 통해 입증하였다.

In this paper, we propose a new method for measuring fine dust through a LoG(Laplacian of Gaussian)-based edge detection technique. CCTV-based images in a video are collected for fine dust measurement, and image ranges are designated through RoI(Region of Interest). After clustering by applying the GMM(Gaussian Mix Model) to the specified area, we detect edge through the LoG algorithm and measure the detected edge strength. The concentration of fine dust is determined based on the measured intensity data of the edge. In this paper, we propose algorithm as the effectiveness of experiment. As a result of collecting and applying CCTV image in the video installed around the laboratory of this school for a month from June to July, the measured result value was proved through this experiment to be sufficient to calculate the concentration and range of fine dust.

12

오토인코더 기반 수치형 학습데이터의 자동 증강 기법

정주은, 김한준, 전종훈

국제인공지능학회(구 한국인터넷방송통신학회) 한국인터넷방송통신학회 논문지 제22권 제5호 2022.10 pp.75-86

※ 원문제공기관과의 협약기간이 종료되어 열람이 제한될 수 있습니다.

본 연구는 딥러닝 기반 변분 오토인코더(Variational Autoencoder)를 활용하여 수치형 학습데이터 내 클래스 불균형 문제를 해결하고, 학습데이터를 증강하여 학습모델의 성능을 향상시키고자 한다. 우리는 주어진 테이블 데이터에 대하여 인위적으로 레코드 개수를 늘리기 위해 ‘D-VAE’을 제안한다. 제안 기법은 최적의 데이터 증강을 지원하기 위해 우선 이산화와 특징선택을 수반한 전처리 과정을 수행한다. 이산화 과정에서 k-means 클러스터링을 적용하여 그룹화한 후, 주어진 데이터가 원-핫 인코딩(one-hot encoding) 기법으로 원-핫 벡터(one-hot vector)로 변환한다. 이후, 특징 선택 기법 중 RFECV 기법을 활용하여 예측에 도움이 되는 변수를 가려내고, 이에 대해서만 변분 오토인코더를 활용하 여 새로운 학습데이터를 생성한다. 제안 기법의 성능을 검증하기 위해 4가지 유형의 실험 데이터를 활용하여 데이터 증강 비율별로 그 유효성을 입증한다.

This study aims to solve the problem of class imbalance in numerical data by using a deep learning-based Variational AutoEncoder and to improve the performance of the learning model by augmenting the learning data. We propose 'D-VAE' to artificially increase the number of records for a given table data. The main features of the proposed technique go through discretization and feature selection in the preprocessing process to optimize the data. In the discretization process, K-means are applied and grouped, and then converted into one-hot vectors by one-hot encoding technique. Subsequently, for memory efficiency, sample data are generated with Variational AutoEncoder using only features that help predict with RFECV among feature selection techniques. To verify the performance of the proposed model, we demonstrate its validity by conducting experiments by data augmentation ratio.

디바이스와 모듈

13

AESA 레이더 광각 빔조향 특성을 고려한 복사소자 설계 기법

김영완, 채희덕, 안세환, 주지한

국제인공지능학회(구 한국인터넷방송통신학회) 한국인터넷방송통신학회 논문지 제22권 제5호 2022.10 pp.87-92

※ 원문제공기관과의 협약기간이 종료되어 열람이 제한될 수 있습니다.

본 논문에서는 탐색기용 AESA 레이더에 적용할 수 있는 배열소자 설계에 관한 연구를 수행하였다. AESA 레이더 에 적용하기 위한 안테나는 전자 빔조향 특성을 확보하기 위해 배열 안테나에 적용할 최적의 복사소자를 선정하고, 설계 시 빔조향 특성을 고려하여야 한다. 특히 광각 빔조향 특성을 충족하기 위해 광각 임피던스 매칭(WAIM:Wide Angle Impedance Matching) 기법을 활용하여 광각 조향 시 발생할 수 있는 음영 지역(Scan Blindness region)을 최소화하 여야 한다. 이처럼 시스템 운용의 안정성 확보가 AESA 레이더의 중요한 설계 고려 사항이 되고 있다. 본 논문에서는 AESA 레이더 안테나 장치에 적용되는 복사소자 특성을 개선하기 위해 복사소자 끝단에 WAIM을 적용하고, 시스템의 안정적 운용 척도인 능동 반사 계수 성능 변화를 검토하였다. 최종 성능 결과는 시뮬레이션 데이터를 수학적으로 합성하 여 제시한 방안의 유효성을 검증하였다.

In this paper, a study was conducted on the design of an array element that can be applied to the AESA radar for seeker. An antenna for application to AESA radar should choose an optimal radiation element to be applied to an array antenna in order to secure electronical beam steering characteristics, and consider beam steering characteristics when designing. In particular, in order to satisfy the wide-angle beam steering characteristics, the wide-angle impedance matching technique should be used to minimize the scan blindness region that may occur during wide-angle steering. As such, securing the stability of system operation is becoming an important design consideration for AESA radar. In this paper, WAIM is applied to the end of the radiation element to improve the characteristics of the radiation element applied to the AESA radar antenna device, and the change in the performance of the active reflection coefficient, which is a stable operation index of the system, is reviewed. The final performance result verified the validity of the proposed method by mathematically synthesizing the simulation data.

14

이중대역 적외선 검출기를 이용한 적외선 카메라 설계

박진호, 김홍락, 김경일, 이다빈

국제인공지능학회(구 한국인터넷방송통신학회) 한국인터넷방송통신학회 논문지 제22권 제5호 2022.10 pp.93-97

※ 원문제공기관과의 협약기간이 종료되어 열람이 제한될 수 있습니다.

적외선 영상은 온도 정보뿐만 아니라 파장 정보를 포함하고 있으며 이는 단일 파장의 적외선 카메라로는 분석이 불가능하다. 다중 파장 적외선 카메라는 적외선 영상에 포함된 광범위한 정보를 획득할 수 있다. 다중 파장 적외선 카메 라의 한 종류인 이중대역 적외선 카메라는 시스템 구성을 쉽게 할 수 있다는 이점이 있다. 이중대역 적외선 카메라는 적외선 영상에 포함된 온도정보 뿐만 아니라 파장 정보를 획득할 수 있고 이를 통해 적외선 카메라의 탐지/식별 성능을 향상시킬 수 있다. 본 논문에서는 중적외선 대역과 원적외선 대역을 동시에 획득할 수 있는 이중대역 적외선 검출기를 이용한 적외선 카메라의 설계에 대하여 기술한다.

Infrared scenes usually contain also spectral information which cannot be resolved using normal single-band infrared cameras. Multispectral infrared imaging cameras give access to the comprehensive information contained within infrared scenes. A Dual-band infrared Camera, a type of multispectral infrared imaging cameras, has the advantage of simple system. A Dual-band Infrared Camera gives access to the spectral information as wells as the temperature information within infrared scenes. Multispectral imaging generally increases the detection and identification performance of a Dual-band Infrared Camera. This paper describes a design of an infrared Camera using a Dual-band Infrared Detector to simultaneously receive infrared radiation from the medium-wave infrared/long-wave infrared(MWIR/LWIR) bands.

15

Ka-대역 추적 레이더용 전원공급기 개발

이동주, 안세환, 주지한, 권준범, 서미희

국제인공지능학회(구 한국인터넷방송통신학회) 한국인터넷방송통신학회 논문지 제22권 제5호 2022.10 pp.99-103

※ 원문제공기관과의 협약기간이 종료되어 열람이 제한될 수 있습니다.

밀리미터파 추적 레이더는 다양한 환경조건에서 운용하므로 입력전압의 큰 변동에도 안정적인 출력전원을 공급 하는 전원공급기가 필요하며, 송수신기에 고품질의 전원공급을 위해 낮은 잡음레벨 특성을 가져야 한다. 본 논문에서는 Ka-대역 추적 레이더에 적용하기 위한 최대 출력 727 W급의 소형 전원공급기 설계 및 구현방안에 대해 기술한다. 전압 안정도 및 효율 요구사항을 충족하기 위해 buck 타입의 DC-DC 컨버터의 윗면이 전원공급기의 커버와 맞닿게 배치하 여 방열효율을 극대화하였다. 최대 부하 조건에서 시스템 효율 88.4 %, 전압정밀도 ±2 %, 잡음레벨은 전압값의 1 % 이내임을 확인하였다.

Millimeter-wave tracking radars operate in various environmental restrictions, thus they demand stable power sources with low noise level under high fluctuation of input voltage. This paper presents the design and implementation of the compact power supply with max power of 727 W for Ka-band tracking radar applications. To meet requirements of voltage accuracy and system efficiency for transceiver circuits, upper plates of buck converters are attached on the covers of power supply for efficient heat dissipation. The proposed power supply achieves system efficiency of 88.4 %, output voltage accuracy of ±2 % and noise level of <1% under full load conditions.

16

국내의 메모리 반도체 설계 기술은 세계 최고의 수준이나, 아직까지 프로세서의 설계는 그에 미치지 못하여 메모 리와 프로세서의 균형있는 발전을 이루지 못하고 있다. Xilinx에서 제공하는 Vivado 통합 환경을 이용하여 저렴한 비용 으로 짧은 시간에 현장에서 즉석으로 쉽게 프로세서를 FPGA 반도체 칩에 구현할 수 있다. 본 논문에서는 유럽 및 전 세계의 대학 및 연구소에서 디지털시스템 설계에 널리 쓰이는 VHDL을 이용하여 32 비트 ARMv4 계열의 프로세서를 설계하고, Vivado에서 Xilinx FPGA로 구현 및 로직아날라이저로 검증하였다. 그 결과, FGPA로 구현된 ARM 프로세 서가 ARM 명령어들로 구성된 프로그램을 성공적으로 수행하였다.

Domestically, we are capable of designing high-end memory semiconductors, but not in processors, resulting in unbalance. Using Vivado as a development enivronment and implementing the processor on a Xilinx FPGA reduces time and cost dramatically. In this paper, the popular language VHDL which is widely used in Europe, universities, and research centers around the world for the digital system design is used for designing a pipelined 32-bit ARM processor, implemented on FPGA and verified by Integrated Logic Analyzer. As a result, the ARM processor implemented on FPGA could execute ARM instructions successfully.

17

전동기 소손의 원인으로는 과부하, 결상, 구속, 층간단락, 권선의 지락, 순간과전압의 유입, 회전자가 고정자에 닿는 경우 등 절연파괴로 이어져 고장 또는 전기 사고로 이어지고 있다. 따라서 기기 고장은 기기의 보수/수리에 필요한 비용에 의한 손실뿐만 아니라, 전동기가 포함된 공정 자체를 멈추기 때문에 공정 정지에 따른 생산성 저하에 의한 막대 한 경제적 손실을 초래한다. 전동기의 고장을 진단하기 위한 현재의 기술의 수준은 진동, 열, 전력분석 방식을 이용하고 있지만, 고장에 따른 상당 부분의 시간이 진행되어야 문제점을 분석할 수 있는 한계점을 가지고 있다. 따라서 본 논문에 서는 이러한 문제점을 해결하고자 DC AMP 신호를 이용하여 절연저항을 측정하는 장치 및 알고리즘을 산업용 전동기에 적용하여 절연저항 상태값을 추종하여 기존방식에서 해결되지 못한 전동기의 열화 및 고장 진단을 제안한다.

The causes of motor burnout include overload, phase loss, restraint, interlayer short circuit, winding ground fault, instantaneous overvoltage, and the rotor contacting the stator, leading to insulation breakdown, leading to breakdown or electrical accidents. Therefore, equipment failure causes not only loss due to cost required for equipment maintenance/repair, but also huge economic loss due to productivity decrease due to process stop because the process itself including the motor is stopped. The current level of technology for diagnosing motor failures uses vibration, heat, and power analysis methods, but there is a limit to analyzing the problems only after a considerable amount of time has passed according to the failure. Therefore, in this paper, a device and algorithm for measuring insulation resistance using DC AMP signal was applied to an industrial motor to solve this problem. And by following the insulation resistance state value, we propose a diagnosis of deterioration and failure of the motor that cannot be solved by the existing method.

18

인체 운동 에너지를 이용한 진자 발전기에 관한 연구

지인호, 신승중

국제인공지능학회(구 한국인터넷방송통신학회) 한국인터넷방송통신학회 논문지 제22권 제5호 2022.10 pp.117-122

※ 원문제공기관과의 협약기간이 종료되어 열람이 제한될 수 있습니다.

본 연구에서 전자기 유도 발전(EMG)은 고정자와 영구자석 회전자로 이루어진 구조로 인체의 팔 운동 에너지를 이용하여 전력 생산이 가능한 방식이다. 그 중 AFPM 기법은 인체의 느린 속도의 팔 운동 에너지에도 민감하게 동작할 수 있는 방법으로 구조가 간단하며 크기는 초소형 설계, 제작이 가능하다. 크기 ∅46x11mm, 회전수 7Hz(420rpm) 의 조건에서 출력전압 0.4VAC, 출력전류 4.5mA, 출력전력 30mW 로 측정되어 목표사양과 유사하게 해석되었다. 따라 서 본 연구에서는 AFPM 기법을 적용한 진자 발전을 연구하여 인체 운동 에너지로 스마트 기기에 전력을 충전하는 데 연구 목적이 있다.

In this study, Electromagnetic Induction Power Generation (EMG) is a structure consisting of a stator and a permanent magnet rotor, and is a method that enables power generation by using the kinetic energy of the human arm. Among them, the axial flux permanent magnet (AFPM) technique is a method that can act sensitively to the kinetic energy of the arm at a slow speed of the human body, and has a simple structure and can be designed and manufactured with an ultra-small size. Under the conditions of size of ∅46x11mm, rotation speed of 7Hz (420rpm), output voltage 0.4VAC, output current 4.5mA, and output power 30mW were measured and analyzed the same as the target specification. Therefore, the purpose of this study is to study the power generation of the pendulum applying the AFPM (Axial Flux Permanent Magnet) technique to charge power to smart devices with kinetic energy of the human body.

19

정확한 모드전송선로 이론 (MTLT)을 적용하여 원추형 광 입사에서 공진 회절격자의 특성을 조사하였다. 원추형 구성에서 공진 회절과 관련된 모드 벡터가 전형적이 구조의 회절격자와 관련된 것보다 입사각에 따라 작게 변한다는 것을 보여주었다. 더욱이, 소멸하는 회절파가 공진 효과를 담당하는 누설 모드를 구동함에 따라, 원추형 장착은 기존 회절격자보다 더 큰 각도 허용 오차를 회절격자에 부여함을 보였다. 이에 기초하여, 수치 계산을 통하여 원추형 입사에서 발견된 스펙트럼을 사용하여, 원추형 및 클래식 구성에서 공진 회절격자의 각도-스펙트럼과 파장-스펙트럼 성능을 정량 화하였다. 이러한 결과는 효율적이고 물리적으로 희소한 공진 회절격자를 요구하는 다양한 응용 분야에서 유용할 것이다.

Applying rigorous modal transmission-line theory (MTLT), the properties of resonant diffraction gratings under conical light incidence is investigated. The mode vectors pertinent to resonant diffraction under conical mounting vary less with incident angle than those associated with diffraction gratings in classical mounting. Furthermore, as the evanescent diffracted waves drive the leaky modes responsible for the resonance effects, the conical mounting imbues diffraction gratings with larger angular tolerance than their classical counterparts. Based on these concepts, the angular-spectral and wavelength-spectral performance of resonant diffraction gratings in conical and classical mounts by numerical calculations with spectra found for conical incidence are quantified. These results will be useful in various applications demanding resonant diffraction gratings that are efficient and physically sparse.

IT 경영 및 정책

20

오팔(OPAL)세대가 이커머스 시장에 새로운 기회를 열고 있다. 이 연구는 혁신확산이론에 기초해 오팔세대 이커 머스 이용자와 비이용자의 인구사회학적 속성과 혁신성을 비교하고, 이 같은 개인 특성들이 이커머스 이용 가능성에 미 치는 영향을 살펴보았다. 연구 결과 오팔세대 이커머스 이용자는 비이용자보다 여성, 무소득층, 고소득층의 비중이 크며, 더 젊고, 교육 수준이 높은 특징을 보였다. 또한 기능적·쾌락적·사회적·인지적 혁신성이 높았다. 한편 오팔세대는 여성이 남성보다, 연령대가 낮을수록, 교육 수준이 높을수록, 기능적 및 쾌락적 혁신성이 높을수록 이커머스 이용 가능성이 큰 것으로 나타났다. 이 결과를 토대로 본 연구의 이론적 의의와 실무적 함의를 제시했다.

This study compared the sociodemographic characteristics and innovativeness of OPAL generation e-commerce users and non-users based on the innovation diffusion theory, and examined the effect of these personal characteristics on the availability of e-commerce use. The result showed that OPAL generation e-commerce users differed from non-users in gender, age, income level, education level, and functional, hedonistic, social and cognitive innovativeness. In addition, gender, age, educational level, functional and hedonistic innovativeness were found to be significant variables that determined the OPAL generation's use of e-commerce. Based on these results, we presented the theoretical and practical implications of this study.

21

최근 몇 년간 빅데이터·AI를 활용하여 산업·사회문제를 해결하고 새로운 가치를 창출하는 것이 국가의 주요 정책 목표로 논의되고 있다. 새 정부 또한 빅데이터·AI를 기반으로 국민·기업·정부가 사회문제 해결과 새로운 가치 창출하는 디지털플랫폼정부를 주요 국정과제로 설정하였다. 아직까지 그간의 논의를 정리하고 향후의 정책 방향을 논의한 연구는 많이 전개되지 못한 상황이다. 이에 본 연구는 지난 5년간의 논의의 진단을 통하여 우리의 현황과 과제를 살펴보고자 한다. 이를 위하여 앞서 통용되고 있던 개념인 4차산업혁명을 키워드로 하여, 신문사설을 수집하여 분석하였다. 텍스트 마이닝 기법을 적용하여 2017년부터 2022년까지 뉴스사설을 수집한 후 9개의 주요의제를 발견하였으며, 이를 기반으 로 디지털플랫폼정부 기반의 미래사회에 대응을 위한 준비과제에 대한 시사점을 제공하였다.

Recently, solving industrial and social problems and creating new values based on big data and AI is being discussed as the main policy goal. The new government also set the digital platform government as a national task in order to achieve new value creation based on big data and AI. However, studies that summarize and diagnose discussions over the past five years are insufficient. Therefore, this study diagnoses the discussions over the past 5 years using the 4th industrial revolution as a keyword. After collecting news editorials from 2017 to 2022 by applying the text mining technique, 9 major topics were discovered. In conclusion, this study provided implications for the government's task to prepare for the future society.

22

인공지능 서비스 영향평가 추진방안에 대한 연구

신선영

국제인공지능학회(구 한국인터넷방송통신학회) 한국인터넷방송통신학회 논문지 제22권 제5호 2022.10 pp.147-157

※ 원문제공기관과의 협약기간이 종료되어 열람이 제한될 수 있습니다.

본 연구의 목적은 영향평가에 대한 정의부터 국내외 인공지능 서비스 영향평가 사례에 대한 분석을 바탕으로 인공지능 서비스 영향평가 추진에 대한 정책적 제언을 수립하는 것이다. 이를 위해서 국내외 타 분야에서 추진된 영향평 가 사례, 인공지능 서비스 국내외 영향평가 사례를 바탕으로 추진 방향을 분석하였다. 국내 인공지능 서비스 영향평가는 다소 광범위하고 포괄적이며, 시점도 사전적 예방 수단에 그치지 않고 상시적·사후적 위험성 관리를 예정하고 있다. 단계 별 추진 방안으로 1단계에는 AI 수준 조사 기반의 경제적 효과 등의 정량적 지표를 개발한 후, 2단계에서는 지능정보화 기본법에 기술된 안전성 및 신뢰성, 인공지능 윤리 등 정보문화, 고용ㆍ노동 등 사회ㆍ경제, 정보보호, 국민의 일상생활 에 미치는 영향에 미치는 분야별 평가체계를 마련한다. 3단계에서는 세부 측정지표나 방식 등의 논의를 확대하고 영향평 가 결과가 인공지능 정책에 반영하는 환류 체계 포함된다면 국내의 인공지능 경쟁력 강화에 도움이 되는 정책 수단이 될 수 있다는 것을 제시하였다. 본 연구는 향후 정책 설계자, 인공지능 서비스 개발자, 시민단체 등 다양한 참여자를 통한 분석이 요구된다.

The purpose of this study is to establish policy recommendations for the promotion of AI service impact assessment based on the definition of impact assessment and analysis of domestic and foreign AI service impact assessment cases. The direction of implementation was analyzed based on the case of impact evaluation promoted in various fields at home and abroad and the case of impact evaluation at home and abroad of artificial intelligence services. As a step-by-step implementation plan, in the first stage, quantitative indicators such as AI level survey-based economic effects are developed, and in the second stage, information culture such as safety and reliability and artificial intelligence ethics described in the Framework Act on Intelligence Information, social, economic, information protection, and people's daily lives are prepared. In the third stage, discussion on detailed metrics and methods will be expanded and impact assessment results will be evaluated. This study requires analysis through various participants such as policy designers, artificial intelligence service developers, and civic groups in the future.

23

작업자 배정 문제의 다항시간 알고리즘

이상운

국제인공지능학회(구 한국인터넷방송통신학회) 한국인터넷방송통신학회 논문지 제22권 제5호 2022.10 pp.159-164

※ 원문제공기관과의 협약기간이 종료되어 열람이 제한될 수 있습니다.

선형배정문제 (LAP)와 선형병목배정문제 (LBAP)는 다항시간으로 최적 해를 구하는 알고리즘이 알려져 있지 않 은 NP-난제로 분류되어 메타휴리스틱 방법이나 O(m4) 계산 복잡도의 선형계획법 (LP) 소프트웨어 패키지나 헝가리안 알고리즘 (HA)을 적용하고 있다. 본 논문은 LAP와 LBAP에 대해 O(mn) = O(m2), m = n 복잡도의 다항시간 알고리즘을 제안하였다. LAP에 대해서는 선택-삭제 방법을, LBAP에 대해서는 삭제-선택 방법을 단순히 적용하였다. 모든 데이터에 적합한 유일한 알고리즘이 존재하지 않는 실험 데이터에 제안된 알고리즘을 적용한 결과, 제안된 알고리즘은 모든 데이 터에 대해 최적 해를 구할 수 있었다.

The linear assignment problem (LAP) and linear bottleneck assignment problem (LBAP) has been unknown the algorithm to solve the optimal solution within polynomial-time. These problems are classified by NP-hard. Therefore, we can be apply metaheuristic methods or linear programming (LP) software package or Hungarian algorithm (HA) with O(m4) computational complexity. This paper suggests polynomial time algorithm with O(mn) = O(m2), m = ntime complexity to LAP and LBAP. The select-delete method is simply applied to LAP, and the delete-select method is used to LBAP. For the experimental data without the unique algorithm can be apply to whole data, the proposed algorithm can be obtain the optimal solutions for whole data.

기타

24

코로나19와 플라스틱 배출량과의 상관관계 분석 : 업사이클

이지현, 황승연, 김정준

국제인공지능학회(구 한국인터넷방송통신학회) 한국인터넷방송통신학회 논문지 제22권 제5호 2022.10 pp.165-170

※ 원문제공기관과의 협약기간이 종료되어 열람이 제한될 수 있습니다.

환경부는 코로나19 발생 초기인 2020년 2월 지자체가 한시적으로 일회용품 사용을 허용할 수 있게 하였다. 그러나 코로나19 기간 생활 폐기물이 증가하자, 무분별한 일회용품 사용을 줄이기 위해 다시 사용을 금지하는 ‘일회용품 사용규제 제외대상’ 개정안을 올해 1월 고시하였다. 이렇게 플라스틱의 사용량이 기존보다 더 많아지고 시민들마저 편리 함에 익숙해져 오히려 더 일회용품 사용을 원하는 상황에 이르렀다. 하지만, 이러한 코로나19 확산과 이전보다 더욱 심각해지는 환경문제에 대한 중요성이 높아지면서 친환경 ‘업사이클’제품이 주목받고 있다. 본 연구에서는 코로나로 증 가한 플라스틱, 플라스틱 배출량의 변화로 인한 업사이클 산업에 대해서 연관성을 파악하고 이를 대시보드로 나타내고자 한다. 이를 통해 대시보드를 구성하는 각 시각화를 제작하고 환경보호와 지속가능한 친환경 제품, 업사이클 산업 및 문화 에 대해서 알리기가 가능할 것으로 기대된다.

The amount of data generated by recent developments in Big data and related technologies has been rapidly increasing, and the need to predict changes in future societies and present technologies to be realized has been continuously raised to lay the foundation for national scientific and technological planning. The existing methods of predicting future technologies have their respective advantages, but problems also exist. Thus, this paper newly establishes and applies the methodology to be used for predicting future technologies specialized in information security fields beyond the existing comprehensive prediction, and draws out innovative technologies that are expected to have high ripple effects in the future, and analyzes the technological diffusion points of each technology to predict future technological changes in the information security sector. It is expected that this will ensure reliability and objectivity of the forecast survey results and allow more sophisticated and multilayered predictions than the overall scientific and technological forecast surveys.

25

학습률 향상을 위한 딥러닝 기반 맞춤형 문제 추천 알고리즘

임민아, 황승연, 김정준

국제인공지능학회(구 한국인터넷방송통신학회) 한국인터넷방송통신학회 논문지 제22권 제5호 2022.10 pp.171-176

※ 원문제공기관과의 협약기간이 종료되어 열람이 제한될 수 있습니다.

최근 딥러닝 기술의 발전과 함께 추천 시스템의 영역도 다양해졌다. 본 논문은 학습률 향상을 위한 알고리즘을 연구하였으며 Word2Vec 모델의 성능 특징과 비교를 통해 단어에 따른 유의어 결과를 연구하였다. 문제 추천 알고리즘 은 Word2Vec 모델의 특징인 텍스트 간 의미 반영 및 유사성 테스트를 통해 표현된 값으로 구현됐다. Word2Vec 의 학습 결과를 통해 텍스트 유사도 값을 이용해 문제 추천을 진행하였으며 유사도가 높은 문제를 추천할 수 있다. 실험 과정에서 정량적인 데이터양으로는 정확성이 낮아지는 결과를 보았으며 데이터 셋의 데이터양이 방대할수록 정확성을 높일 수 있음을 확인하였다.

With the recent development of deep learning technology, the areas of recommendation systems have also diversified. This paper studied algorithms to improve the learning rate and studied the significance results according to words through comparison with the performance characteristics of the Word2Vec model. The problem recommendation algorithm was implemented with the values expressed through the reflection of meaning and similarity test between texts, which are characteristics of the Word2Vec model. Through Word2Vec's learning results, problem recommendations were conducted using text similarity values, and problems with high similarity can be recommended. In the experimental process, it was seen that the accuracy decreased with the quantitative amount of data, and it was confirmed that the larger the amount of data in the data set, the higher the accuracy.

26

딥러닝 기반 운동 자세 교정 시스템의 성능

황병선, 김정호, 이예람, 경찬욱, 선준호, 선영규, 김진영

국제인공지능학회(구 한국인터넷방송통신학회) 한국인터넷방송통신학회 논문지 제22권 제5호 2022.10 pp.177-183

※ 원문제공기관과의 협약기간이 종료되어 열람이 제한될 수 있습니다.

최근 COVID-19로 인해 홈 트레이닝의 관심도가 증가하고 있다. 이에 따라 HAR(human activity recognition) 기술을 홈 트레이닝에 적용한 연구가 진행되고 있다. 기존 HAR 분야의 논문에서는 동적인 자세보다는 앉기, 일어서기와 같은 정적인 자세들을 분석한다. 본 논문은 동적인 운동 자세를 분석하여 사용자의 운동 자세 정확도를 보여주는 딥러닝 모델을 제안한다. AI hub의 피트니스 이미지를 blaze pose를 사용하여 사람의 자세 데이터를 분석한다. 3개의 딥러닝 모델: RNN(recurrnet neural networks), LSTM(long short-term memory networks), CNN(convolution neural networks)에 대하여 실험을 진행한다. RNN, LSTM, CNN 모델의 f1-score는 각각 0.49, 0.87, 0.98로 CNN 모델이 가장 적합하다는 것을 확인하였다. 이후 연구로는, 다양한 학습 데이터를 사용하여 더 많은 운동 자세를 분석할 예정이다.

Recently, interesting of home training is getting bigger due to COVID-19. Accordingly, research on applying HAR(human activity recognition) technology to home training has been conducted. However, existing paper of HAR proposed static activity instead of dynamic activity. In this paper, the deep learning model where dynamic exercise posture can be analyzed and the accuracy of the user’s exercise posture can be shown is proposed. Fitness images of AI-hub are analyzed by blaze pose. The experiment is compared with three types of deep learning model: RNN(recurrent neural network), LSTM(long short-term memory), CNN(convolution neural network). In simulation results, it was shown that the f1-score of RNN, LSTM and CNN is 0.49, 0.87 and 0.98, respectively. It was confirmed that CNN is more suitable for human activity recognition than other models from simulation results. More exercise postures can be analyzed using a variety learning data.

27

국소부위 패턴 표현을 위한 샘플링 기반 초해상도 U-Net

이교석, 갈원모, 임명재

국제인공지능학회(구 한국인터넷방송통신학회) 한국인터넷방송통신학회 논문지 제22권 제5호 2022.10 pp.185-191

※ 원문제공기관과의 협약기간이 종료되어 열람이 제한될 수 있습니다.

본 연구에서는 U-Net, 잔차 신경망, 서브 픽셀 컨볼루션을 기반으로 새로운 초해상도 신경망을 제안한다. U-Net의 최대 풀링으로 인해 세부적인 정보의 손실이 일어나는 것을 막기 위해 서브 픽셀 컨볼루션을 활용한 다운 샘플 링 그리고 연결을 제안한다. 이는 필터 안의 최대 값만으로 새로운 피처맵을 만드는 최대 풀링과 다르게 필터 안의 모든 픽셀을 사용한다. 2x2 크기의 필터가 지나가면서 왼쪽 위, 오른쪽 위, 왼쪽 아래, 오른쪽 아래의 픽셀들로만 이루어진 피처맵을 만든다. 이를 통해 크기가 절반이 되고, 피처맵이 개수가 4배가 된다. 그리고 연산량을 줄이기 위해 두 가지 방법을 제안했다. 첫 번째는 U-Net의 업 컨볼루션 대신 연산량이 없고, 성능이 더 좋은 서브 픽셀 컨볼루션을 사용한다. 두 번째는 U-Net의 연결 층 대신 두 피처 맵을 더하는 층을 사용한다. 밴치 마크 데이터 세트로 실험한 결과 스케일 2의 set5 데이터를 제외하고 모든 스케일 및 벤치마크 데이터 세트에서 더 나은 PSNR 값을 보여주고, 국소부위의 패턴 을 명확하게 표현할 수 있었다.

In this study, we propose a novel super-resolution neural network based on U-Net, residual neural network, and sub-pixel convolution. To prevent the loss of detailed information due to the max pooling of U-Net, we propose down-sampling and connection using sub-pixel convolution. This uses all pixels in the filter, unlike the max pooling that creates a new feature map with only the max value in the filter. As a 2x2 size filter passes, it creates a feature map consisting only of pixels in the upper left, upper right, lower left, and lower right. This makes it half the size and quadruple the number of feature maps. And we propose two methods to reduce the computation. The first uses sub-pixel convolution, which has no computation, and has better performance, instead of up-convolution. The second uses a layer that adds two feature maps instead of the connection layer of the U-Net. Experiments with a banchmark dataset show better PSNR values on all scale and benchmark datasets except for set5 data on scale 2, and well represent local area patterns.

 
페이지 저장