Earticle

현재 위치 Home

Issues

한국차세대컴퓨팅학회 논문지 [THE JOURNAL OF KOREAN INSTITUTE OF NEXT GENERATION COMPUTING]

간행물 정보
  • 자료유형
    학술지
  • 발행기관
    한국차세대컴퓨팅학회 [Korean Institute of Next Generation Computing]
  • pISSN
    1975-681X
  • 간기
    격월간
  • 수록기간
    2005 ~ 2026
  • 등재여부
    KCI 등재
  • 주제분류
    공학 > 컴퓨터학
  • 십진분류
    KDC 566 DDC 004
Vol.18 No.6 (14건)
No
1

경제학 지식은 조직이 좀 더 데이터 기반의 의사 결정하도록 지원하는 분석, 데이터 마이닝, 데이터 시각화, 데이터 도구, 모델링, 인프라를 모두 포함한다. 빠르게 변해가는 사회에서 좀 더 과학적 방법으로 해답을 제시해줄 수 있다. 본 논문에서는 경제학 논문 텍스트에서 키워드 개체 추출 시스템과 관계 정보를 학습하고 예측할 수 있는 관계 기반 BERT 모델을 제안한다. 관계 기반 BERT 모델을 실험을 통해 검증한 후에 지식 그래프 추출 및 지식 그래프 기반 의미론적 추론을 제시한다. 그래프의 연결성은 직접 연결된 관계 정보뿐 아니라 간접적으로 관련된 개체들을 통해 개념이 연결되어 문서 간의 잠재적인 숨겨진 관계를 드러낼 수 있다. 본 논문은 간접적인 관계 정보의 추출을 통해 새로운 의미 정보, 관계 정보를 추론하는 데 나아가는 연구의 방향성을 제시한다.

Economic knowledge includes all analytics, data mining, data visualization, data tools, modeling, and infrastructure that help organizations make more data-driven decisions. In a rapidly changing society, solutions can be presented in a more scientific way. In this paper, we propose a relationship-based BERT model that can learn and predict keyword(entity) extraction systems and relationship information from the text of an economics paper. We present knowledge graph extraction and knowledge graphbased semantic inference after experimental validation of the relationship-based BERT model. The connectivity of graphs can reveal potential hidden relationships between documents by linking concepts through indirectly related objects as well as directly linked relationship information. This paper presents the direction of research moving forward to infer new semantic information and relational information through the extraction of indirect relational information.

2

인터넷 웹사이트는 현재 가장 보편적인 정보전달 채널이자 매체이다. 인터넷 웹사이트는 변경이나 소멸이 쉬운 휘발 적 성격을 가지므로 기록화는 매우 중요하다. 공공부문의 웹사이트 기록화는 2010년 「공공기록물관리법시행령」 개정 시‘전자기록물’의 범위에 ‘웹기록물’이 규정되면서 공식화됐다. 국내 공공부문 웹아카이빙은 직접 이관과 원격 수집 방식을 사용하고 있다. 그러나, 사용자 경험 기반의 새로운 기술이 웹사이트에 적용되면서 웹페이지 원격 수집 품질에 부정적인 영향을 주고 있다. 이 연구는 원격 수집 방식으로 공공부문 웹사이트를 웹기록물로 보존할 수 있도 록 공공부문 웹사이트 구축 및 운영 담당자가 기술적으로 고려해야 할 내용을 구체적으로 다루었다. 특히, 현재 운 영 중인 51개 중앙행정기관 웹사이트의 기술 특성을 분석하여 원격 수집 품질향상 방안을 위해 공공부문 웹사이트 가 갖추어야 할 원격 수집 친화적인 기술적 준수사항을 제시하고 필요하다고 판단되는 정책을 제언하였다.

Internet websites are now the most common channel and medium of information delivery. Internet websites are volatile, and the information can be easily changed or destroyed, so record-keeping is very important. In the case of the revision of the「Enforcement Decree of the Public Records Management Act」in 2010, 'Web records' were defined in the scope of 'Electronic records', and website archiving in public sector became official. Web archiving in the public sector in Korea uses direct transfer and web crawling methods. Meanwhile, the widespread of new user experience-based technologies is negatively impacting the quality of the crawling of webpage. This study specifically deals with the matters that the development and operation officer of a public sector website should consider so that the public sector website information can be sufficiently collected by the crawling method for web records management. By empirically analyzing the technical characteristics of the websites of 51 central administrative agencies currently in operation, a suggestion was derived to improve the quality of the web crawling. This study aimed to present crawler-friendly technical information necessary for constructing public sector websites.

3

순위다중패턴매칭문제는 길이가 n인 텍스트 T와 패턴들의 집합 가 주어졌을 때, 에 속한 패턴들과 순위동형인 의 모든 부분문자열들을 찾는 문제이다. 개의 연속적인 문자인 -그램, 에서 가장 짧은 패턴의 길이를 , 가장 긴 패턴의 길이를 , 모든 패턴들의 길이의 합을 이라 할 때, -그램과 계승수체계를 이용하여 시간에 순위다중패턴매칭문제를 해결하는 알고리즘이 제시되었다. 본 논문에서는 이진인코딩된 텍스트의 핑거프린트를 이용하여 시간에 순위다중패턴매칭문제를 해결하는 알고리즘을 제시한다. 또한, 시간에 탐색 과정을 수행하는 병렬 구현 방법을 제시한다. 실험 결과, 가 커질수록 제시한 알고리즘의 기존 알고리즘보다 수행시간이 느려지지만 공간사용량은 적어졌다. 제시한 병렬 구현 방법은 기존 알고리즘보다 공간효율적이면서 수행시간은 유사하다.

순위다중패턴매칭문제는 길이가 인 텍스트 와 패턴들의 집합 가 주어졌을 때, 에 속한 패턴들과 순위동형인 의 모든 부분문자열들을 찾는 문제이다. 개의 연속적인 문자인 -그램, 에서 가장 짧은 패턴의 길이를 , 가장 긴 패턴의 길이를 , 모든 패턴들의 길이의 합을 이라 할 때, -그램과 계승수체계를 이용하여 시간에 순위다중패턴매칭문제를 해결하는 알고리즘이 제시되었다. 본 논문에서는 이진인코딩된 텍스트의 핑거프린트를 이용하여 시간에 순위다중패턴매칭문제를 해결하는 알고리즘을 제시한다. 또한, 시간에 탐색 과정을 수행하는 병렬 구현 방법을 제시한다. 실험 결과, 가 커질수록 제시한 알고리즘의 기존 알고리즘보다 수행시간이 느려지지만 공간사용량은 적어졌다. 제시한 병렬 구현 방법은 기존 알고리즘보다 공간효율적이면서 수행시간은 유사하다.

4

본 논문에서는 실시간 엣지 컴퓨팅 서비스를 위해 엣지 서버단에서 다량의 엣지 디바이스들의 데이터를 고속으로 처리하는 실시간성을 보장하고, 엣지 컴퓨팅 시스템의 효율적 운영, 최적의 자원관리 및 기능 제어를 수행할 수 있 는 시스템 소프트웨어를 설계하고, 실시간 성능을 제공할 수 있는 OpenEOE라 명명된 기본 구조를 제시하였다. 제 안 시스템 검증을 위한 성능 평가 결과, OpenEOE는 기존 리눅스 배포판인 우분투 시스템 대비, 부하없는 상황과 부하 상황에서 상대적으로 저지연 서비스를 제공할 수 있음을 확인하였다.

In this paper, for real-time edge computing service, the edge server side guarantees real-time processing of a large amount of data from edge devices at high speed, and it is a system that can perform efficient operation of edge computing systems, optimal resource management and function control. We designed the software and presented a basic structure named OpenEOE that can provide real-time performance. As a result of the performance evaluation for verification of the proposed system, it was confirmed that OpenEOE can provide relatively low-latency service under load and no load compared to the Ubuntu system, which is the existing Linux distribution.

5

본 연구에서는 진단검사 분야에 인공지능 기술을 도입하기 위해 검사를 위한 전처리 도구인 검체 분류 장비에 영상 기반의 온라인 분류를 적용하였다. 이를 위해 실제 제어 소프트웨어인 C# 프로그램에 Python으로 구현된 EfficientNet을 적용하였다. 이미지 분류 알고리즘은 PyTorch 모델을 ONNX 모델로 변환하고 파이프라인을 통 해 딥 러닝 모델을 호출하여 C# 기반 제어 프로그램에서 구현된다. 변환 후 실제 환경에서 분류를 검증하여 알고리 즘이 제대로 수행되었는지를 확인한다. 기존 PyTorch 모델은 오프라인 테스트에서는 99%의 높은 정확도를 보였 지만, 온라인 검증 시 총 500개의 검증 샘플 중 트리거 시간 오차로 인해 9개의 오차가 발생했으며, 실제 분류 오차 는 16건으로 95.91%의 분류 정확도를 보였다. 다양한 의료 환경에서 제품 수준의 높은 분류 정확도를 달성하려면 다양한 조명 조건에서 더 많은 이미지 데이터를 수집하고 학습해야 할 것으로 생각된다.

In this study, to introduce artificial intelligence technology in the field of diagnostic testing, online classification using images is applied to specimen classification equipment, which is a pre-processing tool for examination. For this purpose, EfficientNet implemented in Python was applied to the C# program, which is the actual control software. The image classification algorithm is implemented in the C# based control program by converting the PyTorch model to the ONNX model and calling the deep learning model through the pipeline. After conversion, the classification is verified in real environment to show whether the algorithm is properly performed. The existing PyTorch model showed a high accuracy of 99% in the offline test, but during onlie verification, 9 errors occurred due to trigger time error among a total of 500 verification samples, and the actual classification error are 16 cases, showing the classification accuracy of 95.91%. In order to achieve product-level high classification accuracy in various medical environments, it is necessary to collect and learn more image data under varying lighting conditions.

6

본 연구에서 객체 인식 과제의 대상으로 선정한 빗속의 사람 그림은 내담자의 스트레스와 스트레스 대처 행동을 반 영하는 검사이다. Lack의 빗속의 사람 그림 채점 기준에 따르면 비, 웅덩이 등 16개 항목은 스트레스 요인으로 분 류되고 우산, 우비 등 19개 항목은 대처 자원으로 분류된다. 본 연구에서는 총 700장의 빗속의 사람 그림 이미지 중 560장을 트레이닝 셋으로, 30장을 밸리데이션 셋으로, 110장을 테스트 셋으로 구성한 데이터셋으로 객체 인식 모델을 시도하였다. 모델은 one-stage detector인 Dynamic Head를 채택하여 대규모 컴퓨터 비전 벤치마크 데 이터셋 (MS COCO 2017)에서 24 에폭으로 사전 훈련을 진행하였고, 빗속의 사람 그림 데이터셋을 36 에폭으로 fine-tune하였다. 모델의 mean average precision은 밸리데이션 셋에서 62.7 이었고 테스트 셋에서는 49.4 이 었다. 본 연구에서 제안한 모델은 다양한 유형의 빗속의 사람 그림 평가에 참고가 되는 비, 사람, 우산 등의 주요 객체들을 인식할 수 있었다.

Person in the rain (PITR) is an art therapy assessment method that reflects both stress and coping behaviors. According to Lack's PITR scoring criteria, 16 items such as rain and puddles are classified as stressors, and 19 items such as umbrellas and raincoats are classified as coping resources. This study used PITR for object detection with a total of 700 images of the dataset consisting of 560 images for training, 30 for validation, and 110 for testing. The object detection model suggested here adopts a one-stage object detection architecture called Dynamic Head (i.e., Dyhead). After pre-training the model on a large computer vision benchmark dataset (MS COCO 2017) for 24 epochs, it was fine-tuned for another 36 epochs using the PITR dataset, with a mean average precision of 62.7 on the validation set and 49.4 on the test set. The proposed model can detect key objects such as rain, person, and umbrella for the PITR test from various image styles.

7

다양한 분야에서 시계열 데이터의 중요성이 증가하면서 미래의 시계열 데이터를 정확하게 예측하는 것이 중요한 문 제로 대두되고 있다. 시계열 데이터 예측 분야에서는 오랫동안 LSTM 기반 모델을 사용했지만, 최근에는 트랜스포 머 모델이 주목받기 시작했다. 하지만 트랜스포머 모델 구조는 시계열의 순차적인 특성을 보존하는 능력이 약하다는 한계를 가진다. 본 논문에서는 이것을 해결하기 위해 3D 컨볼루션 네트워크와 Transformer를 결합한 구조의 3DCformer를 제안한다. 3DCformer의 인코더는 dilated 컨볼루션을 사용하여 입력 데이터의 순차적인 특성을 강화한 뒤 2D 입력 데이터를 3D로 확장한다. 그 후 3D 컨볼루션 네트워크를 통해 확장된 특성에서 표현을 추출한 다. 3DCformer의 디코더는 인코더에서 추출한 짧은 기간과 긴 기간의 시계열 데이터의 표현을 효율적으로 결합 및 학습하는 구조로 설계한다. 광범위한 실험을 통해 3DCformer가 기존 State-Of-The-Art 모델에 비해 16.18% 낮은 MAE와 24.53% 낮은 MSE를 달성함을 보인다.

As the importance of time-series data increases in many industrial fields, the problem of time-series forecasting is becoming crucial. For time-series forecasting, Transformer-based models have recently received much attention in place of traditional LSTM-based models. However, Transformer-based models have a limitation in their weak ability to preserve sequential features of time-series. To address this problem, we propose a novel Transformer-based forecasting model, called 3DCformer, which combines a 3D convolution network and Transformer. The 3DCformer encoder uses dilated convolution to capture sequential features from time-series and then expands 2D time-series to 3D. The 3D convolution network then extracts representations from the extended 3D data. The 3DCformer decoder is designed to efficiently combines and learns representations of both short-term and long-term features extracted from the encoder. Through extensive experiments, we show that our proposed 3DCformer achieves 16.18% lower MAE and 24.53% lower MSE compared to the existing State-Of-The-Art models.

8

운영체제의 상태를 조작하는 커널 레벨의 악성코드는 시스템 보안에 심각한 위협이 된다. 이러한 공격이 클라우드 환경의 가상머신을 대상으로 발생하면 전체 가상화 인프라가 손상될 수 있기 때문에 가상머신 커널을 보호하는 것은 클라우드에서 중요한 보안 과제이다. 가상화 환경에서 가상머신 보호를 위한 접근방식으로 VMI(Virtual Machine Introspection)가 제안되어왔다. VMI를 통해 호스트 수준에서 가상머신의 상태를 투명하게 모니터링할 수 있다. 그러나 VMI를 활용한 기존 연구는 클라우드 환경 적용에 대한 확장성 문제를 가지고 있다. 또는 기존 VMI의 메모 리 덤프 방식으로 인한 시간 오버헤드로 검증의 실시간성을 제공하지 못하며 가상머신 성능저하를 유발한다는 한계 점이 있다. 본 논문에서는 클라우드에 적용 가능한 VMI 기반의 라이브 가상머신 리눅스 커널 런타임 보호 시스템인 Live Linux Kernel Protection(LLKP)를 제안한다. 호스트의 커널을 수정하지 않고 유저 레벨에서 동작하며 단 일 커널 버전에 대한 하나의 해시 데이터베이스를 생성하여 다수의 가상머신 무결성 검사를 효율적으로 수행한다. 또한, VMI의 시간 오버헤드를 최소화하기 위해 인-메모리 방식의 메모리 부분 덤프를 수행한다. 제안하는 시스템 의 실용성을 검증하기 위해 보안성과 성능 실험을 수행하였다. 실험 결과, 커널 변조가 발생했을 때 평균 58.48ms 인 짧은 시간 내에 탐지했으며, 가상머신 벤치마크는 평균 8.08%의 성능저하가 발생했다. 본 논문에서 제안하는 VMI 기반의 클라우드 환경의 가상머신 리눅스 커널 런타임 보호 시스템으로 가상머신의 보안성을 향상할 수 있다.

Malicious code at the kernel level that manipulates the state of the operating system is a serious threat to system security. Such attacks can cause a wider range of damage in a cloud environment. An attacker can consider a virtual machine(VM) as a target, damaging the entire virtualization infrastructure. Therefore, protecting the guest operating system from such attacks is an important security challenge in the cloud. Virtual Machine Introspection(VMI) based approach has been proposed to protect VM. VMI enables transparent monitoring of VMs at the host level. However, existing studies using VMI have a scalability problem for the introduction of cloud environments. Otherwise, due to the time overhead caused by the existing VMI memory dump method, there is a limitation in that it does not provide real-time verification and causes performance degradation of VM. In this paper, we propose Live Linux Kernel Protection(LLKP), a VMI-based virtual machine Linux kernel runtime protection system applicable to real-world cloud environments. It operates at the user level without modifying the host's kernel and efficiently performs multiple VM integrity checks by creating a single hash database for a single kernel version operating system. In addition, in-memory manner of integrity measurements is performed to minimize the performance overhead of VMI. Security and performance experiments were conducted to verify the practicality of the proposed system. Experiments show that when kernel modification occurred, it was detected quickly within an average of 58.48 ms, and VM benchmarks experienced performance loss of 8.08%. The security of VMs can be improved with the LLKP in a VMI-based cloud environment proposed in this paper.

9

스파이킹 신경망(SNN)은 효율적인 시간 처리와 에너지 소비로 기존 인공 신경망(ANN)의 잠재적인 대안으로 부 상했다. 그러나 심층 SNN을 학습하는 데 어려움이 있어 적용 가능성이 제한된다. 개선된 학습 알고리즘 제공 및 SNN학습을 가능하게 하는 프레임워크 개발에 대한 중요성이 확대되고 있다. 본 논문에서는 기계 학습 응용 프로그 램을 향상시키기 위해 그라디언트 기반 학습을 지원하는 기존 SNN 프레임워크를 활용하여 다양한 실험을 진행한 다. 각 프레임워크를 SNN을 학습한 후, 최종 Top-1 accuracy, time efficiency를 비교 분석한다.

Spiking Neural Networks (SNNs) have emerged as a potential alternative to traditional artificial neural networks (ANNs) because of their temporal processing capabilities and low energy consumption. However, the difficulties in training deep SNNs have limited their applicability. Thus, improving learning algorithms and the frameworks that implement them is one of the primary research focuses in the SNN field. This paper surveys SNN frameworks that specifically support gradientbased learning to enhance machine learning applications. A comparison of the different libraries is described with experimental analysis.

10

본 논문은 차량 사이의 텍스트 메시지 교환을 위한 단거리 광 카메라 통신시스템 시연결과를 제시한다. 텍스트 메시 지 전송을 위한 송신기로 저전력 적외선 LED 배열을 사용한다. 송신기의 배열형 LED는 송신 문자에 따라 패턴이 변화하고, 수신기에서 해당 LED배열의 패턴이 영상으로 수신된다. 수신기로 시중의 상보성 금속산화물반도체 (CMOS)로 구성된 이미지 센서에 기반한 USB 웹 카메라를 사용한다. USB 웹 카메라를 송신기의 LED패턴을 수 신하고 수신된 영상은 PC에서 처리되어 원본 텍스트 메시지를 복원하게 된다. 디코딩 과정은 Python에서 OpenCV를 활용하여 구현된다. 실험 결과에 따르면, 제안된 광카메라통신시스템은 5미터 거리에서 초당 10개의 문자 전송률로 동작할 경우, 1.6%의 프레임 에러율로 데이터를 복원할 수 있다.

This paper presents a demonstration of an short-range optical camera communication(OCC) system for vehicle-to-vehicle(V2V) text message exchange. The transmitter uses an array of low-power infrared(IR) light-emitting diodes(LEDs) to transmit text messages. The lighting patterns in the transmitter LED array vary with different characters, which are detected as different images at the receiver. The receiver is a commercial complementary metal oxide semiconductor(CMOS)-based USB web camera. The USB web camera receives the pattern of the transmitter LEDs and the received images are processed in PC to recover original text messages. The decoding process is implemented using OpenCV with Python. According to the experiment results, the data can be retrieved with 1.6 % frame error rate in a range up to 5 m at a data rate of 10 characters per second.

11

피부질환 진단을 위한 딥러닝 모델은 주로 고해상도 더모스코프 영상에 기반하여 발전되어 온 반면, 저해상도 임상 피부영상도 저가형 인공지능 기반 의료기기에 활용될만한 가치가 있다. 트랜스포머는 영역간 유사한 패턴을 보이는 피부 텍스처의 복원에 적합한 반면, 최근 제안된 트랜스포머 기반 초해상화 모델인 ESRT는 임상피부영상의 초해상 화에 만족할만한 지각적 성능을 보이지 않는다. 본 논문에서는 저해상도 임상피부영상에서 더모스코프 수준의 고해 상도 피부영상을 복원하기 위한 ESRT의 확장 모델을 제안한다. 제안된 모델은 ESRT를 백본으로 하되 트랜스포머 백본과 합성곱 신경망 백본을 기존의 직렬 대신 병렬 구조로 재구성하여 피부 병변 텍스쳐의 특징을 효율적으로 학 습한다. 또한 지각적 손실함수를 적용하여 미세한 텍스쳐의 질감도와 지각적 품질을 향상시킬 수 있다. 다른 대표적 인 초해상화 모델과의 성능비교 실험결과, 제안된 모델이 초해상화 피부영상의 지각적 품질을 향상시키는데 효과적 임을 보여준다.

Deep learning models for skin cancer detection have made a great progress based on high-resolution dermoscopic images, while low-resolution clinical skin images are also valuable to be exploited for low-cost AI-based medical devices. Transformer may be appropriate for reconstructing skin textures where a similar pattern can be easily found even between distant regions, but the efficient super resolution transformer (ESRT) model does not exhibit acceptable perceptual quality in super resolution of clinical skin images. In this paper, we propose an extension of ESRT as a super resolution approach to reconstructing dermoscopy-level high-resolution skin images from low-resolution clinical skin images. In the propose model, the transformer backbone and the convolutional neural network backbone are connected in parallel rather than in series by changing the existing architecture to learn the features of skin lesion texture efficiently. Moreover, the perceptual loss is employed to enhance the perceptual quality of fine textures. We show that the proposed model effectively improves the perceptual quality of super resolution skin images compared to other existing models.

12

유동적인 사용자와 방대한 자료간의 효율적인 접근제어를 위하여 RBAC 시스템을 많이 이용하고 있다. RBAC의 특징은 사용자의 역할에 따라서 접근할 수 있는 정보의 권한이 부여되고, 사용자는 접근권한을 부여받은 정보에만 접근을 허용한다. RBAC 환경에서 일반적으로는 정보의 접근통제가 잘 이루어지는 것처럼 보이지만 정보를 의도적 으로 오용 또는 악용할 수 있다는 문제점이 존재한다. 따라서 본 논문에서는 주성분분석을 이용하여 RBAC 접근제 어의 오용 가능성이 높은 것을 탐지할 수 있는 시스템을 제안한다.

The RBAC system is widely used for efficient access control between flexible users and massive data. The characteristic of RBAC is that the information to be accessed is granted according to the user's role, and the user is allowed access only to the information for which he or she has been granted access. In the RBAC environment, information access control seems to be generally well done, but there is a problem that information can be intentionally misused or abused. Therefore, in this paper, we propose a system that can detect a high possibility of misuse of RBAC access control using principal component analysis.

13

피부영상에서 털 제거는 자동화된 피부진단을 위한 필수적인 전처리 과정이다. 기존의 털 제거 기법은 대부분 영상 처리에 기반한 방식이었지만, 털이 많은 피부에는 성능이 크게 저하되는 문제점이 있다. 다른 접근방식으로서 심층 학습 모델에 기반한 인페인팅 기법을 고려할 수 있는데, 털이 많은 피부영상 학습 데이터의 부족으로 인하여 심층학 습 기반 털 제거 모델은 거의 보고된 바 없다. 본 논문에서는 피부영상에서 털 제거를 위한 영상 인페인팅 기법으로 서 트랜스포머 기반 심층학습 모델인 BAT-Fill의 적용성을 평가한다. BAT-Fill은 양방향 자기회귀 트랜스포머 (BAT) 기반의 거친 네트워크와 생성적 적대 신경망(GAN) 기반의 정제 네트워크로 구성되어 있다. 인페인팅은 일 반적으로 이웃 픽셀의 특징으로부터 점차적으로 채워가는 방식으로 이루어지는 반면, 가느다란 털이 많이 분포되어 있는 피부에서는 이웃 피부의 특성을 정확하게 추출하기 어렵다. 트랜스포머는 서로 다른 영역 사이의 유사성을 학 습하여 피부를 복원하는 방식으로서, 전역적인 피부 특징으로부터 지역적인 피부 특성을 정확하게 복원하는 것을 가 능하게 한다. 모델에 대한 성능 평가 결과, BAT-Fill이 기존 방법에 비해서 PSNR 및 SSIM에서는 유의미한 차이 가 없었으나 FID에서는 피부영상 털 제거에서 실감성과 인지적 품질이 향상되었음을 보여준다.

Hair removal in skin images is the essential preprocessing task for automatized skin cancer detection. Most existing methods for hair removal are based on image processing, but their performance tends to be significantly degraded in hairy skin images. As an alternative, an image inpainting approach based on deep learning can be taken into account, while few deep learning models for hair removal have been reported due to the lack of datasets. In this paper, we evaluate the applicability of BAT-Fill which is a transformer-based deep learning model as an image inpainting method for hair removal in skin images. BAT-Fill consists of not only the coarse network based on bidirectional autoregressive transformers but also the refinement network based on generative adversarial network (GAN). While a typical process of image inpainting is to progressively fill the inner hidden block using the properties of neighbor pixels, it is challenging to accurately extract the skin properties of neighbor pixels when hairs are largely distributed. The transformer is a solution for reconstructing the skin texture by learning the similarity of pixel properties between two distant areas, where local skin textures can be accurately predicted using global skin properties. The model assessment shows that BAT-Fill is effective to enhance the perceptual quality of the hair-removed image as it exhibits significant improvement in FID although it does not in PSNR and SSIM.

14

본 논문에서는 무인 지상 차량(UGV)이 야지 조건에서 주행할 수 있는 영역을 탐지하는 방법을 제안한다. UGV는 일반 차량이 주행하는 포장도로가 아닌 산이나 들판과 같은 야지에서 주행이 가능한 지역을 판단하는 것이 중요하 다. 이를 위해 우선 3D 레이저 스캐너를 사용하여 주행 환경을 거리 이미지 형태로 변환한다. 이를 활용하여 한 프 레임에 수백만 개가 계측되는 레이저 스캐너의 데이터를 2차원 이미지로 빠르게 처리한다. 거리 이미지를 사용하여 주행 차량의 진행 방향뿐만 아니라 좌우 경사의 기울기를 고려하여 주행이 가능한 영역을 탐지한다. 또한 거리 이미 지에서 인접한 픽셀 사이의 각도 차이를 이용하여 각도 이미지를 만들고 이에 스무딩 방법을 적용한다. 이를 통해 차량이 존재하는 위치에서부터 탐색을 시작하여 현재 위치와 유사한 노면의 기울기를 가진 영역을 검사한다. 이를 통해 최종적으로 야지의 조건에서 UGV가 주행이 가능한 영역을 판단하는 알고리즘을 제안한다. 그리고 제안한 방 법의 우수성을 검증하기 위해 실제로 야지를 주행하여 실제 데이터를 수집하고 이를 기반으로 제안한 방법과 기존 방법과의 비교를 진행한다.

In this paper, I propose a traversable region detection method by which an unmanned ground vehicle(UGV) can drive in an off-road condition. It is necessary for UGVs to determine traversable regions when travelling in off-road conditions such as mountains or fields, as opposed to driving on a paved road. To this end, a 3D laser scanner is used to measure the surrounding environment accurately. To process a number of point clouds from a 3D laser scanner efficiently, I propose a range image based traversable region detection approach. In addition, by proposing a traversable detection algorithm that considers not only the traveling direction of the vehicle but also the slope of the left and right slopes, it limits robust performance in various rough terrain conditions. In order to verify the superiority of this method, actual data is collected by driving on rough terrain, and based on this, the proposed method and the existing method are compared.

 
페이지 저장