Earticle

현재 위치 Home

Issues

한국차세대컴퓨팅학회 논문지 [THE JOURNAL OF KOREAN INSTITUTE OF NEXT GENERATION COMPUTING]

간행물 정보
  • 자료유형
    학술지
  • 발행기관
    한국차세대컴퓨팅학회 [Korean Institute of Next Generation Computing]
  • pISSN
    1975-681X
  • 간기
    격월간
  • 수록기간
    2005 ~ 2026
  • 등재여부
    KCI 등재
  • 주제분류
    공학 > 컴퓨터학
  • 십진분류
    KDC 566 DDC 004
Vol.19 No.1 (10건)
No
1

본 연구에서는 복부 CT 영상으로부터 신장과 신장에서 발생한 종양을 U-Net 기반의 컨볼루션 신경망으로 자동으 로 분할하는 방법을 제안한다. 본 논문에서 제안하는 모델은 3차원으로 촬영된 영상의 시멘틱 분할을 위하여 Encoder-Decoder 구조의 컨볼루션 신경망 구조를 활용하며, 여러 방식의 skip connection을 활용하여 구성하고 비교했다. 아울러 의료 영상 분할에서 자주 나타나는 학습 과정 중 클래스 불균형 문제를 해결하기 위한 손실 함수 를 제시한다. 신장 및 신장 내의 종양에 대한 학습은 KiTS19 데이터셋을 사용했으며, 회전 변환, elastic deformation 등의 다양한 변환을 활용하여 데이터를 증강했다. 본 논문에서 제안하는 방법은 skip connection과 Dice Loss 및 Focal Loss를 활용함으로써, 이를 도입하기 전과 비교하여 최대 7.28%의 성능 향상을 보였다.

This study proposes a method for automatically segmenting kidney and kidney tumors from abdominal CT images using a U-Net-based convolutional neural network. The model proposed in this paper utilizes the convolutional neural network structure of the encoder-decoder structure for the semantic segmentation of 3D images. We built multiple models by introducing various types of skip connections and compared the models' performance. In addition, we present a loss function to solve the class imbalance problem during the learning process, which is common in medical image segmentation. We used the KiTS19 dataset to train kidneys and tumors and augmented the data by utilizing various rotations and elastic deformations. The method proposed in this paper introduces skip connections, Dice Loss, and Focal Loss to show a performance improvement of up to 7.28%.

2

클라우드 컴퓨팅 분야에서 마이그레이션 기술의 중요성이 부각되고 있다. 현재 클라우드 컴퓨팅 인프라는 AIaaS (AI as a Service)라는 패러다임 하에 클라우드 컴퓨팅의 SDI(Software-Defined Infrastructure)환경을 구축 하려는 시도가 진행되고 있다. 현재 마이그레이션을 적용 시 패턴 기반, 리소스 기반으로 수행하고자 하는 기법이 등장하고 있다. 하지만, 이와 같은 기법에 근간이 되는 마이그레이션 피처를 식별하고 이를 학습에 활용하는 연구는 미비한 실정이다. 따라서, 본 논문에서는 클라우드 컴퓨팅 마이그레이션 학습 피처들을 식별하였다. 또한, 해당 피 처를 접목하여 마이그레이션을 수행하는 아키텍처 및 프로세스를 제시하였다. 실제 마이그레이션 피처 중 일부를 기 공개된 데이터 세트를 통해 학습하고 적용하는 사례연구를 수행하였다. 제안한 모델은 클라우드 분야에서 AI 기반 의 마이그레이션을 수행 시 학습 적용을 위한 피처 모델로 활용 가능할 것이다.

In the cloud computing field, cloud migration is recognized as important technology. Currently, cloud computing infrastructure is attempting to build an SDI(Software-Defined Infrastructure) environment based on the paradigm called AIaaS(AI-as-a-Service). Furthermore, when applying migration, a pattern-based or resource-based method is emerging. However, research on identifying migration features that are the basis of such methods and using them for learning is insufficient. Therefore, in this paper, we identified migration features for cloud computing. In addition, the architecture and process for performing migration by adapting the identified features are presented. A case study of learning and applying some of the migration features from a previously published data set was conducted. The proposed model will be applicable as a base feature model for learning when performing AI-based migration in the cloud computing field.

3

비디오에서 행동의 위치를 추정하기 위해 행동의 시작과 끝에 모두 주석을 다는 것은 많은 비용을 요구한다. 따라서 주석 생성 비용을 줄이기 위해 비디오 단위의 행동 카테고리만 존재하는 약지도 학습이 활발히 진행되고 있지만 약 지도 학습은 행동단위 주석의 부재에 따른 많은 한계가 존재한다. 최근에는 주석의 생성 비용은 줄이면서 약지도 학 습에 비해 훨씬 개선된 성능을 낼 수 있는 포인트 주석 기반 약지도 학습에 대한 연구가 진행되고 있다. 하지만 이는 행동구간 내의 포인트가 존재하는 위치에 많이 의존한다는 한계가 있다. 본 연구진은 이런 점을 보완하고자, 행동구 간을 나타낼 수 있는 확률분포를 설계하고 포인트 주석을 샘플링하여 학습이 진행됨에 따라 점차 포인트 주석을 행 동구간의 가운데 방향으로 움직일 수 있게끔 하는 포인트 업데이트 방식을 제안한다. 실험은 제안하는 방법이 기존 의 포인트 주석 기반 학습에서 치우친 포인트가 주어진 경우 성능의 한계를 개선함을 보여준다.

Labeling the starting and ending points of interesting actions in a video is labor-intensive and expensive. To reduce the labeling costs, many studies have been conducted on weakly supervised learning, where only video-level action labels exist, but it has limitations due to the absence of frame-level annotations. Recently, research has been conducted on point annotation-based learning, which can achieve much improved performance while reducing labeling costs. However, this has a limitation in that the performance depends the location of annotated points in the action interval. To compensate for this, we design a probability distribution that can represent action intervals, which allows us to sample point annotations and update them to gradually move point annotations toward the center of action intervals as learning progresses. Experiments show that the proposed method improves the performance limitation given biased points in a point annotation-based learning scheme.

4

실내측위시스템은 점차 증가하는 수요에 따라 관련 연구가 활발히 진행되고 있다. 하지만 많은 연구들에서 이용되는 실내지도는 실내 환경에 따라, 혹은 측위에 이용되는 기술과 기법에 맞추어 수동적으로 작성된다. 그렇기 때문에, 실내 환경에 변화가 생기거나 대상 건물이 바뀌는 경우에는 실내 지도를 직접 다시 작성해야하는 번거로움이 있다. 이를 위하여 추가적인 현장 조사 역시 필요로 한다. 또한, 무선통신을 이용하는 방식들은 신호의 강도와 방향만을 토대로 수신 위치를 추정하므로 건물의 특징이 반영되지 않아, 그 추정 결과에 대한 정확성을 판별하기 어려운 문제 점이 있다. 본 논문에서는 다목적 실내탐색을 위하여 전자 건축도면으로부터 건물의 구조에 대한 정보를 추출하여 실내구조가 반영된 데이터구조를 자동으로 형성하는 방법을 소개한다.

With the increasing demand for indoor positioning system, related research is now being actively conducted. However, indoor maps used in these studies are manually written according to the indoor environment or the techniques used for positioning. Therefore, when the indoor environment or the target building changes, there could be an inconvenience of having to rewrite the indoor map. And the additional site survey is also required. In addition, methods using wireless communication estimate the reception location based only on the strength and direction of the signal, so the characteristics of the building are not reflected. Therefore, there is a problem that it is difficult to determine the accuracy of the estimation result. In this paper, we introduces a method of automatically generating a data structure reflecting the indoor structure by extracting information on an electronic architectural drawing for multi-purpose indoor search.

5

가상현실 기술의 발전에 따라 다양한 종류의 교육/훈련 시뮬레이션들이 개발되고 있다. 이러한 시뮬레이션에서 중요 한 기술은 외력에 의해 대상물체를 변형하는 것이다. 여기서는 단단한 물체의 일부가 깎이는 변형을 실시간에 처리할 수 있는 방법을 다루고자 한다. 이 논문에서는 2단계 복셀화(voxelization)와 적응형 리메싱(remeshing)을 이용한 기하모델 변형 기법을 제안한다. 먼저 대상 메쉬를 고해상도로 복셀화하고 생성된 볼륨 데이터를 압축한다. 외력에 의해 모델의 일부가 절단되거나 연마되면 이것을 직접 메쉬에 적용하는 대신 변환된 볼륨 데이터에 반영하여 해당 복 셀(voxel)을 수정한다. 이후 Marching Cubes 알고리즘을 통하여 메쉬를 다시 추출하고 라플라시안 스무딩 (Laplacian smoothing)을 통해 표면을 부드럽게 한다. 기존 Marching Cubes 알고리즘 및 라플라시안 스무딩 알 고리즘은 처리속도가 느리기 때문에 실시간 변형처리가 어렵다. 이를 해결하기 위해 전체 메쉬에 대해 리메싱하는 것 이 아니라 변형된 부분에 대해서만 리메싱을 적용함으로써 실시간 메쉬 생성이 가능하도록 했다. 이 방법의 유효성을 확인하기 위해 치과 수술 시뮬레이션에 이 방법을 적용하여 치아의 일부를 깎아내는 시술이 가능함을 확인하였다.

With the development of virtual reality technology, various types of education/training simulations are being developed. An important technique in these simulations is to deform the object by an external force. Here, we will discuss how to process the deformation of a part of a solid object in real time. In this paper, we propose a geometric model transformation technique using two-step voxelization and adaptive remeshing. First, the target mesh is voxelized at high resolution and the generated volume data is compressed. If a part of the model is cut or polished by an external force, the corresponding voxel is modified by reflecting it in the converted volume data instead of directly applying it to the mesh. Then, the mesh is extracted again through the marching cube algorithm and the surface is smoothed through Laplacian smoothing. Existing marching cube algorithms and Laplacian smoothing algorithms have slow processing speeds, so real-time transformation processing is difficult. To solve this problem, real-time mesh creation was made possible by applying remeshing only to the deformed part instead of remeshing the entire mesh. In order to confirm the effectiveness of this method, it was confirmed that it is possible to shave part of the teeth by applying this method to dental surgery simulation.

6

최근 OTT 서비스 제공자 및 콘텐츠가 급격히 증가함에 따라, 사용자에게 콘텐츠를 추천하는 기술이 많이 연구되고 있다. 그러나 콘텐츠 추천 기술과 관련된 특허 분석 연구는 거의 이루어지지 않았다. 본 논문에서는 콘텐츠 추천 효율 향상을 위하여 OTT 서비스를 선도하는 넷플릭스가 보유하고 있는 특허 중에서 콘텐츠 추천과 관련된 특허를 분석하 였다. 2022년 6월 30일까지 넷플릭스가 미국에 출원하여 공개된 특허는 모두 431건이며, 그 중에서 콘텐츠 추천과 관련된 특허는 36건이었다. 콘텐츠 추천으로 선별된 36건의 특허를 평가 추정 및 추천 알고리즘 개선, 콘텐츠 아이 템 및 장르추천, 선호 콘텐츠 디스플레이 및 장면 표시, 기타 콘텐츠 추천 기술로 분류하였고, 각 기술 분야 별로 콘 텐츠 추천 관련 특허 기술을 분석하였다. 그리고 이를 토대로 콘텐츠 기술 분야에서 필요한 연구를 제언하였다.

With the rapid growth of OTT service providers and content in recent years, there has been a lot of research on techniques to recommend content to users. However, there have been few studies analyzing patents related to content recommendation technologies. In this paper, we analyze patents related to content recommendation among the patents held by Netflix, a leading OTT service, to improve the efficiency of content recommendation. Until June 30, 2022, a total of 431 patents were applied and published by Netflix in the United States, of which 36 patents were related to content recommendation. The 36 patents selected for content recommendation were categorized into rating estimation and recommendation algorithm improvement, content item and genre recommendation, preferred content display and scene display, and other content recommendation technologies. And the patented technologies related to content recommendation were analyzed for each technology area. Based on this, we recommend necessary research in the field of content technology.

7

최근 의미론적 세분화 작업에서 컨볼루션과 트랜스포머 기반의 다양한 딥러닝 모델이 제안되고 있다. 이러한 모델들 은 공개 벤치마크의 다양한 객체에 대해 주목할만한 성능을 보여준다. 그러나 우리는 전력선과 같이 전경과 배경의 비율이 과도하게 불균형하며 얇고 긴 객체에 대해 최신 모델조차도 분할에 실패하는 경향이 있음을 관찰한다. 본 논 문에서 우리는 전력선 인식을 위해 전력선 데이터 세트를 수집하고, 해당 데이터 세트에서 전력선 검출 실패에 대한 다음의 세 가지 원인이 있음을 발견한다. 1) 레이블링 작업의 어려움, 2) 대규모 훈련 데이터 세트의 부족, 3) 극도 로 불균형한 클래스 분포. 더 나아가, 우리는 해당 문제를 해결하기 위해 전력선 인식에 대해 높은 성능을 달성하는 모델 선택에 대한 기준과 훈련 전략을 제시한다. 실험 결과 제시된 학습 전략은 인식 작업에서 기준선 모델과 비교 해 20 mIoU 이상의 성능 향상을 달성한다.

Recently, various deep learning models based on convolution and transformer have been proposed for semantic segmentation tasks. These models show remarkable performance on a variety of objects on public benchmarks. However, we observe that even state-of-the-art models tend to fail in segmentation for thin and long objects with an excessively imbalanced foreground-background ratio, such as powerlines. In this paper, we collect a powerline dataset for powerline segmentation and identify three main causes for powerline segmentation failure in the dataset. 1) difficulty in labeling tasks, 2) lack of large training datasets, 3) extremely unbalanced class distribution. Furthermore, we present criteria for model selection and training strategies that achieve high performance for powerline segmentation. Our experimental results shows that the presented training strategy achevied an improvement of over 20 mIoU in the powerline segmentation task compared to the baseline model.

8

본 논문에서는 네트워크와 저장 장치를 갖춘 TV 세트 혹은 STB과 같은 네트워크 TV들이 P2P 구조로 연결되어 추가 비용없이 자신의 자원을 서로 협력해서 공유하는 캐치업 TV 시스템을 제안한다. 이 시스템의 목표는 캐치업 TV 서비스의 우수한 품질을 유지하면서 P2P 구조를 활용하여 기존의 서버 기반의 시스템에 비해 서버의 부하를 최 대한 줄이는 것이다. 이를 위해 특정 시점에 모든 네트워크 TV들이 접속되어 있지 않더라도 서비스를 제공할 수 있 도록 데이터를 중복해서 분산 저장한다. 동일한 가용성을 제공할 때 복제 기법에 비해 요구되는 저장 공간이 훨씬 적은 이레이져 코딩을 활용하여 저장 공간 효율성은 높인다. 실험을 통해 데이터 중복도와 네트워크 TV 가용성에 따라 제안하는 시스템의 성능을 분석하고 기존 서버만 사용하는 시스템에 비해 P2P 구조를 활용함으로써 서버 부 하를 크게 줄인다는 것을 보인다.

In this paper, we propose a catch-up TV system in which networked TVs such as TV sets or STBs equipped with a network and storage devices are connected in a P2P structure to cooperatively share their resources without additional costs. The goal of our proposed system is to reduce the load of the servers as much as possible compared to the existing server-based systems by utilizing the P2P structure while maintaining the good quality of the catch-up TV service. To this end, we redundantly distribute and store program data so that we can provide the service even if all networked TVs are not connected at a specific time. We increase the efficiency of storage space by employing erasure coding techniques, which requires much less storage space than replication techniques when providing the same availability. Through extensive experiments, we analyzes the performance of our proposed system according to data redundancy and networked TV availability, and show that it reduces server load significantly by utilizing the P2P structure, compared to the conventional systems using only servers.

9

대량의 데이터를 실시간으로 처리하는 스트리밍 처리에서는 데이터가 발생한 순서에 따라 처리하는 것이 중요하다. 그러나 데이터 스트림은 다양한 원인으로 인해 입력 순서가 뒤바뀔 수 있으며, 이런 무질서 데이터는 데이터 처리 시간을 지연시키거나, 처리 정확도를 떨어트리는 문제를 초래한다. 본 논문에서는 무질서 데이터 처리결과의 정확성 을 높이면서 이로 인해 발생하는 데이터 처리 지연을 줄일 수 있는 데이터 스트림 분리 처리 방법인 DSSP(Data Stream Split Processing) 모델을 제안한다. DSSP 모델은 지연 데이터로 인한 전체 처리시간의 지연을 방지하 기 위해 입력 데이터 스트림을 처리시간 내에 입력되는 정상 데이터 스트림과 처리시간 내에 입력되지 못한 지연 데 이터 스트림으로 분리하여 처리한다. 정상적으로 입력된 데이터는 처리결과를 우선 신속히 제공하고, 지연 입력된 데이터는 별도로 저장하였다가 그 처리결과를 추가로 반영하여 데이터의 정확성을 보장할 수 있도록 한다. 본 논문 에서는 DSSP 시스템의 실험적 구현을 통해 그 효율과 성능을 분석한다.

It is crucial to process the data stream in event-time ordering when real-time processing a great amount of data. Data stream however, through various causes may create disorientation of the input order. These out-of-order data may induce data latency and reduce the correctness of the result. We propose a one such approach, a DSSP(Data Stream Split Processing) model that can reduce the latency of the data processing while increasing the accuracy of out-of-order data process results. To prevent the delay of response time caused by late data, our DSSP model splits input data stream into normal data stream that arrives on time and late data stream that does not. This model provides the result of normal data stream first, then applies the late data result that has been separately cached to assure the correctness of the data processing. We analyze the efficiency and performance of our DSSP model through experimental implementation.

10

본 연구에서는 다단으로 구성된 인터페이스에 대해서 항목을 배치하는 방법에 따른 효율성의 차이를 시선 추적을 통 해 분석한다. 화면상에 여러 항목을 표시해야 하는 경우 세로나 가로로 항목들을 나열하여 처리할 수 있으나, 표시 해야 하는 항목의 수가 늘어날 경우, 일부만을 표시한 후 화면을 스크롤 하도록 구성하거나, 다단으로 항목들을 배 치해야 한다. 이 중에서 전체 항목을 모두 한 번에 보여줘야하는 경우 다단 인터페이스가 필연적인데, 레이아웃의 종류(가로/세로로 긴 직사각형 또는 정사각형)나 배치 방향(종 또는 횡)에 따라 6가지의 형태로 사용자에게 보여줄 수 있다. 본 연구에서는 24명의 사용자를 대상으로 시선 추적기가 설치된 환경에서 랜덤하게 배치된 항목들 중에서 하나를 찾도록 하고, 이 과정에서 수행 시간, 커서의 이동, 시선의 이동, 사용자 선호도를 기록했다. 통계 분석 결 과, 배치 방향에 따른 작업 시간 및 커서와 시선 이동 방향의 차이와 레이아웃에 따른 커서 및 시선 이동 방향의 차 이를 확인할 수 있었다.

In this study, we analyze the difference in efficiency according to the item arranging methods for multi-level interfaces through eye tracking. In case of multiple items need to be displayed on the screen, one can arrange them vertically or horizontally. If the number of items exceeds screen space, one has to introduce scrolling after displaying only a part of it, or the items must be arranged in multiple columns. However, a multi-column interface is inevitable if all items must be displayed simultaneously. It can be displayed to the user in six forms depending on the aspect ratio (landscape, portrait, or square) or arrangement direction (horizontal or vertical). In this study, we recruited 24 users and asked them to find one of the randomly placed items using a system with a gaze tracker. We recorded task completion time, cursor movement, gaze movement, and user preference in the user study. Statistical analysis confirmed the difference in task completion time, cursor and gaze movement according to arrangement directions, and cursor and gaze movement according to aspect ratios.

 
페이지 저장