Earticle

현재 위치 Home

Issues

한국차세대컴퓨팅학회 논문지 [THE JOURNAL OF KOREAN INSTITUTE OF NEXT GENERATION COMPUTING]

간행물 정보
  • 자료유형
    학술지
  • 발행기관
    한국차세대컴퓨팅학회 [Korean Institute of Next Generation Computing]
  • pISSN
    1975-681X
  • 간기
    격월간
  • 수록기간
    2005 ~ 2026
  • 등재여부
    KCI 등재
  • 주제분류
    공학 > 컴퓨터학
  • 십진분류
    KDC 566 DDC 004
Vol.19 No.6 (10건)
No
1

폐렴은 폐에 고름 혹은 물이 차는 호흡기 관련 감염 질환이다. 세계적으로 폐렴은 소아 및 노인 계층에서 감염 질환 으로 인한 사망 원인 중 하나이다. 일반적으로 의료진들은 폐렴 진단을 위해 흉부 X-ray 영상을 사용한다. 그러나 폐렴은 유사한 증상을 보이는 감기와 독감으로 오진될 가능성이 높으며, 이는 심각한 합병증의 원인이 될 수 있다. 따라서, 의료진의 실수를 최소화하기 위해 대안적인 보조 진단 방법이 필요하다. 폐렴의 조기 진단을 위한 보조 도 구로 딥러닝 기술에 기반한 인공지능 시스템이 연구되고 있으나, 딥러닝이 진단 보조 도구로 확립하기 위해서는 더 많은 연구가 필요하다. 본 연구에서는 광저우 여성 아동 병원 데이터셋과 코로나19·폐렴·정상 흉부 X-ray 데이터 셋을 사용하여 Swin Transformer와 Residual Neural Network의 성능을 분석한다. 실험 결과, Swin Transformer는 흉부 X-ray 영상 데이터셋에서 98.9%의 정확도를 보이며,코로나19·폐렴·정상 흉부 X-ray 데이 터셋에서는 92.35%의 정확도를 보인다. Residual Neural Network는 두 데이터셋에서 각각 97.9%와 88.8% 의 정확도를 보인다. 이러한 결과는 폐렴 보조 진단 도구로써 Swin Transformer가 Residual Neural Network 보다 적합함을 의미한다. 그러므로, Swin Transformer는 조기 진단과 조기 치료, 환자의 건강 증진에 기여할 수 있을 것이라 기대한다.

PPneumonia is a respiratory infectious disease that causes fluids to fill the lungs. It is considered one of the leading causes of infection-related deaths in children and seniors worldwide. Clinicians usually use chest X-ray images to diagnose pneumonia. However, pneumonia is prone to be misdiagnosed because it overlaps with cold and flu, causing severe and critical medical complications. Consequently, alternative supportive diagnostic methods are needed to minimize human errors and assist clinicians. Several attempts have used artificial intelligence systems, mainly in deep learning methods, to assist clinicians in early pneumonia diagnoses. However, further studies are required to consolidate the use of deep learning as an assistant tool to diagnose pneumonia accurately. In this study, we examine the Swin Transformer and the Residual Neural Network’s performance in classifying pneumonia and healthy chest X-ray images using the Guangzhou Women and Children’s Medical Center dataset and the COVID19, Pneumonia and Normal Chest X-ray Posteroanterior dataset. The experiment results demonstrate that the Swin Transformer achieves an accuracy of 98.9% in the Chest X-ray images dataset and 92.35% in the COVID19, Pneumonia and Normal Chest X-ray Posteroanterior dataset, while the Residual Neural Network achieves an accuracy of 97.9% and 88.8% respectively in classifying pneumonia. These results indicate that the Swin Transformer outperforms the Residual Neural Network as a tool for assisting clinicians in diagnosing pneumonia. Thus, the Swin Transformer may help in early decision-making, leading to treatment initiation and improving patient's health.

2

현재 음성에서 감정 상태를 이해하기 위해 강조, 음높이 변화 및 맥락과 같은 감정적 특징을 인식하는 다양한 음성 감정인식(Speech Emotion Recognition)연구가 활성화 되고 있다. 본 논문은 음성 데이터에서 감정적 단서를 찾 기 위해 시간 영역과 주파수 영역의 다양한 특징을 추출하고 강조, 음높이 변화를 통해 감정을 인식하는 신경망 모 델을 개발하고자 한다. 부족한 데이터 셋으로 인한 과대적합을 예방하기 위해 컴퓨터 비전 분야에서 활용되는 데이 터 증강 기법을 적용하였다. 또한 음성 데이터의 전처리를 수행하고 시간 영역에서 ZCR(Zero Crossing Rate)과 RMS(Root Mean Square) 에너지 특징을 추출하였고 주파수 영역에서 MFCC(Mel-Frequency Cepstral Coefficient), 주파수 대역폭(Spectral Bandwidth), 주파수 중심(Spectral Centroid), 주파수 롤오프의 최대, 최소 값(Spectral Rolloff Max and Min) 같은 스펙트럴 특징을 추출하였다. 과거와 미래의 정보를 저장할 수 있 어 불연속적인 음성 데이터의 과거와 미래의 정보를 효과적으로 학습할 수 있는 양방향 LSTM 신경망 모델을 제안 하였으며, 8가지 감정표현(중립, 차분함, 행복, 슬픔, 분노, 두려움, 혐오, 놀람)이 포함되어 있는 RAVDESS와 7 가지 감정표현(중립, 행복, 슬픔, 분노, 두려움, 혐오, 놀람)이 포함되어 있는 TESS 데이터 셋에 대하여 각각 99.21%, 98.24%의 정확도를 확인하였다. 향후 연구에서는 음성 감정 인식 분야의 주요 어려움 중 하나인 적은 데이터 셋 문제를 메타러닝 기법을 활용하여 해결할 계획이다.

Currently, various studies are actively underway to understand emotional states in speech, recognizing emotional features such as emphasis, pitch changes, and context. This paper aims to develop a neural network model that extracts various features from the time and frequency domains in speech data and recognizes emotions through emphasis and pitch changes. To prevent underfitting and overfitting due to limited datasets, data augmentation techniques commonly used in computer vision were applied. Additionally, preprocessing of the speech data was performed and the time domain features such as Zero Crossing Rate(ZCR) and Root Mean Square(RMS) energy were extracted. Similarly, the frequency domain spectral features such as Mel-frequency cepstral coefficients(MFCCs), Spectral Bandwidth, Spectral Centroid, and Spectral Rolloff Max and Min were extracted. To effectively handle discontinuous speech data by storing past and future information, a bidirectional LSTM model was proposed. On the RAVDESS dataset, which includes eight types of emotional expressions(neutral, calm, happy, sad, angry, fearful, disgusted, surprised), and the TESS dataset, which includes seven types of emotional expressions(neutral, happy, sad, angry, fearful, disgusted, surprised), we confirmed accuracies of 99.21% and 98.24%, respectively. In future research, we plan to address one of the major challenges in the field of speech emotion recognition, the scarcity of datasets, by utilizing meta-learning techniques.

3

VTK.js는 의료영상 데이터를 웹 기반으로 가시화하는 라이브러리로 널리 사용된다. 그러나 그 기능이 기존 C언어 기반의 VTK에 비해 제한적이며, 영상 처리 기능은 CPU를 사용하는 자바스크립트로 작성되었기 때문에 수행 성능 이 느리다는 한계가 있다. 따라서 사용자는 다양한 기능의 추가 구현에 어려움을 느낀다. 본 논문은 웹 어셈블리 (Web Assembly)를 활용하여 VTK.js의 기능을 확장하며, 네이티브 언어 수준의 속도로 CPU 연산을 수행할 수 있 음을 보인다. 그 사례로서 고품질의 음영을 생성하는 볼륨 가시화 기법인 환경광 폐색을 증분 알고리즘과 Web Assembly를 이용하여 구현하였다. 전처리로 생성되는 환경광 분석은 웹 어셈블리를 이용한 CPU에서 수행되며, 그 결과를 이용한 가시화는 GPU에서 수행된다. 본 연구는 해당 기법을 VTK.js에서 제공하는 기능인 셰이더 프로그램 에 통합하므로 환경광 폐색의 고속 사전 계산과 실시간 가시화가 가능하다. 본 연구를 통해 VTK.js 기반의 응용 프 로그램에서 새로운 영상 기능을 웹 어셈블리를 이용하여 빠른 속도로 확장하고 가시화할 수 있는 가능성을 보인다.

VTK.js is widely used as a web-based visualization library for medical image data. However, its functions are limited compared to the existing C-based VTK. Moreover, the image processing function using the CPU is written in JavaScript, so the performance is low. Therefore, users find it difficult to additionally implement various functions. This paper shows that CPU operation can be performed at native speed by extending the function of VTK.js using Web Assembly. As an example, the ambient occlusion, a volume visualization technique that creates high-quality shading effect, was implemented using an incremental algorithm and Web Assembly. Ambient light analysis generated by preprocessing is performed on the CPU using Web Assembly, and visualization using the result is performed on the GPU. This study integrates the technique into a shader program, a function provided by VTK.js, enabling high-speed pre-calculation and visualization of ambient occlusion. This study shows the possibility of expanding new imaging functions using Web Assembly and visualizing them with VTK.js.

4

본 논문에서는 SimilarNet을 이용한 1:1 비교 기법을 시계열 분석에 적용한 보행 상태 추정 모델을 제안한다. SimilarNet은 1:1 비교에 특화된 모델을 설계하기 위한 딥러닝 레이어이며, 이를 응용하면 시계열의 분류 등 다양 한 문제를 해결할 수 있다. 제안 모델은 SimilarNet을 이용하여 사용자의 보행 상태에 따라 분류된 센서 측정 데이 터와 현재 시점의 센서 측정 데이터를 1:1로 비교하여 사용자 보행 상태를 추정한다. 실험 결과 본 논문에서 제안하 는 모델은 동일한 임베딩 모델을 사용한 기존 분류 모델보다 44.11% 향상된 정확도와 기존 모델보다 30% 우수한 학습 성공률을 보인다.

In this paper, we propose a pedestrian walking state estimation model using SimilarNet. The SimilarNet is a deep learning layer to perform the one-to-one comparison operation and is applicable to various problems such as time-series classification. Using the SimilarNet, the proposed model estimates the user's walking state by comparing sensor measurement data classified according to the user's walking state with sensor measurement data at a specific time point. Extensive experiments show that the proposed model achieves a 44.11% improvement in accuracy and a 30% higher learning success rate compared to classification models based on the same embedding model.

5

본 논문은 클라우드 컴퓨팅 환경에서 다양한 분산 멀티미디어 서비스를 효율적으로 제공하기 위한 새로운 시맨틱 버 스 모델을 제안한다. 제안하는 시맨틱 버스 모델은 1) 계층적으로 함께 협력하는 애플리케이션과 전송 바인딩으로 구성되어 있으며, 2) 버스의 실시간 동적 적응을 지원하기 위해, 형상 제어 공간과 기능 제어 공간으로 구성된 메타 공간을 갖으며, 3) 프로파일 기반 서비스 및 자원 관리를 지원한다. 4) 또한, 제안하는 시맨틱 버스를 생성하기 위 한 인터페이스를 Backus-Naur Form 정의를 기반으로 제안하였다. 실험을 통해 제안된 시맨틱 버스 모델이 기존 의 균일 non-시맨틱 모델에 비해 향상된 처리량을 제공함을 검증하였으며, 제안된 버스 모델은 차세대 컴퓨팅 플랫 폼에서 서비스 제공 및 데이터 전송을 위한 핵심 인프라로 활용될 수 있다.

This paper proposes a new semantic bus model to efficiently provide multimedia services in a cloud computing environment. The proposed semantic bus model 1) consists of applications and transport bindings that cooperate together hierarchically; 2) has a metaspace consisting of a configuration control space and a function control space to support real-time dynamic adaptation of the bus; 3) supports profile-based service and resource management; 4) We also proposed Backus-Naur Form (BNF) defintion based interface specification that generates the proposed semantic bus models. Through experiments, it was verified that the proposed semantic bus model provides improved throughput compared to the existing non-semantic model. The proposed bus model can be used as a core infrastructure for service provision and data transmission in next-generation computing platforms.

6

감성 분석은 정보과학의 영역을 넘어 인문학이나 사회과학에서도 중요한 연구 도구로 사용되고 있다. 이러한 분야에 서는 대규모 데이터를 확보하는 것이 연구의 어려움으로 종종 나타난다. 최근 주목을 받는 생성형 인공지능은 의미 적으로 유사한 문장을 생성하여 데이터 부족 문제 해결에 대한 기회를 제공한다. 본 논문에서는 생성형 인공지능을 이용하여 데이터를 증강하고 이를 통해 감성 분석의 정확도를 개선할 수 있음을 보였다. 프롬프트를 비교하여 분류 와 예시를 제공하는 형태가 우수한 증강효과를 나타낸다는 것을 보였고, 이를 통해 증강된 모델은 기존에 비하여 평 균 22%, 최고 74%의 성능 향상을 보였다. 본 논문의 결과는 대규모 데이터 수집이 어려운 소규모 감성 분석 연구 에 유용할 것으로 기대된다.

Sentiment analysis has been used as an important research tool not only in information science but also in humanity and social science. In such fields, research is often hampered by the difficulty of collecting large-scale data. Recent generative artificial intelligence provides an opportunity to overcome this difficulty by generating sentences with similar sentiments. In this paper, we showed that generative artificial intelligence could generate proper supporting data and improve the classification performance of sentiment analysis models. Prompts with classes and examples showed the superior data augmentation, and the consequent augmented models had on average 22% and maximally 75% improvements on the prediction accuracy. The results of this study are expected to be useful for small-scale sentiment analysis where collecting large-scale data is not likely to be easily performed.

7

뇌 구조 자기공명영상 데이터로부터 알츠하이머 환자인지 아닌지 분류하는 작업은 알츠하이머 질환의 조기 발견을 위해 도움이 되는 진단 기법이고, 최근 들어 딥러닝을 이용하여 진단의 정확도를 높이는 연구가 많이 진행되고 있 다. 3차원 영상으로부터 일부 슬라이스를 추출한 후 예측 모델 학습 및 검증을 진행하는 연구가 보고되고 있다. 본 논문에서는 슬라이스 선택 방식에 따른 차이가 뇌영상 알츠하이머 질환 딥러닝 분류의 성능에 어떤 영향을 주는지 비교 분석한다. Coronal 방향의 영상에서 세가지 방식을 비교한다. 엔트로피 순으로 선택하되 슬라이스 덩어리 별 로 선택하지 않는 방식과 덩어리 별로 선택하는 방식, 그리고 그룹간 L2-norm 값이 큰 순으로 선택하되 덩어리 단 위로 선택하는 방식을 비교한다. 5-fold 교차검증을 이용하여 모델 학습 및 검증을 수행한다. 딥러닝 모델로는 이미 지넷 데이터로 사전 학습한 가중치를 갖는 4가지 딥러닝 모델과 사전 학습하지 않은 딥러닝 모델을 이용하여 학습한 다. 검증 결과 엔트로피 기반 방식이 L2-norm 차이 기반의 방식에 비해 구현이 간단하면서도, 비슷한 예측 성능을 보여주고 있다.

The classification of Alzheimer patients vs. normals based on brain structural MRI data is helpful for early diagnosis of Alzheimer’s disease. Recently, numerous research studies investigated deep learning to improve diagnostic accuracy. Several research groups proposed methods for selecting slices from the 3D MRI data and utilized the selected slices as input to model training and validation. This paper addresses the effect of slice selection methods on deep learning classifiers’ performances in predicting Alzheimer’s disease. From the coronal slice orientation, we compared three slice selection methods: Entropy-based method without chunk selection and with chunk selection, and L2-norm-based method with chuck selection. Model development and validation were performed with a five-fold cross validation. We considered four deep convolutional neural network (CNN) models pretrained with ImageNet database as well as one deep CNN model without pretraining. Our results indicate that the entropy-based slice selection method is simpler than the L2-norm-based method in its implementation, and it produces performance similar to the L2-norm-based method.

8

데이터 수량이 빠르게 증가하고 데이터 유형이 더 확장됨에 따라 일부 연구에서는 비구조화 데이터가 연간 전체 데 이터 수량의 85%를 차지하는 비율로 빠르게 증가하고 있다고 지적하였다. 일반적으로 NoSQL 데이터베이스는 키- 밸류 데이터베이스, 열 데이터베이스, 문서 데이터베이스와 그래픽 데이터베이스 네 가지 유형으로 나뉜다. 그래프 데이터베이스는 그래프로 데이터를 저장하여 그래프가 고도 유연성과 고성능에 가가까운 데이터 구조로, 대용량 정 보를 저장하고 검색하는 데 전문적으로 활용되고 있는 스토리지 엔진이다. 본 논문에서는 시장 점유율이 가장 높은 Neo4j와 Nebula Graph 데이터베이스에 대한 성능 평가를 진행한다.

With the rapid growth of data volume and further expansion of data types, some studies point out that unstructured data is rapidly increasing at a rate of 85% of the total data volume per year. Basically, there are four types of NoSQL databases: key-value databases, columnar databases, document databases and graphical databases. Graph databases use graphs to store data, and graphs are one of the closest things to a flexible, high-performance data structure. In this paper, we conduct a performance evaluation of Neo4j and Nebula Graph databases, which have the highest market share.

9

최근 이미지 분류 작업의 기술들은 잘 정제되어 있는 대규모 데이터 세트에서 강력한 성능을 보여주지만, 긴꼬리 분 포에서는 약한 모습을 보인다. 또한, 계층적 데이터 세트에 대한 연구는 제한적이다. 그러나 트리 형태의 구조로 조 직된 계층적 데이터 세트에서는 상위 클래스 정보를 추가적으로 활용할 수 있다. 본 논문에서는 계층적 특징 활용을 위해 문화유산 데이터 세트를 수집하였으며, 해당 데이터 세트에서 분류 실패의 두 가지 원인을 발견하였다. 1) 클 래스 불균형으로 인한 오 분류, 2) 상위 클래스 오 분류. 우리는 이러한 문제를 해결하기 위해 두 가지의 손실 함수 를 활용한 학습 전략을 제안한다. 유니폼 샘플링과 클래스별 유니폼 샘플링, 두 가지 샘플링 방법의 이점을 모두 가 져가기 위한 consistency 손실 함수와 상위 클래스의 특성을 위해 하위 클래스 예측에 기반한 손실 함수를 사용하 여 문화유산 데이터 세트에서 베이스라인 대비 5.4%의 성능 향상을 달성한다.

Recent techniques in image classification show strong performance on large, well-refined datasets, but are weak on long-tailed distributions. In addition, there is limited research on hierarchical datasets; however, hierarchical datasets organized in a tree-like structure can further exploit higher-level class information. In this paper, we collected a cultural heritage dataset to utilize hierarchical features, and found two causes of classification failure in the dataset. 1) misclassification due to class imbalance, and 2) superclass misclassification. To solve these problems, we propose a learning strategy utilizing two loss functions. We use a consistency loss function to take advantage of both sampling methods, uniform sampling and class-specific uniform sampling, and a loss function based on subclass prediction for the characteristics of the parent class. We achieve a performance improvement of 5.4% over baseline on a cultural heritage dataset using our proposed learning technique.

10

기후 변화의 영향으로 물 스트레스를(Water stress) 받고 있는 지역에 전 세계 인구 10%가 거주하고 있지만 전 세계 상수도 공급의 30%가 여전히 누수(leakage)로 인해 낭비되고 있으며 누수를 탐지, 관리하기 위한 기존의 기 술로는 이러한 문제를 제대로 해결하지 못하고 있다. 본 논문의 연구분야는 LTE-M 기반의 사물인터넷(IoT, Internet of Things) 센서 네트워크와 클라우드 서버로 구성되어 있는 원격 누수 관리 시스템을 통해 2020년부터 2022년까지 대구지역 WDN에서 수집된 실제 현장 센서 데이터셋 5,000 샘플을 분석하고 머신 러닝 알고리즘을 적용하여 누수를 검출하고 예측하는 시스템에 대한 것이다. 본 연구에서 사용한 지도학습기반 머신 러닝 모델은 랜덤 포레스트(Random Forest), 그래디언트 부스팅(Gradient Boosting), 로지스틱 회귀(Logistic Regression), 서 포트 벡터 머신(Support Vector Machine), 인공 신경망(Artificial Neural Network)이고 다양한 머신 러닝 알고리즘별 성능을 비교 분석하기 위해 AUROC (Area Under Rest of the Curve), F1 점수와 같은 이진분류 성능 척도를 사용하였다.

Due to the climate change, 10% of the global population resides in the regions facing water stress. Meanwhile, 30% of the global water supply is wasted through leakage. The issue is that existing technologies fall short to detect and manage. This paper focuses on the leakage detection and prediction system, constructed from the data analysis of 5,000 real-world sensor samples, collected from the WDN in Daegu region from 2020 to 2022, and the application of machine learning(ML) algorithms. The research utilizes a remote leak management system consisting of LTE-M-based IoT sensor networks and cloud servers to compile the dataset. Various ML algorithms, including Random Forest(RF), Gradient Boosting(GB), Logistic Regression(LR), Support Vector Machine(SVM), and Artificial Neural Network(ANN), are employed as supervised learning models. Performance comparison and analysis of these ML algorithms applied to the field sensor data are done by binary classification performance metrics, such as AUROC(Area Under Rest of the Curve) and F1 score.

 
페이지 저장