Earticle

현재 위치 Home 검색결과

결과 내 검색

발행연도

-

학문분야

자료유형

간행물

검색결과

검색조건
검색결과 : 1,457
No
1041

순환신경망 및 트랜스포머 구조의 다변량 시계열모델을 이용한 농업용 저수지의 저수율 예측

박재성, 이양원

[Kisti 연계] 대한원격탐사학회 대한원격탐사학회지 Vol.40 No.6 2024 pp.1149-1162

...시계열모델의 저수율 예측 능력을 비교·분석하였다. 2013년부터 2023년까지의 11년 저수율 데이터를 구축하였으며 2013년부터 2021년 데이터를 훈련데이터셋, 2022년 데이터를 검증데이터셋, 2023년 데이터를 평가데이터셋으로 분리하여 사용하였고 mean absolute error (MAE), root mean square error (RMSE), 상관계수 평가지표를 사용하여 저수율 예측 능력을 정량적으로 평가하였다. 과거 저수율만을 입력변수로 사용하는 단변량 시계열예측이 아닌 기상적 영향과 계절적 영향을 입력변수로 반영한 다변량 시계열예측을 사용하였으며, 본 연구에서 사용한 트랜스포머 구조 시계열모델인 temporal fusion transformer (TFT)와 순환신경망 구조 시계열모델 중 더 우수한 예측 능력을 보인 gated recurrent unit (GRU)의 20일 후 예측에 대한 48개 저수지의 RMSE 평균은 각각 7.115%와 17.428%로 TFT 모델이 GRU 모델보다 중기에서 더 우수한 저수율 예측 능력을 보여주었다.

※ 협약을 통해 무료로 제공되는 자료로, 원문이용 방식은 연계기관의 정책을 따르고 있습니다.

원문보기

우리나라에는 농업수 공급, 홍수 예방의 역할을 수행하는 17,100여 개의 농업용 저수지가 존재하지만, 이 중 13,700여 개의 농업용 저수지는 수문 계측 시설이 설치되어 있지 않아 제대로 된 운영을 하기가 힘들다. 한편, 위성영상을 이용한 저수지 수체 탐지와 이를 저수율로 변환하는 연구가 활발히 진행되고 있으며, 저수율 예측 모델을 이용하여 농업용 저수지의 저수율을 높은 정확도로 예측한다면 계측 및 미계측 저수지에 대한 효과적 운영을 가능하게 할 수 있다. 본 연구에서는 저수량 기준 상위 48개 농업용 저수지를 대상으로 순환신경망 구조 및 트랜스포머 구조 시계열모델의 저수율 예측 능력을 비교·분석하였다. 2013년부터 2023년까지의 11년 저수율 데이터를 구축하였으며 2013년부터 2021년 데이터를 훈련데이터셋, 2022년 데이터를 검증데이터셋, 2023년 데이터를 평가데이터셋으로 분리하여 사용하였고 mean absolute error (MAE), root mean square error (RMSE), 상관계수 평가지표를 사용하여 저수율 예측 능력을 정량적으로 평가하였다. 과거 저수율만을 입력변수로 사용하는 단변량 시계열예측이 아닌 기상적 영향과 계절적 영향을 입력변수로 반영한 다변량 시계열예측을 사용하였으며, 본 연구에서 사용한 트랜스포머 구조 시계열모델인 temporal fusion transformer (TFT)와 순환신경망 구조 시계열모델 중 더 우수한 예측 능력을 보인 gated recurrent unit (GRU)의 20일 후 예측에 대한 48개 저수지의 RMSE 평균은 각각 7.115%와 17.428%로 TFT 모델이 GRU 모델보다 중기에서 더 우수한 저수율 예측 능력을 보여주었다.

In Korea, there are 17,100 agricultural reservoirs that play the role of agricultural water supply and flood prevention, but more than 13,700 of them are not equipped with hydrological measurement facilities, making it difficult to operate properly. On the other hand, research on detecting reservoir water volume using satellite imagery and converting it into water yield is actively underway, and if the water yield prediction model can predict the water yield of agricultural reservoirs with high accuracy, it can enable effective operation of measured and unmeasured reservoirs. In this study, we compared and analyzed the ability of recurrent neural network structure and transformer structure time series models to predict water yield for the top 48 agricultural reservoirs by water volume. The 11 years of water yield data from 2013 to 2023 were constructed, and the 2013-2021 data were separated into training data, 2022 data were used as validation data, and 2023 data were used as test data, and the mean absolute error (MAE), root mean square error (RMSE), and correlation coefficient evaluation metrics were used to quantitatively evaluate the water yield prediction ability. Instead of univariate time series forecasting using only historical water storage rate as an input variable, multivariate time series forecasting reflecting meteorological and seasonal effects as input variables was used. The RMSE averages of 48 reservoirs for 20-day forecasts of temporal fusion transformer (TFT), a time series model with a transformer structure, and gated recurrent unit (GRU), a time series model with a recurrent neural network structure, were 7.115% and 17.428%,respectively, showing that the TFT model has a better ability to predict water storage in the medium term than the GRU model.

1042

Long short term memory 모델을 이용한 시계열 수중 소음 데이터 예측

이혜선, 홍우영, 김국현, 이근화

[Kisti 연계] 한국음향학회 한국음향학회지 Vol.42 No.4 2023 pp.313-319

...시계열 기계학습 모델인 Long Short Term Memory(LSTM)에 적용해 보았다. 기포유동소음 데이터는 파이프에서 측정된 소음으로 기포소음, 유동소음, 유체기인소음이 혼합되어 있으며 유형별로 3가지로 분류할 수 있다. 수중 운동체 발사소음은 모형 발사튜브에서 수중 운동체가 사출될 때 발생하는 소음으로 순간소음이며 발사 이벤트마다 불규칙하게 변한다. 이러한 종류의 소음 생성을 위해서는 해석적인 모델보다는 데이터 기반 모델이 유용할 수 있다. 본 연구에서는 LSTM을 데이터 기반 모델을 만들었다. 모델에 영향을 주는 LSTM의 은닉유닛의 개수, 입력시퀸스의 개수, 데시메이션 인자에 따른 모델의 성능을 확인하고 최적의 LSTM 모델을 구성했다. 같은 유형은 새로운 데이터에 대해서도 잘 동작하는 것을 보였다.

※ 협약을 통해 무료로 제공되는 자료로, 원문이용 방식은 연계기관의 정책을 따르고 있습니다.

원문보기

본 논문에서는 일부 소음 데이터만 알고 있을 때 결손된 데이터를 예측할 목적으로 수조에서 측정된 기포유동 소음 데이터와 수중 운동체 발사 소음 데이터를 시계열 기계학습 모델인 Long Short Term Memory(LSTM)에 적용해 보았다. 기포유동소음 데이터는 파이프에서 측정된 소음으로 기포소음, 유동소음, 유체기인소음이 혼합되어 있으며 유형별로 3가지로 분류할 수 있다. 수중 운동체 발사소음은 모형 발사튜브에서 수중 운동체가 사출될 때 발생하는 소음으로 순간소음이며 발사 이벤트마다 불규칙하게 변한다. 이러한 종류의 소음 생성을 위해서는 해석적인 모델보다는 데이터 기반 모델이 유용할 수 있다. 본 연구에서는 LSTM을 데이터 기반 모델을 만들었다. 모델에 영향을 주는 LSTM의 은닉유닛의 개수, 입력시퀸스의 개수, 데시메이션 인자에 따른 모델의 성능을 확인하고 최적의 LSTM 모델을 구성했다. 같은 유형은 새로운 데이터에 대해서도 잘 동작하는 것을 보였다.

In this paper, a time series machine learning model, Long Short Term Memory (LSTM), is applied into the bubble flow noise data and the underwater projectile launch noise data to predict missing values of time-series underwater noise data. The former is mixed with bubble noise, flow noise, and fluid-induced interaction noise measured in a pipe and can be classified into three types. The latter is the noise generated when an underwater projectile is ejected from a launch tube and has a characteristic of instantaenous noise. For such types of noise, a data-driven model can be more useful than an analytical model. We constructed an LSTM model with given data and evaluated the model's performance based on the number of hidden units, the number of input sequences, and the decimation factor of signal. It is shown that the optimal LSTM model works well for new data of the same type.

1043

심층 네트워크 모델에 기반한 어선 횡동요 시계열 예측

김동균, 임남균

[Kisti 연계] 한국항해항만학회 Journal of navigation and port research Vol.47 No.6 2023 pp.376-385

...시계열을 예측하고자 한다. 이미지 기반 딥러닝은 시계열의 다양한 패턴을 학습하여 높은 성능을 낼 수 있다. 이를 위해 Xception, ResNet50, CRNN의 3가지의 이미지 기반 딥러닝 모델을 활용하였다. Xception과 ResNet50은 각각 177, 184개의 층으로 구성되어 있으며 이에 반해 CRNN은 22개의 비교적 얇은 층으로 구성되어 있다. 실험 결과 Xception 딥러닝 모델이 가장 낮은 0.04291의 sMAPE와 0.0198의 RMSE를 기록하였다. ResNet50과 CRNN은 각각 0.0217, 0.022의 RMSE를 기록하였다. 이를 통해 상대적으로 층이 더 깊은 모델의 정확도가 높음을 확인할 수 있다.

※ 협약을 통해 무료로 제공되는 자료로, 원문이용 방식은 연계기관의 정책을 따르고 있습니다.

원문보기

통계에 따르면 어선의 전복 사고는 전체 전복 사고의 절반 이상을 차지한다. 이는 미숙한 조업, 기상 악화, 정비 미흡 등 다양한 원인으로 발생할 수 있다. 업계 규모와 영향도, 기술 복잡성, 지역적 다양성 등으로 인해 어선은 상선에 비해 상대적으로 연구가 부족한 실정이다. 본 연구에서는 이미지 기반 딥러닝 모델을 활용하여 어선의 횡동요 시계열을 예측하고자 한다. 이미지 기반 딥러닝은 시계열의 다양한 패턴을 학습하여 높은 성능을 낼 수 있다. 이를 위해 Xception, ResNet50, CRNN의 3가지의 이미지 기반 딥러닝 모델을 활용하였다. Xception과 ResNet50은 각각 177, 184개의 층으로 구성되어 있으며 이에 반해 CRNN은 22개의 비교적 얇은 층으로 구성되어 있다. 실험 결과 Xception 딥러닝 모델이 가장 낮은 0.04291의 sMAPE와 0.0198의 RMSE를 기록하였다. ResNet50과 CRNN은 각각 0.0217, 0.022의 RMSE를 기록하였다. 이를 통해 상대적으로 층이 더 깊은 모델의 정확도가 높음을 확인할 수 있다.

Fishing boat capsizing accidents account for more than half of all capsize accidents. These can occur for a variety of reasons, including inexperienced operation, bad weather, and poor maintenance. Due to the size and influence of the industry, technological complexity, and regional diversity, fishing ships are relatively under-researched compared to commercial ships. This study aimed to predict the rolling motion time series of fishing boats using an image-based deep learning model. Image-based deep learning can achieve high performance by learning various patterns in a time series. Three image-based deep learning models were used for this purpose: Xception, ResNet50, and CRNN. Xception and ResNet50 are composed of 177 and 184 layers, respectively, while CRNN is composed of 22 relatively thin layers. The experimental results showed that the Xception deep learning model recorded the lowest Symmetric mean absolute percentage error(sMAPE) of 0.04291 and Root Mean Squared Error(RMSE) of 0.0198. ResNet50 and CRNN recorded an RMSE of 0.0217 and 0.022, respectively. This confirms that the models with relatively deeper layers had higher accuracy.

1044

Bi-LSTM 모델을 이용한 음악 생성 시계열 예측

김광진, 이칠우

[Kisti 연계] 한국스마트미디어학회 스마트미디어저널 Vol.11 No.10 2022 pp.65-75

...시계열 데이터를 생성할 수 있도록 은닉층을 다층화하고, 디코더의 출력 게이트에서 인코더의 입력 데이터 중 영향을 주는 요소의 가중치를 적용하는 어텐션(Attention) 메커니즘을 적용한다. LSTM 모델의 인식률 향상을 위한 파라미터로서 손실함수, 최적화 방법 등 설정 변수들을 적용한다. 제안 모델은 MIDI 학습의 효율성 제고 및 예측 향상을 위해 높은음자리표(treble clef)와 낮은음자리표(bass clef)를 구분하여 추출된 음표, 음표의 길이, 쉼표, 쉼표의 길이와 코드(chord) 등을 적용한 다채널 어텐션 적용 양방향 기억 모델(Bi-LSTM with attention)이다. 학습의 결과는 노이즈와 구별되는 음악의 전개에 어울리는 음표와 코드를 생성하며, 화성학적으로 안정된 음악을 생성하는 모델을 지향한다.

※ 협약을 통해 무료로 제공되는 자료로, 원문이용 방식은 연계기관의 정책을 따르고 있습니다.

원문보기

딥러닝은 기존의 분석 모델이 갖는 한계를 극복하고 텍스트, 이미지, 음악 등 다양한 형태의 결과물을 생성할 수 있는 창의적인 도구로 활용되고 있다. 본 고에서는 Niko's MIDI Pack 음원 파일 1,609개를 데이터 셋으로 삼아 전처리 과정을 수행하고, 양방향 장단기 기억 순환 신경망(Bi-LSTM) 모델을 이용하여, 효율적으로 음악을 생성할 수 있는 전처리 방법과 예측 모델을 제시한다. 생성되는 으뜸음을 바탕으로 음악적 조성(調聲)에 적합한 새로운 시계열 데이터를 생성할 수 있도록 은닉층을 다층화하고, 디코더의 출력 게이트에서 인코더의 입력 데이터 중 영향을 주는 요소의 가중치를 적용하는 어텐션(Attention) 메커니즘을 적용한다. LSTM 모델의 인식률 향상을 위한 파라미터로서 손실함수, 최적화 방법 등 설정 변수들을 적용한다. 제안 모델은 MIDI 학습의 효율성 제고 및 예측 향상을 위해 높은음자리표(treble clef)와 낮은음자리표(bass clef)를 구분하여 추출된 음표, 음표의 길이, 쉼표, 쉼표의 길이와 코드(chord) 등을 적용한 다채널 어텐션 적용 양방향 기억 모델(Bi-LSTM with attention)이다. 학습의 결과는 노이즈와 구별되는 음악의 전개에 어울리는 음표와 코드를 생성하며, 화성학적으로 안정된 음악을 생성하는 모델을 지향한다.

Deep learning is used as a creative tool that could overcome the limitations of existing analysis models and generate various types of results such as text, image, and music. In this paper, we propose a method necessary to preprocess audio data using the Niko's MIDI Pack sound source file as a data set and to generate music using Bi-LSTM. Based on the generated root note, the hidden layers are composed of multi-layers to create a new note suitable for the musical composition, and an attention mechanism is applied to the output gate of the decoder to apply the weight of the factors that affect the data input from the encoder. Setting variables such as loss function and optimization method are applied as parameters for improving the LSTM model. The proposed model is a multi-channel Bi-LSTM with attention that applies notes pitch generated from separating treble clef and bass clef, length of notes, rests, length of rests, and chords to improve the efficiency and prediction of MIDI deep learning process. The results of the learning generate a sound that matches the development of music scale distinct from noise, and we are aiming to contribute to generating a harmonistic stable music.

1045

딥러닝을 이용한 핸드크림의 마찰 시계열 데이터 분류

김지원, 이유민, 한상헌, 김경택

[Kisti 연계] 한국산업경영시스템학회 Journal of the Society of Korea Industrial and Systems Engineering Vol.44 No.3 2021 pp.98-105

※ 협약을 통해 무료로 제공되는 자료로, 원문이용 방식은 연계기관의 정책을 따르고 있습니다.

원문보기

The sensory stimulation of a cosmetic product has been deemed to be an ancillary aspect until a decade ago. That point of view has drastically changed on different levels in just a decade. Nowadays cosmetic formulators should unavoidably meet the needs of consumers who want sensory satisfaction, although they do not have much time for new product development. The selection of new products from candidate products largely depend on the panel of human sensory experts. As new product development cycle time decreases, the formulators wanted to find systematic tools that are required to filter candidate products into a short list. Traditional statistical analysis on most physical property tests for the products including tribology tests and rheology tests, do not give any sound foundation for filtering candidate products. In this paper, we suggest a deep learning-based analysis method to identify hand cream products by raw electric signals from tribological sliding test. We compare the result of the deep learning-based method using raw data as input with the results of several machine learning-based analysis methods using manually extracted features as input. Among them, ResNet that is a deep learning model proved to be the best method to identify hand cream used in the test. According to our search in the scientific reported papers, this is the first attempt for predicting test cosmetic product with only raw time-series friction data without any manual feature extraction. Automatic product identification capability without manually extracted features can be used to narrow down the list of the newly developed candidate products.

1046

한국 COVID-19 확진자 수에 대한 시계열 분석: HAR-TP-T 모형 접근법

유성민, 황은주

[Kisti 연계] 한국통계학회 The Korean journal of applied statistics Vol.34 No.2 2021 pp.239-254

...시계열 분석, 즉 추정과 예측에 대하여 연구한다. HAR-TP-T 시계열 모형을 고려하여 HAR 모형의 계수 뿐 아니라 TP-T 오차과정의 모수를 추정하고자 단계별 추정법을 제안한다. 본 연구에서 제안하고 있는 단계별 추정법은, HAR 계수 추정을 위해서는 통상적 최소제곱추정법을 채택하고, TP-T 모수 추정을 위해서는 최대우도추정법을 이용한다. 단계별 추정법에 대한 모의실험을 수행하여, 성능이 우수함을 입증한다. 한국 코로나 확진자 수에 대한 실증적 데이터 분석에서, HAR 모형에서의 차수 p = 2, 3, 4에 대해, 모형의 평균제곱오차가 최소가 되도록 하는 최적화 시간간격(optimal lag)을 포함하여, 여러가지 시간간격을 고려한 HAR-TP-T 모형의 모수 추정값을 계산한다. 제안된 단계별 추정방법과 기존의 MLE만의 방법을, 추정 결과를 제시함으로 함께 비교한다. 본 연구에서 제안하고 있는 추정은 두 가지의 오차 측면, 즉 HAR 모형의 평균제곱오차와 잔차분포에 대한 밀도함수 추정의 평균제곱오차, 두 측면에서 모두 우수함을 입증하였다. 나아가, 추정 결과를 활용한 코로나 확진자 수 예측을 수행하였고, 예측정확도의 한 측도로서 mean absolute percentage error (MAPE)를 계산하여 0.0953%의 매우 작은 오차값을 얻었다. 본 연구에서 선택한 최적화 시간간격을 고려한 HAR-TP-T 시계열 모형 및 단계별 추정 방법은, 정확한 한국 코로나 확진자 수 예측 성능을 제공한다고 할 수 있다.

※ 협약을 통해 무료로 제공되는 자료로, 원문이용 방식은 연계기관의 정책을 따르고 있습니다.

원문보기

이 논문에서는, 2개의 혼합된 t-분포(TP-T)의 오차과정을 따르는 이질적 자기회귀 (HAR) 모형을 이용하여, 한국 코로나 (COVID-19) 확진자 수 데이터에 대한 시계열 분석, 즉 추정과 예측에 대하여 연구한다. HAR-TP-T 시계열 모형을 고려하여 HAR 모형의 계수 뿐 아니라 TP-T 오차과정의 모수를 추정하고자 단계별 추정법을 제안한다. 본 연구에서 제안하고 있는 단계별 추정법은, HAR 계수 추정을 위해서는 통상적 최소제곱추정법을 채택하고, TP-T 모수 추정을 위해서는 최대우도추정법을 이용한다. 단계별 추정법에 대한 모의실험을 수행하여, 성능이 우수함을 입증한다. 한국 코로나 확진자 수에 대한 실증적 데이터 분석에서, HAR 모형에서의 차수 p = 2, 3, 4에 대해, 모형의 평균제곱오차가 최소가 되도록 하는 최적화 시간간격(optimal lag)을 포함하여, 여러가지 시간간격을 고려한 HAR-TP-T 모형의 모수 추정값을 계산한다. 제안된 단계별 추정방법과 기존의 MLE만의 방법을, 추정 결과를 제시함으로 함께 비교한다. 본 연구에서 제안하고 있는 추정은 두 가지의 오차 측면, 즉 HAR 모형의 평균제곱오차와 잔차분포에 대한 밀도함수 추정의 평균제곱오차, 두 측면에서 모두 우수함을 입증하였다. 나아가, 추정 결과를 활용한 코로나 확진자 수 예측을 수행하였고, 예측정확도의 한 측도로서 mean absolute percentage error (MAPE)를 계산하여 0.0953%의 매우 작은 오차값을 얻었다. 본 연구에서 선택한 최적화 시간간격을 고려한 HAR-TP-T 시계열 모형 및 단계별 추정 방법은, 정확한 한국 코로나 확진자 수 예측 성능을 제공한다고 할 수 있다.

This paper studies time series analysis with estimation and forecasting for Korean COVID-19 confirmed cases, based on the approach of a heterogeneous autoregressive (HAR) model with two-piece t (TP-T) distributed errors. We consider HAR-TP-T time series models and suggest a step-by-step method to estimate HAR coefficients as well as TP-T distribution parameters. In our proposed step-by-step estimation, the ordinary least squares method is utilized to estimate the HAR coefficients while the maximum likelihood estimation (MLE) method is adopted to estimate the TP-T error parameters. A simulation study on the step-by-step method is conducted and it shows a good performance. For the empirical analysis on the Korean COVID-19 confirmed cases, estimates in the HAR-TP-T models of order p = 2, 3, 4 are computed along with a couple of selected lags, which include the optimal lags chosen by minimizing the mean squares errors of the models. The estimation results by our proposed method and the solely MLE are compared with some criteria rules. Our proposed step-by-step method outperforms the MLE in two aspects: mean squares error of the HAR model and mean squares difference between the TP-T residuals and their densities. Moreover, forecasting for the Korean COVID-19 confirmed cases is discussed with the optimally selected HAR-TP-T model. Mean absolute percentage error of one-step ahead out-of-sample forecasts is evaluated as 0.0953% in the proposed model. We conclude that our proposed HAR-TP-T time series model with optimally selected lags and its step-by-step estimation provide an accurate forecasting performance for the Korean COVID-19 confirmed cases.

1047

Random Forest 기법을 이용한 도심지 MT 시계열 자료의 차량 잡음 분류

권형석, 류경호, 심익현, 이춘기, 오석훈

[Kisti 연계] 한국지구물리물리탐사학회 지구물리와 물리탐사 Vol.23 No.4 2020 pp.230-242

...시계열을 분류하였다. 고속열차 잡음이 포함된 시계열에 대해서는 확률적 경사 하강법, 서포트 벡터 머신과 랜덤 포레스트 3가지의 분류모델을 적용하여 그 결과를 비교하였다. 대형트럭 잡음이 포함된 시계열 자료에 대해서는 Hx 성분, Hy 성분과 Hx & Hy 합성성분 크기에 대한 3가지의 샘플 자료를 준비하였으며 랜덤 포레스트 분류모델을 구성하여 그 성능을 평가하였다. 마지막으로 차량잡음 제거 효과 분석을 위하여 차량잡음 제거 전후의 시계열, 진폭 스펙트럼과 겉보기비저항 곡선을 비교하였으며, 이를 통해 차량잡음이 영향을 미치는 주파수 대역과 차량잡음 제거 시 발생될 수 있는 문제점에 대해 고찰하였다.

※ 협약을 통해 무료로 제공되는 자료로, 원문이용 방식은 연계기관의 정책을 따르고 있습니다.

원문보기

201 6년 9월에 발생한 경주지진원 구역에 대한 정밀 지질구조 규명을 위해 MT 탐사를 적용하였다. 경주지역의 MT 측정자료는 조사지역 인근의 지하철, 전력선, 공장, 주택, 농경지에서 발생된 전기적 잡음과 철도, 도로에서의 차량잡음 등으로 인해 측정자료 왜곡이 심하게 발생되었다. 이 연구에서는 고속철도 및 고속도로와 인접한 4개소의 MT 탐사자료에 기계학습 기법을 적용하여 차량잡음이 포함된 시계열을 분류하였다. 고속열차 잡음이 포함된 시계열에 대해서는 확률적 경사 하강법, 서포트 벡터 머신과 랜덤 포레스트 3가지의 분류모델을 적용하여 그 결과를 비교하였다. 대형트럭 잡음이 포함된 시계열 자료에 대해서는 Hx 성분, Hy 성분과 Hx & Hy 합성성분 크기에 대한 3가지의 샘플 자료를 준비하였으며 랜덤 포레스트 분류모델을 구성하여 그 성능을 평가하였다. 마지막으로 차량잡음 제거 효과 분석을 위하여 차량잡음 제거 전후의 시계열, 진폭 스펙트럼과 겉보기비저항 곡선을 비교하였으며, 이를 통해 차량잡음이 영향을 미치는 주파수 대역과 차량잡음 제거 시 발생될 수 있는 문제점에 대해 고찰하였다.

We performed a magnetotelluric (MT) survey to delineate the geological structures below the depth of 20 km in the Gyeongju area where an earthquake with a magnitude of 5.8 occurred in September 2016. The measured MT data were severely distorted by electrical noise caused by subways, power lines, factories, houses, and farmlands, and by vehicle noise from passing trains and large trucks. Using machine-learning methods, we classified the MT time series data obtained near the railway and highway into two groups according to the inclusion of traffic noise. We applied three schemes, stochastic gradient descent, support vector machine, and random forest, to the time series data for the highspeed train noise. We formulated three datasets, Hx, Hy, and Hx & Hy, for the time series data of the large truck noise and applied the random forest method to each dataset. To evaluate the effect of removing the traffic noise, we compared the time series data, amplitude spectra, and apparent resistivity curves before and after removing the traffic noise from the time series data. We also examined the frequency range affected by traffic noise and whether artifact noise occurred during the traffic noise removal process as a result of the residual difference.

1048

농경지 지역 무인항공기 영상 기반 시계열 수치표고모델 표고 보정

김태헌, 박주언, 윤예린, 이원희, 한유경

[Kisti 연계] 한국측량학회 Korean Journal of Geomatics Vol.38 No.3 2020 pp.223-235

※ 협약을 통해 무료로 제공되는 자료로, 원문이용 방식은 연계기관의 정책을 따르고 있습니다.

원문보기

본 연구에서는 무인항공기 영상 기반의 정밀농업(precision agricultural) 구현에 있어 핵심 데이터 중 하나인 수치표고모델의 표고를 보정하기 위한 수치표고모델 표고 보정 방법론을 제시한다. 먼저 정사영상에 방사보정을 수행한 다음 ExG (Excess Green)를 생성한다. ExG에 Otsu 기법을 적용하여 산출된 임계값을 기준으로 비식생지역을 추출한다. 이어서, 비식생지역의 위치에 대응되는 수치표고모델의 표고를 표고 보정을 위한 데이터인 EIFs(Elevation Invariant Features)로 추출한다. 추출된 EIFs 간 차이값을 기반으로 정규화된 Z-score를 산출하여 포함된 특이치를 제거한다. 그리고 선형회귀식을 구성하여 수치표고모델의 표고를 보정함으로써 지상기준점 데이터 없이 고품질의 수치표고모델을 제작한다. 총 10장의 수치표고모델을 활용하여 제안기법을 검증하기 위해 표고 보정 전과 후의 최대/최소값, 평균/표준편차를 비교분석하였다. 또한, 검사점을 선정하여 RMSE (Root Mean Square Error)를 산출한 결과, 정확도는 평균 RMSE 0.35m로 도출되었다. 이를 통해 지상기준점 데이터 없이 고품질의 수치표고모델을 제작할 수 있음을 확인하였다.

In this study, we propose an approach for calibrating the elevation of a DEM (Digital Elevation Model), one of the key data in realizing unmanned aerial vehicle image-based precision agriculture. First of all, radiometric correction is performed on the orthophoto, and then ExG (Excess Green) is generated. The non-vegetation area is extracted based on the threshold value estimated by applying the Otsu method to ExG. Subsequently, the elevation of the DEM corresponding to the location of the non-vegetation area is extracted as EIFs (Elevation Invariant Features), which is data for elevation correction. The normalized Z-score is estimated based on the difference between the extracted EIFs to eliminate the outliers. Then, by constructing a linear regression model and correcting the elevation of the DEM, high-quality DEM is produced without GCPs (Ground Control Points). To verify the proposed method using a total of 10 DEMs, the maximum/minimum value, average/standard deviation before and after elevation correction were compared and analyzed. In addition, as a result of estimating the RMSE (Root Mean Square Error) by selecting the checkpoints, an average RMSE was derivsed as 0.35m. Comprehensively, it was confirmed that a high-quality DEM could be produced without GCPs.

1049

딥러닝을 이용한 이변량 장기종속시계열 예측

김지영, 백창룡

[Kisti 연계] 한국통계학회 The Korean journal of applied statistics Vol.32 No.1 2019 pp.69-81

...시계열(long-range dependent time series) 예측을 고려하였다. 시계열 데이터 예측에 적합한 LSTM(long short-term memory) 네트워크를 이용하여 이변량 장기종속시계열을 예측하고 이를 이변량 FARIMA(fractional ARIMA) 모형인 FIVARMA 모형과 VARFIMA 모형과의 예측 성능을 실증 자료 분석을 통해 비교하였다. 실증 자료로는 기능적 자기공명 영상(fMRI) 및 일일 실현 변동성(daily realized volatility) 자료를 이용하였으며 표본외 예측(out-of sample forecasting) 오차 비교를 통해 예측 성능을 측정하였다. 그 결과, FIVARMA 모형과 VARFIMA 모형의 예측값에는 미묘한 차이가 존재하며, LSTM 네트워크의 경우 초매개변수 선택으로 복잡해 보이지만 계산적으로 더 안정되면서 예측 성능도 모수적 장기종속시계열과 뒤지지 않은 좋은 예측 성능을 보였다.

※ 협약을 통해 무료로 제공되는 자료로, 원문이용 방식은 연계기관의 정책을 따르고 있습니다.

원문보기

본 논문에서는 딥러닝을 이용한 이변량 장기종속시계열(long-range dependent time series) 예측을 고려하였다. 시계열 데이터 예측에 적합한 LSTM(long short-term memory) 네트워크를 이용하여 이변량 장기종속시계열을 예측하고 이를 이변량 FARIMA(fractional ARIMA) 모형인 FIVARMA 모형과 VARFIMA 모형과의 예측 성능을 실증 자료 분석을 통해 비교하였다. 실증 자료로는 기능적 자기공명 영상(fMRI) 및 일일 실현 변동성(daily realized volatility) 자료를 이용하였으며 표본외 예측(out-of sample forecasting) 오차 비교를 통해 예측 성능을 측정하였다. 그 결과, FIVARMA 모형과 VARFIMA 모형의 예측값에는 미묘한 차이가 존재하며, LSTM 네트워크의 경우 초매개변수 선택으로 복잡해 보이지만 계산적으로 더 안정되면서 예측 성능도 모수적 장기종속시계열과 뒤지지 않은 좋은 예측 성능을 보였다.

We consider bivariate long range dependent (LRD) time series forecasting using a deep learning method. A long short-term memory (LSTM) network well-suited to time series data is applied to forecast bivariate time series; in addition, we compare the forecasting performance with bivariate fractional autoregressive integrated moving average (FARIMA) models. Out-of-sample forecasting errors are compared with various performance measures for functional MRI (fMRI) data and daily realized volatility data. The results show a subtle difference in the predicted values of the FIVARMA model and VARFIMA model. LSTM is computationally demanding due to hyper-parameter selection, but is more stable and the forecasting performance is competitively good to that of parametric long range dependent time series models.

1050

Unit Root Test를 기반으로 한 장기 시계열 데이터의 Non-Stationary 발생에 따른 구조 변화 검정 및 시각화 연구

유재성, 주재걸

[Kisti 연계] 한국정보처리학회 정보처리학회논문지/소프트웨어 및 데이터 공학 Vol.8 No.7 2019 pp.289-302

...시계열의 구조 변화란, 전체 시계열 자료를 구성하는 기간에서 관측치들의 분포가 상대적으로 안정적이다가, 특정 시점에서 분포 특성의 급격한 변화를 보이는 것을 의미한다. 비정상(non-stationary) 장기 시계열 안에서도, 단기적인 추세의 변화가 일시적인 것인지, 아니면 구조적으로 변한 것인지를 적시에 판단하는 것은 중요하다. 이는 시계열 추세의 변화를 상시 감지하여, 변화에 맞는 적정한 대응을 할 필요가 있기 때문이다. 본 연구에서는 단위근 검정법을 기반으로 한 검정 결과를 시각화함으로써, 의사결정자가 시계열의 구조 변화를 손쉽게 파악할 수 있는 방안을 제시하였다. 특히 시계열을 분할한 후 검정하는 방법을 통해, 장기 시계열일 때에도 단기 구조 변화를 파악할 수 있도록 하였다.

※ 협약을 통해 무료로 제공되는 자료로, 원문이용 방식은 연계기관의 정책을 따르고 있습니다.

원문보기

시계열의 구조 변화란, 전체 시계열 자료를 구성하는 기간에서 관측치들의 분포가 상대적으로 안정적이다가, 특정 시점에서 분포 특성의 급격한 변화를 보이는 것을 의미한다. 비정상(non-stationary) 장기 시계열 안에서도, 단기적인 추세의 변화가 일시적인 것인지, 아니면 구조적으로 변한 것인지를 적시에 판단하는 것은 중요하다. 이는 시계열 추세의 변화를 상시 감지하여, 변화에 맞는 적정한 대응을 할 필요가 있기 때문이다. 본 연구에서는 단위근 검정법을 기반으로 한 검정 결과를 시각화함으로써, 의사결정자가 시계열의 구조 변화를 손쉽게 파악할 수 있는 방안을 제시하였다. 특히 시계열을 분할한 후 검정하는 방법을 통해, 장기 시계열일 때에도 단기 구조 변화를 파악할 수 있도록 하였다.

Structural change of time series means that the distribution of observations is relatively stable in the period of constituting the entire time series data, but shows a sudden change of the distribution characteristic at a specific time point. Within a non-stationary long-term time series, it is important to determine in a timely manner whether the change in short-term trends is transient or structurally changed. This is because it is necessary to always detect the change of the time series trend and to take appropriate measures to cope with the change. In this paper, we propose a method for decision makers to easily grasp the structural changes of time series by visualizing the test results based on the unit root test. Particularly, it is possible to grasp the short-term structural changes even in the long-term time series through the method of dividing the time series and testing it.

1051

비육돈사 공기중 분진 수준에 대한 시계열적 분석 및 돈사내외부 분진 수준 비교분석

김형아, 김창열, 양수정, 조지훈, 신소정, 송은섭, 이윤범, 김효철, 김경란, 이경숙, 허용

[Kisti 연계] 한국환경보건학회 한국환경보건학회지 Vol.45 No.6 2019 pp.630-637

※ 협약을 통해 무료로 제공되는 자료로, 원문이용 방식은 연계기관의 정책을 따르고 있습니다.

원문보기

Objectives: This study was performed to evaluate the secular changes in indoor airborne dust or endotoxin levels in the dust from swine confinement buildings. Indoor levels were compared with the level at the exhaust outlet in order to examine the contribution potential of indoor dust to nearby ambient air dust. Methods: Comparisons were made on inhalable and respirable dust levels reported in 2002, 2012, and 2017 from 14, 10, and 36 swine fattening confinement buildings in Korea, respectively. This data was produced by the same research group. Levels of endotoxin adsorbed into inhalable or respirable dust were also compared. Samples of inhalable or respirable dust were collected indoors and at exhaust outlets from 17 swine fattening confinement buildings in 2019, and dust levels were compared between the indoor and the outlet. Results: The outlet inhalable dust level (0.111 mg/㎥) was approximately 19% of that from indoors, and the respirable dust level (0.033 mg/㎥) was approximately 74% of that from indoors. The outlet respirable dust levels were lower than the airborne fine dust levels in the towns where those farms are located. No significant difference was observed in the inhalable dust levels among the years examined, but the respirable dust level in 2017 (0.143 mg/㎥) was significantly lower than in 2002 (0.328 mg/㎥). The level of endotoxin in inhalable dust was significantly higher in 2017 (722 EU/㎥) than in both 2002 (75 EU/㎥) and 2012 (171 EU/㎥). Conclusion: Even though no apparent contribution from swine farm indoor dust to nearby ambient air dust was observed in terms of amount, a certain control strategy to reduce the production of airborne dust and endotoxin from swine farms is merited.

1052

광, 공업용 건물의 전기 사용량에 대한 시계열 분석

김민아, 김재희

[Kisti 연계] 한국통계학회 The Korean journal of applied statistics Vol.31 No.2 2018 pp.189-204

※ 협약을 통해 무료로 제공되는 자료로, 원문이용 방식은 연계기관의 정책을 따르고 있습니다.

원문보기

본 연구는 2014년 1월부터 2017년 4월까지 광, 공업용 제조업을 하는 건물(GGM)의 전기 사용량에 대한 예측을 살펴보고자 한다. SARIMA, SARIMA + GARCH, Holt-Winters 방법, Fourier 변환으로 분해를 한 ARIMA 모형을 중심으로 네 가지 모형에 대한 적합을 하였다. 또한 2017년 5월 사용량에 대한 예측하고, 실제값을 고려하여 각 모형에 대해 예측 제곱근 평균 제곱 오차와 예측 오차율을 비교하였다. GGM 건물의 전기 사용량에 대한 변동이 심하기 때문에 여러 가지 모형 중에서도 변동성과 주기를 함께 고려한 SARIMA + GARCH 모형의 적합과 예측이 가장 뛰어난 것을 확인하였다.

This study is on forecasting the electricity consumption of an industrial manufacturing building called GGM from January 2014 to April 2017. We fitted models using SARIMA, SARIMA + GARCH, Holt-Winters method and ARIMA with Fourier transformation. We also forecasted electricity consumption for one month ahead and compared the predicted root mean square error as well as the predicted error rate of each model. The electricity consumption of GGM fluctuates weekly and annually; therefore, SARIMA + GARCH model considering both volatility and seasonality, shows the best fit and prediction.

1053

빅데이터를 활용한 공원 이용행태의 시계열분석 - 올림픽공원을 대상으로 -

우경숙, 서주환

[Kisti 연계] 한국조경학회 한국조경학회지 Vol.46 No.2 2018 pp.27-36

...시계열적 행태의 특성을 도출하고, 사회연결망 분석을 통해 온라인 데이터의 유의성을 검증하였다. 텍스트 마이닝 분석 결과, 첫째, '길을 걷다'(산책), '사진을 찍다', '자전거(인라인, 킥보드 등)를 타다', '먹다', '공연을 관람하다'는 올림픽공원에서 행해지는 공통적인 행태로 나타났다. 둘째, 수집된 데이터의 초기에는 운동 등 적극적인 신체활동을 행태가 주를 이루었지만, 최근에는 핸드폰, 게임, 음식을 먹고 커피를 마시는 등의 소극적인 비활동적 행태도 공원에서 나타나는 새로운 행태적 특징으로 나타났다. 셋째, 공원 이용자의 행태에 영향을 미치는 요인은 인터넷 발달, 자신의 개성과 스타일을 표현하는 문화 등 사회의 여러 가지 여건의 변화로 나타났다. 넷째, 올림픽공원에서 나타나는 특별한 행태는 공연 관람 등 문화적인 활동과 역사수업 등 교육적인 활동으로 도출되었다. 결론적으로 공원 계획 설계 시 의도하였던 목적보다는 여러 가지 시대적 변화로 사람들의 라이프 스타일이 변화하고, 공원의 행태에까지 영향을 미치는 것으로 나타났다. 이에 올림픽공원의 주요 행태와 영향을 미치는 요인을 고려하여 이용자에게 적합한 환경으로 변화되어야 할 필요성이 있다. 분석방법으로 활용한 텍스트 마이닝은 과거의 데이터도 수집이 가능하다는 장점이 있어 행태 분석 시 장기적인 관점에서 분석이 가능하고, 도출된 키워드로 새로운 행태 및 가치 측정이 가능하여 이후 행태분석 연구의 영역의 확대가 가능한 것으로 판단된다. 또한, 사회연결망 분석을 통해 온라인 데이터의 타당성을 검증하여 연구결과의 신뢰를 높일 수 있었다. 추후 수집하는 데이터의 종류를 다양하게 하여 더 포괄적인 행태분석에 대한 연구가 수행되어야 하며, 대용량 데이터의 정확성, 신뢰성을 검증할 수 있는 다양한 방법에 대한 연구가 필요할 것이다.

※ 협약을 통해 무료로 제공되는 자료로, 원문이용 방식은 연계기관의 정책을 따르고 있습니다.

원문보기

본 연구는 공원 이용자의 욕구를 파악하여 이용자에 적합한 공원 환경으로 변화되어야 할 필요성에 주목하고, 이용자의 욕구를 파악하기 위하여 행태분석의 필요성을 제기하였다. 이에 온라인 데이터(블로그)를 연구의 기초자료로 선정하고, 5년 단위로 구분하여 데이터를 수집한 후 텍스트 마이닝을 활용해 시계열적 행태의 특성을 도출하고, 사회연결망 분석을 통해 온라인 데이터의 유의성을 검증하였다. 텍스트 마이닝 분석 결과, 첫째, '길을 걷다'(산책), '사진을 찍다', '자전거(인라인, 킥보드 등)를 타다', '먹다', '공연을 관람하다'는 올림픽공원에서 행해지는 공통적인 행태로 나타났다. 둘째, 수집된 데이터의 초기에는 운동 등 적극적인 신체활동을 행태가 주를 이루었지만, 최근에는 핸드폰, 게임, 음식을 먹고 커피를 마시는 등의 소극적인 비활동적 행태도 공원에서 나타나는 새로운 행태적 특징으로 나타났다. 셋째, 공원 이용자의 행태에 영향을 미치는 요인은 인터넷 발달, 자신의 개성과 스타일을 표현하는 문화 등 사회의 여러 가지 여건의 변화로 나타났다. 넷째, 올림픽공원에서 나타나는 특별한 행태는 공연 관람 등 문화적인 활동과 역사수업 등 교육적인 활동으로 도출되었다. 결론적으로 공원 계획 설계 시 의도하였던 목적보다는 여러 가지 시대적 변화로 사람들의 라이프 스타일이 변화하고, 공원의 행태에까지 영향을 미치는 것으로 나타났다. 이에 올림픽공원의 주요 행태와 영향을 미치는 요인을 고려하여 이용자에게 적합한 환경으로 변화되어야 할 필요성이 있다. 분석방법으로 활용한 텍스트 마이닝은 과거의 데이터도 수집이 가능하다는 장점이 있어 행태 분석 시 장기적인 관점에서 분석이 가능하고, 도출된 키워드로 새로운 행태 및 가치 측정이 가능하여 이후 행태분석 연구의 영역의 확대가 가능한 것으로 판단된다. 또한, 사회연결망 분석을 통해 온라인 데이터의 타당성을 검증하여 연구결과의 신뢰를 높일 수 있었다. 추후 수집하는 데이터의 종류를 다양하게 하여 더 포괄적인 행태분석에 대한 연구가 수행되어야 하며, 대용량 데이터의 정확성, 신뢰성을 검증할 수 있는 다양한 방법에 대한 연구가 필요할 것이다.

This study suggests the necessity of behavior analysis as changes to a park environment to reflect user desires can be implemented only by grasping the needs of park users. Online data (blog) were defined as the basic data of the study. After collecting data by 5 - year units, data mining was used to derive the characteristics of the time series behavior while the significance of the online data was verified through social network analysis. The results of the text mining analysis are as follows. First, primary results included 'walking', 'photography', 'riding bicycles'(inline, kickboard, etc.), and 'eating'. Second, in the early days of the collected data, active physical activity such as exercise was the main factor, but recent passive behavior such as eating, using a mobile phone, games, food and drinking coffee also appeared as a new behavior characteristic in parks. Third, the factors affecting the behavior of park users are the changes of various conditions of society such as internet development and a culture of expressing unique personalities and styles. Fourth, the special behaviors appearing at Olympic Park were derived from educational activities such as cultural activities including watching performances and history lessons. In conclusion, it has been shown that people's lifestyle changes and the behavior of a park are influenced by the changes of the various times rather than the original purpose that was intended during park planning and design. Therefore, it is necessary to create an environment tailored to users by considering the main behaviors and influencing factors of Olympic Park. Text mining used as an analytical method has the merit that past data can be collected. Therefore, it is possible to form analysis from a long-term viewpoint of behavior analysis as well as to measure new behavior and value with derived keywords. In addition, the validity of online data was verified through social network analysis to increase the legitimacy of research results. Research on more comprehensive behavior analysis should be carried out by diversifying the types of data collected later, and various methods for verifying the accuracy and reliability of large-volume data will be needed.

1054

하천 건천화 평가를 위한 GIS 기반의 시계열 공간자료 활용에 관한 연구

유재현, 김계현, 박용길, 이기훈, 김성준, 정충길

[Kisti 연계] 한국지리정보학회 Journal of the Korean Association of Geographic Information Studies Vol.21 No.4 2018 pp.50-63

...시계열 공간자료 활용에 대한 연구를 수행하였다. 이에 6개 하천 건천화 영향요소(기상, 토심, 산림밀도 및 높이, 도로망, 지하수 이용량, 토지이용)을 대상으로, 과거 수십년 간의 변화과정을 전국 단위 GIS 자료로 구축하여 연속수문모형 운용에 대한 기초자료로 활용하였다. 이러한 영향요소를 대상으로 시계열에 따라 하천 건천화 원인을 분석하고 해석할 수 있는 분포형 연속수문모형 기반의 DrySAT을 활용하여 하천 건천화 영향요소별 연유출량 및 건천화 평가를 수행하였다. 그 결과, 다른 요소들은 고려하지 않고 주어진 기상 조건하에 연유출량은 기본값 977.9mm로 산출되었다. 반면, 토심 감소, 산림 높이 증가, 도로 개발 증가, 지하수이용량 증가, 토지이용 개발변화를 고려하였을 때의 연평균 유출량은 각각 1,003.5mm, 942.1mm, 961.9mm, 915.5mm, 1003.7mm로 산출되었다. 산출된 결과는 하천건천화의 주요 원인으로서 지표유출량을 증가시켜 하천유량을 감소시키는 토심의 감소, 지표유출량을 감소시키는 산림 밀도의 증가, 지표하유출량을 감소시키는 도로의 증가, 기저유출량을 감소시키는 무분별한 지하수 개발과 지하수이용량의 증가, 지표유출량을 증가시키는 불투수지역의 증가를 들 수 있다. 또한, 하천 건천화 정의 및 등급 범위를 통해서 건천화 등급에 따라 표준유역별로 나타내었으며, 기상, 토심 감소 고려, 산림 높이 증가, 도로 개발 증가, 지하수이용량 증가, 토지이용 개발변화를 고려하였을 때의 건천화 등급은 각각 2.1, 2.2, 2.5, 2.3, 2.8, 2.2로 나타났다. 기본값인 강우조건을 제외한 5개 하천 건천화 영향요소에 대한 건천화 영향순위는 지하수 이용량 변화에 대한 건천화 영향이 제일 컸으며, 산림 밀도 변화, 도로 건설 변화, 토지이용 변화 및 토심 변화 순으로 나타났다. 향후 전국 하천 건천화 평가시스템 개발을 통해 6개 하천 건천화 영향요소에 대한 미래 자료 변화 및 이에 대한 건천화의 진행전망 등 시스템에 의한 평가결과를 토대로 맞춤형 하천 건천 관리 및 방지 방안을 제공할 수 있을 것으로 판단된다.

※ 협약을 통해 무료로 제공되는 자료로, 원문이용 방식은 연계기관의 정책을 따르고 있습니다.

원문보기

급격한 도시화를 겪으면서 자연적인 물순환 체계의 왜곡을 초래하였다. 이러한 물순환 구조의 변화는 기존 수자원 이용 경향을 변화시키며 하천 건천화 현상을 유발하고 있다. 이를 관리하기 위해 건천화 평가 및 예측이 가능한 하천 건천화 영향 평가 기술이 필요하다. 하천 건천화 영향평가 기술 수행을 위해서는 기초자료로써 GIS 기반의 공간자료 구축이 필수적이나, 관련 연구는 미흡한 실정이다. 따라서 본 연구에서는 하천 건천화 평가를 위한 GIS 기반의 시계열 공간자료 활용에 대한 연구를 수행하였다. 이에 6개 하천 건천화 영향요소(기상, 토심, 산림밀도 및 높이, 도로망, 지하수 이용량, 토지이용)을 대상으로, 과거 수십년 간의 변화과정을 전국 단위 GIS 자료로 구축하여 연속수문모형 운용에 대한 기초자료로 활용하였다. 이러한 영향요소를 대상으로 시계열에 따라 하천 건천화 원인을 분석하고 해석할 수 있는 분포형 연속수문모형 기반의 DrySAT을 활용하여 하천 건천화 영향요소별 연유출량 및 건천화 평가를 수행하였다. 그 결과, 다른 요소들은 고려하지 않고 주어진 기상 조건하에 연유출량은 기본값 977.9mm로 산출되었다. 반면, 토심 감소, 산림 높이 증가, 도로 개발 증가, 지하수이용량 증가, 토지이용 개발변화를 고려하였을 때의 연평균 유출량은 각각 1,003.5mm, 942.1mm, 961.9mm, 915.5mm, 1003.7mm로 산출되었다. 산출된 결과는 하천건천화의 주요 원인으로서 지표유출량을 증가시켜 하천유량을 감소시키는 토심의 감소, 지표유출량을 감소시키는 산림 밀도의 증가, 지표하유출량을 감소시키는 도로의 증가, 기저유출량을 감소시키는 무분별한 지하수 개발과 지하수이용량의 증가, 지표유출량을 증가시키는 불투수지역의 증가를 들 수 있다. 또한, 하천 건천화 정의 및 등급 범위를 통해서 건천화 등급에 따라 표준유역별로 나타내었으며, 기상, 토심 감소 고려, 산림 높이 증가, 도로 개발 증가, 지하수이용량 증가, 토지이용 개발변화를 고려하였을 때의 건천화 등급은 각각 2.1, 2.2, 2.5, 2.3, 2.8, 2.2로 나타났다. 기본값인 강우조건을 제외한 5개 하천 건천화 영향요소에 대한 건천화 영향순위는 지하수 이용량 변화에 대한 건천화 영향이 제일 컸으며, 산림 밀도 변화, 도로 건설 변화, 토지이용 변화 및 토심 변화 순으로 나타났다. 향후 전국 하천 건천화 평가시스템 개발을 통해 6개 하천 건천화 영향요소에 대한 미래 자료 변화 및 이에 대한 건천화의 진행전망 등 시스템에 의한 평가결과를 토대로 맞춤형 하천 건천 관리 및 방지 방안을 제공할 수 있을 것으로 판단된다.

The rapid urbanization had led to a distortion of natural hydrological cycle system. The change in hydrological cycle structure is causing streamflow depletion, changing the existing use tendency of water resources. To manage such phenomena, a streamflow depletion impact assessment technology to forecast depletion is required. For performing such technology, it is indispensable to build GIS-based spatial data as fundamental data, but there is a shortage of related research. Therefore, this study was conducted to use the use of GIS-based time series spatial data for streamflow depletion assessment. For this study, GIS data over decades of changes on a national scale were constructed, targeting 6 streamflow depletion impact factors (weather, soil depth, forest density, road network, groundwater usage and landuse) and the data were used as the basic data for the operation of continuous hydrologic model. Focusing on these impact factors, the causes for streamflow depletion were analyzed depending on time series. Then, using distributed continuous hydrologic model based DrySAT, annual runoff of each streamflow depletion impact factor was measured and depletion assessment was conducted. As a result, the default value of annual runoff was measured at 977.9mm under the given weather condition without considering other factors. When considering the decrease in soil depth, the increase in forest density, road development, and groundwater usage, along with the change in land use and development, and annual runoff were measured at 1,003.5mm, 942.1mm, 961.9mm, 915.5mm, and 1003.7mm, respectively. The results showed that the major causes of the streaflow depletion were lowered soil depth to decrease the infiltration volume and surface runoff thereby decreasing streamflow; the increased forest density to decrease surface runoff; the increased road network to decrease the sub-surface flow; the increased groundwater use from undiscriminated development to decrease the baseflow; increased impervious areas to increase surface runoff. Also, each standard watershed depending on the grade of depletion was indicated, based on the definition of streamflow depletion and the range of grade. Considering the weather, the decrease in soil depth, the increase in forest density, road development, and groundwater usage, and the change in land use and development, the grade of depletion were 2.1, 2.2, 2.5, 2.3, 2.8, 2.2, respectively. Among the five streamflow depletion impact factors except rainfall condition, the change in groundwater usage showed the biggest influence on depletion, followed by the change in forest density, road construction, land use, and soil depth. In conclusion, it is anticipated that a national streamflow depletion assessment system to be develop in the future would provide customized depletion management and prevention plans based on the system assessment results regarding future data changes of the six streamflow depletion impact factors and the prospect of depletion progress.

1055

엘만 순환 신경망을 사용한 전력 에너지 시계열의 예측 및 분석

이창용, 김진호

[Kisti 연계] 한국산업경영시스템학회 Journal of the Society of Korea Industrial and Systems Engineering Vol.41 No.1 2018 pp.84-93

※ 협약을 통해 무료로 제공되는 자료로, 원문이용 방식은 연계기관의 정책을 따르고 있습니다.

원문보기

In this paper, we propose an Elman recurrent neural network to predict and analyze a time series of power energy consumption. To this end, we consider the volatility of the time series and apply the sample variance and the detrended fluctuation analyses to the volatilities. We demonstrate that there exists a correlation in the time series of the volatilities, which suggests that the power consumption time series contain a non-negligible amount of the non-linear correlation. Based on this finding, we adopt the Elman recurrent neural network as the model for the prediction of the power consumption. As the simplest form of the recurrent network, the Elman network is designed to learn sequential or time-varying pattern and could predict learned series of values. The Elman network has a layer of "context units" in addition to a standard feedforward network. By adjusting two parameters in the model and performing the cross validation, we demonstrated that the proposed model predicts the power consumption with the relative errors and the average errors in the range of 2%~5% and 3kWh~8kWh, respectively. To further confirm the experimental results, we performed two types of the cross validations designed for the time series data. We also support the validity of the model by analyzing the multi-step forecasting. We found that the prediction errors tend to be saturated although they increase as the prediction time step increases. The results of this study can be used to the energy management system in terms of the effective control of the cross usage of the electric and the gas energies.

1056

효과적인 입력변수 패턴 학습을 위한 시계열 그래프 기반 합성곱 신경망 모형: 주식시장 예측에의 응용

이모세, 안현철

[Kisti 연계] 한국지능정보시스템학회 Journal of Intelligence and Information Systems Vol.24 No.1 2018 pp.167-181

※ 협약을 통해 무료로 제공되는 자료로, 원문이용 방식은 연계기관의 정책을 따르고 있습니다.

원문보기

지난 10여 년간 딥러닝(Deep Learning)은 다양한 기계학습 알고리즘 중에서 많은 주목을 받아 왔다. 특히 이미지를 인식하고 분류하는데 효과적인 알고리즘으로 알려져 있는 합성곱 신경망(Convolutional Neural Network, CNN)은 여러 분야의 분류 및 예측 문제에 널리 응용되고 있다. 본 연구에서는 기계학습 연구에서 가장 어려운 예측 문제 중 하나인 주식시장 예측에 합성곱 신경망을 적용하고자 한다. 구체적으로 본 연구에서는 그래프를 입력값으로 사용하여 주식시장의 방향(상승 또는 하락)을 예측하는 이진분류기로써 합성곱 신경망을 적용하였다. 이는 그래프를 보고 주가지수가 오를 것인지 내릴 것인지에 대해 경향을 예측하는 이른바 기술적 분석가를 모방하는 기계학습 알고리즘을 개발하는 과제라 할 수 있다. 본 연구는 크게 다음의 네 단계로 수행된다. 첫 번째 단계에서는 데이터 세트를 5일 단위로 나눈다. 두 번째 단계에서는 5일 단위로 나눈 데이터에 대하여 그래프를 만든다. 세 번째 단계에서는 이전 단계에서 생성된 그래프를 사용하여 학습용과 검증용 데이터 세트를 나누고 합성곱 신경망 분류기를 학습시킨다. 네 번째 단계에서는 검증용 데이터 세트를 사용하여 다른 분류 모형들과 성과를 비교한다. 제안한 모델의 유효성을 검증하기 위해 2009년 1월부터 2017년 2월까지의 약 8년간의 KOSPI200 데이터 2,026건의 실험 데이터를 사용하였다. 실험 데이터 세트는 CCI, 모멘텀, ROC 등 한국 주식시장에서 사용하는 대표적인 기술지표 12개로 구성되었다. 결과적으로 실험 데이터 세트에 합성곱 신경망 알고리즘을 적용하였을 때 로지스틱회귀모형, 단일계층신경망, SVM과 비교하여 제안모형인 CNN이 통계적으로 유의한 수준의 예측 정확도를 나타냈다.

Over the past decade, deep learning has been in spotlight among various machine learning algorithms. In particular, CNN(Convolutional Neural Network), which is known as the effective solution for recognizing and classifying images or voices, has been popularly applied to classification and prediction problems. In this study, we investigate the way to apply CNN in business problem solving. Specifically, this study propose to apply CNN to stock market prediction, one of the most challenging tasks in the machine learning research. As mentioned, CNN has strength in interpreting images. Thus, the model proposed in this study adopts CNN as the binary classifier that predicts stock market direction (upward or downward) by using time series graphs as its inputs. That is, our proposal is to build a machine learning algorithm that mimics an experts called 'technical analysts' who examine the graph of past price movement, and predict future financial price movements. Our proposed model named 'CNN-FG(Convolutional Neural Network using Fluctuation Graph)' consists of five steps. In the first step, it divides the dataset into the intervals of 5 days. And then, it creates time series graphs for the divided dataset in step 2. The size of the image in which the graph is drawn is $40(pixels){\times}40(pixels)$, and the graph of each independent variable was drawn using different colors. In step 3, the model converts the images into the matrices. Each image is converted into the combination of three matrices in order to express the value of the color using R(red), G(green), and B(blue) scale. In the next step, it splits the dataset of the graph images into training and validation datasets. We used 80% of the total dataset as the training dataset, and the remaining 20% as the validation dataset. And then, CNN classifiers are trained using the images of training dataset in the final step. Regarding the parameters of CNN-FG, we adopted two convolution filters ($5{\times}5{\times}6$ and $5{\times}5{\times}9$) in the convolution layer. In the pooling layer, $2{\times}2$ max pooling filter was used. The numbers of the nodes in two hidden layers were set to, respectively, 900 and 32, and the number of the nodes in the output layer was set to 2(one is for the prediction of upward trend, and the other one is for downward trend). Activation functions for the convolution layer and the hidden layer were set to ReLU(Rectified Linear Unit), and one for the output layer set to Softmax function. To validate our model - CNN-FG, we applied it to the prediction of KOSPI200 for 2,026 days in eight years (from 2009 to 2016). To match the proportions of the two groups in the independent variable (i.e. tomorrow's stock market movement), we selected 1,950 samples by applying random sampling. Finally, we built the training dataset using 80% of the total dataset (1,560 samples), and the validation dataset using 20% (390 samples). The dependent variables of the experimental dataset included twelve technical indicators popularly been used in the previous studies. They include Stochastic %K, Stochastic %D, Momentum, ROC(rate of change), LW %R(Larry William's %R), A/D oscillator(accumulation/distribution oscillator), OSCP(price oscillator), CCI(commodity channel index), and so on. To confirm the superiority of CNN-FG, we compared its prediction accuracy with the ones of other classification models. Experimental results showed that CNN-FG outperforms LOGIT(logistic regression), ANN(artificial neural network), and SVM(support vector machine) with the statistical significance. These empirical results imply that converting time series business data into graphs and building CNN-based classification models using these graphs can be effective from the perspective of prediction accuracy. Thus, this paper sheds a light on how to apply deep learning techniques to the domain of business problem solving.

1057

동적 선형 모델을 이용한 교통 흐름 시계열 분석

김홍근, 박철영, 신창선, 조용윤, 박장우

[Kisti 연계] 한국정보처리학회 정보처리학회논문지/컴퓨터 및 통신 시스템 Vol.6 No.4 2017 pp.179-188

...시계열 분석하고자 한다. 소도시의 경우 버스 정보는 도시교통 흐름을 설명하는 중요하고 효과적인 자료이다. 앞서 언급한 신호등 지연, 보행자, 교차로 등은 교통흐름을 분석하고 예측하는데 어려움을 더한다. 본 논문에서는 동적 선형 모델(Dyanamic Linear Model, DLM)을 이용하여 중요 구간의 교통흐름을 시계열 분석하고 예측하는 방법을 제시한다. 이때 구간별 통행 속도를 평일과 주말로 나누어 분석한다. DLM을 이용하여 구간별 이동속도의 시계열 분석을 통하여 도시 내의 교통흐름을 파악하여 향후 교통 체증 및 혼잡 구간을 예보하고 버스의 정확한 도착시간을 예측하는데 도움을 줄 수 있으리라 생각한다.

※ 협약을 통해 무료로 제공되는 자료로, 원문이용 방식은 연계기관의 정책을 따르고 있습니다.

원문보기

도시 내의 교통흐름을 정확히 분석하는 것은 매우 어렵다. 특히, 교통사고나 보행자, 교차로 등은 도시 내의 교통흐름을 분석하는데 있어서 어려움을 가중시킨다. 현재 소도시(예를 들어 전라남도 순천시)들에도 버스 정보시스템(Bus Information System, BIS)이 보급되어 있고 이를 통하여 도착시간 예측 등과 같은 정보를 제공하고 있다. BIS는 버스의 위치, 구간별 이동시간, 출발-도착 시간등을 제공하고 있다. 따라서 본 논문에서는 BIS로부터 정류장 간의 평균 이동 시간, 그리고 이동 거리 등을 시간대 별로 추출하여 도시 내의 교통흐름을 시계열 분석하고자 한다. 소도시의 경우 버스 정보는 도시교통 흐름을 설명하는 중요하고 효과적인 자료이다. 앞서 언급한 신호등 지연, 보행자, 교차로 등은 교통흐름을 분석하고 예측하는데 어려움을 더한다. 본 논문에서는 동적 선형 모델(Dyanamic Linear Model, DLM)을 이용하여 중요 구간의 교통흐름을 시계열 분석하고 예측하는 방법을 제시한다. 이때 구간별 통행 속도를 평일과 주말로 나누어 분석한다. DLM을 이용하여 구간별 이동속도의 시계열 분석을 통하여 도시 내의 교통흐름을 파악하여 향후 교통 체증 및 혼잡 구간을 예보하고 버스의 정확한 도착시간을 예측하는데 도움을 줄 수 있으리라 생각한다.

It is very challenging to analyze the traffic flow in the city because there are lots of traffic accidents, intersections, and pedestrians etc. Now, even in mid-size cities Bus Information Systems(BIS) have been deployed, which have offered the forecast of arriving times at the stations to passengers. BIS also provides more informations such as the current locations, departure-arrival times of buses. In this paper, we perform the time-series analysis of the traffic flow using the data of the average trvel time and the average speed between stations extracted from the BIS. In the mid size cities, the data from BIS will have a important role on prediction and analysis of the traffic flow. We used the Dynamic Linear Model(DLM) for how to make the time series forecasting model to analyze and predict the average speeds at the given locations, which seem to show the representative of traffics in the city. Especially, we analysis travel times for weekdays and weekends separately. We think this study can help forecast the traffic jams, congestion areas and more accurate arrival times of buses.

1058

여러 가지 가중행렬을 가진 공간 시계열 모형들의 예측

이성덕, 주수인, 이소현

[Kisti 연계] 한국데이터정보과학회 한국데이터정보과학회지 Vol.28 No.1 2017 pp.11-20

...시계열 자료라고 한다. 공간 시계열 자기회귀 이동평균 모형과 공간 시계열 중선형 모형에 대해 소개하고 각각의 Kalman Filter 방법에 의한 모수 추정의 과정을 거쳐 최종 선택된 모형의 예측력을 비교하였다. 또한 공간 시계열 자료의 모형에 포함되는 가중행렬에 대하여 기존의 방법인 동일한 가중치와 더불어 거리에 비례한 가중치와 인구수에 비례한 가중치를 제안하였다. 실증분석을 위해 한국질병관리본부에서 수집한 유행성 이하 선염 자료를 활용하여 가중치를 달리한 공간 시계열 모형을 적합시키고 예측하였다. 예측 오차 제곱합을 활용하여 어느 모형이 가장 효과적인 모형인지 판정하였다.

※ 협약을 통해 무료로 제공되는 자료로, 원문이용 방식은 연계기관의 정책을 따르고 있습니다.

원문보기

시간의 변화뿐만 아니라 공간 위치의 변화를 함께 고려한 자료를 공간 시계열 자료라고 한다. 공간 시계열 자기회귀 이동평균 모형과 공간 시계열 중선형 모형에 대해 소개하고 각각의 Kalman Filter 방법에 의한 모수 추정의 과정을 거쳐 최종 선택된 모형의 예측력을 비교하였다. 또한 공간 시계열 자료의 모형에 포함되는 가중행렬에 대하여 기존의 방법인 동일한 가중치와 더불어 거리에 비례한 가중치와 인구수에 비례한 가중치를 제안하였다. 실증분석을 위해 한국질병관리본부에서 수집한 유행성 이하 선염 자료를 활용하여 가중치를 달리한 공간 시계열 모형을 적합시키고 예측하였다. 예측 오차 제곱합을 활용하여 어느 모형이 가장 효과적인 모형인지 판정하였다.

In this paper, we introduced linear spatial time series (space-time autoregressive and moving average model) and nonlinear spatial time series (space-time bilinear model). Also we estimated the parameters by Kalman Filter method and made comparative studies of power of forecast in the final model. We proposed several weight matrices such as equal proportion allocation, reciprocal proportion between distances, and proportion of population sizes. For applications, we collected Mumps data at Korea Center for Disease Control and Prevention from January 2001 until August 2008. We compared three approaches of weight matrices using the Mumps data. Finally, we also decided the most effective model based on sum of square forecast error.

1059

동해 연안해역 표면수온의 장기 시계열변화

김상우, 임진욱, 윤병선, 정희동, 장성호

[Kisti 연계] 해양환경안전학회 해양환경안전학회지 Vol.20 No.6 2014 pp.601-608

※ 협약을 통해 무료로 제공되는 자료로, 원문이용 방식은 연계기관의 정책을 따르고 있습니다.

원문보기

본 연구에서는 동해 연안정지관측 8개 지점(감포, 울기, 장기갑, 포항, 죽변, 동해(묵호), 주문진, 속초)에서 43년(1971-2013)간 조사한 표층수온을 이용하여 지역별 수온의 유사도에 따른 군집분석과 수온의 장기 변화를 살펴보았다. 수온의 유사도에 의한 군집분석결과, 본 연구지역은 크게 그룹 A(동해, 주문진, 속초)와 그룹 B(감포, 울기, 장기갑, 포항, 죽변)로 구분되었다. 여기서 A 그룹의 속초와 B 그룹의 죽변, 포항, 감포를 중심으로 한 수온과 수온편차의 장기 변화에서 수온은 10년 규모의 변동을 보였다. 각 지역별 수온은 43년간 증가 경향을 보였고, 1988년을 기준으로 고수온기와 저수온기로 구분되었다. 각 지역에서 43년간 수온은 속초가 $2.26^{\circ}C$, 죽변이 $1.99^{\circ}C$, 포항이 $1.11^{\circ}C$, 감포는 $0.89^{\circ}C$ 각각 증가하였고, 지역적으로는 동해 남부에서 북부로 갈수록 수온의 증가 속도가 크게 나타났다. 계절별 수온의 증가는 추계와 동계의 경우 속초>죽변>포항>감포의 순이었고, 춘계와 하계는 죽변>속초>포항>감포의 순으로 나타났다.

The purpose of this study was to explore the long-term variability of sea surface temperature (SST) and cluster analysis derived from in-situ data in the coastal oceanographic observation 8 stations (Sokcho, Jumunjin, Donghae, Jukbyeon, Pohang, Janggigab, Ulgi, Gampo) of the East Sea during 1971-2013. As a result of cluster analysis, SST variations in each area could be divided into two groups, which was a group A of Sokcho, Jumunjin, Donghae, and group B of Jukbyeon, Pohang, Janggigab, Ulgi, Gampo. The SST and SST anomalies at Sokcho, Jukbyeon, Pohang and Gampo during 1971-2013 showed the increase-trend with the variations of decadal-scale. Annual SST values also increased remarkably after 1988. The increases of SST for 43 years showed $2.26^{\circ}C$ at Sokcho, $1.99^{\circ}C$ at Jukbyeon, $1.11^{\circ}C$ at Pohang and $0.89^{\circ}C$ at Gampo. In particular, the SST variations of the northern areas were higher than those of southern areas. The seasonal SSTs increased the order of Sokcho-Jukbyeon-Pohang-Gampo in fall and winter and that of Jukbyeon-Sokcho-Pohang-Gampo in spring and summer.

1060

정준상관분석을 통한 다변량 금융시계열의 변동성 분석

이승연, 황선영

[Kisti 연계] 한국통계학회 The Korean journal of applied statistics Vol.27 No.7 2014 pp.1139-1149

...시계열의 변동성분석을 다변량 기법인 정준상관분석(canonocal correaltion analysis)을 이용해 분석하였다. 변동성의 특성상 계수들이 비음(non-negative)인 정준상관분석, 즉, non-negative and sparse canonical correlation analysis (NSCCA)를 이용해 보았다. 본 논문은 다변량 시계열의 변동성 커브에 대해 연구하고 있으며 제시된 방법론을 이변량 주식자료분석을 통해 예시해 보았다.

※ 협약을 통해 무료로 제공되는 자료로, 원문이용 방식은 연계기관의 정책을 따르고 있습니다.

원문보기

다변량 금융시계열의 변동성분석을 다변량 기법인 정준상관분석(canonocal correaltion analysis)을 이용해 분석하였다. 변동성의 특성상 계수들이 비음(non-negative)인 정준상관분석, 즉, non-negative and sparse canonical correlation analysis (NSCCA)를 이용해 보았다. 본 논문은 다변량 시계열의 변동성 커브에 대해 연구하고 있으며 제시된 방법론을 이변량 주식자료분석을 통해 예시해 보았다.

Multivariate volatility is summarized through canonical correlation analysis (CCA). Along with the standard CCA, non-negative and sparse canonical correlation analysis (NSCCA) is introduced to make sure that volatility coefficients are non-negative and the number of coefficients in the volatility CCA is as small as possible. Various multivariate financial time series are analyzed to illustrate the main contribution of the paper.

 
페이지 저장