년 - 년
[Kisti 연계] 한국통계학회 The Korean journal of applied statistics Vol.33 No.2 2020 pp.147-160
...시계열 일반화 선형 모형의 하나인 계수형 시계열 모형에서 중요한 역할을 하는 과거 관측값과 조건부 평균값의 차수를 자동으로 결정하는 알고리즘을 연구한다. 본 알고리즘은 ARIMA 모형의 차수를 기반으로 시계열 일반화 선형 모형의 차수 후보군을 만들고, 차수 후보군의 조합을 이용하여 정보량 기준으로 최종 모형으로 선택한다. 제안된 알고리즘을 평가하기 위하여, 내재적 모형 및 내재적 시계열의 종류에 따른 시뮬레이션 및 실증 분석을 수행하고 예측력을 ARIMA 모형과 비교한다. 예측 성능 평가 결과, 계수형 시계열 분석에서 ARIMA 모형에 비해 시계열 일반화 선형 모형의 예측 성능이 우수함을 확인할 수 있다. 또한 실증분석으로서, 살인사건 발생 건수의 예측결과 ARIMA 모형보다 중기 및 장기 예측에서 우수한 성능을 나타내는 것을 확인할 수 있다.
※ 협약을 통해 무료로 제공되는 자료로, 원문이용 방식은 연계기관의 정책을 따르고 있습니다.
본 논문은 시계열 일반화 선형 모형의 하나인 계수형 시계열 모형에서 중요한 역할을 하는 과거 관측값과 조건부 평균값의 차수를 자동으로 결정하는 알고리즘을 연구한다. 본 알고리즘은 ARIMA 모형의 차수를 기반으로 시계열 일반화 선형 모형의 차수 후보군을 만들고, 차수 후보군의 조합을 이용하여 정보량 기준으로 최종 모형으로 선택한다. 제안된 알고리즘을 평가하기 위하여, 내재적 모형 및 내재적 시계열의 종류에 따른 시뮬레이션 및 실증 분석을 수행하고 예측력을 ARIMA 모형과 비교한다. 예측 성능 평가 결과, 계수형 시계열 분석에서 ARIMA 모형에 비해 시계열 일반화 선형 모형의 예측 성능이 우수함을 확인할 수 있다. 또한 실증분석으로서, 살인사건 발생 건수의 예측결과 ARIMA 모형보다 중기 및 장기 예측에서 우수한 성능을 나타내는 것을 확인할 수 있다.
In this paper, we study an algorithm that automatically determines the orders of past observations and conditional mean values that play an important role in count time series models. Based on the orders of the ARIMA model, the algorithm constitutes the order candidates group for time series generalized linear models and selects the final model based on information criterion among the combinations of the order candidates group. To evaluate the proposed algorithm, we perform small simulations and empirical analysis according to underlying models and time series as well as compare forecasting performances with the ARIMA model. The results of the comparison confirm that the time series generalized linear model offers better performance than the ARIMA model for the count time series analysis. In addition, the empirical analysis shows better performance in mid and long term forecasting than the ARIMA model.
[Kisti 연계] 한국통계학회 The Korean journal of applied statistics Vol.32 No.5 2019 pp.671-681
...시계열 데이터로 부정맥을 예측하는 것의 유용성에 대해 살펴보았다. 1-Nearest Neighbor 방법과 그것을 앙상블(ensemble)한 learner를 중심으로 비교했을 경우 시계열의 특징을 고려한 적절한 시계열 거리함수를 선택하여 시계열 정보를 활용한 다변량 시계열 데이터 기반 방법의 분류 성능이 더 좋게 나오는 것을 확인하였다.
※ 협약을 통해 무료로 제공되는 자료로, 원문이용 방식은 연계기관의 정책을 따르고 있습니다.
최근에 부정맥 환자가 증가하면서 머신러닝을 이용한 부정맥을 예측하는 연구가 활발하게 진행되고 있다. 기존의 많은 연구들은 특정한 시점의 RR 간격 데이터에서 추출한 특징변수 다변량 데이터에 기반하여 부정맥을 예측하였다. 본 연구에서는 심장 상태가 시간에 따라 변해가는 패턴도 부정맥 예측에 중요한 정보가 될 수 있다고 생각하여 일정한 시간 간격을 두고 특징변수의 다변량 벡터를 추출하여 쌓음으써 얻어지는 다변량 시계열 데이터로 부정맥을 예측하는 것의 유용성에 대해 살펴보았다. 1-Nearest Neighbor 방법과 그것을 앙상블(ensemble)한 learner를 중심으로 비교했을 경우 시계열의 특징을 고려한 적절한 시계열 거리함수를 선택하여 시계열 정보를 활용한 다변량 시계열 데이터 기반 방법의 분류 성능이 더 좋게 나오는 것을 확인하였다.
Studies on predicting arrhythmia using machine learning have been actively conducted with increasing number of arrhythmia patients. Existing studies have predicted arrhythmia based on multivariate data of feature variables extracted from RR interval data at a specific time point. In this study, we consider that the pattern of the heart state changes with time can be important information for the arrhythmia prediction. Therefore, we investigate the usefulness of predicting the arrhythmia with multivariate time series data obtained by extracting and accumulating the multivariate vectors of the feature variables at various time points. When considering 1-nearest neighbor classification method and its ensemble for comparison, it is confirmed that the multivariate time series data based method can have better classification performance than the multivariate data based method if we select an appropriate time series distance function.
[Kisti 연계] 한국항만경제학회 한국항만경제학회지 Vol.35 No.3 2019 pp.61-72
...시계열 모형을 이용한 컨테이너선 시장의 실증적 분석에 기초하여 컨테이너 해운시장의 동태적 움직임에 대한 전략을 제시하고자 했다. 분석 방법론으로는 벡터자기회귀모형(VAR), 벡터오차수정모형(VECM) 등의 다변량 시계열 모형을 사용했다. 실증분석을 위해 컨테이너선 시장의 연간 운송량, 선박량, 운임 자료를 활용했다. 분석 결과에 따르면, 가장 외생적 변수인 운송량 변수가 전체 컨테이너선 시장의 동태적 움직임에 가장 큰 영향을 미친다는 것을 확인할 수 있었다. 이러한 실증분석 결과에 기초하여 본 논문은 선박 투자, 운임 예측, 선사의 전략 수립 등에 대한 시사점을 제시했다. 선박 투자와 관련해서는 해운시장의 외생 변수인 운송량이 운임 불확실성에 가장 큰 비중을 차지하고 있기 때문에 미래 운임수입 흐름에 기반한 프로젝트 금융 보다는 운항 선주의 재무적 안정성을 강조하는 기업 금융 방식이 컨테이너선 투자의 위험관리에 적합하다는 것을 알 수 있다. 운임예측과 관련해서는 미래 예측대상 시점의 변수 값을 사용하는 단순 회귀 예측에 비해 과거의 값만으로 예측값을 도출할 수 있는 VAR 모형 또는 VECM 모형이 보다 현실성이 있다는 점을 살피고 있다. 마지막으로 선사의 전략 수립과 관련하여 시황과 연계한 원리금 상환 계약과 화주와의 운송 계약 도입을 권고하고 있다.
※ 협약을 통해 무료로 제공되는 자료로, 원문이용 방식은 연계기관의 정책을 따르고 있습니다.
본 연구는 컨테이너 해운산업의 경쟁력 제고와 발전을 위해 다변량 시계열 모형을 이용한 컨테이너선 시장의 실증적 분석에 기초하여 컨테이너 해운시장의 동태적 움직임에 대한 전략을 제시하고자 했다. 분석 방법론으로는 벡터자기회귀모형(VAR), 벡터오차수정모형(VECM) 등의 다변량 시계열 모형을 사용했다. 실증분석을 위해 컨테이너선 시장의 연간 운송량, 선박량, 운임 자료를 활용했다. 분석 결과에 따르면, 가장 외생적 변수인 운송량 변수가 전체 컨테이너선 시장의 동태적 움직임에 가장 큰 영향을 미친다는 것을 확인할 수 있었다. 이러한 실증분석 결과에 기초하여 본 논문은 선박 투자, 운임 예측, 선사의 전략 수립 등에 대한 시사점을 제시했다. 선박 투자와 관련해서는 해운시장의 외생 변수인 운송량이 운임 불확실성에 가장 큰 비중을 차지하고 있기 때문에 미래 운임수입 흐름에 기반한 프로젝트 금융 보다는 운항 선주의 재무적 안정성을 강조하는 기업 금융 방식이 컨테이너선 투자의 위험관리에 적합하다는 것을 알 수 있다. 운임예측과 관련해서는 미래 예측대상 시점의 변수 값을 사용하는 단순 회귀 예측에 비해 과거의 값만으로 예측값을 도출할 수 있는 VAR 모형 또는 VECM 모형이 보다 현실성이 있다는 점을 살피고 있다. 마지막으로 선사의 전략 수립과 관련하여 시황과 연계한 원리금 상환 계약과 화주와의 운송 계약 도입을 권고하고 있다.
In order to enhance the competitiveness of the container shipping industry and promote its development, based on the empirical analyses using multivariate time series models, this study aims to suggest a few strategies related to the dynamics of the container shipping market. It uses the vector autoregressive (VAR) and vector error correction (VEC) models as analytical methodologies. Additionally, it uses the annual trade volumes, fleets, and freight rates as the dataset. According to the empirical results, we can infer that the most exogenous variable, the trade volume, exerted the highest influence on the total dynamics of the container shipping market. Based on these empirical results, this study suggests some implications for ship investment, freight rate forecasting, and the strategies of shipping firms. Concerning ship investment, since the exogenous trade volume variable contributes most to the uncertainty of freight rates, corporate finance can be considered more appropriate for container ship investment than project finance. Concerning the freight rate forecasting, the VAR and VEC models use the past information and the cointegrating regression model assumes future information, and hence the former models are found better than the latter model. Finally, concerning the strategies of shipping firms, this study recommends the use of cycle-linked repayment scheme and services contract.
고해상도 시계열 광학 위성 영상과 특징점 추적 기법을 이용한 북극해 해빙 이동 탐지
[Kisti 연계] 대한원격탐사학회 대한원격탐사학회지 Vol.34 No.6 2018 pp.1215-1227
※ 협약을 통해 무료로 제공되는 자료로, 원문이용 방식은 연계기관의 정책을 따르고 있습니다.
해빙의 이동은 지역적 분포뿐만 아니라 해빙의 생성 및 두께에도 영향을 미치기 때문에 해빙의 변화를 평가하는 데에 중요한 정보가 된다. 이 연구에서는 북극해 해빙의 이동 특성 탐지를 위해 Korea Multi-Purpose Satellite-2(KOMPSAT-2)와 Korea Multi-Purpose Satellite-3(KOMPSAT-3)의 두 위성 센서로부터 다중 시기 고해상도 광학 위성 영상을 획득하고, SIFT(Scale-Invariant Feature Transform), SURF(Speeded Up Robust Features) 및 ORB(Oriented FAST and Rotated BRIEF)의 특징점 추적 기법을 적용하였다. 두 위성 센서에서 획득된 영상의 활용을 위해 전처리 단계에서 공간해상도와 방사해상도를 일치시킨 후 특징점 추적 기법을 적용한 결과 SIFT의 경우 영상 전반에 걸쳐 특징점의 고른 공간 분포가 나타났고, SURF의 경우 해빙과 해양의 경계 부분에 특징점이 주요하게 분포하는 경향이 관찰되었으며 이러한 경향은 ORB에서 가장 현저하게 나타났다. 특징점 추적 기법별 연산 시간 측정 결과 SIFT, SURF 및 ORB의 순서로 연산 시간이 감소하였다. ORB의 경우 SIFT 기법 대비 추적된 특징점 수가 평균 59.8%로 줄어들었지만 연산 시간은 평균 8.7%에 해당하는 시간이 소요되어 해빙 이동 특성의 고속 탐지에 적합한 기법으로 판단된다.
Sea ice motion is an important factor for assessing change of sea ice because the motion affects to not only regional distribution of sea ice but also new ice growth and thickness of ice. This study presents an application of multi-temporal high-resolution optical satellites images obtained from Korea Multi-Purpose Satellite-2 (KOMPSAT-2) and Korea Multi-Purpose Satellite-3 (KOMPSAT-3) to measure sea ice motion using SIFT (Scale-Invariant Feature Transform), SURF (Speeded Up Robust Features) and ORB (Oriented FAST and Rotated BRIEF) feature tracking techniques. In order to use satellite images from two different sensors, spatial and radiometric resolution were adjusted during pre-processing steps, and then the feature tracking techniques were applied to the pre-processed images. The matched features extracted from the SIFT showed even distribution across whole image, however the matched features extracted from the SURF showed condensed distribution of features around boundary between ice and ocean, and this regionally biased distribution became more prominent in the matched features extracted from the ORB. The processing time of the feature tracking was decreased in order of SIFT, SURF and ORB techniques. Although number of the matched features from the ORB was decreased as 59.8% compared with the result from the SIFT, the processing time was decreased as 8.7% compared with the result from the SIFT, therefore the ORB technique is more suitable for fast measurement of sea ice motion.
유사 시계열 데이터 분석에 기반을 둔 교육기관의 전력 사용량 예측 기법
[Kisti 연계] 한국정보과학회 정보과학회논문지 Vol.44 No.9 2017 pp.954-965
...시계열 예측 기법은 학습 시점과 예측 시점 간의 차이가 클수록 예측 구간이 넓어짐으로 예측 성능이 크게 떨어진다는 단점이 있다. 본 논문은 이를 보완하려는 방안으로, 먼저 의사결정나무를 이용해 날짜, 요일, 공휴일 여부, 학기 등을 고려하여 시계열 형태가 유사한 전력 데이터를 분류한다. 다음으로 분류된 데이터 셋에 각각의 자기회귀누적이동평균모형을 구성하여, 예측 시점에서 시계열 교차검증을 적용해 대학 캠퍼스의 일간 전력 사용량 예측 기법을 제안한다. 예측의 정확성을 평가하기 위해, 성능 평가 지표를 이용하여 제안한 기법의 타당성을 검증하였다.
※ 협약을 통해 무료로 제공되는 자료로, 원문이용 방식은 연계기관의 정책을 따르고 있습니다.
안정적인 전력 공급은 전력 인프라의 유지 보수 및 작동에 매우 중요하며, 이를 위해 정확한 전력 사용량 예측이 요구된다. 대학 캠퍼스는 전력 사용량이 많은 곳이며, 시간과 환경에 따른 전력 사용량 변화폭이 다양하다. 이러한 이유로, 전력계통의 효율적인 운영을 위해서는 전력 사용량을 정확하게 예측할 수 있는 모델이 요구된다. 기존의 시계열 예측 기법은 학습 시점과 예측 시점 간의 차이가 클수록 예측 구간이 넓어짐으로 예측 성능이 크게 떨어진다는 단점이 있다. 본 논문은 이를 보완하려는 방안으로, 먼저 의사결정나무를 이용해 날짜, 요일, 공휴일 여부, 학기 등을 고려하여 시계열 형태가 유사한 전력 데이터를 분류한다. 다음으로 분류된 데이터 셋에 각각의 자기회귀누적이동평균모형을 구성하여, 예측 시점에서 시계열 교차검증을 적용해 대학 캠퍼스의 일간 전력 사용량 예측 기법을 제안한다. 예측의 정확성을 평가하기 위해, 성능 평가 지표를 이용하여 제안한 기법의 타당성을 검증하였다.
A stable power supply is very important for the maintenance and operation of the power infrastructure. Accurate power consumption prediction is therefore needed. In particular, a university campus is an institution with one of the highest power consumptions and tends to have a wide variation of electrical load depending on time and environment. For this reason, a model that can accurately predict power consumption is required for the effective operation of the power system. The disadvantage of the existing time series prediction technique is that the prediction performance is greatly degraded because the width of the prediction interval increases as the difference between the learning time and the prediction time increases. In this paper, we first classify power data with similar time series patterns considering the date, day of the week, holiday, and semester. Next, each ARIMA model is constructed based on the classified data set and a daily power consumption forecasting method of the university campus is proposed through the time series cross-validation of the predicted time. In order to evaluate the accuracy of the prediction, we confirmed the validity of the proposed method by applying performance indicators.
계층적 시계열 분석을 이용한 지역별 교통사고 발생건수 예측
[Kisti 연계] 한국통계학회 The Korean journal of applied statistics Vol.30 No.1 2017 pp.181-193
...시계열 자료 분석을 위한 대표적인 두 가지 방법인 상향식과 최적조합 예측법을 소개한다. 이러한 예측법은 계층적 시계열을 구성하는 모든 계열을 예측해야 하는 독립적 예측과 달리, 임의의 조정 과정이 없이 하위 계층 계열의 예측값의 합은 항상 상위 계층의 예측값과 일치하게 된다. 또한, 독립적 예측과 비교하여 예측력을 향상시킨다. 계층적 예측법의 효율성을 살펴보기 위하여 국내 16개 시도별 남녀 교통사고 발생건수 시계열 자료를 예측하였다. 이를 통하여 교통사고 발생건수에 대한 각 계층의 예측에서 계층적 방법과 독립적 방법의 차이점 및 우수성을 비교하였다.
※ 협약을 통해 무료로 제공되는 자료로, 원문이용 방식은 연계기관의 정책을 따르고 있습니다.
본 논문에서는 계층적 시계열 자료 분석을 위한 대표적인 두 가지 방법인 상향식과 최적조합 예측법을 소개한다. 이러한 예측법은 계층적 시계열을 구성하는 모든 계열을 예측해야 하는 독립적 예측과 달리, 임의의 조정 과정이 없이 하위 계층 계열의 예측값의 합은 항상 상위 계층의 예측값과 일치하게 된다. 또한, 독립적 예측과 비교하여 예측력을 향상시킨다. 계층적 예측법의 효율성을 살펴보기 위하여 국내 16개 시도별 남녀 교통사고 발생건수 시계열 자료를 예측하였다. 이를 통하여 교통사고 발생건수에 대한 각 계층의 예측에서 계층적 방법과 독립적 방법의 차이점 및 우수성을 비교하였다.
The paper introduces bottom-up and optimal combination methods that can analyze and forecast hierarchical time series. These methods allow forecasts at lower levels to be summed consistently to upper levels without any ad-hoc adjustment. They can also potentially improve forecast performance in comparison to independent forecasts. We forecast regional traffic accident counts as time series data in order to identify efficiency gains from hierarchical forecasting. We observe that bottom-up or optimal combination methods are superior to independent methods in terms of forecast accuracy.
[Kisti 연계] 대한산업공학회 대한산업공학회지 Vol.43 No.6 2017 pp.413-421
※ 협약을 통해 무료로 제공되는 자료로, 원문이용 방식은 연계기관의 정책을 따르고 있습니다.
Multivariate time series data classification has recently attracted interests from both industry and academia, as sensors used in various industries produce a lot of multivariate time series data. Having a lot of features, feature selection from those time series is essential to efficiently construct a classifier. In this paper, we propose a feature selection method to efficiently select features from the multivariate time series data considering variation. The candidate feature set is too large to efficiently select features and there are some feature redundancies. The proposed method can efficiently resolve these problems, and is validated by real datasets obtained from UCI Machine Learning Repository. Experiments show that the proposed method outperforms the typical feature selection methods in terms of accuracy and precision.
MODWT의 시계열 데이터 적용과 ARIMA와 DBNs 결합모델을 이용한 예측
[Kisti 연계] 대한산업공학회 대한산업공학회지 Vol.43 No.6 2017 pp.474-481
※ 협약을 통해 무료로 제공되는 자료로, 원문이용 방식은 연계기관의 정책을 따르고 있습니다.
Times series data is closely related with real-world more than other data. Time Series Prediction is one of the most important subjects that is useful in real-world problems. There are already many time series analysis methods. This study try to overcome the limitations of one of the famous time series analysis methods, ARIMA. ARIMA has limitations that are weakness in short term prediction and absence of nonlinear pattern analysis. This study use MODWT (Maximum Overlap Discrete Wavelet Transform) for preprocessing the time series data, and predict the data with ARIMA (Auto-Regressive Integrated Moving Average) and DBNs (Deep Belief Networks) which is usually used for analyzing nonlinear data. Real case datasets are used to compare the performances with original ARIMA and existing prediction methods. The results from the experiments demonstrate the usefulness and possibilities in various time series fields and superiority with improved accuracy.
고빈도 시계열 분석을 위한 함수 변동성 fARCH(1) 모형 소개와 예시
[Kisti 연계] 한국통계학회 The Korean journal of applied statistics Vol.30 No.6 2017 pp.983-991
...시계열 자료 분석을 위한 최신 함수-변동성 functional ARCH : fARCH(1) 모형을 독자들에게 소개하고 국내 자료 적합을 예시하고 있다. fARCH(1) 모형을 KOSPI/현대차 1분 단위 고빈도 수익률 자료에 적합하여 기존의 ARCH 모형에서는 할 수 없었던 다이나믹한 일중(intraday) 변동성을 추정할 수 있음을 보여주고 있다.
※ 협약을 통해 무료로 제공되는 자료로, 원문이용 방식은 연계기관의 정책을 따르고 있습니다.
본 논문은 고빈도 시계열 자료 분석을 위한 최신 함수-변동성 functional ARCH : fARCH(1) 모형을 독자들에게 소개하고 국내 자료 적합을 예시하고 있다. fARCH(1) 모형을 KOSPI/현대차 1분 단위 고빈도 수익률 자료에 적합하여 기존의 ARCH 모형에서는 할 수 없었던 다이나믹한 일중(intraday) 변동성을 추정할 수 있음을 보여주고 있다.
High frequency time series are now prevalent in financial data. However, models need to be further developed to suit high frequency time series that account for intraday volatilities since traditional volatility models such as ARCH and GARCH are concerned only with daily volatilities. Due to $H{\ddot{o}}rmann$ et al. (2013), functional ARCH abbreviated as fARCH is proposed to analyze intraday volatilities based on high frequency time series. This article introduces fARCH to readers that illustrate intraday volatility configuration on the KOSPI and the Hyundai motor company based on the data with one minute high frequency.
[Kisti 연계] 한국데이터정보과학회 한국데이터정보과학회지 Vol.28 No.4 2017 pp.831-841
※ 협약을 통해 무료로 제공되는 자료로, 원문이용 방식은 연계기관의 정책을 따르고 있습니다.
원주율 ${\pi}$는 임의의 원의 지름에 대한 둘레의 비로 정의되며 상수값을 갖는다. 이 값은 무리수이며 초월수로서 고대로부터 좀 더 정확한 값을 구하기 위한 수많은 노력이 있어왔다. 특히 확률분야에서는 18세기 Buffon의 바늘문제를 기점으로 확률실험을 통하여 ${\pi}$값을 계산하려는 많은 노력이 있어왔다. 통계분야에서 Chong (2008)은 서로 독립인 이변량표준정규확률분포와 단변량 확률보행과정의 차분이 독립인 정규분포를 따른다는 전제조건하에서 ${\pi}$값을 유도하였다. 본 연구에서는 Buffon의 바늘문제와 정사각형에 내접하는 원의 문제에서 유도된 ${\pi}$값을 확률실험을 통하여 근사값을 구해보며 이 값이 실험횟수와 어떤 관계가 있는지 알아본다. 더불어 Chong이 유도한 단변량확률보행과정의 차분에 근거한 ${\pi}$의 일치추정량을 모의실험을 통하여 검증해본다. 나아가 국내외 금융자료를 사용하여 제시된 방법에 의해 계산된 추정값의 수렴여부와 수렴할 경우 극한값과 ${\pi}$의 오차정도를 살펴보고 이를 통하여 효율적시장가설에 대한 설명을 시도한다.
The irrational number ${\pi}$ is defined as the ratio of circumference of a circle to its radius and always becomes constant. This article does Monte Carlo approximation of its value using the famous Buffon's needle experiment and shows that its convergence is not always proportional to the sample size. We also do Monte Carlo simulations to see the convergence of the computed ${\pi}$ values from the random walk series with independent normal increment. Finally we apply the theoretical derivation to various financial time series data such as KOSPI, stock prices of Korean big firms, global stock indices and major foreign exchange rates. The historical data shows that log transformed data random walk process but most of their first lagged data don't follow a normal distribution. More importantly the computed value from the ratio of the regression coefficient ${\pi}$ tend to converge a constant, unfortunately not ${\pi}$. Using this result we could doubt on the efficient market hypothesis, and relate the degree of the hypothesis with the amount of deviation of the estimated ${\pi}$ values.
[Kisti 연계] 한국태양에너지학회 한국태양에너지학회 논문집 Vol.37 No.5 2017 pp.77-84
※ 협약을 통해 무료로 제공되는 자료로, 원문이용 방식은 연계기관의 정책을 따르고 있습니다.
The purpose of this paper is to propose the way of computing conduction time series factors (CTSF) using numerical method. After the accuracy of the numerical solution procedure being verified, the method is applied to the wall type 24 and roof type 14 of ASHARE to find the conduction time series coefficients, so called conduction time series factors. The results agree well with the values presented in the ASHRAE handbook. The method proposed can be easily applied to find unknown CTSF for more complex structures. It provides information about the temperature changes at a given location and time, thus validity of generated CTSF can be checked easily.
불완전 시계열 데이터를 위한 이산 HMM 학습 알고리듬
[Kisti 연계] 한국멀티미디어학회 멀티미디어학회논문지 Vol.19 No.1 2016 pp.22-29
※ 협약을 통해 무료로 제공되는 자료로, 원문이용 방식은 연계기관의 정책을 따르고 있습니다.
Hidden Markov Model is one of the most successful and popular tools for modeling real world sequential data. Real world signals come in a variety of shapes and variabilities, among which temporal and spectral ones are the prime targets that the HMM aims at. A new problem that is gaining increasing attention is characterizing missing observations in incomplete data sequences. They are incomplete in that there are holes or omitted measurements. The standard HMM algorithms have been developed for complete data with a measurements at each regular point in time. This paper presents a modified algorithm for a discrete HMM that allows substantial amount of omissions in the input sequence. Basically it is a variant of Baum-Welch which explicitly considers the case of isolated or a number of omissions in succession. The algorithm has been tested on online handwriting samples expressed in direction codes. An extensive set of experiments show that the HMM so modeled are highly flexible showing a consistent and robust performance regardless of the amount of omissions.
범주형 시계열 자료의 군집화: 프로야구 자료의 사례 연구
[Kisti 연계] 한국데이터정보과학회 한국데이터정보과학회지 Vol.27 No.3 2016 pp.621-627
...시계열 자료의 군집화에 대하여 정리해 보았다. 시계열 자료의 군집화는 일반적인 군집화에 시간을 고려해야하는 측면이 있다. 한편, 범주형 시계열 자료의 군집화에 대한 연구가 진행되었으나 현재 정리 요약된 국내외 논문을 찾기 어렵다. 본 논문에서는 범주형 시계열을 군집화 하는 몇 가지 방법들을 제시하고 그 방법들을 비교하기 위해 프로야구 데이터를 이용하였다. 프로야구 팀들 간에 어떤 팀이 특정 팀에 유독 약한 경기력을 보이는 경우가 있다. 국내 최강이라는 S팀이 유독 H팀에게 그런 경우가 그렇다. 2015년 S팀의 상대전적의 군집화를 통해 S팀과 H팀의 관계가 유별난 지를 밝히려 한다. 통계적으로 말하자면, 승/패로 이루어진 시계열 자료의 군집화를 수행하려는 것이다. 분석결과 S팀과 H팀과의 관계가 다른 팀들과의 관계에 비해 눈에 띠는 차이가 있음을 알 수 있었다.
※ 협약을 통해 무료로 제공되는 자료로, 원문이용 방식은 연계기관의 정책을 따르고 있습니다.
범주형 시계열 자료의 군집화에 대하여 정리해 보았다. 시계열 자료의 군집화는 일반적인 군집화에 시간을 고려해야하는 측면이 있다. 한편, 범주형 시계열 자료의 군집화에 대한 연구가 진행되었으나 현재 정리 요약된 국내외 논문을 찾기 어렵다. 본 논문에서는 범주형 시계열을 군집화 하는 몇 가지 방법들을 제시하고 그 방법들을 비교하기 위해 프로야구 데이터를 이용하였다. 프로야구 팀들 간에 어떤 팀이 특정 팀에 유독 약한 경기력을 보이는 경우가 있다. 국내 최강이라는 S팀이 유독 H팀에게 그런 경우가 그렇다. 2015년 S팀의 상대전적의 군집화를 통해 S팀과 H팀의 관계가 유별난 지를 밝히려 한다. 통계적으로 말하자면, 승/패로 이루어진 시계열 자료의 군집화를 수행하려는 것이다. 분석결과 S팀과 H팀과의 관계가 다른 팀들과의 관계에 비해 눈에 띠는 차이가 있음을 알 수 있었다.
A certain professional baseball team tends to be very weak against another particular team. For example, S team, the strongest team in Korea, is relatively weak to H team. In this paper, we carried out clustering the Korean baseball teams based on the records against the team S to investigate whether the pattern of the record of the team H is different from those of the other teams. The technique we have employed is 'time series clustering', or more specifically 'categorical time series clustering'. Three methods have been considered in this paper: (i) distance based method, (ii) genetic sequencing method and (iii) periodogram method. Each method has its own advantages and disadvantages to handle categorical time series, so that it is recommended to draw conclusion by considering the results from the above three methods altogether in a comprehensive manner.
계수 시계열을 위한 정수값 GARCH 모델링: 사례분석
[Kisti 연계] 한국통계학회 The Korean journal of applied statistics Vol.28 No.1 2015 pp.115-122
...시계열의 조건부 이차적률인 변동성(volatility)을 다루고 있다. 여러 가지 정수값 GARCH, 즉, INGARCH 모형들을 소개하고 계수 시계열인 국내 풍진발생건수에 적용시켜 보았다. 과산포(over-dispersion)와 영과잉(zero-inflation)현상을 계수 시계열의 변동성 분석 입장에서 살펴보았고 향후 분석 모형으로서 영과잉(zero-inflation) INGARCH 모형인 ZI-INGARCH 모형을 살펴보았다.
※ 협약을 통해 무료로 제공되는 자료로, 원문이용 방식은 연계기관의 정책을 따르고 있습니다.
본 연구에서는 정수값을 갖는 계수 시계열의 조건부 이차적률인 변동성(volatility)을 다루고 있다. 여러 가지 정수값 GARCH, 즉, INGARCH 모형들을 소개하고 계수 시계열인 국내 풍진발생건수에 적용시켜 보았다. 과산포(over-dispersion)와 영과잉(zero-inflation)현상을 계수 시계열의 변동성 분석 입장에서 살펴보았고 향후 분석 모형으로서 영과잉(zero-inflation) INGARCH 모형인 ZI-INGARCH 모형을 살펴보았다.
This article is concerned with count time series taking values in non-negative integers. Along with the first order mean of the count time series, conditional variance (volatility) has recently been paid attention to and therefore various integer-valued GARCH(generalized autoregressive conditional heteroscedasticity) models have been suggested in the last decade. We introduce diverse integer-valued GARCH(INGARCH, for short) processes to count time series and a real data application is illustrated as a case study. In addition, zero inflated INGARCH models are discussed to accommodate zero-inflated count time series.
금융시계열 변동성 측정 방법의 비교 분석: 고빈도 자료 및 융합 방법
[Kisti 연계] 한국통계학회 The Korean journal of applied statistics Vol.28 No.6 2015 pp.1163-1170
...시계열 변동성 측정을 위한 다양한 방법들을 소개하고 비교분석 하였다. 최근 들어 활발한 연구가 이루어지고 있는 고빈도(high frequency) 자료에 기초한 변동성 측정방법을 국내 주가에 적용시켜 1분 단위 고빈도 주가로부터 일별 변동성을 계산하였다. 또한, 모형 기반 방법인 GARCH와 자료 기반 방법인 역사적 변동성(historical volatility)을 융합하여 새로운 변동성 측정법을 제안하였다.
※ 협약을 통해 무료로 제공되는 자료로, 원문이용 방식은 연계기관의 정책을 따르고 있습니다.
본 연구에서는 금융시계열 변동성 측정을 위한 다양한 방법들을 소개하고 비교분석 하였다. 최근 들어 활발한 연구가 이루어지고 있는 고빈도(high frequency) 자료에 기초한 변동성 측정방법을 국내 주가에 적용시켜 1분 단위 고빈도 주가로부터 일별 변동성을 계산하였다. 또한, 모형 기반 방법인 GARCH와 자료 기반 방법인 역사적 변동성(historical volatility)을 융합하여 새로운 변동성 측정법을 제안하였다.
Various computational methods for obtaining volatilities for financial time series are reviewed and compared with each other. We reviewed model based GARCH approach as well as the data based method which can essentially be regarded as a smoothing technique applied to the squared data. The method for high frequency data is focused to obtain the realized volatility. A hybrid method is suggested by combining the model based GARCH and the historical volatility which is a data based method. Korea stock prices are analysed to illustrate various computational methods for volatilities.
MODIS 시계열 자료(2001~2011) 및 Timesat 알고리즘에 기초한 남한 지역 식물계절 분석
[Kisti 연계] 한국하천호수학회 Korean journal of ecology and environment Vol.47 No.3 2014 pp.186-193
※ 협약을 통해 무료로 제공되는 자료로, 원문이용 방식은 연계기관의 정책을 따르고 있습니다.
본 연구는 MODIS 위성영상을 이용하여 광역적으로 진행되고 있는 식물계절학적 특징을 분석하고자 수행하였다. 위성영상을 이용한 식물계절학적 특징 분석은 현장 관찰 자료의 분석을 위한 전반적인 식물계절 경향성 및 변동성에 필요한 정보를 제공해 줄 수 있으며, 현장 관찰 값과 광역 식물계절 관측 값의 연결을 통하여 광역 수준에서 보다 정밀도 높은 식물 계절현상 모니터링을 가능하게 한다. 본 연구의 기반이 된 MODIS EVI 자료는 Timesat Algorithms의 double logistic function으로 평활화시켜 분석하였다. 제주${\rightarrow}$남해안${\rightarrow}$지리산${\rightarrow}$소백산${\rightarrow}$설악산의 위도 분포에 따라 식물계절 시작일은 늦어지는 경향을 보였다. 그러나 11년간 주요 산림 지역에서의 식물 계절 시작은 해마다 시작일에 다르게 나타나는 연변동의 특징을 보였다. 변동 자료를 고차다항식으로 변형한 결과, 제주도는 연간 0.38일, 소백산지역은 0.174일 계절 시작이 늦어지고, 남해안은 0.32일, 지리산은 0.239일, 설악산 지역은 0.119일 개엽일이 빨라지고 있는 것으로 나타났다. 우리나라 전체 식물계절 시작 시기의 특징을 공간적으로 살펴보면, 주요 산림 지역은 늦어지고, 분지나 산록의 남사면지역에는 빨라지는 것으로 나타났다. 지역적으로 살펴보면, 제주도의 남서해안 및 북동해안 사면지역, 동남해안 지역이 빠른 경향을 보였다. 행정구역별 식물계절 시작 시기를 분석한 결과, 2001년에는 서울과 경기도, 동해안, 남해안, 마산, 창원, 밀양, 대구, 제주도를 중심으로 빠르게 시작되었다. 이는 서울, 경기도, 마산, 창원, 밀양, 대구 등의 도시지역은 도시화에 따른 기온상승의 영향인 것으로 해석된다. 이 같은 경향은 2005, 2010년에도 같은 경향으로 보이고 있어 도시화가 식물계절 변화에 중요한 영향을 미치고 있는 것으로 해석할 수 있다. 본 연구의 시간적 규모인 10년 이내에서는 기후변동에 따른 식물계절 현상의 변이성을 잘 나타내었으며, 이러한 식물계절 모니터링 기법은 30년 이상의 보다 장기적인 자료를 축적을 통하여 기후변화 양상에 따른 생물 계절 현상 변화와 해석에 중요한 역할을 할 것으로 생각된다.
This study aimed to analyze spatio-temporal trends of phenological characteristics in South Korea by using MODIS EVI. For the phenology analysis, we had applied double logistic function to MODIS time-series data. Our results showed that starting date of phenology seems to have a tendency along with latitudinal trends. Starting date of phenology of Jeju Island and Mt. Sobeak went back for 0.38, 0.174 days per year, respectively whereas, Mt. Jiri and Mt. Seolak went forward for 0.32 days, 0.239 days and 0.119 days, respectively. Our results exhibited the fluctuation of plant phonological season rather than the change of phonological timing and season. Starting date of plant phenology by spatial distribution revealed tendency that starting date of mountain area was late, and basin and south foot of mountain was fast. In urban ares such as Seoul metropolitan, Masan, Changwon, Milyang, Daegu and Jeju, the phonological starting date went forward quickly. Pheonoligcal attributes such as starting date and leaf fall in urban areas likely being affected from heat island effect and related warming. Our study expressed that local and regional monitoring on phonological events and changes in Korea would be possible through MODIS data.
다사건 시계열 자료 분석을 위한 베이지안 기반의 통계적 접근의 응용
[Kisti 연계] 한국경영과학회 한국경영과학회지 Vol.39 No.4 2014 pp.51-69
※ 협약을 통해 무료로 제공되는 자료로, 원문이용 방식은 연계기관의 정책을 따르고 있습니다.
Times to multiple events (TMEs) are a major data type in large-scale business and medical data. Despite its importance, the analysis of TME data has not been well studied because of the analysis difficulty from censoring of observation. To address this difficulty, we have developed a Bayesian-based multivariate survival analysis method, which can successfully estimate the joint probability density of survival times. In this work, we extended this method for the analysis of precedence, dependency and causality among multiple events. We applied this method to the electronic health records of 2,111 patients in a children's hospital in the US and the proposed analysis successfully shows the relation between times to two types of hospital visits for different medical issues. The overall result implies the usefulness of the multivariate survival analysis method in large-scale big data in a variety of areas including marketing, human resources, and e-commerce. Lastly, we suggest our future research directions based multivariate survival analysis method.
[Kisti 연계] 한국경영과학회 한국경영과학회지 Vol.38 No.2 2013 pp.65-73
※ 협약을 통해 무료로 제공되는 자료로, 원문이용 방식은 연계기관의 정책을 따르고 있습니다.
In the simulation output analysis, bootstrap method is an applicable resampling technique to insufficient data which are not significant statistically. The moving block bootstrap, the stationary bootstrap, and the threshold bootstrap are typical bootstrap methods to be used for autocorrelated time series data. They are nonparametric methods for stationary time series data, which correctly describe the original data. In the simulation output analysis, however, we may not use them because of the non-stationarity in the data set caused by the trend such as increasing or decreasing. In these cases, we can get rid of the trend by differencing the data, which guarantees the stationarity. We can get the bootstrapped data from the differenced stationary data. Taking a reverse transform to the bootstrapped data, finally, we get the pseudo-samples for the original data. In this paper, we introduce the applicability of bootstrap methods to the time series data having trend, and then verify it through the statistical analyses.
MODIS 시계열 자료를 이용한 백두산 아고산대 식생 고사지역 탐지
[Kisti 연계] 대한지리학회 대한지리학회지 Vol.47 No.6 2012 pp.825-835
※ 협약을 통해 무료로 제공되는 자료로, 원문이용 방식은 연계기관의 정책을 따르고 있습니다.
본 연구의 목적은 백두산 아고산대에 분포하는 식생고사지역 탐지기법 개발과 지도화이다. 탐지기법은 모디스 영상을 이용한 규칙기반 모델을 개발하였다. 식생고사지역은 잎의 낙지(pruning) 단계에 따라 초기고사(initial dieback), 중간고사(middle dieback), 완전고사(end dieback)로 분류하였다. 2001~2006년 고사지역 면적은 $28km^2$로 확대되었으며, 초기고사는 $16km^2$, 중간고사는 $10km^2$, 완전고사는 $2km^2$로 분석되었다. 2006~20011년에는 고사지역 면적은 $35km^2$로 확대되었다. 2001~2011년 고사지역 총면적은 $35km^2$로, 중간고사지역과 완전고사지역이 확대된 것으로 분석되었다. 본 연구에 적용된 규칙기반 모델은 지구온난화에 따른 산간지대 식생고사지역 예비 탐색에 활용될 수 있을 것으로 기대된다.
The aim of this research is to develope technique and mapping for detecting distribution of vegetation dieback areas in the subalpine zone of Mt. Baekdu. A detection technique developed the rule-based model using MODIS images. Dieback areas could be classified as 4 categories of initial dieback, middle dieback, and end dieback by pruning stages of leaves. Dieback area was $28km^2$ from year 2001 to year 2006, intial dieback was $16km^2$, middle dieback was $10km^2$, and end dieback was $2km^2$ by the each stage. Dieback area was $35km^2$ from year 2006 to year 2011. Total area was $35km^2$ from year 2001 to year 2011, areas of middle dieback and end dieback were increased. The research method for this study may help to support in application with preliminary detection of dieback areas in the mountains by the global warming.
[Kisti 연계] 한국통계학회 Communications for statistical applications and methods Vol.18 No.1 2011 pp.79-87
...시계열 자료를 분석하는데 있어 일반적으로 알려진 ARIMA 모형에 적합하여 분석을 행하면 공간적인 정보를 반영하지 못하기 때문에 기존에 시간만을 고려한 시계열 분석방법에 공간통계의 공간적 정보를 반영한 공간시계열 모형을 고려한다. 공간시계열 모형에서 공간의 위치 및 영향은 시계열 모형에 공간적 정보로써 가중치행렬을 더 함으로써 처리 가능해진다. 가중치행렬은 지리적으로 인접한 지역일수록 공간의존도가 높다는 것을 반영한 것이며 공간시계열 모형의 연구에서 가중치행렬은 인접한 지역들은 동일한 영향을 줄 것이라 가정하였다. 따라서 본 논문에서는 공간시계열 모형인 STARMA 모형과 STBL 모형에 대한 식별방법, 통계적 추론 및 예측력 비교에 대해 연구하였고 특히, 모수추정의 알고리즘 비교와 공간시계열 모형의 예측력 비교를 통해 Kalman-Filter 방법의 우수성을 보이고자 한다.
※ 협약을 통해 무료로 제공되는 자료로, 원문이용 방식은 연계기관의 정책을 따르고 있습니다.
공간적, 시간적으로 퍼져나가는 전염성이 강한 질병인 수두자료를 이용하여 공간 시계열 자료를 분석하는데 있어 일반적으로 알려진 ARIMA 모형에 적합하여 분석을 행하면 공간적인 정보를 반영하지 못하기 때문에 기존에 시간만을 고려한 시계열 분석방법에 공간통계의 공간적 정보를 반영한 공간시계열 모형을 고려한다. 공간시계열 모형에서 공간의 위치 및 영향은 시계열 모형에 공간적 정보로써 가중치행렬을 더 함으로써 처리 가능해진다. 가중치행렬은 지리적으로 인접한 지역일수록 공간의존도가 높다는 것을 반영한 것이며 공간시계열 모형의 연구에서 가중치행렬은 인접한 지역들은 동일한 영향을 줄 것이라 가정하였다. 따라서 본 논문에서는 공간시계열 모형인 STARMA 모형과 STBL 모형에 대한 식별방법, 통계적 추론 및 예측력 비교에 대해 연구하였고 특히, 모수추정의 알고리즘 비교와 공간시계열 모형의 예측력 비교를 통해 Kalman-Filter 방법의 우수성을 보이고자 한다.
A spatial time series model was used for analyzing the method of spatial time series (not the ARIMA model that is popular for analyzing spatial time series) by using chicken pox data which is a highly contagious disease and grid data due to ARIMA not reflecting the spatial processes. Time series model contains a weighting matrix, because that spatial time series model influences the time variation as well as the spatial location. The weighting matrix reflects that the more geographically contiguous region has the higher spatial dependence. It is hypothesized that the weighting matrix gives neighboring areas the same influence in the study of the spatial time series model. Therefore, we try to present the conclusion with a weighting matrix in a way that gives the same weight to existing neighboring areas in the study of the suitability of the STARMA model, spatial time series model and STBL model, in the comparative study of the predictive power for statistical inference, and the results. Furthermore, through the Kalman-Filter method we try to show the superiority of the Kalman-Filter method through a parameter assumption and the processes of prediction.
0개의 논문이 장바구니에 담겼습니다.
선택하신 파일을 압축중입니다.
잠시만 기다려 주십시오.