년 - 년
마이크로 컴퓨터 상에서의 시계열 분석 통계 패키지의 활용에 관한 연구
[Kisti 연계] 한국경영과학회 한국경영과학회 학술대회논문집 1990 pp.11-21
...시계열 자료 분석을 위한 마이크로 컴퓨터용 통계패키지인 TIMESLAB을 소개하였다. TIMESALB은 종래의 통계 분석용 패키지인 SPSS, SAS, TSP 들이 대형 컴퓨터 시스템에 맞도록 설계되어 있어 PC에 서 활용하기에는 많은 디스크 용량을 필요로 하는 등의 문제점을 모두 극복 한 PC용 시계열 자료 분석 프로그램이다. TIMESLAB은 대화용으로 설계되 어 있고 아주 적은 하드 디스크 용량만 가지고서도 쉽게 접근이 가능한 편 리한 시스템의 그 구성, 활용 및 명령어들을 제시하였고, 예제 프로그램과 그 결과를 제시하였다.
※ 협약을 통해 무료로 제공되는 자료로, 원문이용 방식은 연계기관의 정책을 따르고 있습니다.
본 논문에서는 시계열 자료 분석을 위한 마이크로 컴퓨터용 통계패키지인 TIMESLAB을 소개하였다. TIMESALB은 종래의 통계 분석용 패키지인 SPSS, SAS, TSP 들이 대형 컴퓨터 시스템에 맞도록 설계되어 있어 PC에 서 활용하기에는 많은 디스크 용량을 필요로 하는 등의 문제점을 모두 극복 한 PC용 시계열 자료 분석 프로그램이다. TIMESLAB은 대화용으로 설계되 어 있고 아주 적은 하드 디스크 용량만 가지고서도 쉽게 접근이 가능한 편 리한 시스템의 그 구성, 활용 및 명령어들을 제시하였고, 예제 프로그램과 그 결과를 제시하였다.
밤 가격(價格)의 시계열분석(時系列分析)과 예측(豫測)에 관(關)한 연구(硏究)
[Kisti 연계] 한국임학회 한국임학회지 Vol.73 No.1 1986 pp.70-75
※ 협약을 통해 무료로 제공되는 자료로, 원문이용 방식은 연계기관의 정책을 따르고 있습니다.
지난 20년(年) 동안에 있었던 우리나라 밤 가격(價格)의 경향변동(傾向變動)과 계절변동(季節變動)을 분석(分析)하고, 가결변동(價格變動)을 유도(誘導)하여 장래(將來) 20년간(年間)(1985~2004)의 밤 생산량(生産量)과 가격(價格)을 예측(豫測) 하였으며, 그 결과(結果)를 요약(要約)하면 다음과 같다. 1) 밤 가격(價格)은 1965~1972년(年)까지 매년(每年) 10.95%씩 상승(上昇)하였으나, 그 후 1973~1984 년(年)까지는 밤의 과다공급(過多供給) 때문에 매년(每年) 7.25%씩 하락(下落)하였다. 2) 1 년중(年中) 밤 가격(價格)은 수확기(收穫期)인 10월경(月傾)에 가장 낮으며, 7월경(月傾)에 가장 높아진다. 이러한 밤 가격(價格)의 계절변동(季節變動)은 시간(時間)이 지남에 따라서 다소 평준화(平準化)되는 경향(傾向)이 있으나, 아직도 계절지수(季節指數)의 변동폭(變動幅)은 대단히 크다. 3) 일정조건(一定條件)을 전제(前提)하여, 우리나라의 밤 생산량(生産量)은 1992 년(年)에 약(約) 99,000 톤으로 극대치(極大値)에 이르렀다가, 그 후 급속(急速)히 감소(減少)하기 시작(始作)하여 2004년(年)에는 년생산량(年生産量)이 23,000톤 정도가 될 것이며, 밤 가격(價格)은 1992년(年)까지 현재(現在)의 가격수준(價格水準)과 비슷하거나 약간의 상승세(上昇勢)를 유지(維持)하다가, 그 후 급속(急速)히 상승(上昇)할 것으로 예측(豫測)되었다.
The secular trend and seasonal variation of chestnut prices have been analyzed, and the production and price for the next two decades (1985-2004) have been forecasted by the derived equation model. The results of the study can be summarized as follows; 1) The chestnut prices went up at the rate of 10.95% per annum during 1965-1972, but, due to excessive supply of chestnuts, went down at the rate of 7.25% during 1973-1984. 2) In a year, the prices were lowest at the harvesting season, especially on October, and highest on July. Such a seasonal fluctuations of chestnut prices tend to be even with the passage of time, but the range of fluctuation is still wide. 3) It was forecasted under certain premises that the annual chestnut production will be increased by 99,000 tons in 1992, but the amount will fall rapidly to about 23,000 tons in 2004. The prices will be similar to the present level or have slightly upward Tendency until 1992, but this will be rapidly raised thereafter.
동적 시간 왜곡과 시계열 클러스터링을 이용한국내 여행자의 이동경로 선정
[NRF 연계] 한국자료분석학회 Journal of The Korean Data Analysis Society Vol.28 No.1 2026.02 pp.81-95
...시계열로 분석하고, 유사한 이동 패턴을 유형화하기 위해 동적 시간 왜곡(dynamic time warping, DTW) 기반 시계열 군집분석 방법의 성능을 비교·평가하였다. 국내 여행자의 이동경로 분석을 위해 AI 허브(aihub.or.kr)의 ‘국내 여행로그’ 데이터를 사용하였다. 이동경로 간 유사도 분석을 위해 DTW를 적용하였으며, 유사한 이동경로 패턴의 군집화를 위해 DBSCAN, HDBSCAN, k-means, HDBSCAN&k-means 혼합, k-medoids 등 다섯 가지 시계열 군집분석 방법을 적용하였다. 군집별 대표 여행경로 선정은 DTW distance-based medoid(DTW medoid)와 DTW Barycenter Averaging(DBA) 방법을 적용하였다. 또한, 군집별 품질 평가 및 대표경로의 대표성 평가를 위해 분리도와 응집도를 바탕으로 DTW 기반의 시계열 군집 품질 평가 지표와 대표경로의 대표성 분석 지표를 제시하였다. 분석 결과 군집화 성능은 HDBSCAN 방법에서 가장 우수하게 나타났으며, 대부분의 군집에서 DTW medoid 방법으로 선정된 대표경로가 높은 대표성을 보였다.
※ 협약을 통해 무료로 제공되는 자료로, 원문이용 방식은 연계기관의 정책을 따르고 있습니다.
스마트기기의 확산으로 초 단위의 정밀한 시공간 정보를 포함하는 대규모 GPS 기반 이동경로 데이터의 수집이 가능해졌다. 본 연구는 여행자의 이동경로 데이터를 시간 순서에 따른 시계열로 분석하고, 유사한 이동 패턴을 유형화하기 위해 동적 시간 왜곡(dynamic time warping, DTW) 기반 시계열 군집분석 방법의 성능을 비교·평가하였다. 국내 여행자의 이동경로 분석을 위해 AI 허브(aihub.or.kr)의 ‘국내 여행로그’ 데이터를 사용하였다. 이동경로 간 유사도 분석을 위해 DTW를 적용하였으며, 유사한 이동경로 패턴의 군집화를 위해 DBSCAN, HDBSCAN, k-means, HDBSCAN&k-means 혼합, k-medoids 등 다섯 가지 시계열 군집분석 방법을 적용하였다. 군집별 대표 여행경로 선정은 DTW distance-based medoid(DTW medoid)와 DTW Barycenter Averaging(DBA) 방법을 적용하였다. 또한, 군집별 품질 평가 및 대표경로의 대표성 평가를 위해 분리도와 응집도를 바탕으로 DTW 기반의 시계열 군집 품질 평가 지표와 대표경로의 대표성 분석 지표를 제시하였다. 분석 결과 군집화 성능은 HDBSCAN 방법에서 가장 우수하게 나타났으며, 대부분의 군집에서 DTW medoid 방법으로 선정된 대표경로가 높은 대표성을 보였다.
The proliferation of smart devices has enabled the collection of large-scale GPS-based movement trajectory data containing fine-grained spatio-temporal information at the second level. This study analyzes travelers' movement trajectories as time-ordered time series and compares the performance of Dynamic Time Warping(DTW)-based time-series clustering methods to typify similar movement patterns. For domestic travel trajectory analysis, the Domestic Travel Log dataset provided by AI Hub(aihub.or.kr) was used. DTW was applied to measure similarity between trajectories, and five time-series clustering methods―DBSCAN, HDBSCAN, k-means, a hybrid HDBSCAN&k-means approach, and k-medoids―were employed to cluster similar travel patterns. Representative travel routes for each cluster were extracted using two DTW-based methods: the DTW distance-based medoid(DTW medoid) and DTW Barycenter Averaging(DBA). In addition, DTW-based clustering quality metrics and representativeness evaluation metrics were proposed based on separation and cohesion to assess cluster quality and the representativeness of the extracted routes. The results show that HDBSCAN outperformed other methods in clustering accuracy, and in most cases, representative routes derived from the DTW medoid method yielded highly representative cluster examplars than those derived using DBA.
서울시 자살사망률의 시계열 및 공간적 분포 변화, 2000-2023
[NRF 연계] 한국보건사회연구원 보건사회연구 Vol.45 No.4 2025.12 pp.235-258
...시계열적 추이와 공간적 분포 변화를 분석하였다. 통계청 사망원인자료를 이용하여 서울시 자살사망자를 추출하여, 성별, 연령별, 수단별(목맴, 중독, 가스중독, 추락, 익사, 기타)로 사망률을 산출하였으며, 추이의 변화를 파악하기 위해 조인포인트 분석을 이용하여 변화 시점과 연간 변화율 및 95% 신뢰구간을 추정하였다. 또한, 서울시 25개 자치구별 연령표준화 자살사망률 및 사망비를 산출하여 자살률의 지역적 변이를 기간별(2000–2005, 2006–2011, 2012–2017, 2018–2023)로 분석하였다. 서울시 자살사망률은 지난 20여 년간 증가와 감소를 반복하였으나, 최근 들어 여성의 자살률이 상승하였다. 특히 2015년 이후 10–18세 청소년(연간 증가율: 11.2%, 95% 신뢰구간:4.0-35.0)과 19–39세(연간 증가율: 4.1%, 95% 신뢰구간: 0.6-16.1) 청년층에서 증가가 관찰되었다. 자살수단은 목맴이 가장 많이 발생했으나, 중독, 가스중독, 추락으로 인한 자살도 많았으며, 시기에 따라 변화 양상이 다르게 나타났다. 자치구별 자살률은 대체로 서울시 자살사망률의 추이와 유사한 변화를 보였지만, 일부 자치구에서는 서울시 평균에 비해 자살률이 높아지는 경향을 보였다(자살사망비>1). 최근 여성 청소년과 청년층의 자살률이 증가하고 있어 이에 대한 대응이 요구된다. 자살률 변화의 기저 요인을 규명하고 이를 기반으로 한 정책을 마련하기 위한 후속 연구가 필요하다.
※ 협약을 통해 무료로 제공되는 자료로, 원문이용 방식은 연계기관의 정책을 따르고 있습니다.
본 연구는 2000년부터 2023년까지 서울시 자살사망률의 시계열적 추이와 공간적 분포 변화를 분석하였다. 통계청 사망원인자료를 이용하여 서울시 자살사망자를 추출하여, 성별, 연령별, 수단별(목맴, 중독, 가스중독, 추락, 익사, 기타)로 사망률을 산출하였으며, 추이의 변화를 파악하기 위해 조인포인트 분석을 이용하여 변화 시점과 연간 변화율 및 95% 신뢰구간을 추정하였다. 또한, 서울시 25개 자치구별 연령표준화 자살사망률 및 사망비를 산출하여 자살률의 지역적 변이를 기간별(2000–2005, 2006–2011, 2012–2017, 2018–2023)로 분석하였다. 서울시 자살사망률은 지난 20여 년간 증가와 감소를 반복하였으나, 최근 들어 여성의 자살률이 상승하였다. 특히 2015년 이후 10–18세 청소년(연간 증가율: 11.2%, 95% 신뢰구간:4.0-35.0)과 19–39세(연간 증가율: 4.1%, 95% 신뢰구간: 0.6-16.1) 청년층에서 증가가 관찰되었다. 자살수단은 목맴이 가장 많이 발생했으나, 중독, 가스중독, 추락으로 인한 자살도 많았으며, 시기에 따라 변화 양상이 다르게 나타났다. 자치구별 자살률은 대체로 서울시 자살사망률의 추이와 유사한 변화를 보였지만, 일부 자치구에서는 서울시 평균에 비해 자살률이 높아지는 경향을 보였다(자살사망비>1). 최근 여성 청소년과 청년층의 자살률이 증가하고 있어 이에 대한 대응이 요구된다. 자살률 변화의 기저 요인을 규명하고 이를 기반으로 한 정책을 마련하기 위한 후속 연구가 필요하다.
This study aimed to examine temporal and spatial changes in suicide rates in Seoul from 2000 to 2023. We used cause-of-death data to identify suicide deaths in Seoul. Suicide rates were calculated by sex, age, and method (hanging, poisoning, gas poisoning, jumping, drowning, and others). Joinpoint regression analysis was conducted to identify time points where suicide trends changed and to estimate the annual percent change (APC) and corresponding 95% confidence intervals (CIs). Area-specific age-standardized mortality rates (ASMR) and ratios (SMR) of suicide were calculated for 25 districts and visualized for each period (2000-2005, 2006-2011, 2012-2017, and 2018-2023). Suicide rates in Seoul increased around 2010 but began to decrease thereafter. However, in recent years, female suicide rates have increased, particularly among adolescents (APC: 11.2%, 95% CI: 4.0-35.0) and young adults (APC: 4.1%, 95% CI: 0.6-16.1) since 2015. Hanging was the most common method followed by poisoning, gas poisoning, and jumping, with patterns changing over time. Suicide rates varied across districts, with some showing a higher increase than the average (SMR>1). The recent increases in suicides among young women highlight the need for urgent action. A coordinated public health approach is necessary to develop effective suicide prevention policies.
[NRF 연계] 사단법인 미래융합기술연구학회 아시아태평양융합연구교류논문지 Vol.11 No.2 2025.02 pp.597-610
...시계열 통계량을 추출하여 이론적 기대 빈도 및 몬테카를로 방식의 카이제곱 적합도 검정을 수행하였다. 또한 45개 번호 집단 간의 출현 빈도에 대한 차이를 확인하기 위해 ANOVA 검정, 6개 당첨 번호 곱의 분포가 벤포드 법칙을 얼마나 따르는지에 대한 상관 관계를 조사하였다. 실험에서는 24가지 세부 가설 중 1가지 경우에 대해 귀무가설이 기각되고 나머지 경우에서는 전체적으로 통계적 유의성이 있음을 확인하였다.
※ 협약을 통해 무료로 제공되는 자료로, 원문이용 방식은 연계기관의 정책을 따르고 있습니다.
로또 복권은 통계적 무작위성이 보장되어야 하는 대표적인 확률 게임임에도 일부의 사람들은 그 공정성에 대한 의구심을 표현하고 있다. 이러한 의혹 해소를 위한 대부분의 연구들은 6개 당첨 번호에서 연속 번호 출현 형태, 홀짝의 개수, 색상별 출현 횟수, 당첨 번호 합의 분포 등과 같이 복권 사업자가 제공하는 통계 데이터를 기반으로 진행되어 왔다. 본 논문에서는 해당 사이트에서 제공하지 않는 새로운 통계량을 제시하고 이를 기반으로 추첨의 무작위성에 대한 검정을 수행하였다. 각 당첨 번호의 연속 회차간 출현 길이, 동일 번호의 회차간 출현 간격과 같은 시계열 통계량을 추출하여 이론적 기대 빈도 및 몬테카를로 방식의 카이제곱 적합도 검정을 수행하였다. 또한 45개 번호 집단 간의 출현 빈도에 대한 차이를 확인하기 위해 ANOVA 검정, 6개 당첨 번호 곱의 분포가 벤포드 법칙을 얼마나 따르는지에 대한 상관 관계를 조사하였다. 실험에서는 24가지 세부 가설 중 1가지 경우에 대해 귀무가설이 기각되고 나머지 경우에서는 전체적으로 통계적 유의성이 있음을 확인하였다.
Despite being a representative probability game requiring statistical randomness, some individuals doubt the fairness of lottery draws. To resolve such suspicions, most studies have relied on statistical data provided by lottery operators, such as the consecutive number occurrence pattern of six winning numbers within a round, the number of odd and even numbers, the frequency of occurrences by color, and the distribution of the sum of the winning numbers. In this paper, we present new statistical measures not available on the official lottery site and use them to test the randomness of the lottery draw. Time-series statistical measures were extracted, such as the recurrence length of each winning number across consecutive draws and the intervals between the appearances of the same number across draws. These were then tested using theoretically expected frequencies and chi-squared goodness-of-fit tests based on the Monte Carlo method. Additionally, differences in the occurrence frequencies among the 45-number group were examined using ANOVA tests. Correlations between the distribution of the product of six winning numbers and Benford's law were also investigated. In the experiments, one of 24 specific hypotheses led to the rejection of the null hypothesis, while the remaining cases showed overall statistical significance.
기업혁신지표의 시계열 비교 가능성 검토 - 오슬로매뉴얼 개정 전후 변동을 중심으로 -
[NRF 연계] 충북대학교 국가미래기술경영연구소 기술경영 Vol.9 No.1 2024.03 pp.101-130
...시계열적 변동 결과를 분석하여 한국기업혁신조사(KIS)의 발전방안을 제시하고자 하였다. 이를 위해 기업혁신지표 개발 및 측정을 포함한 측정 변화에 대한 문헌분석을 수행하였고, 국제비교가 가능한 지표와 국가를 선별한 후 국제비교의 가능성을 검토하였다. 기업혁신조사는 오슬로 매뉴얼에 근거하여 수행되는 글로벌 비교가 가능하도록 설계되었으나 조사 수행 국가마다 조사방법 및 시점, 혁신관측기간을 비롯한 표본 추출방식 등에서 차이가 발생하였다. OECD가 공표한 기업혁신지표를 활용하여 주요국의 혁신성과 및 혁신활동 측정 결과값을 비교한 결과, 국가 및 지표별 변화패턴의 차이가 존재하는 것으로 나타났다. 이러한 한계에도 불구하고 본 연구에서는 기업의 혁신측정의 중요성과 국제비교의 가능성을 검토하였고 한국기업혁식조사(KIS)의 안정성을 높이기 개선방안을 논의하였다.
※ 협약을 통해 무료로 제공되는 자료로, 원문이용 방식은 연계기관의 정책을 따르고 있습니다.
본 연구는 최근 개정된 오슬로 매뉴얼(Oslo manual)의 개정 이슈를 중심으로 기업혁신 측정결과에 대한 시계열적 변동 결과를 분석하여 한국기업혁신조사(KIS)의 발전방안을 제시하고자 하였다. 이를 위해 기업혁신지표 개발 및 측정을 포함한 측정 변화에 대한 문헌분석을 수행하였고, 국제비교가 가능한 지표와 국가를 선별한 후 국제비교의 가능성을 검토하였다. 기업혁신조사는 오슬로 매뉴얼에 근거하여 수행되는 글로벌 비교가 가능하도록 설계되었으나 조사 수행 국가마다 조사방법 및 시점, 혁신관측기간을 비롯한 표본 추출방식 등에서 차이가 발생하였다. OECD가 공표한 기업혁신지표를 활용하여 주요국의 혁신성과 및 혁신활동 측정 결과값을 비교한 결과, 국가 및 지표별 변화패턴의 차이가 존재하는 것으로 나타났다. 이러한 한계에도 불구하고 본 연구에서는 기업의 혁신측정의 중요성과 국제비교의 가능성을 검토하였고 한국기업혁식조사(KIS)의 안정성을 높이기 개선방안을 논의하였다.
This study analyzes This study is designed to examine the variability of Korean Innovation Survey results by conducting a global time series analysis of key innovation indicators to identify whether time series data for the same nation fluctuate in innovation outcomes and activities due to the revision of the Oslo Manual. The comparative analysis of innovation in leading nations based on innovation indicators and data released by the OECD shows that Korean enterprises are significantly inferior to their counterparts in 33 nations surveyed in the level of innovation outcomes and activities. Korea is also found to be exposed to higher variability in indicators. Considering that nations differ slightly in business environments and survey methods, researchers need to be more careful in carrying out global comparative analyses and establishing related standards. Also, depending on when innovation is measured by nation, limited comparative studies are conducted to identify common indicators for time series analyses. In this vein, this study is deemed to be significant because it presents needs for coming up with ways to improve the stability of the Korean Innovation Survey.
딥러닝 기반 시계열 분석 모델의 불확실성 정량화 비교 연구
[NRF 연계] 한국자료분석학회 Journal of The Korean Data Analysis Society Vol.26 No.1 2024.02 pp.163-174
...시계열 데이터에 주로 쓰이는 딥러닝 모델인 CNN(Convolutional Neural Network), LSTM(Long Short Term Memory), MLP(Multi-Layer Perceptron), 및 CNN-LSTM 모델을 적용하였고 MC(Monte Carlo) Dropout을 통해 베이지안 관점에서 불확실성을 측정하였다. 실험 결과 다양한 패턴의 시계열 데이터에 대해 통계 모델보다 여러 딥러닝 모델이 성능이 좋음을 확인하였고 성능이 가장 우수하지는 않아도 불확실성이 적어 안정적인 모델이 LSTM 계열임을 확인하였다. 이를 통해 불확실성이 모델의 정확도와 함께 모델 선택 시 고려되어야 할 요소임을 확인하였고 불확실성이 큰 모델이 이상 탐지하므로 CNN 계열의 모델이 적합함을 확인하였다.
※ 협약을 통해 무료로 제공되는 자료로, 원문이용 방식은 연계기관의 정책을 따르고 있습니다.
인공지능의 발전으로 머신러닝과 딥러닝 모델이 다양한 산업에서 적용되어 좋은 성능을 보이고 있으며 최근 금융시장에서도 적용되는 사례가 증가하고 있다. 그러나 딥러닝 모델은 예측 결과가 나오게 된 과정과 해석을 파악하기에 어려움이 있다. 이는 결과에 대한 해석이 특히 중요시 되는 금융에 딥러닝 모델을 적용하는데 어려움이 있어 신뢰할 수 있는 모델에 대한 필요성이 대두되고 있다. 신뢰할 수 있는 모델이란 모델에 Dropout과 같은 변화에도 일관된 예측을 보이는 안정적인 모델로 모델의 불확실성을 통해 파악할 수 있다. 본 연구는 딥러닝 모델의 불확실성을 확인하여 신뢰할 수 있는 모델의 기준을 보이고 모델의 불확실성을 통해 이상 탐지하는 모델을 파악하고자 한다. 실험에서 전통적인 통계 모델 ARIMA(Auto Regressive Integrated Moving Average)와 시계열 데이터에 주로 쓰이는 딥러닝 모델인 CNN(Convolutional Neural Network), LSTM(Long Short Term Memory), MLP(Multi-Layer Perceptron), 및 CNN-LSTM 모델을 적용하였고 MC(Monte Carlo) Dropout을 통해 베이지안 관점에서 불확실성을 측정하였다. 실험 결과 다양한 패턴의 시계열 데이터에 대해 통계 모델보다 여러 딥러닝 모델이 성능이 좋음을 확인하였고 성능이 가장 우수하지는 않아도 불확실성이 적어 안정적인 모델이 LSTM 계열임을 확인하였다. 이를 통해 불확실성이 모델의 정확도와 함께 모델 선택 시 고려되어야 할 요소임을 확인하였고 불확실성이 큰 모델이 이상 탐지하므로 CNN 계열의 모델이 적합함을 확인하였다.
With the advancement of artificial intelligence, machine learning, and deep learning, their applications in various industries, particularly finance, have increased. However, interpreting predictions from deep learning models poses challenges, especially in finance where result interpretation is important. This study aims to determine the uncertainty of stable deep learning models, despite changes in the model like dropout, to establish standards for reliable models and identify those detecting anomal data through model uncertainty. In the experiment, the traditional statistical model ARIMA and deep learning models mainly used for time series analysis, CNN, LSTM, MLP, and CNN-LSTM. Uncertainty was measured from a Bayesian perspective using MC Dropout. The experimental results confirmed that deep learning models performed better than statistical models for various patterns of time series data. It was observed that, even if the performance was not the best, LSTM based models exhibited low uncertainty, indicating stability. Consequently, this study highlights the importance of considering uncertainty along with accuracy in model selection. Moreover, it was confirmed that models with higher uncertainty are suitable for anomaly detection, making CNN based models particularly fitting for this purpose.
연안 정지 관측 시계열 데이터 결측치 보정에 관한 실증연구: 주문진 관측소 중심으로
[NRF 연계] 사단법인 미래융합기술연구학회 아시아태평양융합연구교류논문지 Vol.9 No.12 2023.12 pp.43-54
※ 협약을 통해 무료로 제공되는 자료로, 원문이용 방식은 연계기관의 정책을 따르고 있습니다.
해양의 수온 관측 자료는 결측 구간이 빈번하게 발생하기 때문에 관측 자료의 전처리 과정에서 결측 구간의 보정이 필수 적이다. 특히, 현장 시료의 채집과 분석에 기반한 관측소의 경우 주말 및 기상악화 시 반복적이고 주기적으로 결측이 발생하는 구조를 가진다. 본 연구에서는 연안정지 관측 데이터 중 수온의 결측치 보정을 위한 최적화된 방법을 모색하고자 통계적 방법인 다중 대치법(Multiple Imputation, MI), 회귀모델인 자기회귀 누적 이동평균(Auto-Regressive Integrated Moving Average, ARIMA) 모델 및 인공신경망 방법인 장단기 메모리(Long Short Term Memory, LSTM) 모델을 사용하였다. 주문진 관측소의 수온 데이터 중 대부분의 결측일은 주말이었다. 모델의 구현은 5일(평일)의 수온 자료를 이용하여 2일(주말)의 수온을 보정하는 방법을 사용하였다. 평균 제곱근 편차(Root Mean Square Error, RMSE)와 평균 절대 오차(Mean Absolute Error, MAE)를 사용하여 모델을 평가하였으며, 각각의 모델을 예측값과 실측값의 잔차를 이용하여 비교 분석하였다. 분석결과 장단기 메모리 모델이 다중 대치법 및 자기회귀 누적 이동평균 모델에 비해 상대적으로 좋은 성능을 보이는 것으로 확인되었다.
The sea surface temperature (SST) is an important physical property that describes ocean characteristics. However, SST monitoring in harsh marine environments has a discontinuity problem in field observation using a research vessel. Therefore, correcting the missing data is essential in the preprocessing of the observation data because the missing data frequently occurs in the sea water temperature observation system. Especially, observation stations based on the collection and analysis of field samples repeatedly and periodically generate missing data during weekends and bad weather. In this study, a statistical method (Multiple Imputation, MI), a regression model (Auto-Regressive Integrated Moving Average, ARIMA), and an artificial neural network method (Long Short Term Memory, LSTM) were tested to find an optimized method for correcting the missing SST data among coastal stationary observation data. Most of the missing SST data at the Jumunjin observatory were from weekends. The models were implemented by correcting the SST for 2 days (weekends) based on SST data for 5 days (weekdays). Models were evaluated using Root Mean Square Error (RMSE) and Mean Absolute Error (MAE), and each model was compared using the residuals between predicted and measured values. Our study indicates that the LSTM model shows relatively better performance compared to MI and ARIMA.
민족, 국민, 국가 -시계열 워드 임베딩을 활용한 조선일보 기사의 민족 담론 의미 변동 추적(1920~40)
[NRF 연계] 한국현대소설학회 현대소설연구 Vol.90 2023.06 pp.5-38
...시계열 워드 임베딩(dynamic word embedding)과 추세 검정(trend test)을 활용해 민족 담론 관련 어휘(‘민족’, ‘국민’, ‘국가’)의 의미 변화를 통시적으로 그려내는 연구다. 그간 한국의 민족(주의) 담론관련 연구는 대부분 1910년 이전 텍스트를 대상으로 이뤄져 왔고, 소수의 텍스트를 정성적으로 읽어내는 방식이었다. 이 논문은 디지털인문학 방법론을 기반으로일제강점기 20여 년간의 조선일보 전수 텍스트에 내재한 민족 담론을 읽어내는 시도이다. 우리는 연구 가설에 관한 네 가지 지점을 확인하였다: 1) ‘민족’, ‘국민’, ‘국가’는 분석 대상 단어 중에서 맥락 변화가 큰 주요 단어이다. 2) 민족의 맥락 변화는 조선일보의 내부 변화와 사회주의 및 일제 파시즘의 강화라는 외부 요인과 연결돼 있다. 3) ‘민족-국가’와 ‘국민-국가’의 시간에 따른 유사도는 서로 다른 추세를보이며 변곡점은 내선일체 이데올로기의 강화된 시점이다. 4) ‘민족’과 ‘국민’의 맥락 분화는 계속 증가하며 이는 사회주의와 일제의 국민화 정책의 영향으로 볼 수있다.
※ 협약을 통해 무료로 제공되는 자료로, 원문이용 방식은 연계기관의 정책을 따르고 있습니다.
이 논문은 1920년부터 창간호부터 1940년 폐간호까지 발간된 조선일보 데이터에서 정규 기사 844,251건을 추려낸 후 시계열 워드 임베딩(dynamic word embedding)과 추세 검정(trend test)을 활용해 민족 담론 관련 어휘(‘민족’, ‘국민’, ‘국가’)의 의미 변화를 통시적으로 그려내는 연구다. 그간 한국의 민족(주의) 담론관련 연구는 대부분 1910년 이전 텍스트를 대상으로 이뤄져 왔고, 소수의 텍스트를 정성적으로 읽어내는 방식이었다. 이 논문은 디지털인문학 방법론을 기반으로일제강점기 20여 년간의 조선일보 전수 텍스트에 내재한 민족 담론을 읽어내는 시도이다. 우리는 연구 가설에 관한 네 가지 지점을 확인하였다: 1) ‘민족’, ‘국민’, ‘국가’는 분석 대상 단어 중에서 맥락 변화가 큰 주요 단어이다. 2) 민족의 맥락 변화는 조선일보의 내부 변화와 사회주의 및 일제 파시즘의 강화라는 외부 요인과 연결돼 있다. 3) ‘민족-국가’와 ‘국민-국가’의 시간에 따른 유사도는 서로 다른 추세를보이며 변곡점은 내선일체 이데올로기의 강화된 시점이다. 4) ‘민족’과 ‘국민’의 맥락 분화는 계속 증가하며 이는 사회주의와 일제의 국민화 정책의 영향으로 볼 수있다.
This paper selects 844,251 regular articles from the Chosun Ilbo data, published from the first issue in 1920 to the last issue in 1940, and uses dynamic word embedding and trend tests to illustrate the changes in the meaning of national discourse-related vocabulary (‘minjok’, ‘gungmin’, and ‘gukga’) over time. Prior research on national discourse in Korea has focused primarily on texts written prior to 1910 and relied on qualitative readings of a limited number of texts. Using digital humanities methodology, this paper attempts to interpret the national discourse embedded in the texts of the Chosun Ilbo during the two decades of Japanese colonization. We determined four factors in relation to our research hypothesis: 1) “Minjok,” “gungmin,” and “gukga” are the most frequently occurring words with significant contextual differences among the words analyzed. 2) The contextual shift in ethnicity is a result of both internal and external factors, such as the consolidation of socialism and Japanese fascism. 3) The similarity between ‘minjok-gukga’ and ‘gungmin-gukga’ over time reveals distinct tendencies, with the turning point being the reinforcement of the “Japan and Korea are One Entity” ideology. 4) The increasing contextual distinction between “minjok” and “gungmin” can be attributed to socialism and Japanese nationalization policies.
카오스 이론 기반 시계열의 내재적 패턴분석: 룰렛과 KOSPI200 지수선물 데이터 대상
[NRF 연계] 한국지식경영학회 지식경영연구 Vol.22 No.4 2021.12 pp.119-133
...시계열 패턴 예측 연구가 수많이 진행되고 있다. 하지만 데이터에 내재된 불확실성으로 인해 비선형 시계열 데이터의 특정 패턴을 예측하는 데 한계가 존재하고, 기업경영의 전략적 의사결정 어려움이 존재한다. 또한, 최근 수십 년간 불규칙한 랜덤워크 모형의 시계열 데이터 예측을위해 산업의 목적에 맞는 금융시장 데이터를 대상으로 다양한 연구가 진행되고 있지만, 특정 규칙을 예측하고 지속가능의 기업목적 달성 어려움이 있다. 본 연구에서는 룰렛 데이터와 금융시장 데이터를 Chaos 분석기법을 이용하여 예측 결과를 비교분석하고 유의미한 결과를 도출하였다. 그리고, 본 연구는 카오스 분석이 시계열 자료를 분석하는데 있어 새로운 방법을 모색하는데 유용함을 확인하였다. 룰렛 게임의 특성을 한국 주가지수 선물의 시계열과 비교 분석하여 추세가확인되는 경우 예측력을 높일 수 있다는 점을 도출하였으며, 불확실성이 높고 랜덤워크가 존재하는 비선형 시계열 데이터가 특정한 패턴을 가지고 있는지 판단하는데 의의가 있다.
※ 협약을 통해 무료로 제공되는 자료로, 원문이용 방식은 연계기관의 정책을 따르고 있습니다.
각 산업에서 대량의 데이터가 생산되면서, 빠른 경영 의사결정을 위해 시계열 패턴 예측 연구가 수많이 진행되고 있다. 하지만 데이터에 내재된 불확실성으로 인해 비선형 시계열 데이터의 특정 패턴을 예측하는 데 한계가 존재하고, 기업경영의 전략적 의사결정 어려움이 존재한다. 또한, 최근 수십 년간 불규칙한 랜덤워크 모형의 시계열 데이터 예측을위해 산업의 목적에 맞는 금융시장 데이터를 대상으로 다양한 연구가 진행되고 있지만, 특정 규칙을 예측하고 지속가능의 기업목적 달성 어려움이 있다. 본 연구에서는 룰렛 데이터와 금융시장 데이터를 Chaos 분석기법을 이용하여 예측 결과를 비교분석하고 유의미한 결과를 도출하였다. 그리고, 본 연구는 카오스 분석이 시계열 자료를 분석하는데 있어 새로운 방법을 모색하는데 유용함을 확인하였다. 룰렛 게임의 특성을 한국 주가지수 선물의 시계열과 비교 분석하여 추세가확인되는 경우 예측력을 높일 수 있다는 점을 도출하였으며, 불확실성이 높고 랜덤워크가 존재하는 비선형 시계열 데이터가 특정한 패턴을 가지고 있는지 판단하는데 의의가 있다.
As a large amount of data is produced in each industry, a number of time series pattern prediction studies are being conducted to make quick business decisions. However, there is a limit to predicting specific patterns in nonlinear time series data due to the uncertainty inherent in the data, and there are difficulties in making strategic decisions in corporate management. In addition, in recent decades, various studies have been conducted on data such as demand/supply and financial markets that are suitable for industrial purposes to predict time series data of irregular random walk models, but predict specific rules and achieve sustainable corporate objectives There are difficulties. In this study, the prediction results were compared and analyzed using the Chaos analysis method for roulette data and financial market data, and meaningful results were derived. And, this study confirmed that chaos analysis is useful for finding a new method in analyzing time series data. By comparing and analyzing the characteristics of roulette games with the time series of Korean stock index future, it was derived that predictive power can be improved if the trend is confirmed, and it is meaningful in determining whether nonlinear time series data with high uncertainty have a specific pattern.
[NRF 연계] 통계청 통계연구 Vol.26 No.2 2021.06 pp.31-51
...시계열을 제대로 분석하기 위해서는 시계열에 포함된 계절변동과 달력변동을 체계적으로 제거한 계절조정이 필요하다. 일반적인 데이터분석가들은 R 또는 Python의 계절조정방법인 STL을 이용하여 계절조정하고 있다. STL은 시간별, 일별 데이터와 같은 고빈도 시계열의 계절조정에 이용되고 있는 등 활용도가 커지고 있다. 이 논문에서는 STL의 방법을 과정별로 X-13ARIMA-SEATS의 X-11필터와 비교하여 정리하였다. 또한, 모의실험과 실제 데이터의 계절조정을 통해서 STL을 X-11필터와 비교하였다. 모의실험 결과 계절변동이 시간에 따라 변할 때 STL에 의한 계절조정이 X-11필터에 의한 계절조정에 비해 우수하게 나타났다. 또한, STL에서는 시계열의 계절변동 형태, 불규칙 변동의 변동성에 따라 계절평활화 모수를 다르게 선택하는 것이 필요한 것으로 나타났다. STL을 우리나라 월별 산업생산지수와 월별 수출(통관)에 적용하여 계절조정을 실시하였는데 그 결과가 X-13ARIMA-SEATS(X-11 필터)의 계절조정 결과와 유사하게 나타나 STL이 X-13ARIMA-SEATS의 대안으로 될 수 있을 것으로 판단된다.
※ 협약을 통해 무료로 제공되는 자료로, 원문이용 방식은 연계기관의 정책을 따르고 있습니다.
월별, 분기별 시계열을 제대로 분석하기 위해서는 시계열에 포함된 계절변동과 달력변동을 체계적으로 제거한 계절조정이 필요하다. 일반적인 데이터분석가들은 R 또는 Python의 계절조정방법인 STL을 이용하여 계절조정하고 있다. STL은 시간별, 일별 데이터와 같은 고빈도 시계열의 계절조정에 이용되고 있는 등 활용도가 커지고 있다. 이 논문에서는 STL의 방법을 과정별로 X-13ARIMA-SEATS의 X-11필터와 비교하여 정리하였다. 또한, 모의실험과 실제 데이터의 계절조정을 통해서 STL을 X-11필터와 비교하였다. 모의실험 결과 계절변동이 시간에 따라 변할 때 STL에 의한 계절조정이 X-11필터에 의한 계절조정에 비해 우수하게 나타났다. 또한, STL에서는 시계열의 계절변동 형태, 불규칙 변동의 변동성에 따라 계절평활화 모수를 다르게 선택하는 것이 필요한 것으로 나타났다. STL을 우리나라 월별 산업생산지수와 월별 수출(통관)에 적용하여 계절조정을 실시하였는데 그 결과가 X-13ARIMA-SEATS(X-11 필터)의 계절조정 결과와 유사하게 나타나 STL이 X-13ARIMA-SEATS의 대안으로 될 수 있을 것으로 판단된다.
STL is a method for decomposing time series into seasonal and non-seasonal components using Loess. STL can be used in seasonal adjustment of Korean time series considering Korean specific own effects such as traditional holidays, the number of trading days. In this paper, STL was compared with X-11 through simulation. In addition, STL and X-13ARIMA-SEATS were applied to monthly Korea's industrial production index and exports (customs clearance) and the results were compared.
[NRF 연계] 한국자료분석학회 Journal of The Korean Data Analysis Society Vol.22 No.5 2020.10 pp.1751-1766
...시계열 자료를 군집화할 때, 시계열의 계열수가 많은 경우에는 자료의 특성이 유사한 시계열들을 군집화한 후 이를 사전정보로 활용하여 모형설정 및 예측을 수행한다면 훨씬 효율적일 것이다. 시계열 자료의 군집분석 방법에는 다양한 거리가 정의될 수 있으며, 크게 두 가지로 구분한다. 첫째는 시간영역(time domain)에서의 분석으로, 시계열 자료의 특성인 자기상관함수(auto-correlation function), 부분(partial)자기상관함수로부터 거리(distance)를 정의하는 방법이다. 둘째는 주파수영역(frequency domain)에서의 분석으로, 표본 자기공분산함수(sample auto-covariance function)를 통해 얻어지는 주기도(periodogram)를 이용하여 거리를 정의하는 방법이다. 본 연구에서는 스펙트럼 밀도함수(spectral density function)의 추정량인 주기도 간의 상관성(association)에 근거한 거리를 제안하였다. 먼저 기존에 시계열 자료를 그룹화하는 데 사용된 거리들을 간략히 소개하고, 주기도 간의 상관관계로부터 거리를 제안하여 모의실험을 통해 성능을 비교하였다. 또한, 1990년 1월부터 2015년 4월까지 전국 월별 제조업생산지수 자료를 대상으로 기존의 거리와 본 연구에서 제안한 거리를 이용하여 산업 간의 군집화를 시도하였다.
※ 협약을 통해 무료로 제공되는 자료로, 원문이용 방식은 연계기관의 정책을 따르고 있습니다.
시계열 자료를 군집화할 때, 시계열의 계열수가 많은 경우에는 자료의 특성이 유사한 시계열들을 군집화한 후 이를 사전정보로 활용하여 모형설정 및 예측을 수행한다면 훨씬 효율적일 것이다. 시계열 자료의 군집분석 방법에는 다양한 거리가 정의될 수 있으며, 크게 두 가지로 구분한다. 첫째는 시간영역(time domain)에서의 분석으로, 시계열 자료의 특성인 자기상관함수(auto-correlation function), 부분(partial)자기상관함수로부터 거리(distance)를 정의하는 방법이다. 둘째는 주파수영역(frequency domain)에서의 분석으로, 표본 자기공분산함수(sample auto-covariance function)를 통해 얻어지는 주기도(periodogram)를 이용하여 거리를 정의하는 방법이다. 본 연구에서는 스펙트럼 밀도함수(spectral density function)의 추정량인 주기도 간의 상관성(association)에 근거한 거리를 제안하였다. 먼저 기존에 시계열 자료를 그룹화하는 데 사용된 거리들을 간략히 소개하고, 주기도 간의 상관관계로부터 거리를 제안하여 모의실험을 통해 성능을 비교하였다. 또한, 1990년 1월부터 2015년 4월까지 전국 월별 제조업생산지수 자료를 대상으로 기존의 거리와 본 연구에서 제안한 거리를 이용하여 산업 간의 군집화를 시도하였다.
The main goal of clustering time-series data is to clarify how similarity between time-series can be measured. There are two different approaches for identifying the similarity. The first approach focuses on the distances based on autocorrelation function and partial autocorrelation function inherent in given time-series measurements. The distances between estimated parameters under ARIMA model are also proposed. The second approach considers the time series clustering based on the estimator of spectral densisty function named periodogram and its transformations realized in the frequency domain. In this papar, we propose the metrics based on relationships between (smoothed) periodograms for the time-series data classification. The proposal is based on Pearson’s correlation and intra-class correlation. We evaluated the similarity metrics of our interest via three different simulation scenarios. A real-data analysis with 24 Korea manufacturing production indices data is also presented.
부동산펀드 수익률의 시계열 특성과 유형간 동적 상호작용에 관한 연구
[NRF 연계] 한국주택학회 주택연구 Vol.28 No.1 2020.02 pp.27-47
※ 협약을 통해 무료로 제공되는 자료로, 원문이용 방식은 연계기관의 정책을 따르고 있습니다.
부동산펀드의 수익위험 특성과 유형간 상호작용에 대한 이해의 필요가 커지고 있다. 본 연구는 부동산펀드의 일간 수익률 및 순자산증가를 분석하여 다음과 같은 결과를 얻었다. 첫째, 수익위험은 해외형 > 임대형 > 대출형 순으로 큰 것으로 나타났는데, 이는 일반적인 기대와 일치한다. 수익률의 분기별 평균값을 분기별 표준편차로 회귀분석 한 결과 모든 유형에서 표준편차의 계수가 유의하여 부동산펀드가 위험에 상응하는 수익률을 제공하는 것도 알 수 있었다. 둘째, 그랜저인과관계분석과 VAR 모형을 적용한 결과 8분기 시차 이내에 유형간 상호작용이 존재하며, 임대형과 대출형 사이에는 경쟁관계가 형성된 것을 확인하였다. 특히 임대형이 대출형에 미치는 영향은 수익률 뿐 아니라 순자산증가에서도 유의하게 확인되었다. 본 연구를 통해 부동산펀드 유형별로 수익위험 특성에 차이가 있는 것과 대출형과 임대형 간에 경쟁관계가 형성되어 수익률과 순자산증가에 상호작용이 존재하는 것을 확인할 수 있었다.
The growth of the real estate fund market requires investors who understand the time series characteristics and inter-category dynamics of the real estate fund return. This study analyzed the daily return and change of NAV (net asset value) of the three categories of debt, equity, and overseas funds in the real estate fund market. The empirical results of the study are as follows. First, the cumulative return and the dispersion of the daily return are high in the order of overseas, equity, and debt funds. This is the risk-return level order, which corresponds to the general belief. Moreover, the standard deviation of the quarterly return significantly explains the average return during the same period in all the categories. These results show that real estate funds compensate for their risk through returns. Second, the grander causality analysis of the return of the three categories showed that significant casualties exist within eight-quarter lags. Moreover, the VAR (vector auto-regressive) model states that debt and equity funds compete with each other in the investment market, so their returns and NAV changes affect each other.
영산강 부유하중의 시계열적 입도 특성 변화: 승촌보, 죽산보를 중심으로
[NRF 연계] 한국지형학회 한국지형학회지 Vol.26 No.4 2019.12 pp.1-20
※ 협약을 통해 무료로 제공되는 자료로, 원문이용 방식은 연계기관의 정책을 따르고 있습니다.
In order to establish appropriate policy to control sediment-associated problems, it is necessary to identify the physical characteristics of the reservoir sediments in particulate form in the Yeongsan River. Two time-integrated suspended sediment samplers were installed at Seungchon and Juksan weir on the upper and middle Yeongsan River in July 2012. Reservoir sediment samples were obtained at monthly intervals until October 2014. During the monitoring period, a total of 38 sediment samples were obtained and analyzed. Seasonal trends of suspended sedimentation rates and grain size distributions were examined based on variations in precipitation and discharge fluctuations. Moreover, stream flow characteristics, which has a great influence on the physical characteristics of the river sediment, was analyzed using flow duration curve for the period 2003-2019 at Naju gauging station. Sedimentation rates during summer, when heavy rainfall was concentrated due to the monsoonal front and typhoon, were very high, indicating the positive relationship between sediment concentration and discharge. Particle size analysis of the collected sediment showed that coarse silt and very fine sand-sized sediment dominated most of the Seungchon weir sediment. On the other hand, medium silt-sized sediment dominated the downstream Juksan weir except for a few summer samples. These results implied that the physical characteristics of the suspended sediment are determined not only due to flow fluctuations, but also with regard to the antecedent rainfall conditions, hillslope-channel connectivity, and the supply of materials from various contributing regions. This information about flow characteristics and temporal variations in reservoir sediment can be used for safe management of the weir and discussing the issues on the dismantling of the weirs.
아파트 발코니면적의 시계열적 변화와 내재가치 추정에 관한 연구
[NRF 연계] 한국부동산분석학회 부동산학연구 Vol.25 No.3 2019.09 pp.59-71
※ 협약을 통해 무료로 제공되는 자료로, 원문이용 방식은 연계기관의 정책을 따르고 있습니다.
본 연구는 우리나라 주택시장에서 발코니확장이 가지는 의미와 발코니의 내재가치를 선행연구와 정책변 화, 지난 30여년간의 발코니면적 변화 등을 이용하여 분석하였다. 그동안 발코니확장이나 발코니면적 증가 에 대한 연구는 꾸준히 이루어져왔으나 주로 발코니의 건축적 기능이나 주거환경적인 의미 등에 집중하였 을 뿐, 주택수요나 주택가격 등 주택시장에 미치는 영향에 대해서는 연구가 미흡했다. 본 연구에서는 1983 년 이후 2016년까지 준공된 서울시의 310개 아파트를 대상으로 시기별 발코니면적의 변화를 살펴보고, 변 화의 원인에 대해 진단해보았다. 또한 2018년 7월 기준 시세자료를 토대로 다른 요인들을 통제하였을 때, 발코니면적이 가지는 내재가치를 추정하여 방이나 거실과 같은 본래의 실내면적의 가치와 비교하였다. 주 요 연구결과를 요약하면 아래와 같다. 첫째, 1983년 이후 2016년까지 아파트들을 전용면적대비 발코니면적 비율(이후 발코니비율)을 기준으로 시기구분하면 크게 세시기로 나눌 수 있는 바, 1기는 1983년에서 1992 년, 2기는 1993년에서 2003년, 3기는 2004년에서 2016년까지이다. 1기에서 2기로 넘어가는 시기에는 발코 니비율이 약 5%p 증가하였는데, 이때는 80년대 경제발전으로 인해 주택수요가 폭발하면서 추진한 5개 신 도시의 입주가 시작되는 시기이다. 2기에서 3기로 전환되는 시기는 1998년 외환위기에서 회복하여 주택시 장이 재활성화된 시기로서 2005년 발코니확장 합법화가 이루어지는 시점이다. 이때는 발코니비율이 약 9%p 정도 증가하여 1990년대초보다 더 급격한 면적 증가가 이루어졌다. 둘째, 연구자료를 기반으로 헤도닉 모형을 추정하면 발코니의 내재가치는 약 641만원/㎡로서 전용면적의 내재가치(471~594만원/㎡)보다 크게 나타났다. 즉, 주택시장에서는 발코니의 가치를 실내면적과 유사하거나 더 높게 보고 있다는 것을 확인할 수 있었다. 연구결과는 아래와 같은 몇 가지 시사점을 제공한다. 첫째, 서비스면적을 늘려서 주택수요 증가 를 편법적으로 충족시키는 상황을 바로잡기 위해서는 일정 구간에만 국한되어 있는 각종 혜택을 주택면적 에 따라 다양한 혜택을 누릴 수 있도록 조정할 필요가 있다. 이를테면 국민주택규모 이하와 초과의 극명한 혜택의 차이를 완화시킬 필요가 있다. 둘째, 이미 발코니면적은 내부공간으로서 중요한 가격형성요인이 되 었으므로 이를 포함하여 밀도규제나 과세를 하여 형평성을 증가시킬 필요가 있다.
The purpose of this study is to review the historic change of balcony of apartment in Seoul for the last three decades and estimate the imputed value of the balcony space. The balcony data of the 310 apartment units of Seoul were collected on the real estate information service sites which provide floor plan of each unit. The other data for the Hedonic Price Model to detect imputed value of balcony were gathered on the public apartment data provider including Korea Appraisal Board and National Statistical Geographic Information Service. The results are summarized as follows. First, the last 33 years can be divided into 3 periods: 1983 to 1992, 1993 to 2003, and 2004 to 2016. The Balcony to Exclusive Using Area Ratio (BER) raised from 19.6 percent to 24.3 percent in early 1990s. The BER change from period 2 to period 3 is about 8.7 percent point (from 24.3 to 33.0). The changes seem to be caused by rapid housing demand under the loose regulation on balcony renovation. Because the balcony area is excluded when the government calculates the floor area for taxation and building permission. Therefore, Koreans usually wanted to expand the balcony illegally and the space was changed into interior area such as bedroom and livingroom. Second the estimated unit value of balcony is about 6.4 million won per square meter that is more expensive than that of original interior area , 4.7~5.9 million won per square meter. The results provide meaningful policy implications associated with housing market. The existing incentives and benefit for under mid-sized house should be adjusted to the increasing housing demand. For example, decremental incentives by the house size increase can be adopted. Second, a new floor area standard including balcony size is necessary to realize fair taxation and building permission. This study suggests that we can call the new floor area standard ‘Real Using Area.’
[NRF 연계] 한국관광레저학회 관광레저연구 Vol.30 No.3 2018.03 pp.371-391
※ 협약을 통해 무료로 제공되는 자료로, 원문이용 방식은 연계기관의 정책을 따르고 있습니다.
The purpose of the paper is to estimate Cycle Variation Error in Technical efficiency measure in tourist accommodation business. Cycle Variation Error is a measurement error in efficiency measure due to difference in sensitivity of each firm against common external shocks. That a Cycle Variation Error is in an efficiency measure means that the measure contains a heterogeneous component of error which is not explained by conventional concept of random error. Thus, estimating Cycle Variation Error is important because it is related with credibility of statistical inference via conventional efficiency measure. Empirical results indicate that overall Cycle Variation Error is small. Therefore, statistical estimations based on existing DEA/SFA efficiency measures of tourist accommodation business are acceptable within the framework of Cycle Variation Error. However, few data points which have large Cycle Variation Error are also observed. Thus, Cycle Variation Error problem ought to be considered for firm level decision making using by efficiency measure.
머신 러닝 방법과 시계열 분석 모형을 이용한 부동산 가격지수 예측
[NRF 연계] 한국주택학회 주택연구 Vol.26 No.1 2018.02 pp.107-133
...시계열분석 방법인 자기회귀이동평균모형, 벡터자기회귀모형, 베이지언 벡터자기회귀모형을 이용하여 아파트 매매실거래가격지수를 예측하고 모형간 예측력을 비교하였다. 연구 결과, 첫째, 머신 러닝 방법의 예측력이 시계열분석 모형보다 우수한 것으로 나타났다. 둘째, 시장이 안정적인 상황에서는 머신 러닝 방법과 시계열분석 방법 모두 시장 추세를 적절히 예측하는 것으로 나타났다. 셋째, 구조적인 변화 또는 외부 충격으로 시장이 급변하는 경우 머신 러닝 방법은 시장 추세를 대체로 유사하게 예측하는 것으로 나타났으나, 시계열분석 방법은 시장 추세를 전혀 예측할 수 없는 것으로 나타났다. 향후 머신 러닝 방법을 활용함으로써 부동산 시장에 대한 예측의 정확성이 향상될 것으로 기대된다.
※ 협약을 통해 무료로 제공되는 자료로, 원문이용 방식은 연계기관의 정책을 따르고 있습니다.
본 연구의 목적은 부동산 가격지수 예측을 위한 머신 러닝 방법의 활용가능성을 확인하는 것이다. 이를 위해 머신 러닝 방법인 서포트 벡터 머신, 랜덤 포레스트, 그래디언트 부스팅 회귀 트리, 심층신경망, LSTM과 시계열분석 방법인 자기회귀이동평균모형, 벡터자기회귀모형, 베이지언 벡터자기회귀모형을 이용하여 아파트 매매실거래가격지수를 예측하고 모형간 예측력을 비교하였다. 연구 결과, 첫째, 머신 러닝 방법의 예측력이 시계열분석 모형보다 우수한 것으로 나타났다. 둘째, 시장이 안정적인 상황에서는 머신 러닝 방법과 시계열분석 방법 모두 시장 추세를 적절히 예측하는 것으로 나타났다. 셋째, 구조적인 변화 또는 외부 충격으로 시장이 급변하는 경우 머신 러닝 방법은 시장 추세를 대체로 유사하게 예측하는 것으로 나타났으나, 시계열분석 방법은 시장 추세를 전혀 예측할 수 없는 것으로 나타났다. 향후 머신 러닝 방법을 활용함으로써 부동산 시장에 대한 예측의 정확성이 향상될 것으로 기대된다.
This study aims to explore the feasibility of using machine learning methods to forecast the real estate price index. To do so, machine learning methods, such as support vector machine, random forest, gradient boosting regression tree, deep neural networks, and long short term memory networks (LSTM), and the time series analysis methods such as the autoregressive integrated moving average model (ARIMA), the vector autoregression model (VAR), and the Bayesian vector autoregressive model (Bayesian VAR), were used to predict the real estate price index for apartments. The following were the main findings of the comparison of their predictive abilities. First, the predictive power of machine learning methods is superior to that of the time series analysis methods. Second, in a stable market situation, both machine learning and time series analysis methods can predict market trends moderately well. Third, when the market undergoes a dramatic change due to structural changes or external shocks, the machine learning method can accurately predict market trends for the most part, whereas the time series analysis method fails to do so. Thus, the accuracy of real estate market forecasts can be expected to improve with the use of machine learning methods.
직장이동행태의 시계열적 추이: 이중노동시장 검토를 중심으로
[NRF 연계] 한국자료분석학회 Journal of The Korean Data Analysis Society Vol.19 No.6 2017.12 pp.3103-3119
※ 협약을 통해 무료로 제공되는 자료로, 원문이용 방식은 연계기관의 정책을 따르고 있습니다.
본 연구는 한국노동패널 직업력(work history)자료를 이용하여 직무의 숙련(skill)을 기준으로 노동시장을 1차(primary labor market)와 2차(secondary labor market)로 구분하고, 기업규모를 추가하여 4가지 시장유형으로 구분한 후 각 노동시장간 전환에 따르는 제약요인을 분석함으로써 우리나라 노동시장의 이중구조(dualism)를 살펴보았다. 분석방법으로는 해자드확률(hazard rate)을 추정하는 기간분석모형을 사용하였다. 분석결과, 첫째, 우리나라는 첫 일자리 배치가 학력수준에 따라 할당되는 경향이 강하였다. 하지만 노동시장 진입이후 학력요인은 일자리 이동에 더 이상 통계적으로 유의하지 않았다. 둘째, 노동시장간 단순 전환율 분석결과에서는 노동이동 결과 2차·중소기업군 시장으로 내몰릴 가능성이 가장 높았고, 상향 노동시장으로 이동이 쉽지 않은 것으로 나타났다. 셋째, 개인과 직업특성이라는 이질성을 통제한 해자드모형 추정결과에서는 모든 모형에서 gamma가 양의 값을 보임에 따라 현재 노동시장을 벗어날 가능성이 희박한 것으로 나타났다. 결과적으로 우리나라 노동시장은 숙련수준과 기업규모별로 상당히 경직적이어서 일자리 이동에 제약이 따르고 일자리 이동을 통해 상향 노동시장으로의 전환이 쉽지 않은 것으로 보인다.
This study divides labor market into primary labor market and secondary labor market based on skill of job using work history data of Korean labor & income panel study. We examined the dualism of the Korean labor market by analyzing the constraints on the labor market transition after dividing the market into four types by adding the firm size. The main analysis method is the duration analysis model which estimates the hazard rate. First, Korea has a tendency to place the first job by education level, showing symmetry according to educational background. Second, in the analysis of the simple transition rate between the labor markets, the shift of jobs is most likely to be transferred to the secondary and small business market, and it is not easy to move to the upward labor market. Third, the hazard model estimates that controlled the heterogeneity of individual and job showed that gamma had a positive value in all models and that it is unlikely to escape the current labor market. The Korea labor market is very strict due to the level of skill and firm size, and there is a restriction on the movement of jobs, and it seems that the shift to upward labor market through job transfer is not easy.
전력수요의 빈도별 시계열 특성에 따른 예측 모형 구축에 관한 연구
[NRF 연계] 한국자료분석학회 Journal of The Korean Data Analysis Society Vol.19 No.4 2017.08 pp.1991-2003
...시계열 특성을 연구한다. 일반적으로 전력수요는 단위근을 가진 자료로 인식되고 있으며, 따라서 공적분 관계를 규명하는 데에 연구의 초점이 맞추어져 왔다. Granger(1966)가 지적했듯이 경제변수들은 저빈도(low frequency)에서 스펙트럴 매스가 매우 큰 모양을 가지고 있다. Yang(2000)은 시제간 집계(temporal aggregation)가 시계열 특성의 변화를 야기할 수 있음을 보였다. 같은 변수라 하더라도 시계열 수집 빈도에 따라 시계열 특성이 달라진다면, 해당 변수에 대한 예측 모형 구축에 있어서 이러한 빈도별 시계열 특성이 반영되어야 한다. 본 연구는 다음과 같이 두 가지 면에서 전력수요 관련 연구에 기여한다. 첫째, 이 연구는 전력수요는 일정 주기 이상의 저빈도 자료에서는 경제변수와 같이 단위근을 가지지만 고빈도 자료에서는 이러한 특징이 사라짐을 밝혔다. 둘째, 단위근이 존재하는 빈도 자료에서는 경제변수와 공적분 관계가 있을 수도 함께 밝혀 향후 전력수요 모형 구축에 기반을 제공하고 있다.
※ 협약을 통해 무료로 제공되는 자료로, 원문이용 방식은 연계기관의 정책을 따르고 있습니다.
본 연구는 전력수요의 주기별 시계열 특성을 연구한다. 일반적으로 전력수요는 단위근을 가진 자료로 인식되고 있으며, 따라서 공적분 관계를 규명하는 데에 연구의 초점이 맞추어져 왔다. Granger(1966)가 지적했듯이 경제변수들은 저빈도(low frequency)에서 스펙트럴 매스가 매우 큰 모양을 가지고 있다. Yang(2000)은 시제간 집계(temporal aggregation)가 시계열 특성의 변화를 야기할 수 있음을 보였다. 같은 변수라 하더라도 시계열 수집 빈도에 따라 시계열 특성이 달라진다면, 해당 변수에 대한 예측 모형 구축에 있어서 이러한 빈도별 시계열 특성이 반영되어야 한다. 본 연구는 다음과 같이 두 가지 면에서 전력수요 관련 연구에 기여한다. 첫째, 이 연구는 전력수요는 일정 주기 이상의 저빈도 자료에서는 경제변수와 같이 단위근을 가지지만 고빈도 자료에서는 이러한 특징이 사라짐을 밝혔다. 둘째, 단위근이 존재하는 빈도 자료에서는 경제변수와 공적분 관계가 있을 수도 함께 밝혀 향후 전력수요 모형 구축에 기반을 제공하고 있다.
This study examines the features of electricity demand in different frequency. Generally electricity demand data has unit root. Therefore, most studies on electricity demand focuses on the cointegration relation of the data. As Granger (1966) noted, the spectral mass of economic variables is concentrated mostly at low frequencies. Yang (2000) shows that temporal aggregation could incur changes in the features of time series. This study contributes to the literature in two ways. First, it shows that lower frequency electricity demand data has a unit root while higher frequency electricity data does not share the same feature as higher frequency counterpart. Second, this study also shows that lower frequency electricity data has cointegration relations with other economic variables such as GDP. This would provide a foundation for constructing a model to predict long-run electricity demand.
[NRF 연계] 한국농촌경제연구원 농촌경제 Vol.40 No.2 2017.06 pp.55-73
...시계열 가격 자료를 이용하여 오차수정모형(ECM)과 Bayesian VAR 모형을 추정하고, 추정된 모형의 가격 예측력을 표본 외 예측을 통해 평가하고자 하였다. 분석에 이용된 모든 가격 자료는 단위근을 포함한 비정상시계열로 나타났으며, 공적분 관계가 존재하여 오차수정모형과 Bayesian VAR 모형을 추정하였다. 추정 결과 예측력은 양호한 것으로 나타났으며, Bayesian VAR 모형보다 오차수정모형의 예측력이 비교적 좋은 것으로 나타났다. 본 연구에서 추정된 마늘 가격 예측 모형은 물량 예측을 기반으로 하는 현행 가격 예측 모형을 보완할 수 있으며, 모형 운용 과정의 효율성에도 기여할 수 있을 것으로 기대된다.
※ 협약을 통해 무료로 제공되는 자료로, 원문이용 방식은 연계기관의 정책을 따르고 있습니다.
마늘은 한국인의 식생활에서 빠질 수 없는 양념채소로 수급 상황과 가격을 예측함은 생산농가의 소득과 소비자 물가안정측면에서 매우 중요하다. 본 연구는 마늘의 시계열 가격 자료를 이용하여 오차수정모형(ECM)과 Bayesian VAR 모형을 추정하고, 추정된 모형의 가격 예측력을 표본 외 예측을 통해 평가하고자 하였다. 분석에 이용된 모든 가격 자료는 단위근을 포함한 비정상시계열로 나타났으며, 공적분 관계가 존재하여 오차수정모형과 Bayesian VAR 모형을 추정하였다. 추정 결과 예측력은 양호한 것으로 나타났으며, Bayesian VAR 모형보다 오차수정모형의 예측력이 비교적 좋은 것으로 나타났다. 본 연구에서 추정된 마늘 가격 예측 모형은 물량 예측을 기반으로 하는 현행 가격 예측 모형을 보완할 수 있으며, 모형 운용 과정의 효율성에도 기여할 수 있을 것으로 기대된다.
Garlic is an important seasoning vegetable that can not be excluded from Korean diet. Predicting its supply and demand situations and price is very important in terms of producer's income and consumer price stability. This study estimated the error correction model (ECM) and the Bayesian VAR model using time series price data of garlic. Also this study assessed the predictive power of the estimated model by performing the out-of-sample forecasts. All price data used in the analysis were identified as non-stationary time series data. There was a cointegration relationship between wholesale prices of whole bulbs of garlic and peeled garlic, so the error correction model and the Bayesian VAR model were estimated. Estimation results showed that predictive power of the models was pretty good and the error correction model had better predictive power than the Bayesian VAR model. The estimated garlic pricing models in this study are expected to contribute not only to the current price prediction model based on quantity forecasting but also to the efficiency of the model operation process.
0개의 논문이 장바구니에 담겼습니다.
선택하신 파일을 압축중입니다.
잠시만 기다려 주십시오.