년 - 년
간여시계열에 의한 성범죄 예방 정책의 효과분석: 전자감시제도의 성범죄 일반예방효과를 중심으로
[NRF 연계] 한국행정연구원 한국행정연구 Vol.20 No.1 2011.04 pp.225-253
...시계열을 통하여 전자감시제도의 정책 개입 효과를 분석하였다. 특히 본 논문에서는 전자감시제도의 성범죄 일반예방효과 분석에 초점을 맞추었기 때문에 공식데이터인 성범죄 발생건수와 성범죄 동종 재범율을 이용하였다. 분석 결과, 전자감시제도의 개입은 크진 않지만 영구적 • 단계적으로 약간의 성범죄 예방 효과가 있는 것으로 나타났다. 이는 전자감시제도의 대상이 성범죄를 저질렀던 사람 중 재범의 우려가 있는 사람에게만 국한되므로, 실질적인 통제를 느낄 수 없는 잠재적 성범죄자들에게는 성범죄로 인한 처벌에 대해 큰 경각심을 주지 못한 것으로 해석된다. 본 연구의 결과는 전자감시제도를 시행함에 있어 감시대상의 범위를 더욱 확대 적용하여 성범죄 처벌에 대한 경각심을 더욱 높여야할 필요성을 제기해 주고 있다. 아울러 전자장치 부착 대상을 확대함에 있어 재범위험성의 판단은 검사나 법원의 영역에만 국한된 것이 아닌, 심리학 혹은 정신의학 등의 전문가 진단까지 함께 고려하여 전자창치 부착명령의 요건으로 할 필요성이 있음을 정책적 함의로 제시하였다.
※ 협약을 통해 무료로 제공되는 자료로, 원문이용 방식은 연계기관의 정책을 따르고 있습니다.
본 논문은 최근 사회적으로 큰 문제가 되고 있는 성범죄의 심각성을 인식하고 서울시를 분석대상으로 하여 간여 시계열을 통하여 전자감시제도의 정책 개입 효과를 분석하였다. 특히 본 논문에서는 전자감시제도의 성범죄 일반예방효과 분석에 초점을 맞추었기 때문에 공식데이터인 성범죄 발생건수와 성범죄 동종 재범율을 이용하였다. 분석 결과, 전자감시제도의 개입은 크진 않지만 영구적 • 단계적으로 약간의 성범죄 예방 효과가 있는 것으로 나타났다. 이는 전자감시제도의 대상이 성범죄를 저질렀던 사람 중 재범의 우려가 있는 사람에게만 국한되므로, 실질적인 통제를 느낄 수 없는 잠재적 성범죄자들에게는 성범죄로 인한 처벌에 대해 큰 경각심을 주지 못한 것으로 해석된다. 본 연구의 결과는 전자감시제도를 시행함에 있어 감시대상의 범위를 더욱 확대 적용하여 성범죄 처벌에 대한 경각심을 더욱 높여야할 필요성을 제기해 주고 있다. 아울러 전자장치 부착 대상을 확대함에 있어 재범위험성의 판단은 검사나 법원의 영역에만 국한된 것이 아닌, 심리학 혹은 정신의학 등의 전문가 진단까지 함께 고려하여 전자창치 부착명령의 요건으로 할 필요성이 있음을 정책적 함의로 제시하였다.
The purpose of this study is to analysis general deterrence effect of Sexual crime of electronic monitoring system. For it, an official data related to the number of sexual crime and recidivism rate of the same kind of sexual crime was collected and it was analyzed by the intervention time-series. The analysis showed that electronic monitoring system has an some effect on sexual crime prevention according to a result of intervention time-series analysis. Through the analysis result, this study is suggest that there are the need to extend the scope of the application of electronic monitoring system in order to alert the potential sex offenders to attention of the punishment.
[NRF 연계] 한국관광학회 관광학연구 Vol.31 No.6 2007.12 pp.289-311
※ 협약을 통해 무료로 제공되는 자료로, 원문이용 방식은 연계기관의 정책을 따르고 있습니다.
방한 일본인 관광객은 외래관광객 중 가장 큰 비중을 차지하면서 총 방한 외래관광객의 증감에 주도적 영향을 미치고 있다. 또한, 최근 경제성장과 국가간 교류증가에 따라 중국인 관광객이 미국인 관광객을 제치고 제2의 인바운드 시장으로 부상하고 있는데, 이러한 추세는 <그림 1>을 통해서도 가시적으로 확인할 수 있다.<표 1> 방한 외래객 방문현황과 관광환경 변화연도외래관광객성장률관광환경 변화19902,958,8398.5%-19913,196,3408.0%걸프전19923,231,0811.1%-19933,331,2263.1%대전엑스포 개최19943,580,0247.5%한국방문의 해19953,753,1974.8%-19963,683,779-1.8%-19973,908,1406.1%아시아 금융위기와 IMF19984,250,2168.8%한국경제위기 및 원화약세 지속 19994,659,7859.6%-20005,321,79214.2%인천국제공항개항20015,147,204-3.3%9.11 테러 발생 및 한국방문의 해20025,347,4683.9%한일 월드컵 공동개최20034,753,604-11.1%SARS 발병, 이라크전쟁20045,818,13822.4%한류열풍20056,021,7643.5%한일공동방문의 해 20066,155,0462.2%
[NRF 연계] 한국경제연구학회 한국경제연구 Vol.19 2007.12 pp.151-172
...시계열 자료를 이용하여 담배수요의 가격탄력성을 추정하였다. 우리나라의 담배수요의 가격탄력성이 매우 낮다고 보고되었던 기존 문헌과는 달리, 시간추세를 통제하게 되면 총담배 수요의 가격탄력성과 국내산 담배의 가격탄력성이 각각 -0.20와 -0.31로 통계적으로 유의한 것으로 추정되었고, 표본기간을 담배수입이 자유화된 1988~2005년으로 한정하게 되면 이 두 탄력성의 추정치는 각각 -0.50과 -0.79로 높아졌다. 담배에 대한 제세공과금을 도구변수로 사용하여 담배 가격의 내생성을 통제하는 경우에도 탄력성은 다소 감소하나 여전히 통계적으로 1% 수준에서 유의하였다. 본 논문의 실증분석 결과는 담배의 제세공과금 10%인상이 약 4.5%의 담배수요 감소를 유도하는 것으로 해석될 수 있는데, 이는 담배 관련 제세공과금의 인상이 담배 소비 감소에 효과적일 수 있음을 의미한다.
※ 협약을 통해 무료로 제공되는 자료로, 원문이용 방식은 연계기관의 정책을 따르고 있습니다.
본 논문은 1965년부터 2005까지 41년간의 우리나라의 담배 소비량과 가격에 대한 시계열 자료를 이용하여 담배수요의 가격탄력성을 추정하였다. 우리나라의 담배수요의 가격탄력성이 매우 낮다고 보고되었던 기존 문헌과는 달리, 시간추세를 통제하게 되면 총담배 수요의 가격탄력성과 국내산 담배의 가격탄력성이 각각 -0.20와 -0.31로 통계적으로 유의한 것으로 추정되었고, 표본기간을 담배수입이 자유화된 1988~2005년으로 한정하게 되면 이 두 탄력성의 추정치는 각각 -0.50과 -0.79로 높아졌다. 담배에 대한 제세공과금을 도구변수로 사용하여 담배 가격의 내생성을 통제하는 경우에도 탄력성은 다소 감소하나 여전히 통계적으로 1% 수준에서 유의하였다. 본 논문의 실증분석 결과는 담배의 제세공과금 10%인상이 약 4.5%의 담배수요 감소를 유도하는 것으로 해석될 수 있는데, 이는 담배 관련 제세공과금의 인상이 담배 소비 감소에 효과적일 수 있음을 의미한다.
This paper estimates the price elasticity of tobacco demand using the macro time-series data on tobacco consumption in Korea covering 41 years from 1965 to 2004. Unlike the previous studies on price elasticity of tobacco demand in Korea, this paper finds that the price elasticity of tobacco demand is estimated to be significantly different from zero. After controlling the time trend and its square term, we find that the estimated price elasticity is -0.20 and -0.31, respectively for total tobacco demand and tobacco demand for domestic products. When the sample period is restricted to more recent period from 1988 to 2004, the estimated coefficients become larger to -0.50 and -0.79. Controlling for endogeneity of tobacco price by applying IV estimation using the tobacco taxes as IV leads to slightly smaller estimated elasticities, which still remain statistically significant at 1% level. Our empirical results imply that a 10% increase in tobacco taxes would lead to approximately 4.5% decrease in tobacco quantity demanded, indicating the potential effectiveness of tobacco taxes in decreasing tobacco consumption in Korea.
금융시계열의 상관행렬 속성분해를 위한 새로운 방법 연구
[NRF 연계] 한국자료분석학회 Journal of The Korean Data Analysis Society Vol.9 No.4 2007.08 pp.1833-1848
...시계열자료의 상관행렬 확률분포에서는 무작위 과정을 따르는 자료에서 관찰되지 않는 시간의존성을 가졌다. 둘째, 실제 금융시계열자료는 RMT방법의 무작위 상관행렬의 고유치 범위를 벗어나는 고유치가 존재하며, 이들 고유치 중에서 가장 큰 고유치는 시장지수의 속성과 높은 관련성을 가졌다. 셋째, RMT방법의 무작위 상관행렬의 범위를 벗어나는 고유치 속성을 반영한 상관행렬의 확률분포는 실제자료로부터의 상관행렬 확률분포와 매우 유사한 반면에, 범위 내에 속하는 상관행렬의 확률분포는 뚜렷한 차이를 가졌다. 이상의 관찰을 통하여, 우리는 RMT방법에 의하여 특정 속성을 갖는 상관행렬로의 분해가 가능하며, 기존 재무이론과의 결합 검증함으로써 금융시장의 가격결정메커니즘을 보다 잘 이해하는데 유용한 방법임을 알 수 있었다.
※ 협약을 통해 무료로 제공되는 자료로, 원문이용 방식은 연계기관의 정책을 따르고 있습니다.
우리는 한국주식시장의 KOSPI지수를 구성하는 개별주식자료를 이용하여, 주식수익률간 상관행렬로부터 분석적으로 무작위 속성을 분해할 수 있는 RMT(random matrix theory)방법을 체계적으로 관찰하였다. 검증결과는 다음과 같다. 첫째, 실제 금융시계열자료의 상관행렬 확률분포에서는 무작위 과정을 따르는 자료에서 관찰되지 않는 시간의존성을 가졌다. 둘째, 실제 금융시계열자료는 RMT방법의 무작위 상관행렬의 고유치 범위를 벗어나는 고유치가 존재하며, 이들 고유치 중에서 가장 큰 고유치는 시장지수의 속성과 높은 관련성을 가졌다. 셋째, RMT방법의 무작위 상관행렬의 범위를 벗어나는 고유치 속성을 반영한 상관행렬의 확률분포는 실제자료로부터의 상관행렬 확률분포와 매우 유사한 반면에, 범위 내에 속하는 상관행렬의 확률분포는 뚜렷한 차이를 가졌다. 이상의 관찰을 통하여, 우리는 RMT방법에 의하여 특정 속성을 갖는 상관행렬로의 분해가 가능하며, 기존 재무이론과의 결합 검증함으로써 금융시장의 가격결정메커니즘을 보다 잘 이해하는데 유용한 방법임을 알 수 있었다.
This paper investigates the statistical properties of the correlation matrix between individual stocks traded in the Korean stock market using the random matrix theory proposed by Wigner et al. We found that the distribution of correlation matrix between stocks in the Korean stock market is deviated from the correlation matrix calculated from the random data, and that varies with time. We also found that the eigenvalue distribution of correlation matrix is deviated from the range predicted by the RMT. In order to estimate the properties of each eigenvalues, we created the new time series having the feature of each eigenvalues. The time series made by the largest eigenvalue have a higher correlation with the Korean market index, KOSPI, while the correlation with the market index is zero in the time series created by the eigenvalues predicted by the RMT. In other words, the eigenvalues deviated from the RMT region have the relation with the common factor in the stock market, while the eigenvalues in the RMT range have not the relation with the market.
단변량 시계열모형과 계량경제모형의 정확도 비교: 표본내 정확도와 표본후 정확도
[NRF 연계] 한국관광학회 관광학연구 Vol.31 No.4 2007.08 pp.35-53
...시계열모형(univariate time series),계량경제모형(econometric model)
※ 협약을 통해 무료로 제공되는 자료로, 원문이용 방식은 연계기관의 정책을 따르고 있습니다.
The purpose of this paper is to compare accuracy among tourism forecasting models to predict tourism demand to South Korea from Japan and U.S.A. For this end, annual data from 1970 to 2000 were used for within sample accuracy, whereas data from 2001 to 2004 were employed for testing period in order to test post sample accuracy. The criterion used for testing accuracy is value of MAPE. The empirical results indicate that econometric model for Japan and exponential smoothing for USA performed best in terms of within sample accuracy, while naive 1 model for USA and ARIMA model for Japan outperformed others on the basis of ex post forecasting accuracy. The results suggest that no single forecasting method performs consistently best across within and post sample accuracies.핵심용어(Key words):표본내 정확도(within sample accuracy), 표본후 정확도(post sample accuracy), 단변량 시계열모형(univariate time series),계량경제모형(econometric model)
[NRF 연계] 한국국제회계학회 국제회계연구 Vol.15 2006.08 pp.21-44
...시계열자료의 특성을 파악하고, ARCH모형, 회귀모형(WLS), GARCH-M모형 등으로 실증분석하였다. 본 연구의 분석결과로 주식포트폴리오의 기대수익률에서 국채수익률을 차감한 기대시장위험프리미엄이 주식수익률의 추정변동성과 통계적으로 유의한 양(+)의 관계를 나타내었으나, 반면에 비기대주식시장수익률이 주식수익률의 비기대변동성과는 음(-)의 관계가 나타남으로써, 이러한 음(-)의 관련성이 기대위험프리미엄과 변동성간의 양(+)의 관련성에 대한 간접적 증거를 나타낸다고 볼 수 있다.
※ 협약을 통해 무료로 제공되는 자료로, 원문이용 방식은 연계기관의 정책을 따르고 있습니다.
>본 논문은 주식수익률과 변동성간의 관련성을 연구하고자 한다. 본 연구에서 1990년 1월부터 2004년 12월까지의 연구기간의 한국종합주가지수(코스피)의 월별 자료를 이용하여 Fisher(1966), Scholes와 Williams(1977), Merton(1980) 및 French, Schwert 및 Stambaugh (1987) 등의 모형을 바탕으로 먼저 살펴보고, 자기상관, 계열상관, Q통계량 및 ARIMA모형 등으로 시계열자료의 특성을 파악하고, ARCH모형, 회귀모형(WLS), GARCH-M모형 등으로 실증분석하였다. 본 연구의 분석결과로 주식포트폴리오의 기대수익률에서 국채수익률을 차감한 기대시장위험프리미엄이 주식수익률의 추정변동성과 통계적으로 유의한 양(+)의 관계를 나타내었으나, 반면에 비기대주식시장수익률이 주식수익률의 비기대변동성과는 음(-)의 관계가 나타남으로써, 이러한 음(-)의 관련성이 기대위험프리미엄과 변동성간의 양(+)의 관련성에 대한 간접적 증거를 나타낸다고 볼 수 있다.
>This study is intended to examine the relation between stock returns and volatility. By referring to monthly data on the fluctuation of Korean Composite Stock Price Index(KOSPI) during research periods from January 1990 to December 2004, it examined into models of the time series suggested by Fisher(1966), Scholes and Williams(1977), Merton(1980), French, Schwert and Stambaugh(1987). Then it identified the time series properties of the data by means of autocorrelation, serial correlation, Q-statistic, ARIMA model, analyzing the data by ARCH model, Regression model(WLS), GARCH-M model. As the result of the analyses herein, it was found that the expected market risk premium equivalent to the expected returns in stock portfolio as subtracted from the government bond yields is positively and statistically significant related to the predicted volatility of stock returns, but the unexpected stock market returns have a negative relation with the unexpected volatility. These findings show that this negative relation provides second hand evidence about a positive relation between the expected risk premium and volatility.
다변량 시계열 분석에 기반한 쿠버네티스 오토-스케일링 개선
[NRF 연계] 한국정보처리학회 KIPS Transactions on Computer and Communication Systems Vol.11 No.3 2004.06 pp.73-82
...시계열 분석 모델을 사용하여 분석·예측하고 이를 기반으로 오토-스케일링 정책을 수립하는 방안을 제안한다. 이를 검증하기 위해 쿠버네티스 환경에서 커스텀 스케쥴러를 구현하고, 실험을 통해 쿠버네티스 기본 오토-스케일링 방식과 비교 분석한다. 제안하는기법은 시스템 자원과 응답시간 사이의 영향에 기반한 예측 데이터를 활용하여 예상되는 상황에 대한 오토-스케일링을 선제적으로 실행함으로써시스템의 안정성을 확보하고 서비스 품질이 저하되지 않는 범위내에서 필요한 만큼의 인스턴스를 세밀하게 관리할 수 있는 결과를 보인다.
※ 협약을 통해 무료로 제공되는 자료로, 원문이용 방식은 연계기관의 정책을 따르고 있습니다.
오토-스케일링은 클라우드 컴퓨팅 기술이 ICT 핵심 기반 기술로 자리 잡을 수 있는 가장 중요한 기능 중 하나로써 사용자나 서비스 요청의폭발적인 증가 또는 감소에도 시스템 자원과 서비스 인스턴스를 적절하게 확장 또는 축소하여 상황에 맞는 서비스의 안정성과 비용 대비 효과를향상하는 기술이다. 하지만 특정 시스템 자원에 대한 모니터링 시점의 단일 메트릭 데이터를 기반으로 정책이 수립·실행되다 보니 이미 서비스에영향이 있거나 실제 필요한 서비스 인스턴스를 세밀하게 관리하지 못하는 문제점이 있다. 이러한 문제점을 해결하기 위해서 본 논문에서는 시스템자원과 서비스 응답시간을 다변량 시계열 분석 모델을 사용하여 분석·예측하고 이를 기반으로 오토-스케일링 정책을 수립하는 방안을 제안한다. 이를 검증하기 위해 쿠버네티스 환경에서 커스텀 스케쥴러를 구현하고, 실험을 통해 쿠버네티스 기본 오토-스케일링 방식과 비교 분석한다. 제안하는기법은 시스템 자원과 응답시간 사이의 영향에 기반한 예측 데이터를 활용하여 예상되는 상황에 대한 오토-스케일링을 선제적으로 실행함으로써시스템의 안정성을 확보하고 서비스 품질이 저하되지 않는 범위내에서 필요한 만큼의 인스턴스를 세밀하게 관리할 수 있는 결과를 보인다.
Auto-scaling is one of the most important functions for cloud computing technology. Even if the number of users or service requestsis explosively increased or decreased, system resources and service instances can be appropriately expanded or reduced to provide servicessuitable for the situation and it can improves stability and cost-effectiveness. However, since the policy is performed based on a singlemetric data at the time of monitoring a specific system resource, there is a problem that the service is already affected or the serviceinstance that is actually needed cannot be managed in detail. To solve this problem, in this paper, we propose a method to predictsystem resource and service response time using a multivariate time series analysis model and establish an auto-scaling policy basedon this. To verify this, implement it as a custom scheduler in the Kubernetes environment and compare it with the Kubernetes defaultauto-scaling method through experiments. The proposed method utilizes predictive data based on the impact between system resourcesand response time to preemptively execute auto-scaling for expected situations, thereby securing system stability and providing as muchas necessary within the scope of not degrading service quality. It shows results that allow you to manage instances in detail.
[Kisti 연계] 한국지리정보학회 Journal of the Korean Association of Geographic Information Studies Vol.27 No.1 2024 pp.1-11
...시계열 측정 데이터의 시각화 성능을 향상시키기 위한 데이터 구축 및 표시 방법을 시도하고, 그 절차와 장단점을 살펴본다.
※ 협약을 통해 무료로 제공되는 자료로, 원문이용 방식은 연계기관의 정책을 따르고 있습니다.
현재 측정되는 많은 데이터가 지표를 기반으로 측정되지만, 측정지점의 높이값이 기초자료로 활용되지 않기 때문에, 3차원 지리정보시스템에 활용하고자 할 때 어려움이 발생한다. 지표면에 많은 양을 표시하기 위해서는 지형정보를 이용하여 지표면에 점을 그리거나, 지표면의 각 측정지점의 높이값을 추출하여 다각형을 생성하는 방법이 다양하게 사용될 수 있다. 본 연구에서는 다양한 형태의 데이터 표현 방법 중 지표면에 표현되는 시계열 측정 데이터의 시각화 성능을 향상시키기 위한 데이터 구축 및 표시 방법을 시도하고, 그 절차와 장단점을 살펴본다.
A lot of the data currently measured is measured based on indicators, but since the height value of the measurement point is not used as basic data, difficulties arise when trying to use it in a three-dimensional geographic information system. Various methods can be used to create polygons by drawing points on the surface using topographic information or extracting the height value of each measurement point on the surface in order to display large quantities on the surface. Among the various types of data expression methods, this study attempts a data construction and display method to improve visualization performance of time series measurement data expressed on the surface, and examines its procedures and strengths and weaknesses.
벼 높이 시계열 분석 최적화를 위한 데이터 가공 방법 비교 분석
[Kisti 연계] 한국식물생명공학회 Journal of plant biotechnology Vol.51 2024 pp.344-353
...시계열 데이터를 바탕으로, 최적화된 표현체 분석 도구 및 데이터 처리에 대한 최적화와 그 유효성 검증에 중점을 두었다. 세 가지 주요 표현형 분석 도구인 ImageJ, OpenCV, PlantCV를 활용하여 벼의 키 성장 곡선을 비교한 결과, 도구마다 생장 단계별로 고유한 성능 차이가 나타났다. ImageJ는 초기 생장 단계에서 변동성이 컸으며, OpenCV는 후기 단계에서 정확도가 저하되는 경향이 있었다. 반면, PlantCV는 모든 생장 단계에서 안정적이고 일관된 결과를 보여, 표현형 분석 도구로서의 높은 신뢰성을 입증하였다. 추가적으로, 반복 샘플, 촬영 각도 선택, 이상치 제거가 데이터 변동성과 오류율에 미치는 영향을 분석한 결과, 반복 샘플만으로는 변동성 제어가 충분하지 않았으나, 각도 최적화와 이상치 제거를 결합한 방법이 데이터의 신뢰성과 정확성을 크게 개선하는 데 기여함을 확인하였다. 특히, 이상치 제거와 각도별 최대 값 선별은 성장 곡선을 보다 부드럽고 안정적으로 조정하는 데 중요한 역할을 하였다. 이러한 최적화된 분석 방법을 통해 도출된 형질 데이터는 딥러닝 기반 GBS(Genotyping-by-Sequencing) 파이프라인으로 식별된 12,127개의 SNP을 활용한 GWAS(유전체 연관 분석)를 통해 검증되었으며, 염색체 3, 6, 9번에서 벼 키와 연관된 유의미한 SNP를 확인하였다. 주요 유전자 OsBIG, OsGH9B3, OsSTRL2, OsCCS52A는 성장 호르몬 생합성 경로와 연결되어 본 연구의 최적화된 표현형 분석 방법이 유의미한 형질-연관 마커 식별에 효과적임을 입증하였다.
※ 협약을 통해 무료로 제공되는 자료로, 원문이용 방식은 연계기관의 정책을 따르고 있습니다.
본 연구는 벼 96품종의 전 생육주기 동안 촬영된 시계열 데이터를 바탕으로, 최적화된 표현체 분석 도구 및 데이터 처리에 대한 최적화와 그 유효성 검증에 중점을 두었다. 세 가지 주요 표현형 분석 도구인 ImageJ, OpenCV, PlantCV를 활용하여 벼의 키 성장 곡선을 비교한 결과, 도구마다 생장 단계별로 고유한 성능 차이가 나타났다. ImageJ는 초기 생장 단계에서 변동성이 컸으며, OpenCV는 후기 단계에서 정확도가 저하되는 경향이 있었다. 반면, PlantCV는 모든 생장 단계에서 안정적이고 일관된 결과를 보여, 표현형 분석 도구로서의 높은 신뢰성을 입증하였다. 추가적으로, 반복 샘플, 촬영 각도 선택, 이상치 제거가 데이터 변동성과 오류율에 미치는 영향을 분석한 결과, 반복 샘플만으로는 변동성 제어가 충분하지 않았으나, 각도 최적화와 이상치 제거를 결합한 방법이 데이터의 신뢰성과 정확성을 크게 개선하는 데 기여함을 확인하였다. 특히, 이상치 제거와 각도별 최대 값 선별은 성장 곡선을 보다 부드럽고 안정적으로 조정하는 데 중요한 역할을 하였다. 이러한 최적화된 분석 방법을 통해 도출된 형질 데이터는 딥러닝 기반 GBS(Genotyping-by-Sequencing) 파이프라인으로 식별된 12,127개의 SNP을 활용한 GWAS(유전체 연관 분석)를 통해 검증되었으며, 염색체 3, 6, 9번에서 벼 키와 연관된 유의미한 SNP를 확인하였다. 주요 유전자 OsBIG, OsGH9B3, OsSTRL2, OsCCS52A는 성장 호르몬 생합성 경로와 연결되어 본 연구의 최적화된 표현형 분석 방법이 유의미한 형질-연관 마커 식별에 효과적임을 입증하였다.
In this study, we developed and validated an optimized phenotypic analysis method using time-series data collected throughout the full growth cycle of 96 rice cultivars. Height growth curves were compared across three phenotyping tools (ImageJ, OpenCV, and PlantCV), each of which showed distinct performance characteristics at different stages of rice growth. ImageJ displayed significant variability in early growth stages, while OpenCV suffered from decreased accuracy during later stages. PlantCV, however, provided stable and consistent results across all stages, making it the most reliable tool for this phenotypic analysis. We also examined the effects of replicate sampling, camera angle selection, and outlier removal on data variability and error rates. Results indicated that replicate sampling alone was insufficient to control variability; however, combining optimized processing techniques, particularly angle selection and outlier exclusion, substantially improved data reliability and precision. Outlier removal, along with selecting maximum angle values, contributed to smoother growth curves with less variability, enhancing the robustness of the data. The reliability of these phenotypic traits was further validated through genome-wide association studies (GWAS), using 12,127 SNPs identified via a deep learning-based GBS(Genotyping-by-Sequencing) pipeline. The GWAS analysis identified significant SNPs associated with rice height on chromosomes 3, 6, and 9. Notably, genes such as OsBIG, OsGH9B3, OsSTRL2, and OsCCS52A were confirmed to play roles in rice height, linking them to growth hormone biosynthesis pathways. This optimized phenotypic analysis method demonstrates strong potential for identifying trait-associated markers in rice and other crop plants.
Sentinel-1 시계열 SAR 간섭기법을 활용한 영일만항과 주변 지역의 2017 포항 지진 동시성 및 지진 후 변위 분석
[Kisti 연계] 대한원격탐사학회 대한원격탐사학회지 Vol.40 No.1 2024 pp.19-31
...시계열 변위를 산출하였고, 2017년 11월에 발생한 포항 지진에 의한 변위를 분석하였다. 영일만항의 남부(최남단 제외)와 중앙부는 관측 초기에 약 10개월 동안 건설 활동에 기인하는 큰 변위를 보였으며, 포항 지진의 동시성 변위로 서쪽방향으로 최대 1.6 cm의 수평 움직임 및 0.5 cm의 침하가 발생하였다. 반면 매립이 가장 늦게 완료된 항만 최남단과 가장 오래된 항만 북부에서는 포항 지진에 의한 변위가 거의 관측되지 않았다. 이는 항만 매립토의 고결화가 약할수록 지진에 더욱 취약하며, 매립이 진행 중이어서 흙의 고결화가 매우 약한 경우는 오히려 지진에 크게 영향을 받지 않음을 지시한다. 영일만항 전역에서는 온도 변화에 따른 매립토의 체적 변화에 기인한 1 cm 내외 수준의 여름철 침하 및 겨울철 융기 현상이 매년 반복적으로 관측되었다. 영일만항에 인접한 제1, 제2일반산업단지의 지반은 관측 기간 동안 침하하였고, 침하 속도는 제1일반산업단지에서 더 빨랐다. 제1일반산업단지는 포항 지진 동시성 변위로 서쪽 방향으로 3 mm의 수평 움직임과 6 mm의 침하가 관측되었으나, 제2일반산업단지는 포항 지진에 영향을 거의 받지 않은 것으로 분석되었다. 이 연구의 결과를 통해 영일만항의 시계열 변위 특성을 파악할 수 있었고, 해안에 매립을 통해 건설된 항만의 안정성에 지진이 미치는 영향을 이해할 수 있었다.
※ 협약을 통해 무료로 제공되는 자료로, 원문이용 방식은 연계기관의 정책을 따르고 있습니다.
항만은 국민의 생활과 국가의 경제에 큰 영향을 미치는 사회기반시설로, 최근 인프라의 노후화율이 증가하고 다양한 자연재해가 빈번하게 발생하고 있어 안전 관리를 위한 항만의 변위 모니터링이 필수적이다. 이 연구에서는 포항 영일만항과 주변 지역에 대해 Sentinel-1 위성의 상향(2017년 2월-2023년 7월) 및 하향(2017년 2월-2021년 12월) 궤도 관측에서 획득된 영상레이더(Synthetic Aperture Radar, SAR) 자료에 고정산란체 레이더 간섭기법(Permanent Scatterer Interferometric SAR)을 적용하여 시계열 변위를 산출하였고, 2017년 11월에 발생한 포항 지진에 의한 변위를 분석하였다. 영일만항의 남부(최남단 제외)와 중앙부는 관측 초기에 약 10개월 동안 건설 활동에 기인하는 큰 변위를 보였으며, 포항 지진의 동시성 변위로 서쪽방향으로 최대 1.6 cm의 수평 움직임 및 0.5 cm의 침하가 발생하였다. 반면 매립이 가장 늦게 완료된 항만 최남단과 가장 오래된 항만 북부에서는 포항 지진에 의한 변위가 거의 관측되지 않았다. 이는 항만 매립토의 고결화가 약할수록 지진에 더욱 취약하며, 매립이 진행 중이어서 흙의 고결화가 매우 약한 경우는 오히려 지진에 크게 영향을 받지 않음을 지시한다. 영일만항 전역에서는 온도 변화에 따른 매립토의 체적 변화에 기인한 1 cm 내외 수준의 여름철 침하 및 겨울철 융기 현상이 매년 반복적으로 관측되었다. 영일만항에 인접한 제1, 제2일반산업단지의 지반은 관측 기간 동안 침하하였고, 침하 속도는 제1일반산업단지에서 더 빨랐다. 제1일반산업단지는 포항 지진 동시성 변위로 서쪽 방향으로 3 mm의 수평 움직임과 6 mm의 침하가 관측되었으나, 제2일반산업단지는 포항 지진에 영향을 거의 받지 않은 것으로 분석되었다. 이 연구의 결과를 통해 영일만항의 시계열 변위 특성을 파악할 수 있었고, 해안에 매립을 통해 건설된 항만의 안정성에 지진이 미치는 영향을 이해할 수 있었다.
Ports are vital social infrastructures that significantly influence both people's lives and a country's economy. In South Korea, the aging of port infrastructure combined with the increased frequency of various natural disasters underscores the necessity of displacement monitoring for safety management of the port. In this study, the time-series displacements of Yeongilman Port and surrounding areas in Pohang, South Korea, were measured by applying Permanent Scatterer Interferometric Synthetic Aperture Radar (PSInSAR) to Sentinel-1 SAR images collected from the satellite's ascending (February 2017-July 2023) and descending (February 2017-December 2021) nodes, and the displacement associated with the 2017 Pohang earthquake in the port was analyzed. The southern (except the southernmost) and central parts of Yeongilman Port showed large displacements attributed to construction activities for about 10 months at the beginning of the observation period, and the coseismic displacement caused by the Pohang earthquake was up to 1.6 cm of the westward horizontal motion and 0.5 cm of subsidence. However, little coseismic displacement was observed in the southernmost part of the port, where reclamation was completed last, and in the northern part of the oldest port. This represents that the weaker the consolidation of the reclaimed soil in the port, the more vulnerable it is to earthquakes, and that if the soil is very weakly consolidated due to ongoing reclamation, it would not be significantly affected by earthquakes. Summer subsidence and winter uplift of about 1 cm have been repeatedly observed every year in the entire area of Yeongilman Port, which is attributed to volume changes in the reclaimed soil due to temperature changes. The ground of the 1st and 2nd General Industrial Complexes adjacent to Yeongilman Port subsided during the observation period, and the rate of subsidence was faster in the 1st Industrial Complex. The 1st Industrial Complex was observed to have a westward horizontal displacement of 3 mm and a subsidence of 6 mm as the coseismic displacement of the Pohang earthquake, while the 2nd Industrial Complex was analyzed to have been little affected by the earthquake. The results of this study allowed us to identify the time-series displacement characteristics of Yeongilman Port and understand the impact of earthquakes on the stability of a port built by coastal reclamation.
TadGAN 기반 시계열 이상 탐지를 활용한 전처리 프로세스 연구
[Kisti 연계] 한국품질경영학회 Journal of the Korean Society for Quality Management Vol.50 No.3 2022 pp.459-471
※ 협약을 통해 무료로 제공되는 자료로, 원문이용 방식은 연계기관의 정책을 따르고 있습니다.
Purpose: The purpose of this study was to increase prediction accuracy for an anomaly interval identified using an artificial intelligence-based time series anomaly detection technique by establishing a pre-processing process. Methods: Significant variables were extracted by applying feature selection techniques, and anomalies were derived using the TadGAN time series anomaly detection algorithm. After applying machine learning and deep learning methodologies using normal section data (excluding anomaly sections), the explanatory power of the anomaly sections was demonstrated through performance comparison. Results: The results of the machine learning methodology, the performance was the best when SHAP and TadGAN were applied, and the results in the deep learning, the performance was excellent when Chi-square Test and TadGAN were applied. Comparing each performance with the papers applied with a Conventional methodology using the same data, it can be seen that the performance of the MLR was significantly improved to 15%, Random Forest to 24%, XGBoost to 30%, Lasso Regression to 73%, LSTM to 17% and GRU to 19%. Conclusion: Based on the proposed process, when detecting unsupervised learning anomalies of data that are not actually labeled in various fields such as cyber security, financial sector, behavior pattern field, SNS. It is expected to prove the accuracy and explanation of the anomaly detection section and improve the performance of the model.
[Kisti 연계] 한국통계학회 The Korean journal of applied statistics Vol.35 No.3 2022 pp.347-356
...시계열 비대칭 변동성을 모형화하기 위해서 다중 임계점을 가진 비대칭-ARCH 점화식(A-ARCH(1))을 제안하고 있다. 특히 임계점이 두 개인 간단한 모형에 초점을 맞추어 설명하고 있으며 미국 S&P500 자료 분석을 통해 예시하였다. 다양한 A-ARCH(1) 모형의 예측력 비교를 위해 모수적-붓스트랩을 활용하여 예측오차의 평가 및 예측구간의 정확도를 설명하였다.
※ 협약을 통해 무료로 제공되는 자료로, 원문이용 방식은 연계기관의 정책을 따르고 있습니다.
본 논문에서는 금융 시계열 비대칭 변동성을 모형화하기 위해서 다중 임계점을 가진 비대칭-ARCH 점화식(A-ARCH(1))을 제안하고 있다. 특히 임계점이 두 개인 간단한 모형에 초점을 맞추어 설명하고 있으며 미국 S&P500 자료 분석을 통해 예시하였다. 다양한 A-ARCH(1) 모형의 예측력 비교를 위해 모수적-붓스트랩을 활용하여 예측오차의 평가 및 예측구간의 정확도를 설명하였다.
This article is concerned with asymmetric volatility models for financial time series. A generalization of standard single-threshold volatility model is discussed via multiple-threshold in which we specialize to twothreshold case for ease of presentation. An empirical illustration is made by analyzing S&P500 data from NYSE (New York Stock Exchange). For comparison measures between competing models, parametric bootstrap method is used to generate forecast distributions from which summary statistics of CP (Coverage Probability) and PE (Prediction Error) are obtained. It is demonstrated that our suggestion is useful in the field of asymmetric volatility analysis.
[Kisti 연계] 한국통계학회 The Korean journal of applied statistics Vol.34 No.2 2021 pp.205-223
...시계열에 상수항과 선형 추세가 포함된 ADF-회귀모형식을 adaptive lasso로 추정하여 단위근을 식별하는 방법이 제안되었으나, 미지의 선형 추세가 존재할 때 검정력이 떨어지는 것으로 나타났다. 이 문제를 해결하기 위해 본 논문에서는 ADF-회귀모형식을 적합시킬 때 원 시계열 대신 선형 추세가 제거된 시계열을 사용하는 수정안을 제안하였다. 그리고 수정안에서는 일차적으로 선형 추세를 제거한 후 모형식을 적합시키기 때문에 ADF-회귀모형식 중 상수항과 선형 추세를 모두 포함하지 않는 모형식을 사용하였다. 기존의 방법보다 수정안을 사용할 때 단위근의 존재를 판단하는 검정력이 향상되는지 모의실험을 통해 검토하였으며, ADF 검정과 DF-GLS 검정과의 비교 실험도 진행하였다. 모의실험 결과 adaptive lasso를 이용하여 단위근의 존재를 판단할 때 원 시계열보다 추세가 제거된 시계열을 사용하는 경우가 높은 정확도를 가지며, 자료의 개수가 충분히 많을 때 단위근을 잘 판단함을 확인할 수 있었다.
※ 협약을 통해 무료로 제공되는 자료로, 원문이용 방식은 연계기관의 정책을 따르고 있습니다.
본 논문에서는 adaptive lasso 방법을 이용하여 단위근의 존재 여부를 판단하는 방법에 대해 연구하였다. 최근 원 시계열에 상수항과 선형 추세가 포함된 ADF-회귀모형식을 adaptive lasso로 추정하여 단위근을 식별하는 방법이 제안되었으나, 미지의 선형 추세가 존재할 때 검정력이 떨어지는 것으로 나타났다. 이 문제를 해결하기 위해 본 논문에서는 ADF-회귀모형식을 적합시킬 때 원 시계열 대신 선형 추세가 제거된 시계열을 사용하는 수정안을 제안하였다. 그리고 수정안에서는 일차적으로 선형 추세를 제거한 후 모형식을 적합시키기 때문에 ADF-회귀모형식 중 상수항과 선형 추세를 모두 포함하지 않는 모형식을 사용하였다. 기존의 방법보다 수정안을 사용할 때 단위근의 존재를 판단하는 검정력이 향상되는지 모의실험을 통해 검토하였으며, ADF 검정과 DF-GLS 검정과의 비교 실험도 진행하였다. 모의실험 결과 adaptive lasso를 이용하여 단위근의 존재를 판단할 때 원 시계열보다 추세가 제거된 시계열을 사용하는 경우가 높은 정확도를 가지며, 자료의 개수가 충분히 많을 때 단위근을 잘 판단함을 확인할 수 있었다.
In this paper, we study a method to determine the existence of unit roots by using the adaptive lasso. The previously proposed method that applied the adaptive lasso to the original time series has low power when there is an unknown trend. Therefore, we propose a modified version that fits the ADF regression model without deterministic component using the adaptive lasso to the detrended series instead of the original series. Our Monte Carlo simulation experiments show that the modified method improves the power over the original method and works well in large samples.
광업 데이터의 시계열 분석을 통해 실리카 농도를 예측하기 위한 머신러닝 모델
[Kisti 연계] 한국품질경영학회 Journal of the Korean Society for Quality Management Vol.48 No.3 2020 pp.511-520
※ 협약을 통해 무료로 제공되는 자료로, 원문이용 방식은 연계기관의 정책을 따르고 있습니다.
Purpose: The purpose of this study was to devise an accurate machine learning model for predicting silica concentrations following the addition of impurities, through time series analysis of mining data. Methods: The mining data were preprocessed and subjected to time series analysis using the machine learning model. Through correlation analysis, valid variables were selected and meaningless variables were excluded. To reflect changes over time, dependent variables at baseline were treated as independent variables at later time points. The relationship between independent variables and the dependent variable after n point was subjected to Pearson correlation analysis. Results: The correlation (R2) was strongest after 3 hours, which was adopted as a dependent variable. According to root mean square error (RMSE) data, the proposed method was superior to the other machine learning methods. The XGboost algorithm showed the best predictive performance. Conclusion: This study is important given the current lack of machine learning studies pertaining to the domestic mining industry. In addition, using time series analysis in mining data will show further improvement. Before establishing a predictive model for the proposed method, predictions should be made using data with time series characteristics. After doing this work, it should also improve prediction accuracy in other domains.
이분산 시계열 모형에서 모수의 변화에 대한 모니터링 절차의 점근 성질
[Kisti 연계] 한국통계학회 The Korean journal of applied statistics Vol.33 No.4 2020 pp.467-482
...시계열 모형에서 모수의 변화에 대한 모니터링 절차를 연구한다. 모니터링 절차에서 수정된 잔차의 누적합을 이용한 탐지기를 소개하고 귀무가설과 대립가설 하에서 각각 모니터링 절차에 대한 점근적 성질을 규명한다. 그리고 모의실험과 사례 분석을 통하여 제안한 모니터링 방법의 성능이 우수함을 확인한다.
※ 협약을 통해 무료로 제공되는 자료로, 원문이용 방식은 연계기관의 정책을 따르고 있습니다.
본 논문은 이분산성을 갖는 위치-척도 시계열 모형에서 모수의 변화에 대한 모니터링 절차를 연구한다. 모니터링 절차에서 수정된 잔차의 누적합을 이용한 탐지기를 소개하고 귀무가설과 대립가설 하에서 각각 모니터링 절차에 대한 점근적 성질을 규명한다. 그리고 모의실험과 사례 분석을 통하여 제안한 모니터링 방법의 성능이 우수함을 확인한다.
We investigate a monitoring procedure for the early detection of parameter changes in location-scale time series models. We introduce a detector for monitoring procedure based on modified residual cumulative sum (CUSUM). The asymptotic properties of the monitoring procedure are established under the null and alternative hypotheses. Simulation results and data analysis are also provided for illustration.
전기 사용량 시계열 함수 데이터에 대한 비모수적 군집화
[Kisti 연계] 한국통계학회 The Korean journal of applied statistics Vol.32 No.1 2019 pp.149-160
...시계열 데이터에 대해 functional data analysis 기법을 적용하여 군집화하고 각 군집의 특성을 파악하고 예측에 활용하고자 한다. 하루동안의 A 대학교의 전기 사용량은 패턴은 주중과 주말 에 큰 차이를 보이며 스플라인 기저함수로 FPCA 구한 후 이들에 대한 가우시안 분포의 혼합모형 기반 군집분석으로 3개의 군집화가 적절해 보인다. 각 군집에 대해 평균 함수, 확률밀도함수, 일들의 분포 등을 정리해 각 군집에 대한 정보와 특징을 보여준다.
※ 협약을 통해 무료로 제공되는 자료로, 원문이용 방식은 연계기관의 정책을 따르고 있습니다.
본 연구는 2016년 7월부터 2017년 6월까지 인천 소재 A 대학교의 15분 단위의 일일 전기 사용량 시계열 데이터에 대해 functional data analysis 기법을 적용하여 군집화하고 각 군집의 특성을 파악하고 예측에 활용하고자 한다. 하루동안의 A 대학교의 전기 사용량은 패턴은 주중과 주말 에 큰 차이를 보이며 스플라인 기저함수로 FPCA 구한 후 이들에 대한 가우시안 분포의 혼합모형 기반 군집분석으로 3개의 군집화가 적절해 보인다. 각 군집에 대해 평균 함수, 확률밀도함수, 일들의 분포 등을 정리해 각 군집에 대한 정보와 특징을 보여준다.
The electricity consumption time series data of 'A' University from July 2016 to June 2017 is analyzed via nonparametric functional data clustering since the time series data can be regarded as realization of continuous functions with dependency structure. We use a Bouveyron and Jacques (Advances in Data Analysis and Classification, 5, 4, 281-300, 2011) method based on model-based functional clustering with an FEM algorithm that assumes a Gaussian distribution on functional principal components. Clusterwise analysis is provided with cluster mean functions, densities and cluster profiles.
Landsat-8 시계열 위성영상을 활용한 도심지 확장에 따른 열섬포텐셜 분석
[Kisti 연계] 한국측량학회 Korean Journal of Geomatics Vol.36 No.4 2018 pp.305-316
...시계열 토지피복도(2013년~2015년, 2017년)를 생성하였다. 그리고 취득된 위성영상에서 제공하는 두 가지 열적외선 밴드에서 산출된 밝기온도와 자동기상관측망 자료와의 정확도 평가를 통해 연구에 활용할 밴드를 선정하였다. 선정된 밴드와 지표면 방사율을 고려하여 지표면온도를 산출하였으며, 이를 기반으로 산출된 열섬포텐셜 변화분석을 수행하였다. 분석결과, 연구지역의 행정구역별 도심지 변화율이 크게 관측되는 지역의 지표면온도는 주변지역 보다 $3^{\circ}C{\sim}4^{\circ}C$ 높고, 열섬포텐셜 또한 $4^{\circ}C{\sim}5^{\circ}C$ 높게 관측되었다. 하지만 도심지 변화율이 크고 녹지의 비율이 높은 지역에서는 열섬현상이 완화되는 경향을 보였다. 이를 통해 면적대비 도심지가 차지하는 비율이 높아지면 열섬을 유발할 가능성이 증가하지만 녹지를 통해 열섬을 완화 시킬 수 있다는 것을 알 수 있었다.
※ 협약을 통해 무료로 제공되는 자료로, 원문이용 방식은 연계기관의 정책을 따르고 있습니다.
우리나라의 도시화 비율이 증가함에 따라 도시열섬으로 인한 도시 열 환경의 중요성이 증대되고 있다. 본 연구에서는 2012년에 출범하여 급속도로 발전을 이룬 세종특별자치시의 도시 열 환경 분석을 위해 열섬포텐셜을 이용하였다. 우선 도심지의 비율 및 변화율을 분석하기 위해 Landsat-8 OLI/TIRS 위성영상을 기반으로 연구지역의 시계열 토지피복도(2013년~2015년, 2017년)를 생성하였다. 그리고 취득된 위성영상에서 제공하는 두 가지 열적외선 밴드에서 산출된 밝기온도와 자동기상관측망 자료와의 정확도 평가를 통해 연구에 활용할 밴드를 선정하였다. 선정된 밴드와 지표면 방사율을 고려하여 지표면온도를 산출하였으며, 이를 기반으로 산출된 열섬포텐셜 변화분석을 수행하였다. 분석결과, 연구지역의 행정구역별 도심지 변화율이 크게 관측되는 지역의 지표면온도는 주변지역 보다 $3^{\circ}C{\sim}4^{\circ}C$ 높고, 열섬포텐셜 또한 $4^{\circ}C{\sim}5^{\circ}C$ 높게 관측되었다. 하지만 도심지 변화율이 크고 녹지의 비율이 높은 지역에서는 열섬현상이 완화되는 경향을 보였다. 이를 통해 면적대비 도심지가 차지하는 비율이 높아지면 열섬을 유발할 가능성이 증가하지만 녹지를 통해 열섬을 완화 시킬 수 있다는 것을 알 수 있었다.
As the urbanization ratio increases, the heat environment in cities is becoming more important due to the urban heat island. In this study, the heat island spatial analysis was calculated and conducted for analysis of urban thermal environment of Sejong city, which was launched in 2012 and has been developed rapidly. To analyze the ratio and change rate of urban area, a multi temporal land cover map (2013 to 2015 and 2017) of study area is generated based on Landsat-8 OLI/TIRS (Operational Land Imager / Thermal Infrared Sensor) satellite imagery. Then, we select an TIR (Thermal Infrared) band from the two TIR bands provided by the Landsat-8, which is used for calculating the heat island potential, through the accuracy evaluation of the brightness temperature and AWS (Automatic Weathering Station) data. Based on the selected band and surface emissivity, land surface temperature is calculated and the estimated heat island potential change is analyzed. As a result, the land surface temperature of the high ratio and change rate of urban area was significantly higher than the surrounding area around $3^{\circ}C$ to $4^{\circ}C$, and the heat island potential was also higher around $4^{\circ}C$ to $5^{\circ}C$. However, the heat island phenomenon was alleviated in urban areas with high rate of change that also show high green area ratio. Therefore, we demonstrated that dense urban area increases the possibility of inducing heat island, but it can mitigate the heat island through green areas.
딥러닝 시계열 알고리즘 적용한 기업부도예측모형 유용성 검증
[Kisti 연계] 한국지능정보시스템학회 Journal of Intelligence and Information Systems Vol.24 No.4 2018 pp.1-32
...시계열 알고리즘 기반의 기업부도예측 모형이 유용함을 검증한다. 부도에 대한 정의는 Lee(2015) 연구와 동일하게 기업의 상장폐지 사유들 중 실적이 부진했던 경우를 부도로 선정한다. 독립변수의 경우, 기존 선행연구에서 이용되었던 재무비율 변수를 비롯한 기타 재무정보를 포함한다. 이후 최적의 변수군을 선별하는 방식으로 다변량 판별분석, 로짓 모형, 그리고 Lasso 회귀분석 모형을 이용한다. 기업부도예측 모형 방법론으로는 Altman(1968)이 제시했던 다중판별분석 모형, Ohlson(1980)이 제시한 로짓모형, 그리고 비시계열 기계학습 기반 부도예측모형과 딥러닝 시계열 알고리즘을 이용한다. 기업 데이터의 경우, '비선형적인 변수들', 변수들의 '다중 공선성 문제', 그리고 '데이터 수 부족'이란 한계점이 존재한다. 이에 로짓 모형은 '비선형성'을, Lasso 회귀분석 모형은 '다중 공선성 문제'를 해결하고, 가변적인 데이터 생성 방식을 이용하는 딥러닝 시계열 알고리즘을 접목함으로서 데이터 수가 부족한 점을 보완하여 연구를 진행한다. 현 정부를 비롯한 해외 정부에서는 4차 산업혁명을 통해 국가 및 사회의 시스템, 일상생활 전반을 아우르기 위해 힘쓰고 있다. 즉, 현재는 다양한 산업에 이르러 빅데이터를 이용한 딥러닝 연구가 활발히 진행되고 있지만, 금융 산업을 위한 연구분야는 아직도 미비하다. 따라서 이 연구는 기업 부도에 관하여 딥러닝 시계열 알고리즘 분석을 진행한 초기 논문으로서, 금융 데이터와 딥러닝 시계열 알고리즘을 접목한 연구를 시작하는 비 전공자에게 비교분석 자료로 쓰이기를 바란다.
※ 협약을 통해 무료로 제공되는 자료로, 원문이용 방식은 연계기관의 정책을 따르고 있습니다.
본 연구는 경제적으로 국내에 큰 영향을 주었던 글로벌 금융위기를 기반으로 총 10년의 연간 기업데이터를 이용한다. 먼저 시대 변화 흐름에 일관성있는 부도 모형을 구축하는 것을 목표로 금융위기 이전(2000~2006년)의 데이터를 학습한다. 이후 매개 변수 튜닝을 통해 금융위기 기간이 포함(2007~2008년)된 유효성 검증 데이터가 학습데이터의 결과와 비슷한 양상을 보이고, 우수한 예측력을 가지도록 조정한다. 이후 학습 및 유효성 검증 데이터를 통합(2000~2008년)하여 유효성 검증 때와 같은 매개변수를 적용하여 모형을 재구축하고, 결과적으로 최종 학습된 모형을 기반으로 시험 데이터(2009년) 결과를 바탕으로 딥러닝 시계열 알고리즘 기반의 기업부도예측 모형이 유용함을 검증한다. 부도에 대한 정의는 Lee(2015) 연구와 동일하게 기업의 상장폐지 사유들 중 실적이 부진했던 경우를 부도로 선정한다. 독립변수의 경우, 기존 선행연구에서 이용되었던 재무비율 변수를 비롯한 기타 재무정보를 포함한다. 이후 최적의 변수군을 선별하는 방식으로 다변량 판별분석, 로짓 모형, 그리고 Lasso 회귀분석 모형을 이용한다. 기업부도예측 모형 방법론으로는 Altman(1968)이 제시했던 다중판별분석 모형, Ohlson(1980)이 제시한 로짓모형, 그리고 비시계열 기계학습 기반 부도예측모형과 딥러닝 시계열 알고리즘을 이용한다. 기업 데이터의 경우, '비선형적인 변수들', 변수들의 '다중 공선성 문제', 그리고 '데이터 수 부족'이란 한계점이 존재한다. 이에 로짓 모형은 '비선형성'을, Lasso 회귀분석 모형은 '다중 공선성 문제'를 해결하고, 가변적인 데이터 생성 방식을 이용하는 딥러닝 시계열 알고리즘을 접목함으로서 데이터 수가 부족한 점을 보완하여 연구를 진행한다. 현 정부를 비롯한 해외 정부에서는 4차 산업혁명을 통해 국가 및 사회의 시스템, 일상생활 전반을 아우르기 위해 힘쓰고 있다. 즉, 현재는 다양한 산업에 이르러 빅데이터를 이용한 딥러닝 연구가 활발히 진행되고 있지만, 금융 산업을 위한 연구분야는 아직도 미비하다. 따라서 이 연구는 기업 부도에 관하여 딥러닝 시계열 알고리즘 분석을 진행한 초기 논문으로서, 금융 데이터와 딥러닝 시계열 알고리즘을 접목한 연구를 시작하는 비 전공자에게 비교분석 자료로 쓰이기를 바란다.
In addition to stakeholders including managers, employees, creditors, and investors of bankrupt companies, corporate defaults have a ripple effect on the local and national economy. Before the Asian financial crisis, the Korean government only analyzed SMEs and tried to improve the forecasting power of a default prediction model, rather than developing various corporate default models. As a result, even large corporations called 'chaebol enterprises' become bankrupt. Even after that, the analysis of past corporate defaults has been focused on specific variables, and when the government restructured immediately after the global financial crisis, they only focused on certain main variables such as 'debt ratio'. A multifaceted study of corporate default prediction models is essential to ensure diverse interests, to avoid situations like the 'Lehman Brothers Case' of the global financial crisis, to avoid total collapse in a single moment. The key variables used in corporate defaults vary over time. This is confirmed by Beaver (1967, 1968) and Altman's (1968) analysis that Deakins'(1972) study shows that the major factors affecting corporate failure have changed. In Grice's (2001) study, the importance of predictive variables was also found through Zmijewski's (1984) and Ohlson's (1980) models. However, the studies that have been carried out in the past use static models. Most of them do not consider the changes that occur in the course of time. Therefore, in order to construct consistent prediction models, it is necessary to compensate the time-dependent bias by means of a time series analysis algorithm reflecting dynamic change. Based on the global financial crisis, which has had a significant impact on Korea, this study is conducted using 10 years of annual corporate data from 2000 to 2009. Data are divided into training data, validation data, and test data respectively, and are divided into 7, 2, and 1 years respectively. In order to construct a consistent bankruptcy model in the flow of time change, we first train a time series deep learning algorithm model using the data before the financial crisis (2000~2006). The parameter tuning of the existing model and the deep learning time series algorithm is conducted with validation data including the financial crisis period (2007~2008). As a result, we construct a model that shows similar pattern to the results of the learning data and shows excellent prediction power. After that, each bankruptcy prediction model is restructured by integrating the learning data and validation data again (2000 ~ 2008), applying the optimal parameters as in the previous validation. Finally, each corporate default prediction model is evaluated and compared using test data (2009) based on the trained models over nine years. Then, the usefulness of the corporate default prediction model based on the deep learning time series algorithm is proved. In addition, by adding the Lasso regression analysis to the existing methods (multiple discriminant analysis, logit model) which select the variables, it is proved that the deep learning time series algorithm model based on the three bundles of variables is useful for robust corporate default prediction. The definition of bankruptcy used is the same as that of Lee (2015). Independent variables include financial information such as financial ratios used in previous studies. Multivariate discriminant analysis, logit model, and Lasso regression model are used to select the optimal variable group. The influence of the Multivariate discriminant analysis model proposed by Altman (1968), the Logit model proposed by Ohlson (1980), the non-time series machine learning algorithms, and the deep learning time series algorithms are compared. In the case of corporate data, there are limitations of 'nonlinear variables', 'multi-collinearity' of variables, and 'lack of data'. While the logit model is nonlinear, the Lasso regression model solves the multi-collinearity problem, an
GIS 기반의 시계열 공간자료를 활용한 하천건천화 평가 시스템 소개
[Kisti 연계] 한국농공학회 전원과 자원 Vol.60 No.4 2018 pp.110-116
※ 협약을 통해 무료로 제공되는 자료로, 원문이용 방식은 연계기관의 정책을 따르고 있습니다.
0개의 논문이 장바구니에 담겼습니다.
선택하신 파일을 압축중입니다.
잠시만 기다려 주십시오.