년 - 년
시계열 섭동 모델링 알고리즘 : 운전자 프로그래밍과 양자역학 섭동이론의 통합
[Kisti 연계] 한국정보처리학회 정보처리학회논문지 B Vol.b9 No.3 2002 pp.277-286
...시계열에 대하여 수학모델을 구축, 예측하기 위한 새로운 알고리즘을 개발하였다. 시계열 분석과 양자역학 파동방정식의 해를 구하는 섭동이론과의 절차적 유사성을 논하고, 이것을 GP로 구현하는 전형적 접근방안을 제시한다. 함수집합(Function Set)으로서 직교함수(Orthogonal Functions)를 이용하고 병렬 집단을 사용하는 GP를 이용하여 원 시계열에 대한 초기 수학모델을 구하고, 원 시계열 데이터로부터 모델의 평가값을 뺀 나머지로 구성되는 잔여 시계열에 대하여 다시 GP를 적용하는 과정을 일정한 종료조건이 충족될 때가지 반복함으로써 실세계 카오스 시계열에 대한 정확성 높은 수학모델을 구축하는데 성공하였다. 타 방법론과의 비교와 향후 해결과제에 대하여도 소개한다.
※ 협약을 통해 무료로 제공되는 자료로, 원문이용 방식은 연계기관의 정책을 따르고 있습니다.
양자역학 섭동이론과 유전자프로그래밍(GP) 기법을 접목시킴으로써 실세계(Real-world)에서 발생하는 카오스 시계열에 대하여 수학모델을 구축, 예측하기 위한 새로운 알고리즘을 개발하였다. 시계열 분석과 양자역학 파동방정식의 해를 구하는 섭동이론과의 절차적 유사성을 논하고, 이것을 GP로 구현하는 전형적 접근방안을 제시한다. 함수집합(Function Set)으로서 직교함수(Orthogonal Functions)를 이용하고 병렬 집단을 사용하는 GP를 이용하여 원 시계열에 대한 초기 수학모델을 구하고, 원 시계열 데이터로부터 모델의 평가값을 뺀 나머지로 구성되는 잔여 시계열에 대하여 다시 GP를 적용하는 과정을 일정한 종료조건이 충족될 때가지 반복함으로써 실세계 카오스 시계열에 대한 정확성 높은 수학모델을 구축하는데 성공하였다. 타 방법론과의 비교와 향후 해결과제에 대하여도 소개한다.
Genetic programming (GP) has been combined with quantum mechanical perturbation theory to make a new algorithm to construct mathematical models and perform predictions for chaotic time series from real world. Procedural similarities between time series modeling and perturbation theory to solve quantum mechanical wave equations are discussed, and the exemplary GP approach for implementing them is proposed. The approach is based on multiple populations and uses orthogonal functions for GP function set. GP is applied to original time series to get the first mathematical model. Numerical values of the model are subtracted from the original time series data to form a residual time series which is again subject to GP modeling procedure. The process is repeated until predetermined terminating conditions are met. The algorithm has been successfully applied to construct highly effective mathematical models for many real world chaotic time series. Comparisons with other methodologies and topics for further study are also introduced.
[Kisti 연계] 한국통계학회 The Korean journal of applied statistics Vol.15 No.2 2002 pp.311-321
...시계열 자료의 전이함수분석에 있어서 조건부 이분산성을 도입하고 기존의 선형 이분산모형인 Engle(1982)의 ARCH 모형과 더불어 비선형 모형인 베타-ARCH 및 분계점-ARCH모형을 고려하였다. 모형적합절차를 간략히 소개하였으며 제안된 모형을 미국 나스닥지수와 국내 종합주가지수에 적용시켜본 결과 비선형 ARCH 모형이 우수함을 알 수 있었다.
※ 협약을 통해 무료로 제공되는 자료로, 원문이용 방식은 연계기관의 정책을 따르고 있습니다.
시계열 자료의 전이함수분석에 있어서 조건부 이분산성을 도입하고 기존의 선형 이분산모형인 Engle(1982)의 ARCH 모형과 더불어 비선형 모형인 베타-ARCH 및 분계점-ARCH모형을 고려하였다. 모형적합절차를 간략히 소개하였으며 제안된 모형을 미국 나스닥지수와 국내 종합주가지수에 적용시켜본 결과 비선형 ARCH 모형이 우수함을 알 수 있었다.
Transfer function model(TFM) capturings conditional heteroscedastic pattern is introduced to analyze stochastic regression relationship between the two time series. Nonlinear ARCH concept is incorporated into the TFM via threshold ARCH and beta- ARCH models. Steps for statistical analysis of the proposed model are explained along the lines of the Box & Jenkins(1976, ch. 10). For illustration, dynamic analysis between KOSPI and NASDAQ is conducted from which it is seen that threshold ARCH performs the best.
[Kisti 연계] 대한산업공학회 대한산업공학회지 Vol.28 No.2 2002 pp.171-177
※ 협약을 통해 무료로 제공되는 자료로, 원문이용 방식은 연계기관의 정책을 따르고 있습니다.
In this paper, we propose a new data fusion method to improve the performance of individual prediction models for time series data. Individual models used are ARIMA and neural network and their results are combined based on the weight reflecting the inverse of EWMA of squared prediction error of each individual model. Monte Carlo simulation is used to identify the situation where the proposed approach can take a vintage point over typical fusion methods which utilize MSE for weight. Study results indicate the following: EWMA performs better than MSE fusion when the data size is large with a relatively big amplitude, which is often observed in intra-cranial pressure data. Additionally, EWMA turns out to be a best choice among MSE fusion and the two individual prediction models when the data size is large with relatively small random noises, often appearing in tax revenue data.
[Kisti 연계] 대한자원환경지질학회 대한자원환경지질학회 학술대회논문집 2002 pp.28-30
※ 협약을 통해 무료로 제공되는 자료로, 원문이용 방식은 연계기관의 정책을 따르고 있습니다.
시계열 데이터베이스와 강결합된 규칙발견 알고리즘 설계와 구현
[Kisti 연계] 한국정보과학회 한국정보과학회 학술대회논문집 2001 pp.43-45
...시계열 데이터베이스를 통한 RDB와 강 결합함으로써 표준화에 대한 문제를 해겨라고자 시도하였다. RDB와의 강 결합은 표준화 문제를 해결함과 더불어 마이닝 시스템에 DBMS의 관련 기술을 이용함으로써 성능을 극대화시킨다. 특히 DBMS의 인텍스 기능을 이용함으로써 마이닝 시스템의 성능 향상을 시도하였다. 본 논문에서는 기존의 순차패턴 탐사의 시간개념 부재, 트랜잭션 데이터베이스 기반구조, 그리고 알고리즘 수행에 있어서 메모리 한계에 따른 문제등의 단점을 지적하고, 이를 수정하고 보완하기 위해서 시간 거리와 패턴 길이의 개념을 확장하였으며 그에 따른 연관규칙의 관련 공식을 수정 보완하여 제안한다. 또한 RDB와의 강 결합되어 기존의 트랜잭션 데이터베이스 구조를 벗어나 시계열 데이터에 보다 쉽게 적용할 수 있는 절차와 알고리즘을 제안한다.
※ 협약을 통해 무료로 제공되는 자료로, 원문이용 방식은 연계기관의 정책을 따르고 있습니다.
마이닝 시스템은 그 특성에 따라 매우 다른 형태의 구현 방법이 존재한다. 그러므로 마이닝 시스템간 호환성이나 재사용성은 매우 낮다. 본 노문에서는 이 문제를 시계열 데이터베이스를 통한 RDB와 강 결합함으로써 표준화에 대한 문제를 해겨라고자 시도하였다. RDB와의 강 결합은 표준화 문제를 해결함과 더불어 마이닝 시스템에 DBMS의 관련 기술을 이용함으로써 성능을 극대화시킨다. 특히 DBMS의 인텍스 기능을 이용함으로써 마이닝 시스템의 성능 향상을 시도하였다. 본 논문에서는 기존의 순차패턴 탐사의 시간개념 부재, 트랜잭션 데이터베이스 기반구조, 그리고 알고리즘 수행에 있어서 메모리 한계에 따른 문제등의 단점을 지적하고, 이를 수정하고 보완하기 위해서 시간 거리와 패턴 길이의 개념을 확장하였으며 그에 따른 연관규칙의 관련 공식을 수정 보완하여 제안한다. 또한 RDB와의 강 결합되어 기존의 트랜잭션 데이터베이스 구조를 벗어나 시계열 데이터에 보다 쉽게 적용할 수 있는 절차와 알고리즘을 제안한다.
[Kisti 연계] 한국산업정보학회 한국산업정보학회논문지 Vol.6 No.3 2001 pp.29-34
※ 협약을 통해 무료로 제공되는 자료로, 원문이용 방식은 연계기관의 정책을 따르고 있습니다.
본 논문에서는 신경회로망을 이용하여 아날로그 시 계열정보를 직접 처리할 수 있는 연상기억 시스템을 제안한다. 제안하는 시스템은 시 계열정보를 상기할 때 현재의 정보와의 일치 결과만으로 출력(상기결과)을 결정하는 것 외에 과거의 일치결과도 고려한 상태에서 출력을 결정하는 시스템이다. 시스템의 기본적인 능력을 조사하기 위하여 기억패턴을 주기계열로 그리고 하중은 전부 고정하는 조건으로 단순화하여 시뮬레이션을 행하여 오류정정 능력을 갖는 것을 확인하였다. 시간축 방향의 하중을 적절하게 설정하면 기억용량의 증대나 상기 오류의 저감 등의 효과가 기대된다.
In this paper, a new associative memory system for analog time-sequential data processing is proposed. This system effectively associate time-sequential data using not only matching with present data but also matching with past data. Furthermore in order to improve error correction ability, weight varying in time domain is introduced in this system. The network is simulated with several periodic time-sequential input patterns including noise. The results show that the proposed system has ability to correct input errors. We expect that the proposed system may be applied for a real time processing of analog time-sequential information.
[Kisti 연계] 한국정보과학회 한국정보과학회 학술대회논문집 2001 pp.178-180
※ 협약을 통해 무료로 제공되는 자료로, 원문이용 방식은 연계기관의 정책을 따르고 있습니다.
모양 기반 검색은 주어진 질의 시퀸스의 요소 값에 상관없이, 모양이 유사한 시퀸스 혹은 부분시퀸스를 찾는 연산이다. 본 논문에서는 시프트, 스케일링, 타임 워핑 등 동일 모양 변환의 다양한 조합을 지원할 수 있는 새로운 모양 기반유사 검색 모델을 제안하고, 효과적인 유사 부분 시퀸스 검색을 위한 인덱싱과 질의 처리 방법을 제안한다. 또한 실세계의 증권데이터를 이용한 다양한 실험 결과에 의하여, 본 방식이 질의 시퀸스와 유사한 모양의 모든 서브시퀸스를 성공적으로 찾는 것은 물론 순차검색 방법과 비교하여 매우 빠른 검색 효율을 가짐을 보인다.
시계열 데이터베이스를 위한 서브시퀀스 매칭 후처리 과정의 최적화
[Kisti 연계] 한국정보처리학회 한국정보처리학회 학술대회논문집 2001 pp.39-42
...시계열 데이터베이스에서 서브시퀀스 매칭을 효과적으로 처리하는 방안에 관하여 논의한다. 먼저, 서브시퀀스 매칭의 후처리 과정에서 발생하는 기존 기법의 문제점을 지적하고, 이를 해결할 수 있는 최적의 기법을 제안하였다. 제안된 기법은 이진 트리 내에 후보 시퀀스에 대한 정보를 삽입해 둠으로써 같은 시퀀스에 속하는 후보 윈도우들과 같은 서브시퀀스에 속하는 후보 윈도우들을 연속적으로 처리하는 방식을 사용한다. 이 결과, 디스크 액세스와 서브시퀀스 비교의 측면에서 중복 작업을 완전히 제거할 수 있다. 제안된 기법의 성능 개선 효과를 검증하기 위하여 실제 주식 데이터를 위한 성능 평가를 수행하였다. 실험 결과에 의하면, 제안된 기법은 기존의 기법과 비교하여 전체적으로 55배에서 156배까지의 성능 개선 효과가 있는 것으로 나타났다.
※ 협약을 통해 무료로 제공되는 자료로, 원문이용 방식은 연계기관의 정책을 따르고 있습니다.
본 논문에서는 시계열 데이터베이스에서 서브시퀀스 매칭을 효과적으로 처리하는 방안에 관하여 논의한다. 먼저, 서브시퀀스 매칭의 후처리 과정에서 발생하는 기존 기법의 문제점을 지적하고, 이를 해결할 수 있는 최적의 기법을 제안하였다. 제안된 기법은 이진 트리 내에 후보 시퀀스에 대한 정보를 삽입해 둠으로써 같은 시퀀스에 속하는 후보 윈도우들과 같은 서브시퀀스에 속하는 후보 윈도우들을 연속적으로 처리하는 방식을 사용한다. 이 결과, 디스크 액세스와 서브시퀀스 비교의 측면에서 중복 작업을 완전히 제거할 수 있다. 제안된 기법의 성능 개선 효과를 검증하기 위하여 실제 주식 데이터를 위한 성능 평가를 수행하였다. 실험 결과에 의하면, 제안된 기법은 기존의 기법과 비교하여 전체적으로 55배에서 156배까지의 성능 개선 효과가 있는 것으로 나타났다.
시계열 데이터베이스에서 인덱스 보간법을 기반으로 정규화 변환을 지원하는 서브시퀀스 매칭 알고리즘
[Kisti 연계] 한국정보과학회 정보과학회논문지:데이타베이스 Vol.28 No.2 2001 pp.217-232
...시계열 데이터베이스에서 정규화 변환을 지원하는 서브시퀀스 매칭 알고리즘을 제안한다. 정규화 변환을 시계열 데이터 간의 절대적인 유클리드 거리에 관계 없이, 구성하는 값들의 상대적인 변화 추이가 유사한 패턴을 갖는 시계열 데이터를 검색하는 데에 유용하다. 기존의 서브시퀀스 매칭 알고리즘을 확장 없이 정규화 변환 서브시퀀스 매칭에 단순히 응용할 경우, 질의 결과로 반환되어야 할 서부시퀀스를 모두 찾아내지 못하는 착오 기각이 발생한다. 또한, 정규화 변환을 지원하는 기존의 전체 매칭 알고리즘의 경우, 모든 가능한 질의 시퀀스 길이 각각에 대하여 하나씩의 인덱스를 생성하여야 하므로, 저장 공간 및 데이터 시퀀스 삽입/삭제의 부담이 매우 심각하다. 본 논문에서는 인덱스 보간법을 이용하여 문제를 해결한다. 인덱스 보간법은 인덱스가 요구되는 모든 경우 중에서 적당한 간격의 일부에 대해서만 생성된 인덱스를 이용하며, 인덱스가 필요한 모든 경우에 대한 탐색을 수행하는 기법이다. 제안된 알고리즘은 몇 개의 질의 시퀀스 길이에 대해서만 각각 인덱스를 생성한 후, 이를 이용하여 모든 가능한 길이의 질의 시퀀스에 대해서 탐색을 수행한다. 이때, 착오 기각이 발생하지 않음을 증명한다. 제안된 알고리즘은 질의 시에 주어진 질의 시퀀스의 길이에 따라 생성되어 있는 인덱스 중에서 가장 적절한 것을 선택하여 탐색을 수행한다. 이때, 생성되어 있는 인덱스의 개수가 많을수록 탐색 성능이 향상된다. 필요에 따라 인덱스의 개수를 변화함으로써 탐색 성능과 저장 공간 간의 비율을 유연하게 조정할 수 있다. 질의 시퀀스의 길이 256 ~ 512중 다섯 개의 길이에 대해 인덱스를 생성하여 실험한 결과, 탐색 결과 선택률이 $10^{-2}$일 때 제안된 알고리즘의 탐색 성능이 순차 검색에 비하여 평균 2.40배, 선택률이 $10^{-5}$일 때 평균 14.6배 개선되었다. 제안된 알고리즘의 탐색 성능은 탐색 결과 선택률이 작아질수록 더욱 향상되므로, 실제 데이터베이스 응용에서의 효용성이 높다고 판단된다.
※ 협약을 통해 무료로 제공되는 자료로, 원문이용 방식은 연계기관의 정책을 따르고 있습니다.
본 논문에서는 시계열 데이터베이스에서 정규화 변환을 지원하는 서브시퀀스 매칭 알고리즘을 제안한다. 정규화 변환을 시계열 데이터 간의 절대적인 유클리드 거리에 관계 없이, 구성하는 값들의 상대적인 변화 추이가 유사한 패턴을 갖는 시계열 데이터를 검색하는 데에 유용하다. 기존의 서브시퀀스 매칭 알고리즘을 확장 없이 정규화 변환 서브시퀀스 매칭에 단순히 응용할 경우, 질의 결과로 반환되어야 할 서부시퀀스를 모두 찾아내지 못하는 착오 기각이 발생한다. 또한, 정규화 변환을 지원하는 기존의 전체 매칭 알고리즘의 경우, 모든 가능한 질의 시퀀스 길이 각각에 대하여 하나씩의 인덱스를 생성하여야 하므로, 저장 공간 및 데이터 시퀀스 삽입/삭제의 부담이 매우 심각하다. 본 논문에서는 인덱스 보간법을 이용하여 문제를 해결한다. 인덱스 보간법은 인덱스가 요구되는 모든 경우 중에서 적당한 간격의 일부에 대해서만 생성된 인덱스를 이용하며, 인덱스가 필요한 모든 경우에 대한 탐색을 수행하는 기법이다. 제안된 알고리즘은 몇 개의 질의 시퀀스 길이에 대해서만 각각 인덱스를 생성한 후, 이를 이용하여 모든 가능한 길이의 질의 시퀀스에 대해서 탐색을 수행한다. 이때, 착오 기각이 발생하지 않음을 증명한다. 제안된 알고리즘은 질의 시에 주어진 질의 시퀀스의 길이에 따라 생성되어 있는 인덱스 중에서 가장 적절한 것을 선택하여 탐색을 수행한다. 이때, 생성되어 있는 인덱스의 개수가 많을수록 탐색 성능이 향상된다. 필요에 따라 인덱스의 개수를 변화함으로써 탐색 성능과 저장 공간 간의 비율을 유연하게 조정할 수 있다. 질의 시퀀스의 길이 256 ~ 512중 다섯 개의 길이에 대해 인덱스를 생성하여 실험한 결과, 탐색 결과 선택률이 $10^{-2}$일 때 제안된 알고리즘의 탐색 성능이 순차 검색에 비하여 평균 2.40배, 선택률이 $10^{-5}$일 때 평균 14.6배 개선되었다. 제안된 알고리즘의 탐색 성능은 탐색 결과 선택률이 작아질수록 더욱 향상되므로, 실제 데이터베이스 응용에서의 효용성이 높다고 판단된다.
[Kisti 연계] 한국지능정보시스템학회 Journal of Intelligence and Information Systems Vol.7 No.1 2001 pp.27-45
...시계열 데이터로부터 순차패턴을 발견하는 연구는 사건이나 아이템이 주로 연구되어왔지만, 최근에는 설비의 상태를 알 수 있는 센서와 같은 수치 값의 형태를 가지는 분야에 관심을 가지게 되었다. 그러나 수치 형태의 데이터는 패턴을 만드는 동안 동일한 값을 가지는 경우가 거의 없기 때문에 기존의 사건이나 아이템 등으로 변환될 수 있는 패턴요소의 특징을 만드는 것이 가장 중요하다. 이러한 패턴요소를 발견하는 지금가지 방법은 이동 윈도우와 클러스터링을 사용하는 방법을 적용하였는데, 이러한 방법은 다양한 윈도우의 크기와 클러스터 값을 적용하여 반복적으로 작업을 하며, 찾아진 결과를 해석하는데도 많은 문제가 있다. 본 연구는 수치 값을 가진 데이터를 벡터의 형태로 만들어 패턴요소를 만드는 방법을 제시한다. 이렇게 만들어진 패턴요소는 전체 데이터를 사용하는 것 보다 이해되기 쉽고 보다 빠르게 순차패턴을 찾을 수 있다. 벡터로 변환된 패턴요소는 각도와 크기를 가지는데 우리는 이들 벡터들의 상호 연관성을 정의하고, 이들 연관성을 이용하여 순차패턴을 찾는 방법을 제시한다.
※ 협약을 통해 무료로 제공되는 자료로, 원문이용 방식은 연계기관의 정책을 따르고 있습니다.
데이터마이닝에서 시계열 데이터로부터 순차패턴을 발견하는 연구는 사건이나 아이템이 주로 연구되어왔지만, 최근에는 설비의 상태를 알 수 있는 센서와 같은 수치 값의 형태를 가지는 분야에 관심을 가지게 되었다. 그러나 수치 형태의 데이터는 패턴을 만드는 동안 동일한 값을 가지는 경우가 거의 없기 때문에 기존의 사건이나 아이템 등으로 변환될 수 있는 패턴요소의 특징을 만드는 것이 가장 중요하다. 이러한 패턴요소를 발견하는 지금가지 방법은 이동 윈도우와 클러스터링을 사용하는 방법을 적용하였는데, 이러한 방법은 다양한 윈도우의 크기와 클러스터 값을 적용하여 반복적으로 작업을 하며, 찾아진 결과를 해석하는데도 많은 문제가 있다. 본 연구는 수치 값을 가진 데이터를 벡터의 형태로 만들어 패턴요소를 만드는 방법을 제시한다. 이렇게 만들어진 패턴요소는 전체 데이터를 사용하는 것 보다 이해되기 쉽고 보다 빠르게 순차패턴을 찾을 수 있다. 벡터로 변환된 패턴요소는 각도와 크기를 가지는데 우리는 이들 벡터들의 상호 연관성을 정의하고, 이들 연관성을 이용하여 순차패턴을 찾는 방법을 제시한다.
Sequential discovery from time series data has mainly concerned about events or item sets. Recently, the research has stated to applied to the numerical data. An example is sensor information generated by checking a machine state. The numerical data hardly have the same valuers while making patterns. So, it is important to extract suitable number of pattern features, which can be transformed to events or item sets and be applied to sequential pattern mining tasks. The popular methods to extract the patterns are sliding window and clustering. The results of these methods are sensitive to window sine or clustering parameters; that makes users to apply data mining task repeatedly and to interpret the results. This paper suggests the method to retrieve pattern features making numerical data into vector of an angle and a magnitude. The retrieved pattern features using this method make the result easy to understand and sequential patterns finding fast. We define an inclusion relation among pattern features using angles and magnitudes of vectors. Using this relation, we can fad sequential patterns faster than other methods, which use all data by reducing the data size.
시계열예측에 대한 역전파 적용에 대한 결정적, 추계적 가상항 기법의 효과
[Kisti 연계] 한국정보처리학회 한국정보처리학회 학술대회논문집 2001 pp.535-538
※ 협약을 통해 무료로 제공되는 자료로, 원문이용 방식은 연계기관의 정책을 따르고 있습니다.
Since 1990s, many literatures have shown that connectionist models, such as back propagation, recurrent network, and RBF (Radial Basis Function) outperform the traditional models, MA (Moving Average), AR (Auto Regressive), and ARIMA (Auto Regressive Integrated Moving Average) in time series prediction. Neural based approaches to time series prediction require the enough length of historical measurements to generate the enough number of training patterns. The more training patterns, the better the generalization of MLP is. The researches about the schemes of generating artificial training patterns and adding to the original ones have been progressed and gave me the motivation of developing VTG schemes in 1996. Virtual term is an estimated measurement, X(t+0.5) between X(t) and X(t+1), while the given measurements in the series are called actual terms. VTG (Virtual Tern Generation) is the process of estimating of X(t+0.5), and VTG schemes are the techniques for the estimation of virtual terms. In this paper, the alternative VTG schemes to the VTG schemes proposed in 1996 will be proposed and applied to multivariate time series prediction. The VTG schemes proposed in 1996 are called deterministic VTG schemes, while the alternative ones are called stochastic VTG schemes in this paper.
[Kisti 연계] 한국지능시스템학회 한국지능시스템학회 학술대회논문집 2001 pp.113-116
...시계열 자료로 해석하고 시계열 자료의 퍼지 로직에 기반한 모델링에 대해 설명한다. 음악은 음악적 기호들인 보표, 악센트, 오선, 박자표, 음표, 쉼표 등등과 같은 유한개의 음악적 표기법들로 구성된다. 악보는 음악 해석에 필요한 리듬, 멜로디, 화음등과 달은 다양한 특성을 표현하기 위해 음악적 기호들을 사용한다. 본 논문에서는 각각의 시간에서 소리나는 음들의 비트와 높낮이로 인식한다는 관점에서 음악에서의 비트와 음의 높낮이를 시계열 자료로 표현하는 것이 가능하다. 악보의 규정된 특징들을 바탕으로, 악보를 시계열 자료로 표현하고 시계열을 예측하기 위해 퍼지 로직에 기반한 모델로 구성한다. 제안한 방법의 타당성으로 보이기 위해 몇 가지 예를 제시한다.
※ 협약을 통해 무료로 제공되는 자료로, 원문이용 방식은 연계기관의 정책을 따르고 있습니다.
이 논문에서는 음악을 시계열 자료로 해석하고 시계열 자료의 퍼지 로직에 기반한 모델링에 대해 설명한다. 음악은 음악적 기호들인 보표, 악센트, 오선, 박자표, 음표, 쉼표 등등과 같은 유한개의 음악적 표기법들로 구성된다. 악보는 음악 해석에 필요한 리듬, 멜로디, 화음등과 달은 다양한 특성을 표현하기 위해 음악적 기호들을 사용한다. 본 논문에서는 각각의 시간에서 소리나는 음들의 비트와 높낮이로 인식한다는 관점에서 음악에서의 비트와 음의 높낮이를 시계열 자료로 표현하는 것이 가능하다. 악보의 규정된 특징들을 바탕으로, 악보를 시계열 자료로 표현하고 시계열을 예측하기 위해 퍼지 로직에 기반한 모델로 구성한다. 제안한 방법의 타당성으로 보이기 위해 몇 가지 예를 제시한다.
This paper describes an analysis of the music as a time series and the fuzzy logic-based modeling of it. All music is made up of a finite number of musical notations known as the musical symbols, such as clefs, staff, tine signature, notes, rests, etc. . The musical score uses musical symbols to present various characteristics, such as rhythm, melody, chord, etc,. for interpreting the music. In this paper, it is possible to transform the beat and pitch in the musical into time series from the viewpoint of recognizing beat and pitch of sounding tone at each time. On the basis of the identified features of the musical score, a musical score is represented as a time series and then is constructed to fuzzy logic-based model for predicting them. Examples are presented to illustrate the validity of the proposed method.
시계열 데이터베이스에서의 서브시퀀스 매칭을 위한 윈도우 구성의 일반화
[Kisti 연계] 한국정보과학회 정보과학회논문지:데이타베이스 Vol.28 No.3 2001 pp.357-372
※ 협약을 통해 무료로 제공되는 자료로, 원문이용 방식은 연계기관의 정책을 따르고 있습니다.
본 논문에서는 서브시퀀스 매칭에서 윈도우 구성의 일반화 개념을 제안하고, 이에 기반한 새로운 서브시퀀스 매칭 방법인 GeneralMatch를 제안한다. 기존 연구인 Faloutsos 등의 방법 (간단히 FRM이라 한다)은 점 여과 효과의 결여로 인해 많은 착오해답을 발생시켰다. 본 저자들의 DualMatch는 점 여과 효과를 발휘하여 성능을 크게 향상시켰으나, 주어진 최소 질의 시퀀스 길이에 대해 최대 윈도우 크기가 작은(FRM의 1/2) 문제가 있었다. GeneralMatch는 DualMatch를 더욱 개선한 방법으로서, 두 방법의 장점을 모두 취한다. 즉, FRM과 같이 큰 윈우를 사용할 수 있으며, 동시에 DualMatch와 같이 점 여과 효과를 발휘할 수 있다. GeneralMatch는 데이터 시퀀스를 J-슬라이딩 윈도우(일반화된 슬라이딩 윈도우)로 나누고, 질의 시퀀스를 J-디스조인트 윈도우(일반화된 디스조인트 윈도우)로 나누는 방법을 사용한다. 본 논문에서는 GerneralMatch의 정확성, 즉 GeneralMatch가 착오기각이 발생하지 않음을 증명한다. 또한, 주어진 최소 질의 시퀀스 길이에 대해 GeneralMatch가 바르게 동작하기 위한 최대 윈도우 크기가 있음을 증명한다. 그리고, 페이지 액세스 횟수를 최소로 하는 J 값의 결정 방법을 제안하다. 실제 주식 데이터에 대한 실험 결과, GeneralMatch는 낮은 선택률 범위($10^{-6}~10^{-4}$)에서 DualMatch에 비해 평균 114%, FRM에 비해 998% 성능을 향상시켰으며, 높은 선택률 범위($10^{-6}~10^{-4}$)에서도 DualMatch에 비해 평균 46%, FRM에 비해 평균 65% 성능을 향상시켰다.
In this paper, we present the concept of generalization in constructing windows for subsequence matching and propose a new subsequence matching method. GeneralMatch, based on the generalization. The earlier work of Faloutsos et al.(FRM in short) causes a lot of false alarms due to lack of the point-filtering effect. DualMatch, which has been proposed by the authors, improves performance significantly over FRM by exploiting the point filtering effect, but it has the problem of having a smaller maximum window size (half that FRM) given the minimum query length. GeneralMatch, an improvement of DualMatch, offers advantages of both methods: it can use large windows like FRM and, at the same time, can exploit the point-filtering effect like DualMatch. GeneralMatch divides data sequences into J-sliding windows (generalized sliding windows) and the query sequence into J-disjoint windows (generalized disjoint windows). We formally prove that our GeneralMatch is correct, i.e., it incurs no false dismissal. We also prove that, given the minimum query length, there is a maximum bound of the window size to guarantee correctness of GeneralMatch. We then propose a method of determining the value of J that minimizes the number of page accesses, Experimental results for real stock data show that, for low selectivities ($10^{-6}~10^{-4}$), GeneralMatch improves performance by 114% over DualMatch and by 998% iver FRM on the average; for high selectivities ($10^{-6}~10^{-4}$), by 46% over DualMatch and by 65% over FRM on the average.
시계열 분석을 이용한 실시간 네트워크 트래픽 예측 시스템의 설계
[Kisti 연계] 한국정보처리학회 한국정보처리학회 학술대회논문집 2001 pp.1323-1326
...시계열 분석을 이용해 트래픽의 변화추이를 예측할 수 있는 시스템을 설계 및 구현한다. SNMP를 이용한 MIB-II 정보를 바탕으로 하는 분석 방법은 누적 데이터를 기본으로 하는 관리 방법으로 이상 징후의 판단이 실시간 감시에는 적합하지 않은 점이 있다. 따라서, 본 논문에서는 실시간 트래픽 감시를 위해 서브네트워크에 들어오거나 나가는 트래픽의 양을 측정하여 분석하고, 이 정보를 바탕으로 특정 시점 이후의 트래픽 추이를 시계열 분석 방법을 이용하여 미래의 트래픽 양을 예측하는 알고리즘을 시스템으로 구현한다. 예측 알고리즘으로는 AR, MA, ARMA, ARIMA 모델중에 평균 제곱 오차를 최소로 가지는 알고리즘을 선택하여 예측하도록 설계한다. 개발되는 시스템을 망 관리자가 전체 통신 네트워크의 부하 상태를 예상할 수 있게 하여 신속하고 예방적인 대응을 할 수 있다.
※ 협약을 통해 무료로 제공되는 자료로, 원문이용 방식은 연계기관의 정책을 따르고 있습니다.
서브네트워크에서 실시간으로 통신 트래픽을 감시하고, 트래픽 정보를 바탕으로 시계열 분석을 이용해 트래픽의 변화추이를 예측할 수 있는 시스템을 설계 및 구현한다. SNMP를 이용한 MIB-II 정보를 바탕으로 하는 분석 방법은 누적 데이터를 기본으로 하는 관리 방법으로 이상 징후의 판단이 실시간 감시에는 적합하지 않은 점이 있다. 따라서, 본 논문에서는 실시간 트래픽 감시를 위해 서브네트워크에 들어오거나 나가는 트래픽의 양을 측정하여 분석하고, 이 정보를 바탕으로 특정 시점 이후의 트래픽 추이를 시계열 분석 방법을 이용하여 미래의 트래픽 양을 예측하는 알고리즘을 시스템으로 구현한다. 예측 알고리즘으로는 AR, MA, ARMA, ARIMA 모델중에 평균 제곱 오차를 최소로 가지는 알고리즘을 선택하여 예측하도록 설계한다. 개발되는 시스템을 망 관리자가 전체 통신 네트워크의 부하 상태를 예상할 수 있게 하여 신속하고 예방적인 대응을 할 수 있다.
[Kisti 연계] 한국지능시스템학회 Journal of Korean Institute of Intelligent Systems Vol.10 No.4 2000 pp.315-323
...시계열 예측분제에 적용하여 유효성을 입증하고자 한다.
※ 협약을 통해 무료로 제공되는 자료로, 원문이용 방식은 연계기관의 정책을 따르고 있습니다.
본 논문에서는 생명창발과 진화에 기반한 신경망 구성방법을 제안한다. 이 방법은 생뭉의 DNA 구조의 특성과 식물의 생장에 기반을 둔 방법이다. 본 논문에서 제안한 방법은 DNA 코딩 방법과 L-system의 생장 구칙을 이용하여 신경망을 구성하는 방법이닫. L-system은 병렬적인 제조합 규칙을 이용하여, DNA 코딩 방법은 표현의 제약이 없는 표기법이다. 또한 진화 알고리듬은 다윈의 자연도태를 모방한 탐색법으로 다양한 해공간의 표현과 높은 효율로 탐색이 가능하다. 본 논문에서는 이러한 방법들을 이용햐 신경망을 구성하고, 신경망의 Mackey-Glass, Sunspot, KOSPI 같은 시계열 예측분제에 적용하여 유효성을 입증하고자 한다.
In this paper, we propose a method of constructing neural networks using bio-inpired emergent and evolutionary concepts. This method is algorithm that is based on the characteristics of the biological DNA and growth of plants, Here is, we propose a constructing method to make a DNA coding method for production rule of L-system. L-system is based on so-called the parallel rewriting nechanism. The DNA coding method has no limitation in expressing the produlation the rule of L-system. Evolutionary algotithms motivated by Darwinaian natural selection are population based searching methods and the high performance of which is highly dependent on the representation of solution space. In order to verify the effectiveness of our scheme, we apply it one step ahead prediction of Mackey-Glass time series, Sunspot data and KOSPI data.
시계열 예측 Application S/W 개발에 관한 연구
[Kisti 연계] 대한전기학회 대한전기학회 학술대회논문집 2000 pp.2983-2985
...시계열 예측 엔진의 개발과 그 엔진을 Application S/W로 구현하는 것이다 시계열 예측 엔진은 과거의 데이터를 분석하여 예측을 위한 식의 차수와 형태를 결정하고 이를 바탕으로 파라미터를 결정한 후 미래의 간을 예측하는 3가지 단계를 거친다. 석기에 쓰이는 기법들은 여러 가지가 있는데 본 논문에서는 ARMA(Auto Regressive Moving Average)를 기본으로 분석하였다 Application S/W는. 개발된 예측 엔진에서 분석될 과거 데이터를 입력받아 예측 엔진 구동에 사용되고 그 결과를 그래프로 나타내는 일련의 과정을 거친다. Application S/W 개발의 많은 Programming Language가 존재하지만 본 논문에서는 Visual C누 +을 사용하였다. 또한 이 논문에선, 특정 교차로를 통과하는 교통량 변화에 대한 데이터를 이용하여 예측을 수행하고. 그 결과를 Application S/W에 적용시켰다.
※ 협약을 통해 무료로 제공되는 자료로, 원문이용 방식은 연계기관의 정책을 따르고 있습니다.
이 논문의 목적은 시계열 예측 엔진의 개발과 그 엔진을 Application S/W로 구현하는 것이다 시계열 예측 엔진은 과거의 데이터를 분석하여 예측을 위한 식의 차수와 형태를 결정하고 이를 바탕으로 파라미터를 결정한 후 미래의 간을 예측하는 3가지 단계를 거친다. 석기에 쓰이는 기법들은 여러 가지가 있는데 본 논문에서는 ARMA(Auto Regressive Moving Average)를 기본으로 분석하였다 Application S/W는. 개발된 예측 엔진에서 분석될 과거 데이터를 입력받아 예측 엔진 구동에 사용되고 그 결과를 그래프로 나타내는 일련의 과정을 거친다. Application S/W 개발의 많은 Programming Language가 존재하지만 본 논문에서는 Visual C누 +을 사용하였다. 또한 이 논문에선, 특정 교차로를 통과하는 교통량 변화에 대한 데이터를 이용하여 예측을 수행하고. 그 결과를 Application S/W에 적용시켰다.
[Kisti 연계] 한국수자원학회 한국수자원학회 논문집 Vol.33 No.4 2000 pp.427-435
※ 협약을 통해 무료로 제공되는 자료로, 원문이용 방식은 연계기관의 정책을 따르고 있습니다.
침수지에 대한 신속하고 정확한 지도의 제작은 홍수재해 복구와 관리 및 예방을 위한 중요한 자료로 사용된다. 타 위성영상에 비하여 기상조건에 관계없이 영상자료의 획득이 용이한 레이더 영상을 이용하여 침수지 조사와 홍수후의 농경지 복구 상태를 파악하고자 하였다. 1999년 여름 경기도 북부 지역에 발생한 홍수 사상을 사례지로 하여 C-band RADARSAT 위성영상을 이용하였고, 침수 시점인 8월 4일 영상과 그 전후 영상을 포함하여 세 시기의 영상을 이용하였다. 영상의 기하보정 및 잡음 제거 등 전처리 과정을 거친 후 세 시기의 영상에서 나타나는 여러 지표물들의 레이더반사신호의 변화를 분석하였다. 수면, 논, 밭 산림 등의 다양한 지표물의 시기별 반사신호를 분석한 결과, 침수되었던 논에서 뚜렷한 반사신호의 차이를 관찰할 수 있었다. 또한 홍수 이후의 영상인 8월 14일 영상을 함께 분석함으로써 침수되었던 논의 복구상태에 따른 차이를 구분할 수 있었고, 이러한 결과는 세 시기의 칼라합성영상에서도 쉽게 판독되었다.
It is often crucial to obtain a map of flood inundated area with more accurate and rapid manner. This study attempts to evaluate the potential of satellite synthetic aperture radar (SAR) data for mapping of flood inundated area in Imjin river basin. Multitemporal RADARSAT SAR data of three different dates were obtained at the time of flooding on August 4 and before and after the flooding. Once the data sets were geometrically corrected and preprocessed, the temporal characteristics of relative radar backscattering were analyzed. By comparing the radar backscattering of several surface features, it was clear that the flooded rice paddy showed the distinctive temporal pattern of radar response. Flooded rice paddy showed significantly lower radar signal while the normally growing rice paddy show high radar returns, which also could be easily interpreted from the color composite imagery. In addition to delineating the flooded rice fields, the multitemporal radar imagery also allow us to distinguish the afterward condition of once-flooded rice field.
[Kisti 연계] 한국수자원학회 한국수자원학회 논문집 Vol.33 No.1 2000 pp.756-761
※ 협약을 통해 무료로 제공되는 자료로, 원문이용 방식은 연계기관의 정책을 따르고 있습니다.
시계열 데이타베이스에서 임의 계수의 이동평균 변환을 지원하는 서브시퀀스 매칭 알고리즘
[Kisti 연계] 한국정보과학회 정보과학회논문지:데이타베이스 Vol.27 No.3 2000 pp.469-485
...시계열 데이터베이스에서 임의 계수의 이동평균 변환을 지원하는 서브시퀀스 매칭 알고리즘을 제안한다. 이동평균 변환은 시계열 데이터 내의 잡음의 영향을 감소시킴으로써 시계열데이타 전체의 경향을 파악하는데에 유용하여 통계경제학 등의 분야에서 널리 사용되어 왔다. 응용 분야와 분석하려고 하는 시계열 데이타의 특성에 따라 잡음의 영향을 줄이는 정도와 경향을 파악하는 주기가 달라지므로 이동평균 계수의 선택도 달라진다. 제안된 매칭 알고리즘은 기존의 서브시퀀스 매칭 알고리즘을 확장하여 임의 계수의 이동평균 변환을 지원한다. 기존의 서브시퀀스 매칭 알고리즘을 확장 없이 그대로 응용할 경우 하나의 이동평균 계수에 대하여 하나씩의 인덱스를 생성하여야 한다. 따라서, 임의의 이동평균 계수를 지원하려면 저장 공간 및 데이터 시퀀스의 삽입/삭제 부담이 매우 심각하다. 본 논문에서는 하나의 이동평균 계수 $ extsc{k}$에 대해서 생성한 인덱스만을 이용하여 인덱스가 생성되어 있지 않은 계수 m($\leq$$textsc{k}$)에 대해서도 탐색을 수행하는 방법을 제안한다. 이때, 제안된 탐색 기법이 질의 결과로 반환되어야 할 서브시퀀스를 모두 찾아내지 못하는 착오 기각이 발생하지 않음을 증명한다. 제안된 알고리즘은 하나 이상의 이동평균 계수에 대하여 생성된 인덱스를 이용할 수도 있으며, 이때 탐색 성능의 향상을 얻을 수 있다. 실험을 통하여 제안된 알고리즘의 평균 탐색 성능을 구한 결과, 제안된 알고리즘이 순차 검색에 비하여 최대 약 2.7배까지 우수하였다. 제안된 알고리즘의 탐색 성능은 탐색 결과 선택률이 작아질수록 향상되어, 일반적인 데이터베이스 응용에서의 효용성이 높다고 판단된다. 본 논문에서 제안된 탐색 기법은 유사한 경향을 갖는 주가 데이타의 검색, 특정 상품의 판매 예측, 기온 데이터 분석을 통한 일기 예보 등 이동평균 변환을 필요로 하는 다양한 응용 분야에 적용될수 있다.
※ 협약을 통해 무료로 제공되는 자료로, 원문이용 방식은 연계기관의 정책을 따르고 있습니다.
본 논문에서는 시계열 데이터베이스에서 임의 계수의 이동평균 변환을 지원하는 서브시퀀스 매칭 알고리즘을 제안한다. 이동평균 변환은 시계열 데이터 내의 잡음의 영향을 감소시킴으로써 시계열데이타 전체의 경향을 파악하는데에 유용하여 통계경제학 등의 분야에서 널리 사용되어 왔다. 응용 분야와 분석하려고 하는 시계열 데이타의 특성에 따라 잡음의 영향을 줄이는 정도와 경향을 파악하는 주기가 달라지므로 이동평균 계수의 선택도 달라진다. 제안된 매칭 알고리즘은 기존의 서브시퀀스 매칭 알고리즘을 확장하여 임의 계수의 이동평균 변환을 지원한다. 기존의 서브시퀀스 매칭 알고리즘을 확장 없이 그대로 응용할 경우 하나의 이동평균 계수에 대하여 하나씩의 인덱스를 생성하여야 한다. 따라서, 임의의 이동평균 계수를 지원하려면 저장 공간 및 데이터 시퀀스의 삽입/삭제 부담이 매우 심각하다. 본 논문에서는 하나의 이동평균 계수 $ extsc{k}$에 대해서 생성한 인덱스만을 이용하여 인덱스가 생성되어 있지 않은 계수 m($\leq$$textsc{k}$)에 대해서도 탐색을 수행하는 방법을 제안한다. 이때, 제안된 탐색 기법이 질의 결과로 반환되어야 할 서브시퀀스를 모두 찾아내지 못하는 착오 기각이 발생하지 않음을 증명한다. 제안된 알고리즘은 하나 이상의 이동평균 계수에 대하여 생성된 인덱스를 이용할 수도 있으며, 이때 탐색 성능의 향상을 얻을 수 있다. 실험을 통하여 제안된 알고리즘의 평균 탐색 성능을 구한 결과, 제안된 알고리즘이 순차 검색에 비하여 최대 약 2.7배까지 우수하였다. 제안된 알고리즘의 탐색 성능은 탐색 결과 선택률이 작아질수록 향상되어, 일반적인 데이터베이스 응용에서의 효용성이 높다고 판단된다. 본 논문에서 제안된 탐색 기법은 유사한 경향을 갖는 주가 데이타의 검색, 특정 상품의 판매 예측, 기온 데이터 분석을 통한 일기 예보 등 이동평균 변환을 필요로 하는 다양한 응용 분야에 적용될수 있다.
In this paper, we propose a subsequence matching algorithm that supports moving average transform of arbitrary order in time-series databases. Moving average transform reduces the effect of noise and has been used in many areas such as econometrics since it is useful in finding the overall trends in the time-series data. The moving average order to be used varies, since the users want to control the degree of noise reduction and the frequency of analysis depending on the applications and the characteristics of data sequences. The proposed matching algorithm supports moving average transform of arbitrary order by extending the existing subsequence matching algorithm. If we applied the existing subsequence matching algorithm without any extension, we would have to generate an index per each moving average order. Thus, supporting an arbitrary moving average order would cause serious overhead on storage space and insertion/deletion of data sequences. The proposed algorithm can use only one index for a preselected moving average order k and performs subsequence matching for an arbitrary order m($\leq$k). We prove that the proposed algorithm causes no false dismissal, i.e., it does not miss part of the final search result. The proposed algorithm can also use more than one index for improving search performance. We have evaluated the performance of the proposed algorithm through experiments. The results show that the proposed algorithm improves the performance by up to 2.7 times on the average compared with the sequential scan algorithm. Since the proposed subsequence matching algorithm works better with smaller selectivities, it is suitable for practical applications. The proposed algorithm can be applied in a variety of areas that use the moving average transform. They include finding stock items with similar trends in prices, estimation of sales for a Product, and weather forecast through temperature data analysis.
시계열 직관 예측에 영향을 주는 의사결정자의 인지적/생리적 특성분석에 관한 연구
[Kisti 연계] 한국감성과학회 감성과학 Vol.3 No.2 2000 pp.41-55
...시계열 예측의 정확성과 뇌파의 차이를 통계적 검증, 인공신경망, 데이터 마이닝의 세 가지 접근방법으로 탐색하여 그 결과를 비교 분석함으로써 시계열 직관 예측에 영향을 주는 의사결정자의 인지적/생리적 특성을 도출함으로써 효과적인 의사결정환경을 조성하는데 공헌하고자 하였다. 실험결과 통계적 분석에서는 아무런 유의성을 찾을 수 없었으나, 인공신경망 분석에서는 인지유형과 감성유형이 모두 시계열 예측 정확도와 상관성이 있는 것으로 나타났으며, 데이터 마이닝 분석에서는 보다 의미 있는 상관관계를 찾아낼 수 있었다.
※ 협약을 통해 무료로 제공되는 자료로, 원문이용 방식은 연계기관의 정책을 따르고 있습니다.
경영활동에 있어서 직관력은 잘 알려진 인지능력이지만 효과적인 의사결정지원시스템의 개발 목적으로는 거의 고려되고 있지 않다. 본 연구는 의사결정자의 인지 유형에 따른 시계열 예측의 정확성과 뇌파의 차이를 통계적 검증, 인공신경망, 데이터 마이닝의 세 가지 접근방법으로 탐색하여 그 결과를 비교 분석함으로써 시계열 직관 예측에 영향을 주는 의사결정자의 인지적/생리적 특성을 도출함으로써 효과적인 의사결정환경을 조성하는데 공헌하고자 하였다. 실험결과 통계적 분석에서는 아무런 유의성을 찾을 수 없었으나, 인공신경망 분석에서는 인지유형과 감성유형이 모두 시계열 예측 정확도와 상관성이 있는 것으로 나타났으며, 데이터 마이닝 분석에서는 보다 의미 있는 상관관계를 찾아낼 수 있었다.
0개의 논문이 장바구니에 담겼습니다.
선택하신 파일을 압축중입니다.
잠시만 기다려 주십시오.