불완전 데이터를 위한 일반화된 데이터 구조 : LDA, 에이다부스트, EBP 기반 딥러닝 모델 적용
A Generalizable Data Structure for Incomplete Data : Applications to LDA, AdaBoost, and EBP-Based Deep Learning Models
This study proposes a novel data structure designed to efficiently handle incomplete data characterized by missing values and heterogeneous attribute configurations, and applies it to three different learning models for comparative performance analysis. The proposed structure provides a flexible representation of incomplete inputs and is adapted respectively to an LDA-based model, an AdaBoost framework, and an EBP-based deep learning model. Experimental results show that the LDA model can be extended as an effective weak learner within the AdaBoost framework by employing a decision tree–based partitioning method, resulting in improved performance compared to standalone LDA. In addition, the EBP model demonstrates the ability to learn implicit block structures even when the input features have varying cardinalities and lack explicit block boundary information. These findings indicate that the proposed data structure is widely applicable across diverse learning models and data conditions.
한국어
본 연구는 결측치와 속성 간 이질성이 존재하는 불완전 데이터를 효율적으로 처리하기 위한 새로운 데이터 구조를 제안하고, 이를 세 가지 상이한 학습 모델에 적용하여 성능을 비교·분석한다. 제안된 데이터 구조는 불완전성을 포함하는 입력을 유연하게 표현하도록 하며, LDA 기반 모델, 에이다부스트 구조, 그리고 EBP 기반 딥러닝 모델에 각각 변형하여 적용한다. 실험 결과, LDA 모델은 결정 트리 절단 방식을 활용하여 에이다부스트의 약한 분류기로 확장될 수 있음을 확인 하고, 이로 인해 단일 LDA 대비 향상된 성능을 보인다. 또한 EBP 모델은 속성별 상이한 카디널리티와 명시적 블록 경계 정보가 없는 입력에서도 암묵적인 블록 구조를 효과적으로 학습할 수 있음을 나타낸다. 이러한 결과는 제안된 데이터 구조 가 다양한 모델과 데이터 조건에서 적용 가능함을 의미한다.
목차
요약 Abstract 1. 서론 2. 배경 2.1 결측값을 확률로 표현하는 데이터 구조 2.2 선형 판별 분석을 이용하는 결정 트리 2.3. 에이다부스트의 모델을 위한 결정트리 3. 불완전한 데이터를 위한 학습 모델들 3.1 LDA의 학습 3.2 에이다부스트의 학습 3.3 불완전한 데이터를 위한 EBP의 학습 4. 실험 4.1 실험 방법 비교 4.2 실험 결과 5. 결론 REFERENCES
키워드
불완전한 데이터확률적 데이터 표현LDA에이다부스트EBPIncomplete DataProbabilistic Data RepresentationLDAAdaBoostEBP
저자
이종찬 [ Jong Chan Lee | 청운대학교 컴퓨터공학과 교수 ]
Corresponding Author