Big data has created new technical and business environment which change organizations in many ways. It is time for organizations to cope with huge data volume as well as various data types and the speed of data production and utilization. In this context, research on data integration for solving these problems falls short of academic and industry demand. Especially academic research have not provided enough answers on effective decision making support through big data integration. By developing a big data integration framework evaluating such techniques as Hadoop, data federation, and data virtualization as well as infrastructure like parallel data warehouse, cloud systems, logical data warehouse and data lake and analyzing a public sector data integration case, the paper proposes a strategy to select appropriate big data integration approaches in various situations.
한국어
빅데이터라는 새로운 기술 및 경영 환경은 데이터가 조직에서 활용되는 방법에 많은 변화를 초래 하고 있다. 이는 기업들이 이전과 다른 데이터의 규모는 물론 다양한 형태, 그리고 데이터 생산에서 활 용까지 더욱 빠른 속도에 대응해야하기 때문이다. 그러나 빅데이터의 부상과 함께 데이터의 규모가 상 상을 초월할 정도로 커지지는 환경에서 여러 곳에 흩어져 있는 다양한 종류의 데이터를 어떻게 통합하 여 실시간으로 제공해 의사결정을 더욱 효율적이며 효과적으로 할 수 있는지에 대한 연구는 아직까지 매우 초기 수준에 있다. 본 연구는 빅데이터 환경에서 데이터 통합을 위해 사용될 수 있는 다양한 방법 들인 하둡, 데이터 페더레이션, 데이터 가상화, 그리고 이들과 관련된 인프라인 병렬형 데이터웨어하우 스, 논리적 데이터 웨어하우스, 클라우드 시스템, 데이터 호수 등의 특징을 분석해 정리하고 공공기관 의 빅데이터 통합 사례를 통해 비즈니스 상황에 맞는 데이터 통합 방법의 선택 전략을 제시하고자 한다.
목차
요약 Abstract 1. 연구의 목적 2. 이론적 배경 2.1 빅데이터 시대의 데이터 활용 문제점 2.2 규모에 대한 대응 문제 2.3 다양성에 대한 대응 문제 2.4 속도에 대한 대응 문제 2.5 빅데이터와 데이터 통합 2.6 데이터 통합 접근법 2.7 데이터 통합 전략 3. 연구 방법 4. 사례의 선정과 분석 4.1 데이터 통합의 배경 4.2 데이터의 통합의 방법 4.3 데이터 통합의 한계점 4.4 향후 데이터 통합의 대안 5. 결론 References
키워드
빅데이터데이터 통합데이터 가상화데이터 페더레이션병렬형 데이터 웨어하우스논리적 데이터웨어하우스하둡데이터 호수클라우드 시스템Big DataData IntegrationData FederationData VirtualizationHadoopData LakeParallel Data WarehouseLogical Data WarehouseCloud Systems
한국EA학회는 전사적 관점의 아키텍처 개념 및 원칙을 국내 민간기업 및 정부기관에 적용 확산시키고, EA 및 관련 분야의 연구, 전문인력의 양성 및 정책적 건의 등을 통해 기업 및 정부기관의 경쟁력 및 생산성을 향상시키고, 우리나라 지식 기반 산업 등의 고도화를 도모하는 것을 목적으로 합니다.