Earticle

현재 위치 Home

주성분분석을 이용한 기종점 데이터의 압축 및 주요 패턴 도출에 관한 연구
A Study on the Compression and Major Pattern Extraction Method of Origin-Destination Data with Principal Component Analysis

첫 페이지 보기
  • 발행기관
    한국ITS학회 바로가기
  • 간행물
    한국ITS학회논문지 KCI 등재 바로가기
  • 통권
    제19권 제4호 통권90호 (2020.08)바로가기
  • 페이지
    pp.81-99
  • 저자
    김정윤, 탁세현, 윤진원, 여화수
  • 언어
    한국어(KOR)
  • URL
    https://www.earticle.net/Article/A380158

※ 기관로그인 시 무료 이용이 가능합니다.

5,400원

원문정보

초록

영어
Origin-destination data have been collected and utilized for demand analysis and service design in various fields such as public transportation and traffic operation. As the utilization of big data becomes important, there are increasing needs to store raw origin-destination data for big data analysis. However, it is not practical to store and analyze the raw data for a long period of time since the size of the data increases by the power of the number of the collection points. To overcome this storage limitation and long-period pattern analysis, this study proposes a methodology for compression and origin-destination data analysis with the compressed data. The proposed methodology is applied to public transit data of Sejong and Seoul. We first measure the reconstruction error and the data size for each truncated matrix. Then, to determine a range of principal components for removing random data, we measure the level of the regularity based on covariance coefficients of the demand data reconstructed with each range of principal components. Based on the distribution of the covariance coefficients, we found the range of principal components that covers the regular demand. The ranges are determined as 1~60 and 1~80 for Sejong and Seoul respectively.
한국어
기종점 데이터는 수요 분석 및 서비스 설계를 위해서 대중교통, 도로운영 등 다양한 분야에 서 저장 및 활용되고 있다. 최근 빅데이터의 활용성이 증대되면서 기종점 데이터의 분석 및 활용에 대한 수요도 함께 증가하고 있다. 기존의 일반적인 교통 정보 데이터가 수집장비 수(n) 에 비례하여 데이터양이 증가(a·n)하는 것과는 다르게, 기종점 데이터는 수집지점 수(n)의 증 가에 따라 수집 데이터의 양이 기하급수적으로 증가(a·n2)하는 경향이 있다. 이로 인하여 기종 점 데이터를 원시 데이터의 형태로 장기간 저장하고 빅데이터 분석에 활용하는 것은 대용량의 저장 공간이 필요하다는 것을 고려할 때 실용적 대안으로 여겨지지 않고 있다. 이와 함께 기종 점 데이터는 0~10 사이의 작은 수요 부분에 패턴화된 형태와 무작위 적인 형태의 데이터가 섞여있어 작은 수요가 그룹화되어 발생하는 주요 패턴을 추출하기에 어려움이 있다. 이러한 기종점 데이터의 저장용량의 한계와 패턴화 분석의 한계를 극복하고자 본 연구에서는 주성분 분석을 활용한 대중교통 기종점 데이터의 압축 및 분석 방법을 제안하였다. 본 연구에서는 서 울시와 세종시의 대중교통 이용 데이터를 활용하여 모빌리티 데이터를 분석하고, 모빌리티 기 종점 데이터에 포함된 무작위 성향이 높은 데이터를 제거하기 위해 주성분분석 기반의 데이터 압축 및 복원에 관한 연구를 수행하였다. 주성분분석으로 분해된 기종점 데이터와 원데이터를 비교하여 주요한 수요 패턴을 찾고 이를 통해 압축률과 복원율을 높일 수 있는 주성분 범위를 제안하였다. 본 연구에서 분석한 결과, 서울시 기준 1~80, 세종시 기준 1~60까지의 주성분을 사용할 경우 주요 이동 데이터의 손실 없이 기종점 데이터에 포함되어있는 노이즈를 제거하고 데이터를 압축 및 복원이 가능하였다.

목차

요약
ABSTRACT
Ⅰ. 서론
Ⅱ. 선행 연구
Ⅲ. 활용 데이터
Ⅳ. 방법론
1. 주성분분석 기반 빅데이터 압축 및 복원
2. 복원데이터의 유사도 산출을 통한 주성분분석
Ⅴ. 분석결과
Ⅵ. 결론
ACKNOWLEDGEMENTS
REFERENCES

키워드

빅데이터 대중교통 데이터 기종점 데이터 주성분분석 패턴 분석 Big data Public transit data Origin-destination data Principal component analysis Pattern analysis

저자

  • 김정윤 [ Jeongyun Kim | 한국과학기술원 건설및환경공학과 박사과정 ] 주저자
  • 탁세현 [ Sehyun Tak | 한국교통연구원 4차산업혁명교통연구본부 부연구위원 ] 교신저자
  • 윤진원 [ Jinwon Yoon | 한국과학기술원 건설및환경공학과 박사과정 ] 공저자
  • 여화수 [ Hwasoo Yeo | 한국과학기술원 건설및환경공학과 부교수 ] 공저자

참고문헌

자료제공 : 네이버학술정보

간행물 정보

발행기관

  • 발행기관명
    한국ITS학회 [The Korean Society of Intelligent Transport Systems]
  • 설립연도
    2002
  • 분야
    공학>교통공학
  • 소개
    ◈ 전문분야간 공동협의, 공동연구를 통한 ITS의 학술적 발전 ◈ 산·학·연 협동체계 구축으로 기술개발 지원 ◈ 정부정책 및 제도 방향에 대한 기술적 자문 ◈ 외국 ITS 관련 학술단체와 기술교류 ◈ 관련전문가 및 기술자의 교육 및 양성

간행물

  • 간행물명
    한국ITS학회논문지 [The Journal of The Korean Society of Intelligent Transport Systems]
  • 간기
    격월간
  • pISSN
    1738-0774
  • eISSN
    2384-1729
  • 수록기간
    2003~2026
  • 등재여부
    KCI 등재
  • 십진분류
    KDC 326 DDC 338

이 권호 내 다른 논문 / 한국ITS학회논문지 제19권 제4호 통권90호

    피인용수 : 0(자료제공 : 네이버학술정보)

    함께 이용한 논문 이 논문을 다운로드한 분들이 이용한 다른 논문입니다.

      페이지 저장