Earticle

현재 위치 Home

Iowa Liquor Sales Data Predictive Analysis Using Spark

첫 페이지 보기
  • 발행기관
    한국경영정보학회 바로가기
  • 간행물
    Asia Pacific Journal of Information Systems KCI 등재 SCOPUS 바로가기
  • 통권
    제31권 제2호 (2021.06)바로가기
  • 페이지
    pp.185-196
  • 저자
    Ankita Paul, Shuvadeep Kundu, Jongwook Woo
  • 언어
    영어(ENG)
  • URL
    https://www.earticle.net/Article/A396168

※ 기관로그인 시 무료 이용이 가능합니다.

4,300원

원문정보

초록

영어
The paper aims to analyze and predict sales of liquor in the state of Iowa by applying machine learning algorithms to models built for prediction. We have taken recourse of Azure ML and Spark ML for our predictive analysis, which is legacy machine learning (ML) systems and Big Data ML, respectively. We have worked on the Iowa liquor sales dataset comprising of records from 2012 to 2019 in 24 columns and approximately 1.8 million rows. We have concluded by comparing the models with different algorithms applied and their accuracy in predicting the sales using both Azure ML and Spark ML. We find that the Linear Regression model has the highest precision and Decision Forest Regression has the fastest computing time with the sample data set using the legacy Azure ML systems. Decision Tree Regression model in Spark ML has the highest accuracy with the quickest computing time for the entire data set using the Big Data Spark systems.

목차

ABSTRACT
Ⅰ. Introduction
Ⅱ. Related Work
Ⅲ. Machine Learning Algorithms
Ⅳ. Our Work
4.1. Azure ML
4.2. SparkML
Ⅴ. Experimental Results
Ⅵ. Conclusion

 Hardware Specifications

키워드

Machine learning Big Data Predictive analysis PySpark Regression

저자

  • Ankita Paul [ Graduate student, Computer Information Systems, California State University, Los Angeles, USA ]
  • Shuvadeep Kundu [ Graduate student, Computer Information Systems, California State University, Los Angeles, USA ]
  • Jongwook Woo [ Professor, CIS Department, California State University, Los Angeles, USA ] Corresponding Author

참고문헌

자료제공 : 네이버학술정보

간행물 정보

발행기관

  • 발행기관명
    한국경영정보학회 [The Korea Society of Management information Systems]
  • 설립연도
    1989
  • 분야
    사회과학>경영학
  • 소개
    이 학회는 경영정보학의 연구 및 교류를 촉진하고 학문의 발전과 응용에 공헌함을 목적으로 합니다.

간행물

  • 간행물명
    Asia Pacific Journal of Information Systems
  • 간기
    계간
  • pISSN
    2288-5404
  • eISSN
    2288-6818
  • 수록기간
    1990~2026
  • 등재여부
    KCI 등재,SCOPUS
  • 십진분류
    KDC 325 DDC 658

이 권호 내 다른 논문 / Asia Pacific Journal of Information Systems 제31권 제2호

    피인용수 : 0(자료제공 : 네이버학술정보)

    함께 이용한 논문 이 논문을 다운로드한 분들이 이용한 다른 논문입니다.

      페이지 저장