Earticle

현재 위치 Home

LDA기반 토픽모델링을 활용한 공공데이터 기반의 교육용 데이터마이닝 연구
A Study on Educational Data Mining for Public Data Portal through Topic Modeling Method with Latent Dirichlet Allocation

첫 페이지 보기
  • 발행기관
    한국정보교육학회 바로가기
  • 간행물
    정보교육학회논문지 KCI 등재 바로가기
  • 통권
    제26권 제5호 (2022.10)바로가기
  • 페이지
    pp.439-448
  • 저자
    신승기
  • 언어
    한국어(KOR)
  • URL
    https://www.earticle.net/Article/A419618

※ 기관로그인 시 무료 이용이 가능합니다.

4,000원

원문정보

초록

영어
This study aims to search for education-related datasets provided by public data portals and examine what data types are constructed through classification using topic modeling methods. Regarding the data of the public data portal, 3,072 cases of file data in the education field were collected based on the classification system. Text mining analysis was performed using the LDA-based topic modeling method with stopword processing and data pre-processing for each dataset. Program information and student-supporting notifications were usually provided in the pre-classified dataset for education from the data portal. On the other hand, the characteristics of educational programs and supporting information for the disabled, parents, the elderly, and children through the perspective of lifelong education were generally indicated in the dataset collected by searching for education. The results of data analysis through this study show that providing sufficient educational information through the public data portal would be better to help the students' data science-based decision-making and problem-solving skills.
한국어
본 연구에서는 공공데이터포털에서 제공하는 교육관련 데이터를 검색하고 토픽모델링 기법을 활용한 분류를 통해 어떠한 데이터의 종류가 구축되어 있으며 활용이 가능한지를 살펴보고자 하였다. 공공데이터포털의 데이터 에 대하여 분류체계를 기준으로 교육분야의 파일데이터는 3,072건이 수집되었으며, 검색어를 활용하여 ‘교육’을 검색하여 나타난 파일데이터 2,361건으로 나타났다. 각각의 데이터셋에 대하여 불용어처리를 실시하고 데이터전 처리를 수행하여 LDA기반 토픽모델링을 활용하여 텍스트마이닝 분석을 실시하였다. 사전에 교육으로 분류된 데 이터셋에서는 현재 재학중인 학교급별 학생을 대상으로 지원하는 프로그램과 정보에 대한 내용이 제공되고 있었 다. 한편, 교육으로 검색하여 수집된 데이터셋에서는 장애인, 학부모, 노인, 아동 등 평생교육의 관점으로 제공되 는 교육 프로그램 및 지원현황이라는 특징이 나타났다. 데이터과학기반의 의사결정 및 문제해결력을 기르기 위 해 공공데이터포털이 제공하는 데이터에서 교육과정 및 내용이 충분히 제공되는 것도 좋은 기회가 될 것이다.

목차

요약
Abstract
1. 서론
2. 이론적 배경
2.1. 공공데이터 이용과 활용의 법률적 근거
2.2. 공공데이터포털과 교육
3. 연구목적 및 연구방법
4. 연구결과
4.1. 분류체계 활용 토픽모델링 분석 결과
4.2. 검색어 활용 토픽모델링 분석 결과
5. 데이터과학교육을 위한 교육용 공공데이터 분석
6. 공공데이터 활용 데이터과학교육 방안
7. 결론 및 제언
참고문헌

키워드

공공데이터포털 데이터마이닝 텍스트마이닝 토픽모델링 데이터과학교육 Public Data Portal Data Mining Text Mining Topic Modeling Data Science Education

저자

  • 신승기 [ Seungki Shin | 서울교육대학교 컴퓨터교육과 ]

참고문헌

자료제공 : 네이버학술정보

간행물 정보

발행기관

  • 발행기관명
    한국정보교육학회 [Korean Association of Information Education]
  • 설립연도
    1997
  • 분야
    사회과학>교육학
  • 소개
    사단법인 한국정보교육학회는 21세기 지식 정보화 사회에서 정보 교육에 관한 학술 및 기술 발전에 기여하기 위하여 정보교육과 관련된 학술대회개최, 학술논문지 발간, 연구지원사업 등을 추진하여 21세기 지식 정보화 시대의 초석을 마련하며 정부에서 추진하고 있는 교육정보화 사업과 연계하는 것을 기본 방향으로 한다.

간행물

  • 간행물명
    정보교육학회논문지 [Journal of The Korean Association of Information Education]
  • 간기
    격월간
  • pISSN
    1229-3245
  • 수록기간
    1997~2026
  • 등재여부
    KCI 등재
  • 십진분류
    KDC 374 DDC 375

이 권호 내 다른 논문 / 정보교육학회논문지 제26권 제5호

    피인용수 : 0(자료제공 : 네이버학술정보)

    함께 이용한 논문 이 논문을 다운로드한 분들이 이용한 다른 논문입니다.

      페이지 저장