LDA기반 토픽모델링을 활용한 공공데이터 기반의 교육용 데이터마이닝 연구
A Study on Educational Data Mining for Public Data Portal through Topic Modeling Method with Latent Dirichlet Allocation
This study aims to search for education-related datasets provided by public data portals and examine what data types are constructed through classification using topic modeling methods. Regarding the data of the public data portal, 3,072 cases of file data in the education field were collected based on the classification system. Text mining analysis was performed using the LDA-based topic modeling method with stopword processing and data pre-processing for each dataset. Program information and student-supporting notifications were usually provided in the pre-classified dataset for education from the data portal. On the other hand, the characteristics of educational programs and supporting information for the disabled, parents, the elderly, and children through the perspective of lifelong education were generally indicated in the dataset collected by searching for education. The results of data analysis through this study show that providing sufficient educational information through the public data portal would be better to help the students' data science-based decision-making and problem-solving skills.
한국어
본 연구에서는 공공데이터포털에서 제공하는 교육관련 데이터를 검색하고 토픽모델링 기법을 활용한 분류를 통해 어떠한 데이터의 종류가 구축되어 있으며 활용이 가능한지를 살펴보고자 하였다. 공공데이터포털의 데이터 에 대하여 분류체계를 기준으로 교육분야의 파일데이터는 3,072건이 수집되었으며, 검색어를 활용하여 ‘교육’을 검색하여 나타난 파일데이터 2,361건으로 나타났다. 각각의 데이터셋에 대하여 불용어처리를 실시하고 데이터전 처리를 수행하여 LDA기반 토픽모델링을 활용하여 텍스트마이닝 분석을 실시하였다. 사전에 교육으로 분류된 데 이터셋에서는 현재 재학중인 학교급별 학생을 대상으로 지원하는 프로그램과 정보에 대한 내용이 제공되고 있었 다. 한편, 교육으로 검색하여 수집된 데이터셋에서는 장애인, 학부모, 노인, 아동 등 평생교육의 관점으로 제공되 는 교육 프로그램 및 지원현황이라는 특징이 나타났다. 데이터과학기반의 의사결정 및 문제해결력을 기르기 위 해 공공데이터포털이 제공하는 데이터에서 교육과정 및 내용이 충분히 제공되는 것도 좋은 기회가 될 것이다.
목차
요약 Abstract 1. 서론 2. 이론적 배경 2.1. 공공데이터 이용과 활용의 법률적 근거 2.2. 공공데이터포털과 교육 3. 연구목적 및 연구방법 4. 연구결과 4.1. 분류체계 활용 토픽모델링 분석 결과 4.2. 검색어 활용 토픽모델링 분석 결과 5. 데이터과학교육을 위한 교육용 공공데이터 분석 6. 공공데이터 활용 데이터과학교육 방안 7. 결론 및 제언 참고문헌
키워드
공공데이터포털데이터마이닝텍스트마이닝토픽모델링데이터과학교육Public Data PortalData MiningText MiningTopic ModelingData Science Education
한국정보교육학회 [Korean Association of Information Education]
설립연도
1997
분야
사회과학>교육학
소개
사단법인 한국정보교육학회는 21세기 지식 정보화 사회에서 정보 교육에 관한 학술 및 기술 발전에 기여하기 위하여 정보교육과 관련된 학술대회개최, 학술논문지 발간, 연구지원사업 등을 추진하여 21세기 지식 정보화 시대의 초석을 마련하며 정부에서 추진하고 있는 교육정보화 사업과 연계하는 것을 기본 방향으로 한다.
간행물
간행물명
정보교육학회논문지 [Journal of The Korean Association of Information Education]