A text-mining-based word class categorization method and LSTM-based vocabulary pattern prediction method are introduced in this paper. A preprocessing method based on simple text appearance frequency analysis is first described. This method was developed as a data screening tool but showed 4.35 times higher prediction accuracy compared to Word Master book. An LSTM deep learning method is also suggested for vocabulary appearance pattern prediction method. AI performs a regression with various size of data window of previous exams to predict the probabilities of word appearance in the next exam. Predicted values of AI over various data windows are processed into a single score as a weighted sum, which we call an "AI-Score", which represents the probability of word appearance in next year's exam. Suggested method showed 100% accuracy at the range 100-score area and showed only 1.7% error of prediction in the section where the scores were over 60 points.
한국어
텍스트 마이닝 기법 기반의 어휘 분류 기법과 LSTM을 활용한 어휘 출현 패턴 예측 방법을 소개한다. 단순한 텍스트의 등장 빈도를 기반으로 한 프리프로세싱 기법을 제안하며, 이 기법으로 제작된 어휘 스크리닝 기술은 시중의 베스트셀러 수능 어휘 교재인 워드 마스터 대비 2023년도 수능 시험 적중률이 4.35배 더 높았다. LSTM 딥러닝 기법을 활용한 인공지능 기술도 함께 제안하며, 이 기법 은 수능 시험에서 특정 어휘가 어떤 패턴으로 등장하는지 분석하고 이를 토대로 다음 수능에 출제될 어휘의 목록과 그 등장확률을 예측할 수 있다. AI의 예측값은 여러 크기의 데이터 윈도우를 바탕으로 학습된 추론값을 노멀라이즈한 뒤 가중합 연산하여 구한 것 이며, 저자들은 이 값을 AI-Score라고 부른다. AI-score는 특정 단어가 다음 수능 시험에서 등장할 확률을 의미하며, 논문에서 제안 하는 방법론이 100점으로 분류한 단어들은 2023수능에서 100% 출제되었다. AI-Score가 60점 이상인 영역에서는 불과 1.7%수준의 오차로 수능에 출제될 단어들의 등장 확률을 예측하는 데 성공했다.
목차
요약 ABSTRACT I. Introduction II. Related Works 1. Patterns of Exams 2. Natural Language Processing III. Method 1. Data 2. Preprocessing 3. Frequency Analysis 4. Word Screening by Experts 5. Neural Network Architecture 6. Data Windowing 7. Training 8. Normalization of Regression Results IV. Result 1. AI Prediction Values 2. Prediction of 2023 K-CSAT Exam 3. AI Prediction Accuracy V. Discussion VI. Conclusion Acknowledgement Supplement Data References
키워드
자연어처리텍스트 마이닝딥 러닝패턴 예측수능Natural language processingText miningDeep learningPattern predictionCSAT
저자
반병현 [ Byunghyun Ban | 프로젝트 균형감각 ]
Corresponding Author
한국인공지능교육학회 [Korean Association of Artificial Intelligence Education]
설립연도
2019
분야
사회과학>교육학
소개
인공지능 기반의 융합 사회의 도래로 사회 전반에서 인공지능의 소양과 역량에 대한 요구가 증가하고 있습니다. 알파고 이후 인공지능은 우리 생활의 일부가 되고 있고 인공지능 기술이 융합 산업의 핵심으로 대두되었습니다. 인공지능기술이 다른 분야를 만났을 때 창출되는 가치는 자동차, 반도체, 스마트폰의 부가가치를 모두 합친 것보다 초월하고 있고 인공지능 역량을 가진 인재는 세상의 변화를 주도하는 막강한 영향력을 갖게 되었습니다.
이러한 인재의 양성은 혁신 기업의 존망을 좌우하게 되었고 국가의 경쟁력으로 이어지고 있습니다. 이것이 인공지능교육의 필요성이며 이를 이끌 단체로서 인공지능교육학회가 있습니다.
한국인공지능교육학회는 인공지능 기술과 융합적 역량을 가진 인재를 양성하고 미래 사회에서 인공지능이 인간을 위한 기술로 전개될 수 있도록 교육의 기반을 마련하고자 합니다. 학회에서는 인공지능에 관한 산학연 연계의 학문을 발전시키고 국가 발전에 기여하는 인재를 양성하는 등 다양한 방면에서 인공지능교육의 발전을 위해 노력하겠습니다. 또한 글로벌 인공지능과 융합 기술 분야에서 우리나라가 선도할 수 있도록 다양한 연구와 학술활동 그리고 국내외 공유의 장을 만들어 가도록 하겠습니다 .
간행물
간행물명
인공지능연구 논문지 [Journal of The Korean Association of Artificial Intelligence Education]