Earticle

현재 위치 Home

자연어 처리 모델을 활용한 블록 코드 생성 및 추천 모델 개발
Development of Block-based Code Generation and Recommendation Model Using Natural Language Processing Model

첫 페이지 보기
  • 발행기관
    한국정보교육학회 바로가기
  • 간행물
    정보교육학회논문지 KCI 등재 바로가기
  • 통권
    제26권 제3호 (2022.06)바로가기
  • 페이지
    pp.197-207
  • 저자
    전인성, 송기상
  • 언어
    한국어(KOR)
  • URL
    https://www.earticle.net/Article/A414024

※ 기관로그인 시 무료 이용이 가능합니다.

4,200원

원문정보

초록

영어
In this paper, we develop a machine learning based block code generation and recommendation model for the purpose of reducing cognitive load of learners during coding education that learns the learners block that has been made in the block programming environment using natural processing model and fine-tuning and then gen­erates and recommends the selectable blocks for the next step. To develop the model, the training dataset was produced by pre-processing 50 block codes that were on the popular block programming language web site ‘Entry’. Also, after dividing the pre-processed blocks into training dataset, verification dataset and test dataset, we developed a model that generates block codes based on LSTM, Seq2Seq, and GPT-2 model. In the results of the performance evaluation of the developed model, GPT-2 showed a higher performance than the LSTM and Seq2Seq model in the BLEU and ROUGE scores which measure sentence similarity. The data results generated through the GPT-2 model, show that the performance was relatively similar in the BLEU and ROUGE scores ex­cept for the case where the number of blocks was 1 or 17.
한국어
본 논문에서는 코딩 학습 중 학습자의 인지 부하 감소를 목적으로 자연어 처리 모델을 이용하여 전이학습 및 미세조정을 통해 블록 프로그래밍 환경에서 이미 이루어진 학습자의 블록을 학습하여 학습자에게 다음 단계에서 선택가능한 블록을 생성하고 추천해주는 머신러닝 기반 블록 코드 생성 및 추천 모델을 개발하였다. 모델 개발을 위해 훈련용 데이터셋은 블록 프로그래밍 언어인 ‘엔트리’ 사이트의 인기 프로젝트 50개의 블록 코드를 전 처리하여 제작하였으며, 훈련 데이터셋과 검증 데이터셋 및 테스트 데이터셋으로 나누어 LSTM, Seq2Seq, GPT-2 모델을 기반으로 블록 코드를 생성하는 모델을 개발하였다. 개발된 모델의 성능 평가 결과, GPT-2가 LSTM과 Seq2Seq 모델보다 문장의 유사도를 측정하는 BLEU와 ROUGE 지표에서 더 높은 성능을 보였다. GPT-2 모델을 통해 실제 생성된 데이터를 확인한 결과 블록의 개수가 1개 또는 17개인 경우를 제외하면 BLEU와 ROUGE 점수에서 비교적 유사한 성능을 내는 것을 알 수 있었다.

목차

요약
Abstract
1. 서론
2. 이론적 배경
2.1. 프로그래밍 교육에서의 학습자 피드백
2.2. 자연어 처리 기술
3. 연구방법
3.1. 데이터셋 구축
3.2. 데이터 전처리
3.3. 모델 개발 방법
3.4. 모델 평가
4. 연구결과
4.1. GPT-2 모델을 활용한 블록 생성
4.2. LSTM, Seq2Seq, GPT-2 모델의 성능 평가
5. 결론
참고문헌

키워드

자연어 처리 자연어 생성 블록 프로그래밍 코드 생성 GPT-2 BLEU ROUGE Natural Language Process Natural Language Generation Block-based Programming Code Generation GPT-2 BLEU ROUGE

저자

  • 전인성 [ In-Seong Jeon | 한국교원대학교 컴퓨터교육과 ]
  • 송기상 [ Ki-Sang, Song | 한국교원대학교 컴퓨터교육과 ] 교신저자

참고문헌

자료제공 : 네이버학술정보

간행물 정보

발행기관

  • 발행기관명
    한국정보교육학회 [Korean Association of Information Education]
  • 설립연도
    1997
  • 분야
    사회과학>교육학
  • 소개
    사단법인 한국정보교육학회는 21세기 지식 정보화 사회에서 정보 교육에 관한 학술 및 기술 발전에 기여하기 위하여 정보교육과 관련된 학술대회개최, 학술논문지 발간, 연구지원사업 등을 추진하여 21세기 지식 정보화 시대의 초석을 마련하며 정부에서 추진하고 있는 교육정보화 사업과 연계하는 것을 기본 방향으로 한다.

간행물

  • 간행물명
    정보교육학회논문지 [Journal of The Korean Association of Information Education]
  • 간기
    격월간
  • pISSN
    1229-3245
  • 수록기간
    1997~2026
  • 등재여부
    KCI 등재
  • 십진분류
    KDC 374 DDC 375

이 권호 내 다른 논문 / 정보교육학회논문지 제26권 제3호

    피인용수 : 0(자료제공 : 네이버학술정보)

    함께 이용한 논문 이 논문을 다운로드한 분들이 이용한 다른 논문입니다.

      페이지 저장