Plagiarism is a serious problem in school education due to current technologies such as the internet and word processors. This paper presents how to detect source code plagiarism using similarity based on string comparison methods. The main contribution is to use hierarchical agglomerative clustering technique to classify plagiarism groups, which are then visualized as a dendrogram. Graders can set an empirical threshold to the dendrogram to navigate plagiarism groups. We evaluated the performance of the presented method with a real world data. The result showed the usefulness and applicability of this method.
한국어
인터넷 통신의 발달 및 워드프로세서의 기능 향상으로 인해 일선 교육현장에서의 표절은 심각한 문제가 되고 있다. 본 연구에서는 C, C++, Java 등으로 작성된 프로그램 소스 코드들의 유사도를 측정하는 방법을 제시하고, 소스 코드를 계층적으로 군집화하고 표절 결과를 수형도로 시각화하는 방법을 제시한다. 채점자는 시각화된 수형도를 보고 임계값을 설정하여 표절 그룹을 분리할 수 있다. 실제 데이터에서 효과를 알아보기 위해서 학부 1학년생 컴퓨터 개론 및 실습과목 강의 중에 제출된 과제물 프로그램을 이용하여 실험해 보았으며, 유용하고 현실성 있는 방법임을 확인하였다.
목차
요약 A B S T R A C T 1. 서론 2. 관 련 연 구 2.1 프 로 그 램 소 스 코 드 의 표 절 방 법 3. S L IN K 를 이 용 한 표 절 검 사 3.1 유 사 도 3.2 S L IN K 를 이 용 한 계 층 적 군 집 화 3.3 소 스 코 드 표 절 검 사 구 현 3.4 소 스 코 드 표 절 검 사 실 험 4. 소 스 코 드 표 절 검 사 평 가 4.1 평가 데이터 4.2 평가 결과의 표현 5. 결론 및 향후과제 참고문헌
한국정보교육학회 [Korean Association of Information Education]
설립연도
1997
분야
사회과학>교육학
소개
사단법인 한국정보교육학회는 21세기 지식 정보화 사회에서 정보 교육에 관한 학술 및 기술 발전에 기여하기 위하여 정보교육과 관련된 학술대회개최, 학술논문지 발간, 연구지원사업 등을 추진하여 21세기 지식 정보화 시대의 초석을 마련하며 정부에서 추진하고 있는 교육정보화 사업과 연계하는 것을 기본 방향으로 한다.
간행물
간행물명
정보교육학회논문지 [Journal of The Korean Association of Information Education]