2025 (15)
2024 (20)
2023 (16)
2022 (18)
2021 (18)
2020 (19)
2019 (18)
2018 (16)
2017 (18)
2016 (16)
2015 (23)
2014 (20)
2013 (19)
2012 (19)
2011 (22)
2010 (18)
2009 (10)
2008 (10)
2007 (9)
2006 (9)
2005 (8)
2004 (13)
2002 (9)
2001 (10)
2000 (11)
6,300원
한자를 이용하여 한국어를 표기한 차자표기 자료는 한국어 역사 자료 말뭉치에 포 함되지 않았지만 개인이나 연구 기관에서 전산 입력한 자료는 그동안 꾸준히 축적되 어 왔다. 본고는 이두와 구결을 중심으로 지금까지 알려진 전산화된 자료의 현황을 살펴보고 개선 방안을 모색해 보았다. 그리고 논의 과정에서 한국어 역사 자료 말뭉 치에 차자표기 자료가 반드시 포함되어야 한다는 점, 독자를 위해 차자표기 원문과 현대 한국어 번역문의 병렬 말뭉치 형식으로 구축할 필요가 있다는 점, 자료의 성격 상 원본의 확인이 중요하다는 점 등을 강조하였다.
So far, there has been no construction of a national corpus for Korean language data written using Chinese characters. However, the data that have been computerized by individuals or research institutes have been steadily accumulated, and in particular, recently, various data have been computerized and disclosed, and basic research has become active, so the conditions for constructing corpus for Korean language data written using Chinese characters are conspicuous. In this paper, we examine the current status of computerized data known so far, focusing on Idu and Kugyol, and emphasize the need to include the data in Korean historical language corpus, the need to construct it in a parallel corpus format of the original text and modern Korean translation, and the importance of confirming the original sources.
7,900원
본고는 21세기 세종계획 역사말뭉치와 역사자료 종합 정비 말뭉치 가운데 근대 국 어 말뭉치의 현황과 문제점을 살펴보고 향후 말뭉치 구축에서 개선되어야 할 사항을 제안하는 데 목적이 있다. 21세기 세종계획에서는 265종의 문헌 약 391만 어절의 근 대 국어 말뭉치를 구축하였고, 역사자료 종합 정비 사업에서는 역사말뭉치의 상당 부 분을 정제하고 언해문의 경우 한문-언해문 병렬 말뭉치의 형식으로 가공하였는데 이 가운데 근대 국어 자료 말뭉치는 258종 약 351만 어절을 구축하였다. 역사자료 종합 정비 말뭉치는 이전 세종역사말뭉치의 오류들이 상당 부분 수정되었다. 그러나 근대 국어 일부 자료에서는 글자 입력의 오류, 띄어쓰기 오류, 분절 및 태깅 오류 등이 여 전히 발견되는 데 향후 이러한 문제점을 개선하는 데 집중해야 할 것이다. 향후 말뭉치 구축에서 개선되어야 할 사항으로, 언간, 장서각 필사자료(소설, 실기 류, 전기류 등) 등의 포함, 한자음 입력, 한문-언해문 병렬 말뭉치로의 지속적 구축, 말뭉치 텍스트에 대응하는 이미지 자료 구축과 이미지 서비스 방법에 대한 고민, 말 뭉치 header에 풍부한 서지 정보와 지금까지의 연구 성과를 포함, 구축된 말뭉치의 코 드 통일, 구축된 말뭉치를 잘 활용할 수 있는 검색 프로그램의 개발 등을 제안하였고, 향후 개인이 구축한 말뭉치들을 수집하여 종합화하기 위해서는 통일된 구축 형식을 정할 필요가 있음을 언급하였다.
The purpose of this study is to examine the current status and problems of modern Korean corpora among the 21st century Sejong Project historical corpora and corpora of comprehensive modification of historical materials, and to suggest matters to be improved in future corpora construction. In the 21st century, about 3.91 million modern Korean corpora of 265 kinds of materials were constructed, and in the comprehensive modification of historical materials project, a large portion of the historical corpora were refined and processed in the form of Chinese-Korean parallel corpora. The corpora of comprehensive modification of historical materials have been largely corrected for errors in the previous Sejong historical corpora. However, in some modern Korean corpora, errors in character input, spacing, segmentation and tagging are still found, and we should focus on improving these problems in the future. For improvements in future modern Korean corpus, additional construction of Korean letters and Jangseogak manuscript materials, input of Chinese character’s pronunciation, continuous construction of Chinese-Korean parallel corpora, consideration and service methods of image data, inclusion of abundant bibliographic information and research results in corpus headers, code unification of constructed corpora, and development of search programs were proposed. And it was mentioned that in order to collect and synthesize corpus built by individuals in the future, it is necessary to set a unified construction format.
8,700원
이 연구는 개화기 국어 말뭉치 구축 현황과 개선 방안을 밝히는 것을 목적으로 한 다. 그 동안 개화기 말뭉치도 어느 정도의 규모가 개별적으로 축적되었지만, 자료 간 의 일관성과 호환성이 떨어지고 대부분의 자료가 미공개되거나 공개되더라도 검색 결 과만을 볼 수 있어 개화기 말뭉치에 대한 다양한 분석과 활용이 어렵다. 이를 극복하기 위해서는 다양한 장르를 대상으로 한 말뭉치 구축 지침을 마련해야 한다. 특히, 띄어쓰기 및 한자 처리에 대한 원칙 마련이 시급하다. 주석말뭉치 구축을 위해서도 다양한 장르를 대상으로 하되, 연구자들의 이용의 편이성을 높이기 위해 고 어형과 현대어형을 동시에 제시할 필요가 있다. 거시적으로는 연구 그룹 간 특정 장 르(신문, 잡지, 신소설, 교과서 등)의 언어 자료를 최대한 발굴․전산화하기 위한 분업 및 협업 체계 수립, 개화기 국어 말뭉치 구축 시 반드시 포함해야 할 공통 정보 및 입 력 지침 마련, 시기별․장르별 균형 말뭉치 구축 방법론 모색 등이 이루어져야 한다. 특히, 상호주의적 원칙에 따라 자료를 공유할 수 있는 플랫폼 구축이 절실히 필요하다.
The purpose of this study is to reveal the status of Korean corpus establishment in the modernization period and measures for improvement. Up until now, the corpus in the modernization period has been accumulated separately to some extent; however, it is difficult to analyze and utilize it profoundly because the data are not consistent and compatible, and also, most data are unreleased, and even if they are opened, only search results can be viewed. To solve this problem, first, it is necessary to prepare common information and input guidelines that must be included when a corpus is built. In particular, principles on spacing or processing Chinese characters should be established. In order to build a tagged corpus, too, it is necessary to present both old and modern forms of words to increase user convenience for researchers. Macroscopically, to computerize language data in a specific genre among research groups as much as possible, it is needed to build up a system for task division and cooperation and seek methodology to establish a balanced corpus by period and by genre. Particularly, there is an urgent need to establish a platform to share data according to the principle of reciprocity.
7,500원
이 글에서는 국어사 말뭉치가 어떻게 활용되어 왔는지를 살펴보고, 앞으로 국어사 말뭉치를 구축하는 데 있어 고려해야 할 사항과 함께 국어사 말뭉치 활용 방안에 대 한 관견을 제시하고자 하였다. 인문학의 다른 분야에 비하면 국어사 분야의 전산화는 비교적 이른 편이었으나, 주로 원시말뭉치가 구축되었고 단순 검색이나 사전 편찬에 활용되는 데 그쳤다. 앞으로 구축에 있어서는 국제적인 표준에 의거하여, 시공간의 제 약을 받지 않는 방식으로 말뭉치의 구축과 보완이 활발하게 이루어져야 한다. 활용에 있어서는 국어사 및 인접분야 연구나 어휘역사정보 구축은 물론이고, 더 나은 형태소 분석기와 콘코던서의 개발, 머신러닝/딥러닝 학습 등을 위해 활용할 필요가 있다. 구 축․보완되는 말뭉치의 접근과 사용은 오픈 사이언스․오픈 데이터라는 관점에서 반드시 개방적으로 이루어져야 한다.
This paper examines the utilization of Korean historical corpora and provides perspectives on how to better utilize them, as well as considerations for future corpus construction. Compared to other humanities fields, computerization in the history of the Korean language has been relatively early, but the raw corpus has mainly been used for simple searching and dictionary compilation. In the future, it is necessary to actively construct and modify the corpora in accordance with international standards, without being constrained by space and time. In terms of utilization, the corpora should be used not only for research on the history of the Korean language and related fields, but also for creating information on lexical history, developing better tokenizers and concordancers, and training data for machine/deep learning. Finally, access to and use of the corpora should be open in terms of open science and open data.
6,400원
『佛說大報父母恩重經(諺解)』 는 16세기 중반 이후 20세기 초반까지 44종의 이본 간행이 확인된다. 이 중 16세기는 현전하는 『불설대보부모은중경(언해)』 가 간행된 가장 이른 시기이며, 50년간 44종 중 12종이 집중적으로 간행되던 시기이기도 하다. 본 연 구에서는 『불설대보부모은중경(언해)의 16세기 이본 중 1583년 槐山小馬寺에서 간행한 『佛說大報父母恩重經(諺解)』 의 저본과 특징을 고찰하였다. 그 결과 소마사에서 간행된 『불설대보부모은중경(언해)』 는 張銀守라는 인물이 간행 사업에 많은 관여를 하였으며, 저본은 1545년 오응성 발문이 수록된 전주본으로 여겨 진다. 해당 문헌은 圖像에서 처마, 佛壇등에서 다른 판본과 구분되는 특징이 확인되 는 반면, 한문과 언해문에서 탈획과 이체자로 대체되는 등의 현상이 확인된다. 차후 『불설대보부모은중경(언해)』 전반에 걸친 이본간 관계를 확인할 필요가 있다.
It is possible to find out 44 kinds of variant texts published from the mid-16th century to the early 20th century, for the 『Bulseoldaebobumoeunjunggyeong (Korean annotation of Chinese classics)』. The 16th century was the earliest period in which 『Bulseoldaebobumoeunjunggyeong(Korean annotation of Chinese classics)』 was published and 12 kinds were intensively published among 44 kinds, for 50 years. This study considered the sources text and the characteristics of the 『Bulseoldaebobumoeunjunggyeong( Korean annotation of Chinese classics)』 published in Soma Temple on Goisan-gun, Chungcheongbuk-do in 1583, among variant texts of it, published in the 16th century. The findings show that Jang Eunsu(張銀守) greatly engaged in the publication project of the 『Bulseoldaebobumoeunjunggyeong(Korean annotation of Chinese classics)』, and the source text of it is recognized as the Jeonju version in which an epilogue, which was written by O Eungseong in 1545, is recorded. Although the characteristics of eaves, Buddhist altars, etc, which are distinguished from other versions, are found from the literature, it is also found that Chinese characters and Eonhaemun are replaced with missing strokes and variant Chinese characters. It is necessary to verify the relationship among the whole variant texts of 『Bulseoldaebobumoeun- junggyeong(Korean annotation of Chinese classics)』 in the future.
9,100원
『사민필지』는 19세기 말 헐버트가 저술한 한국 최초의 세계지리 교과서로, 161면 의 본문에 더해 8면의 지도가 수록되어 있다. 『사민필지』에는 60여 개 국가의 인구, 물산, 정치, 종교, 교육, 산업, 수출입, 재정 등에 관한 다양한 정보가 담겨 있다. 본고 에서는 서구에서 구축된 근대적 지식이 한글을 매개로 국내로 도입된 선구적 사례로서 『사민필지』가 갖는 자료적 가치에 주목하고, 헐버트가 왜 이러한 교과서를 저술하 였는지, 집필 과정에서 어떤 자료들을 참고했는지, 어떠한 내용을 취사선택하였는지, 무엇을 강조하고자 하였는지 등의 문제들을 검토해 보았다. 2장에서는 헐버트가 가족 들에게 보낸 편지에 나타난 『사민필지』 관련 기술을 살펴봄으로써 1888년 말부터 이 책의 기획과 자료 수집이 시작되었고, 1890년 상반기에 집필이 완료되었으며 이후 교 열과 지도 삽입 등의 과정을 거쳐 1890년 12월 말에서 1891년 2월 말 사이 간행이 이 루어졌음을 확인하였다. 또한 그가 『사민필지』 저술 당시 조선인에 대한 근대적 교육을 통해 부패한 정치를 개혁할 민중 정당의 탄생을 희망하고 있었고, 그러한 숨은 의도가 각국의 정치 체제에 대한 서술에 반영되어 있었음을 알 수 있었다. 3장에서는 1880년대 영미권 세계지리 교과서 42종을 분석해 서구에서 구축된 근대적 지식이 헐 버트에 의해 재구성되어 국내에 도입되는 과정을 살펴보았다. 『사민필지』는 수리지리 학, 자연지리학, 정치지리학의 세 분야를 포함했다는 점에서 19세기 말 세계지리 교과 서의 일반적 내용 구성을 따랐다고 볼 수 있다. 하지만 천문지리학을 함께 다룬 점은 매우 예외적이었는데, 이는 근대적 지식을 다룬 교과서가 전무하던 상황에서 지리 교 과의 확장성을 최대한 활용하고자 했던 결과로 생각된다. 또한 곳곳에서 한국의 상황 이나 한국인의 관점을 적극 고려한 것이나 제국주의의 침략을 규탄하고 경각심을 일 깨운 것도 이 책의 특징이라 할 수 있다. 각국에 대한 기술에서 위도와 경도, 상하폭, 면적, 재정 규모, 세액, 수출입액 등에 대한 구체적인 수치를 제시한 것도 영미권 교과서에서는 볼 수 없는 독특한 부분이다. 4장에서는 헐버트가 회고록에서 언급한 『정치인연감』과 『휘태커연감』 1886~1890년판을 검토해 헐버트가 『사민필지』에 해당 연 감의 수치를 반영하지 않았으며, 저술 과정에서 두 연감을 직접적인 참고 자료로 활 용했다고 볼 근거가 없음을 확인하였다.
Saminpilji is Korea’s first world geography textbook written by H. B. Hulbert at the end of the 19th century. This book consists of 161 pages of texts along with 8 pages of maps. Saminpilji contains various information of more than 60 countries such as population, product, politics, religion, education, industry, import and export, and finance. In this paper, I examined issues such as why Hulbert wrote this textbook, what materials he referred to in the writing process, what content he chose, and what he wanted to emphasize while focusing on the value of Saminpilji as a pioneering example of textbook containing modern knowledge built in the West and introduced in Korea through Hangeul. In Chapter 2, I discussed that Saminpilji was planned from the end of 1888, completed in the first half of 1890, and published between the end of December 1890 and the end of February 1891 by analyzing the letters Hulbert sent to his family. In addition, the letters show that Hulbert hoped for his Korean students to create a political party to reform a corrupt government. Chapter 3 analyzed 42 world geography textbooks published in the US and the Great Britain in the 1880s and examined the process of modern knowledge built in the West being reconstructed for Koreans by Hulbert. At the end of the 19th century, world geography textbooks in the United Kingdom and the United States generally included three areas: mathematical geography, physical geography, and political geography, and this was common in Saminpilji. However, the inclusion of astronomical geography in Saminpilji was exceptional, which is thought to be the result of trying to make the most of the scalability of the geography subject in the absence of textbooks dealing with modern knowledge in Korea. In addition, Saminpilji is characterized by actively considering the situation of Korea and the perspective of Koreans, criticizing imperialist aggression, and raising awareness among Koreans. It is also unique that Saminpilji presented specific numbers on latitude and longitude, upper and lower widths, area, financial size, tax amount, and import and export amount in the description of each country. Chapter 4 reviewed the 1886-1890 editions of The Statesman’s Yearbook and Whitaker’s Almanack, which Hulbert mentioned in his memoir, confirming that Hulbert did not reflect the figures of the almanacs in Saminpilji, and that there is no basis of these almanacs were referred to while writing Saminpilji.
7,200원
이 글은 한글 문화유산 데이터베이스의 개념을 정의한 후 이를 구축하는 과정과 활용하는 방안을 모색하는 것을 목적으로 한다. 한글 문화유산 데이터베이스는 문헌 자료를 포함해 한글로 작성된 언어 자료를 총칭하는 개념이다. 따라서 문헌 중심의 분류 체계와는 다른 분류 체계가 필요하며, 수집과 활용의 대상을 텍스트만으로 한정 하기도 어렵다. 하지만 실제로는 한글 문화유산의 대부분이 문헌 자료이므로 우선적 으로 문헌 자료를 활용해 원시 데이터베이스와 말뭉치 주석 데이터베이스를 구축하는 방법을 모색해 보았다. 데이터베이스의 구축에 그치지 않고 구축한 데이터베이스를 활용하기 위해 필요한 분류 체계와 정보 제공 방식도 함께 살펴보았다.
This article aims to define the concept of a Hangeul cultural heritage database, and then explore the process of its development and utilization. The Hangeul cultural heritage database is a concept that collectively refers to language data written in Hangeul, including literature data. Therefore, the classification system must not be literature-based, and it can be difficult to achieve text alone in collection and utilization. However, in reality, most of Hangeul’s cultural heritage is literature data, so we first searched for ways to develop a raw database and a corpus annotation database using literature data. In addition to using the database, we examined the classification system and information provision method required to utilize the database.
0개의 논문이 장바구니에 담겼습니다.
선택하신 파일을 압축중입니다.
잠시만 기다려 주십시오.