Earticle

현재 위치 Home 검색결과

결과 내 검색

발행연도

-

학문분야

자료유형

간행물

검색결과

검색조건
검색결과 : 16
No
1

A Study on the Analysis of Major Issues of Army Communication Channel Using Text Mining Techniques KCI 등재

Hansu Shin, Wonseok Kang

한국제도경제학회 제도와 경제 제17권 제2호 통권 48호 2023.05 pp.99-124

※ 기관로그인 시 무료 이용이 가능합니다.

6,400원

본 연구는 빅데이터를 통해 ‘육군’의 주요 이슈와 관련된 뉴스를 3개 섹션으 로 구분하여 수집하고, 육군 관련 주요 이슈를 분석하여 문제점을 도출하였다. 분석 기간은 2017년부터 2021년까지 총 3개 구간(문재인 정부 초기, 국방개혁 2.0 시행 이후, 코로나19 사태 이후)으로 구분하여 언론에서 다룬 기사의 주제 를 분석했다. 그 결과, 뉴스 속 군의 주요 이슈는 군 본연의 역할과 관련된 국 방력보다는 성범죄, 부정부패, 가혹행위, 전투력 남용, 군 복지, 급식, 급식 품 질, 의료서비스 등 군 내부 및 사회 문제였다. 이러한 부정적 이슈에 대해 군은 국방개혁 2.0을 추진하고, 급식 개선 등을 통해 발전하기 위해 노력하는 모습을 보였다. 육군이 현재의 부정적인 이미지를 탈피하고 군사력 발전에 집중하기 위 해서는 군 내부 장병들에 관심을 가지고 적극적인 교육과 투자가 필요하다. 또 한, 군 내외로 지속적으로 제기된 문제점들을 적극적으로 파악하고 이에 대해 해결하겠다는 의지 표명과 함께 군 이미지 변화를 위한 철저한 노력이 필요함 을 제시하였다.

This study collected news related to major issues of the ‘Army’ by dividing it into three periods through big data, and analyzed major issues related to the Army and derived problems. The analysis period was divided into three sub-periods (initially by the Moon Jae In government, after the implementation of Defense Reform 2.0, and after the COVID-19 situation) from 2017 to 2021, and the topics of articles covered by the media were analyzed. As a result, the main issues of the Army in the news were not defense capabilities related to the military’s main role, but internal and social issues such as sex crimes, corruption, abuse, combat power abuse, and military welfare, as well as food distribution, food quality, and medical services. In response to these negative issues, the military has shown efforts to improve itself by promoting Defense Reform 2.0 and improving meals. In order for the Army to overcome its current negative image and focus on the development of its military power, it is necessary to actively educate and invest in the soldiers inside the military. In addition, it was suggested that the military should make thorough efforts to change its image by actively identifying and resolving issues that have been consistently raised inside and outside the military.

2

4,900원

온라인 공론장을 통한 시민의 참여가 늘어나는 가운데 참여자들에게도 합리적이고 이성적인 커뮤니케이션 능력이 요구된다. 억제되지 않은 커뮤 니케이션이 증대될 경우 극단적 가치관을 지닌 집단의 출현과 확장이 가 능해지기 때문이다. 또한 사람들이 사용하는 언어와 메시지는 그 사람의 정체성을 나타내는 하나의 지표로 작용하는 바 본 연구에서는 ‘탄핵 반대 집단’의 댓글 텍스트를 분석함으로써 그들의 정체성을 파악하고자 하였다. 이에 본 연구에서는 텍스트 마이닝을 통한 빈출 단어 분석, 연관 분석, 토픽 모델링을 통해 ‘탄핵 반대 집단’이 생산한 텍스트를 단어 및 문장 단위로 분석하고, 텍스트 내에서 각 단어가 어떤 의미를 갖는지를 파악하 였다. 분석 결과, ‘탄핵 반대 집단’은 정치 분야에 높은 관심을 보였으며, 안보를 비롯한 모든 사안에 대해서 극도로 보수적인 성향을 보이는 것으로 나타났다. 특히 탄핵 이슈에 대해서는 ‘언론의 거짓 선동’에 의한 잘못 된 판결이 이루어졌다고 믿고 있는 것으로 드러났다.

While participation of citizens through the online public sphere increasing, participants are required to have rational and sensible communication skills. Otherwise, unrestrained communication will increase, allowing the emergence and expansion of groups with extreme view of values. On the other hand, the language and message used by some people serve as an indicator of their identity. In this study, we tried to understand their identity by analyzing the text in the comment of the ‘impeachment opposition group’. We analyzed the texts produced by the ‘opposition group’ by words and sentences by word frequency analysis, association analysis and topic modeling through text mining, understanding the meaning of each word in the text. As a result, it was founded that the group showed high interest in the political field and showed an extremely conservative tendency toward security and other issues. In particular, they believed that the impeachment issue had been misjudged by the “false incitement of the press”.

3

단어출현빈도분석과 AHP를 통한 기술 연구 동향과 기대 효과 분석: 바이오 에너지 분리막을 중심으로

이인우, 서한결, 장수진, 조철희, 정양헌

[NRF 연계] 한국경영교육학회 경영교육연구 Vol.35 No.5 2020.10 pp.335-348

※ 협약을 통해 무료로 제공되는 자료로, 원문이용 방식은 연계기관의 정책을 따르고 있습니다.

원문보기

[연구목적] 본 연구는 과학 기술 연구 동향과 기술 도입 기대 효과를 함께 분석하는 방안을 바이오 에너지 분리막 분야에 적용하여 연구개발 전략 제시에 도움이 되는 연구 방안을 제시하고자 하였다. [연구방법] 본 연구는 분리막 기술 연구 방향과 기대효과를 분석하기 위해 각각에 대해두 가지 연구방법을 이용하였다. 우선 텍스트 마이닝을 통해 단어출현빈도분석으로 선행연구의 연구 방향을 확인하였고, AHP를 통해 기대효과를 알아보았다. [연구결과] 분석결과 분리막 기술의 연구 방향은 주로 분리막 관련 다양한 공정과 공정개선을 통한 성능 향상에 있는 것으로 확인되었다. 분리막 기술을 통한 기대 효과는 바이오 에너지 공정에서 발생하는 환경 문제 해결이 주된 것으로 나타났다. [연구의 시사점] 분리막 관련 연구는 분리막 성능에 중점을 두고 진행되고 있으며 분리막을 실제 공정에 도입하는 측에서 기대하는 부분은 분리막 도입으로 인한 효과와 분리성능 향상에 의한 효과에 중점을 두고 있음을 확인하였다. 이는 분리막 기술 연구가 실제니즈를 잘 반영하여 이루어지고 있음을 보여준다. 이처럼 특정 기술의 연구 방향과 도입에 따른 기대효과를 함께 분석할 수 있으며, 이는 연구개발 전략 제시에 도움이 될 수 있음을 확인하였다.

[Purpose] Purpose of this study is to propose a research methodology that is helpful in presenting the R&D strategy by applying analysis on research trends and expected effect of technology introduction together in the field of bioenergy membranes. [Methodology] For this purpose, we used two research methodologies. Word frequency analysis of text mining was used to analyze the research trends of previous studies, and the expected effect was investigated through AHP. [Findings] This study found that the research trends of membrane is mainly to improve performance through various processes and expected effect focus on environmental problem solving arising from bioenergy process. [Implications] It was confirmed that main research trends of membrane is performance of membrane and expected effect is performance improvement by introduction of membrane in bioenergy processes. This shows that research on membrane is well reflected in actual needs. This methodology can be helpful in presenting the consumer-oriented R&D strategy.

4

조선교육요람 영문판(1913년, 1920년)에 나타난 교육기관 연구 : 단어 출현빈도 분석과 분산표상 모델을 활용하여

탁진영, 손민주

[NRF 연계] 사단법인한국교수불자연합회 한국교수불자연합학회지 Vol.37 2023.08 pp.167-199

※ 협약을 통해 무료로 제공되는 자료로, 원문이용 방식은 연계기관의 정책을 따르고 있습니다.

원문보기

본 연구는 1913년과 1920년 조선총독부가 발행한 영문판 조선교육요람의 분석을 기반으로제1차 조선교육령이 공포된 1911년부터 제2차 조선교육령이 공포된 1922년 사이의 식민지교육정책을 관찰하는 것을 목표로 한다. 특히 본 연구는 1913년과 1920년 조선교육요람의 영어텍스트에서 기술된 교육기관에 대해 중점적으로 살펴봄으로써 일본이 시행한 교육정책의 특징을파악하고자 하였다. 이를 위해 텍스트마이닝 기법을 활용한 양적 분석과 텍스트마이닝 분석 결과를 역사와 언어학적 관점에서 해석하는 질적 분석을 종합적으로 진행하였다. 구체적으로, 조선교육요람 영문판(1913년, 1920년)의 연도별 핵심어의 출현빈도를 계산한 후 교육기관을 중심으로자주 등장한 기관을 살펴보았으며, 다음으로는 분산표상 모델을 활용해 ‘school(학교)’의 유사어를추출한 후 이를 토대로 교육기관의 특징을 살펴보았다. 분석 결과 일본은 교육기관의 운영 주체에따라 차별적인 교육정책을 펼쳤으며, 다양한 유형의 교육기관을 통해 조선인에게 저급하고 차별적인 교육정책을 시행한 것을 확인할 수 있었다. 특히 1920년 조선교육요람 영문판에서는 1913년조선교육요람 영문판에서보다 표면적으로는 더 다양한 유형의 교육기관이 서술되어 조선의 교육정책이 발전한다는 인상을 주었지만, 실제로는 이전보다 더 구체적이고 교묘하게 식민지 교육정책을 이어 나가고자 한 정황을 파악할 수 있었다. 그리고 이러한 1920년 영문판 조선교육요람의 흐름은 제1차 조선교육령 간행 약 11년 후 일본인과 동일한 수준의 교육을 제공한다고 발표하였지만 실제로는 계속해서 차별적인 정책이 시행된 제2차 조선교육령의 모습과 닮아있다. 결국 일본이 제1차 조선교육령 발행부터 제2차 조선교육령 발행 전까지 지속적으로 우민 양성 교육정책에 집중하였음이 본 연구에서 증명되었다. 또한 본 연구는 양적 연구와 질적 연구가 역사 연구에서 상호보완적으로 사용될 수 있음을 제시하였다.

This study analyzed two English texts, Manual of Education of Koreans (1913) and Manual of Education in Chosen 1920(1920), published by the Japanese Government-General of Korea, to investigate the stream of colonial education policies from 1911 when First Chosen Educational Ordinance was declared to 1922 when the Second Chosen Educational Ordinance was declared. In particular, we focused on the educational institutions described in two English texts to examine the education policies implemented by Japan. Given this object, we comprehensively conducted quantitative analysis utilizing text-mining techniques and qualitative analysis that interpreted the results of the text-mining analysis with a historical and linguistic perspective. Specifically, we first calculated the word frequency of two English texts and took a closer look at words related to educational institutions. Then we extracted tokens related to ‘school’ through the distributed representation model. As a result of the analysis, it was confirmed that Japan implemented a discriminatory education policy according to the operational subjects of the educational institutions, and implemented a low and differentiated education policy against Koreans through various types of educational institutions. Especially, in Manual of Education in Chosen 1920(1920) introduced more diverse types of educational institutions than Manual of Education of Koreans(1913) as if Chosen’s educational policy was developed, but it was found that it was intended to implement more specific and subtle colonial educational policies. In addition, this stream of educational policy was closely connected to Second Chosen Educational Ordinance in 1922, in which the Japanese Government-General of Korea more subtly executed education policies to foster ignorant people. Finally, we unveiled that Japan continued implementing education policies to keep the people ignorant from the issuance of First Chosen Educational Ordinance to the issuance of Second Chosen Educational Ordinance. Also, we suggested that quantitative research can be used in concordance with qualitative research in historical research.

5

어휘 계량적 분석과 띄어쓰기 문제

한영균

[NRF 연계] 서울대학교 규장각한국학연구원 한국문화 Vol.31 2003.06 pp.49-76

※ 협약을 통해 무료로 제공되는 자료로, 원문이용 방식은 연계기관의 정책을 따르고 있습니다.

원문보기

It is well known that one of the most trouble-making problems in word frequency analysis of modern Korean corpora is irregualrities in word spacing, especailly that of the MWLUs(milti-word lexical units) including compounds. This comes from the facts that articles which regulate spacing of modern Korean have some contradictions and unclarity on one side, and that it is impossible to register all the MWLUs and compound words, even the full size dictionary, which can be used as a source of reference for word-spacing, and most of the lexicons of language processing tools of Korean depend on paper dictionaries on the other. As a result, lists of compounds in word frequency lists show inconsistancy, and this influences the whole results of frequency analysis of a corpus. It is argued that to overcome such problems, it is preferable to make a list of compound words and MWLUs based on the corpus to be analysed, and the lexicon of language processing tools must be reorganized based on the list of compound words and MWLUs. And as this list can be used as a source of supplement for the revision of the dictionary which originally used for the word frequency analysis, the whole process of word frequency analysis shows circularity.

6

토픽모델링과 단어 빈도분석을 통한 버지니아 울프 일기와 소설 키워드 읽기

전보미

[NRF 연계] 영미문학연구회 영미문학연구 Vol.48 2025.06 pp.5-41

※ 협약을 통해 무료로 제공되는 자료로, 원문이용 방식은 연계기관의 정책을 따르고 있습니다.

원문보기

This study applies topic modeling to Virginia Woolf’s diaries from 1915 to 1941 to analyze key themes and keywords. By clustering major topics, the research aims to structurally illuminate Woolf’s personal interests and inner world while also exploring the intertextual relationship between her diaries and novels through shared themes. Focusing on the significance of nature and war as central themes in Woolf’s life and works after 1910, this study examines the formation of her social and political language as a humanist and pacifist. In particular, it investigates how Woolf sought to explore the values and meanings of life despite the devastation of war, with these two themes serving as focal points in her writing. To achieve this, the study combines LDA-based topic modeling with SBERT-based semantic similarity analysis and keyword frequency analysis, allowing for both thematic clustering and quantitative comparison between texts. Employing the methodology of distant reading, this study seeks to structure and visualize the key themes and keywords in Woolf’s texts. At the same time, through close reading of the representative passages, it traces the concrete ways in which specific themes?such as war and nature?are contextualized and given meaning within her works.

7

규범과 현실 사이의 거리 좁히기 ­국어 어휘 빈도 조사 방법론의 정립을 위한 시론­

한영균

[NRF 연계] 어문연구학회 어문연구 Vol.43 2003.12 pp.121-152

※ 협약을 통해 무료로 제공되는 자료로, 원문이용 방식은 연계기관의 정책을 따르고 있습니다.

8

코퍼스 기반 공간 범주 부치사의 결합 단어 빈도 및 양상 분석

문유미

[NRF 연계] 중국어문학연구회 중국어문학논집 Vol.141 2023.09 pp.85-116

※ 협약을 통해 무료로 제공되는 자료로, 원문이용 방식은 연계기관의 정책을 따르고 있습니다.

원문보기

This paper conducts a quantitative study on the space-category adpositions in Chinese based on Corpus, and aimed to perform empirical analysis on the quantitative type. First, adpositions indicating the concept of space, '在, 於, 自, 嚮, 到, 往, 從, 朝, 由, 打’', were classified each per word order. Then the antecedent nouns combined with them were subsequently classified according to each part of the speech symbol. As a result, they were most frequently used with Nc (noun of place), followed by Na (common noun) and Ncd (noun of direction). Here, Na is much more frequently present in B and C types accompanying the postpositions, than Nc and Ncd (place of direction unavailable for accompanying the postposition afterward). Next, the word frequency of the postposition present at the space-category adposition, and the presence pattern of the antecedent noun, were quantitatively studied. As a result, not only the adposition phrase distribution by preposition or postposition to the verb varied, but the type of accompanying postpositions was also diverse. This paper has not dealt with details related to this with the limiting capacity, but aims to induce the typical characteristic and feature of space-category adpositions in Chinese, based on the study result on quantitative analysis.

9

단어 빈도의 통시적 분석을 통해 본 IPCC 기후변화 담론 변화

윤순진, 김선회

[NRF 연계] 한국중원언어학회 언어학 연구 Vol.73 2024.10 pp.269-300

※ 협약을 통해 무료로 제공되는 자료로, 원문이용 방식은 연계기관의 정책을 따르고 있습니다.

원문보기

This study analyzes the word frequencies in the Intergovernmental Panel on Climate Change reports to uncover scientific concerns and linguistic trends in climate change discourse. Focusing on four “Summary for Policymakers” reports from 2001 to 2023, it investigates how the language used by climate scientists reflects shifting priorities in climate change issues. Using a corpus-based approach, it analyzes word frequencies, noting the prominence of words related to climate change, such as climate, change, global, warming, adaptation, and mitigation. The findings suggest that while earlier reports predominantly used the term climate change, there has been a recent shift toward the more urgent term global warming. Additionally, action-oriented terms like just and net zero have entered the most recent report, indicating a focus on immediate solutions. The analysis also exhibits a growing use of scientific confidence description which underscores the increasing certainty in climate science. This linguistic shift reflects changing scientific priorities in the global policy response of climate risks. The study contributes to both climate science and linguistics by exploring how evolving word choices influence public understanding in climate change issues.

10

단어 빈도와 유사도 분석 기반의 회의록 요약 시스템 설계 및 구현

허강호, 양진우, 김동현, 복경수, 유재수

[Kisti 연계] 한국콘텐츠학회 한국콘텐츠학회논문지 Vol.19 No.10 2019 pp.620-629

※ 협약을 통해 무료로 제공되는 자료로, 원문이용 방식은 연계기관의 정책을 따르고 있습니다.

원문보기

의사 결정을 위한 토론이나 토의의 내용을 객관적 요약하고 분류하는 자동화된 회의록 요약 시스템이 요구되고 있다. 본 논문은 기존에 사용되었던 회의록 요약 시스템을 보완할 수 있도록 word2vec 모델을 이용한 회의록 요약 시스템을 설계하고 구현한다. 제안 시스템은 형태소 분석 과정에서 불용어를 제거하고 문서에서 공통적인 의견을 가진 대표 문장을 추출하기 위해 추가로 word2vec 모델로 학습을 수행한다. 제안 시스템은 회의 과정에서 수집되는 문서를 분석하여 자동으로 분류하고 다양한 의견들 중 안건을 대표하는 대표 문장을 추출한다. 회의 진행자는 제안 시스템을 통해 회의에서 다뤄지는 모든 안건을 보다 빠르게 확인하고 관리할 수 있다. 제안 시스템은 대규모 토론이나 토의의 여러 가지 안건을 분석하여 대표 의견이 될 수 있는 문장을 요약하여 빠른 정확한 의사 결정을 지원한다.

An automated minutes summary system is required to objectively summarize and classify the contents of discussions or discussions for decision making. This paper designs and implements a minutes summary system using word2vec model to complement the existing minutes summary system. The proposed system is further implemented with word2vec model to remove index words during morpheme analysis and to extract representative sentences with common opinions from documents. The proposed system automatically classifies documents collected during the meeting process and extracts representative sentences representing the agenda among various opinions. The conference host can quickly identify and manage all the agendas discussed at the meeting through the proposal system. The proposed system analyzes various agendas of large-scale debates or discussions and summarizes sentences that can be representative opinions to support fast and accurate decision making.

11

단어 명명 과제에서 나타난 빈도 효과: 단어처리 인지모형 분석

주혜리, 이다정, 고성룡

[Kisti 연계] 한국인지과학회 인지과학 Vol.35 No.4 2024 pp.305-330

※ 협약을 통해 무료로 제공되는 자료로, 원문이용 방식은 연계기관의 정책을 따르고 있습니다.

원문보기

이 연구는 이중 경로 가설과 단어 빈도가 높을수록 단어 명명 속도가 빨라진다는 이전 연구를 기반으로 하여 단어 명명 과제를 통해 단어 빈도 효과를 관찰하고자 했다. 또한 이 연구에서는 주혜리와 고성룡(2021)이 소개한 단일경계 확산모형을 사용하여 단어 명명 과제에서 얻은 데이터를 분석하여 모델의 특정 파라미터와의 관련성을 확인하고자 했다. 실험 결과에서는 고빈도 단어 조건에서 저빈도 단어 조건보다 단어를 더 빠르게 명명하는 반응 시간이 나타났다. 단어 명명 과제에서 얻은 데이터를 분포 분석하고 단일경계 확산모형에 넣어 실행한 결과, 단어 빈도 차이가 정보표집율 파라미터의 차이로 설명될 수 있었다. 실험 결과를 바탕으로 단일경계 확산모형이 단어 명명 과제의 단어 처리 과정을 정보표집율 파라미터로 설명할 수 있으며, 모형이 이중경계이나 파라미터의 변동성 가정과 관계없이 언어 처리 현상을 설명하고 개인의 언어 처리 능력을 예측할 수 있는 유용한 도구임을 재확인하였다.

This study aimed to examine the effect of word frequency on word naming responses based on the dual route hypothesis and prior research indicating that higher word frequency leads to faster word naming reactions. First, the effect of word frequency was observed through a word naming task. Additionally, this study utilized the one boundary diffusion model introduced by Choo and Koh (2021) to analyze the data obtained from the word naming task, with the objective of examining the relationship between the model's specific parameters and the observed effects. Experimental results indicated that responses were faster for high frequency words compared to low frequency words. Analysis of the distribution of data obtained from the word naming task, when fitted to the one boundary diffusion model, revealed that differences in word frequency could be accounted for by variations in the drift rate parameter. The findings reaffirm that the one boundary diffusion model can effectively explain the word processing mechanisms in the word naming task through the drift rate parameter. Furthermore, the model proves to be a valuable tool for describing language processing phenomena and predicting individual differences in language processing abilities, regardless of the assumptions related to two boundary models or parameter variability.

12

소셜 네트워크 서비스의 단어 빈도와 범죄 발생과의 관계 분석

김용우, 강행봉

[Kisti 연계] 한국정보처리학회 정보처리학회논문지/컴퓨터 및 통신 시스템 Vol.5 No.9 2016 pp.229-236

※ 협약을 통해 무료로 제공되는 자료로, 원문이용 방식은 연계기관의 정책을 따르고 있습니다.

원문보기

기존의 범죄 예측 방법들은 범죄 발생을 예측하기 위해 기존 기록을 이용하였다. 그러나 이러한 범죄 예측 모델은 데이터를 갱신하는데 어려움이 있다. 범죄 예측을 향상시키기 위해서 소셜 네트워크 서비스(SNS)를 이용하여 범죄를 예측하는 연구들이 진행되었지만, SNS 데이터와 범죄 기록 사이의 관계에 대한 연구는 미흡하다. 따라서, 본 논문에서는 SNS 데이터와 범죄 발생 사이의 관계를 범죄 예측의 관점에서 분석하였다. 잠재 디리클레 할당(LDA)을 이용하여 범죄 발생과 관련된 단어를 포함하는 트윗을 추출하였고, 범죄 기록에 따른 트윗 빈도의 변화를 분석하였다. 범죄 관련 단어를 포함하는 트윗의 빈도를 계산하고, 범죄 발생에 따라서 트윗 빈도를 분석하였다. 범죄가 발생하였을 때, 범죄와 관련된 트윗의 빈도가 변화하였다. 게다가, 범죄 발생 전후에 트윗 빈도가 특정 패턴을 보이기 때문에 SNS 데이터가 범죄 예측 모델에 도움이 될 것이다.

In the past, crime prediction methods utilized previous records to accurately predict crime occurrences. Yet these crime prediction models had difficulty in updating immense data. To enhance the crime prediction methods, some approaches used social network service (SNS) data in crime prediction studies, but the relationship between SNS data and crime records has not been studied thoroughly. Hence, in this paper, we analyze the relationship between SNS data and criminal occurrences in the perspective of crime prediction. Using Latent Dirichlet Allocation (LDA), we extract tweets that included any words regarding criminal occurrences and analyze the changes in tweet frequency according to the crime records. We then calculate the number of tweets including crime related words and investigate accordingly depending on crime occurrences. Our experimental results demonstrate that there is a difference in crime related tweet occurrences when criminal activity occurs. Moreover, our results show that SNS data analysis will be helpful in crime prediction model as there are certain patterns in tweet occurrences before and after the crime.

13

소셜 네트워크 서비스의 단어 빈도와 범죄 발생과의 관계 분석

김용우, 강행봉

[NRF 연계] 한국정보처리학회 KIPS Transactions on Computer and Communication Systems Vol.5 No.9 2016.09 pp.229-236

※ 협약을 통해 무료로 제공되는 자료로, 원문이용 방식은 연계기관의 정책을 따르고 있습니다.

원문보기

기존의 범죄 예측 방법들은 범죄 발생을 예측하기 위해 기존 기록을 이용하였다. 그러나 이러한 범죄 예측 모델은 데이터를 갱신하는데어려움이 있다. 범죄 예측을 향상시키기 위해서 소셜 네트워크 서비스(SNS)를 이용하여 범죄를 예측하는 연구들이 진행되었지만, SNS 데이터와 범죄 기록 사이의 관계에 대한 연구는 미흡하다. 따라서, 본 논문에서는 SNS 데이터와 범죄 발생 사이의 관계를 범죄 예측의 관점에서 분석하였다. 잠재 디리클레 할당(LDA)을 이용하여 범죄 발생과 관련된 단어를 포함하는 트윗을 추출하였고, 범죄 기록에 따른 트윗빈도의 변화를 분석하였다. 범죄 관련 단어를 포함하는 트윗의 빈도를 계산하고, 범죄 발생에 따라서 트윗 빈도를 분석하였다. 범죄가 발생하였을 때, 범죄와 관련된 트윗의 빈도가 변화하였다. 게다가, 범죄 발생 전후에 트윗 빈도가 특정 패턴을 보이기 때문에 SNS 데이터가 범죄 예측 모델에 도움이 될 것이다.

In the past, crime prediction methods utilized previous records to accurately predict crime occurrences. Yet these crime prediction models had difficulty in updating immense data. To enhance the crime prediction methods, some approaches used social network service (SNS) data in crime prediction studies, but the relationship between SNS data and crime records has not been studied thoroughly. Hence, in this paper, we analyze the relationship between SNS data and criminal occurrences in the perspective of crime prediction. Using Latent Dirichlet Allocation (LDA), we extract tweets that included any words regarding criminal occurrences and analyze the changes in tweet frequency according to the crime records. We then calculate the number of tweets including crime related words and investigate accordingly depending on crime occurrences. Our experimental results demonstrate that there is a difference in crime related tweet occurrences when criminal activity occurs. Moreover, our results show that SNS data analysis will be helpful in crime prediction model as there are certain patterns in tweet occurrences before and after the crime.

14

최근 6년 간의 수능 영어 듣기평가 어휘 분석: 어휘 규모, 어휘 난이도, 고빈도 내용어 중심

김가현, 차경환

[NRF 연계] 팬코리아영어교육학회 영어교육연구 Vol.33 No.2 2021.06 pp.23-36

※ 협약을 통해 무료로 제공되는 자료로, 원문이용 방식은 연계기관의 정책을 따르고 있습니다.

원문보기

This study aims to compare and analyze differences in the English listening assessment of the College Scholastic Ability Test (CSAT) following the introduction of criterion-referenced test, focusing on lexical scales, lexical variations, word difficulty, and high frequency content words. For this analysis, CSAT English listening passages from 2015-2020 were collected. Then the passages were organized into six text files, and analyzed by AntConc 3.5.8, AntWord Profiler 1.4.0, and WordSmith 7.0. Results showed that, since the introduction of criterion-referenced test in 2018, there has been a slight decrease in the number of lexical scales and types and lexical diversity compared to the three years prior to the change in test method. The characteristics of high frequency content words, particularly the high percentage of verbs and nouns, show that it is necessary to devote attention to teaching them to students. Accordingly, it is proposed that greater recognition should be given to the importance of high frequency content words for efficient CSAT English listening pedagogy. (163 words)

15

한글 두 글자 단어와 비단어의 어휘판단에 글자 빈도, 글자 유형, 받침이 미치는 영향: KLP 자료의 분석

신명석, 박창호

[Kisti 연계] 한국인지과학회 인지과학 Vol.34 No.4 2023 pp.277-297

※ 협약을 통해 무료로 제공되는 자료로, 원문이용 방식은 연계기관의 정책을 따르고 있습니다.

원문보기

본 연구는 한국어 심성어휘 데이터베이스(KLP-DB)의 분석을 통해 글자 빈도, 글자의 모음 유형, 받침 유무 등 글자 수준 정보가 두 글자로 된 단어와 비단어의 어휘판단에 어떤 영향을 주는지를 알아보고자 하였다. 반응시간과 오반응률에 대한 위계적 회귀분석을 실시한 결과 단어의 어휘판단에는 단어빈도가 중대한 영향을 미치지만, 첫째 글자의 빈도, 첫째 글자와 둘째 글자의 모음 유형과 받침 유무와 같은 글자 속성이 영향을 미쳤고, 두 글자의 모음 유형의 조합 및 둘째 글자의 빈도와 받침 유무의 조합도 영향을 주었다. 비단어의 어휘판단에는 첫째 글자와 둘째 글자의 빈도, 첫째 글자의 모음 유형, 첫째 글자와 둘째 글자의 받침 유무와 같은 글자 속성이 영향을 미쳤고, 두 글자의 사용빈도의 조합, 모음 유형의 조합, 및 첫째 글자의 빈도와 받침의 조합도 영향을 주었다. 단어빈도는 단어의 어휘판단에서 강력한 영향을 미쳤으며, 글자속성은 단어보다 비단어의 판단에서 더 일관적인 영향을 미쳤다. 본 연구의 결과는 어휘판단과제에서 단어와 비단어 목록의 구성 및 반응시간의 해석에 글자 속성의 문제를 충분히 고려해야 함을 가리킨다. 글자 속성의 효과에 대한 이해는 단어 재인 과정의 이해에도 기여할 것이다.

This study attempted to find out how lexical decision of two-syllable words or pseudo-words is affected by syllabic information, such as syllable frequency, syllable (i.e. vowel) type, and presence of final consonant (i.e. batchim), through the analysis of the Korean Lexicon Project Database (KLP-DB). Hierarchical regression of RT data showed that lexical decision of words was influenced by the frequency of the first syllable, the syllable type of the first and second syllables, batchim for the first and second syllables, and also by the interaction of the two syllable types and the interaction of syllable frequency and batchim of the second syllable. For pseudo-words lexical decision was influenced by the frequency of the first and second syllables, syllable type of the first syllable, and batchim for the first and second syllables, and also by the interaction of the two syllable frequencies, the interaction of the two syllable types, and the interaction of syllable frequency and batchim of the first syllable. Word frequency had a strong effect on lexical decision of words, while syllabic information had a stable effect on the lexical decision of pseudo-words. These results indicate that syllabic information should be seriously considered in constructing word and pseudo-word lists and interpreting lexical decision time. Understanding the effect of syllabic information will also contribute to the understanding of word recognition process.

16

중학교 1, 2, 3학년 개정교과서와 2016-2020년 듣기 모의고사 코퍼스기반 어휘 분석: 어휘 수준, 다양성, 고빈도 내용어 중심

최은영, 차경환

[NRF 연계] 팬코리아영어교육학회 영어교육연구 Vol.34 No.1 2022.03 pp.67-82

※ 협약을 통해 무료로 제공되는 자료로, 원문이용 방식은 연계기관의 정책을 따르고 있습니다.

원문보기

This study investigated the differences of word difficulty, diversity and high frequency content words in English textbooks for middle school and in the listening test. For this analysis, the listening scripts in 36 textbooks and listening tests for the past 5 years were collected. Then the passages were analyzed by AntCont 3.5.9 and Wordsmith tool 7.0. As a result of the study, the token coverage rate of NGSL 1level increased as the grade level increased, while 2level decreased. In addition, it was found that it was not possible to properly prepare for the listening test only with the content words presented in the first and second grade textbooks. Finally, it was confirmed that the word difficulty and diversity presented in textbooks and listening test by grade level increased or decreased without a certain standard. These results indicate the need to pay attention to vocabulary difficulty and diversity control by grade level when selecting vocabulary for textbooks and listening test as well as considering the connection. For this, objective standards of word difficulty and diversity by grade are required, and these standards should be consistent with the exact evaluation of learners' English listening achievement.

 
페이지 저장