Earticle

현재 위치 Home

LDA 토픽 모델링과 Word2vec을 활용한 유사 특허문서 추천연구
LDA Topic Modeling and Recommendation of Similar Patent Document Using Word2vec

첫 페이지 보기
  • 발행기관
    한국경영정보학회 바로가기
  • 간행물
    경영정보학연구 KCI 등재 바로가기
  • 통권
    제22권 제1호 (2020.02)바로가기
  • 페이지
    pp.17-31
  • 저자
    이앞길, 최근호, 김건우
  • 언어
    한국어(KOR)
  • URL
    https://www.earticle.net/Article/A371231

※ 기관로그인 시 무료 이용이 가능합니다.

4,800원

원문정보

초록

영어
With the start of the fourth industrial revolution era, technologies of various fields are merged and new types of technologies and products are being developed. In addition, the importance of the registration of intellectual property rights and patent registration to gain market dominance of them is increasing in oversea as well as in domestic. Accordingly, the number of patents to be processed per examiner is increasing every year, so time and cost for prior art research are increasing. Therefore, a number of researches have been carried out to reduce examination time and cost for patent-pending technology. This paper proposes a method to calculate the degree of similarity among patent documents of the same priority claim when a plurality of patent rights priority claims are filed and to provide them to the examiner and the patent applicant. To this end, we preprocessed the data of the existing irregular patent documents, used Word2vec to obtain similarity between patent documents, and then proposed recommendation model that recommends a similar patent document in descending order of score. This makes it possible to promptly refer to the examination history of patent documents judged to be similar at the time of examination by the examiner, thereby reducing the burden of work and enabling efficient search in the applicant’s prior art research. We expect it will contribute greatly.
한국어
4차 산업혁명 시대의 시작과 함께 다양한 분야의 기술들이 서로 융합하며 새로운 형태의 기술과 제품들이 개발되고 있으며, 이와 더불어 그것들에 대한 시장 지배력을 갖기 위한 지식 재산권의 행사나 특허등록의 중요성이 높아지고 있어 국내는 물론 해외에서의 특허출원이 증가하고 있다. 이에 따라, 심사관 1인당 처리해야 할 특허 처리 건수가 해마다 많아지고 있어 선행기술조사에 소비되는 시간과 비용이 점점 증가하고 있는 실정이다. 본 연구는 다수의 해외특허 우선권 주장 시 동일 우선권 주장 특허문서 간 유사도를 계산하여 심사관 및 특허 출원인이 유사문서를 우선 검토 할 수 있도록 함으로써 심사 시간과 비용을 줄이고자 하였다. 이를 위해, 본 연구에서는 비정형 특허 문서의 데이터를 전처리 후 LDA 토픽 모델링과 Word2vec을 활용하여 특허 문서 간 유사도를 구하고, 이 유사도 점수가 높은 순으로 검토 문서를 우선 추천하는 유사 특허 추천 모델을 제안하였다. 3단계의 모델 생성과정을 통해 만들어진 모델을 사용하여 재현율 95%로 높은 결과를 보였다. 본 연구에서 제안한 모델을 통해, 심사관은 효율적으로 선행기술에 대한 조사가 가능해지며, 심사 수행 중 유사하다고 판단된 특허문서에 대한 심사 이력을 신속하게 참고할 수 있어 업무 부담감을 줄이고 심사풀질을 향상시킬 수 있을 것으로 기대된다.

목차

요약
Ⅰ. 서론
1.1 연구의 배경
1.2 연구의 목적
1.3 연구의 범위
Ⅱ. 관련 연구
2.1 특허
2.2 Vector Space Model
2.3 Word Embedding
2.4 Perceptrons
2.5 Word2vec
2.6 LDA(Latent Dirichlet Allocation)
2.7 선행연구와의 차별점
Ⅲ. 모델 생성
3.1 데이터 수집
3.2 데이터 전처리
3.3 모델 선택
Ⅳ. 모델 적용
Ⅴ. 결론
참고문헌
Abstract

키워드

특허문서 유사 특허문서 추천 LDA 토픽모델링 Text mining Word2vec Patent Document Similar Patent Document LDA Topic Modeling Text Mining Word2vec

저자

  • 이앞길 [ Apgil Lee | 한밭대학교 경영학과 박사과정 ]
  • 최근호 [ Keunho Choi | 한밭대학교 경영회계학과 조교수 ]
  • 김건우 [ Gunwoo Kim | 한밭대학교 경영회계학과 부교수 ] 교신저자

참고문헌

자료제공 : 네이버학술정보

간행물 정보

발행기관

  • 발행기관명
    한국경영정보학회 [The Korea Society of Management information Systems]
  • 설립연도
    1989
  • 분야
    사회과학>경영학
  • 소개
    이 학회는 경영정보학의 연구 및 교류를 촉진하고 학문의 발전과 응용에 공헌함을 목적으로 합니다.

간행물

  • 간행물명
    경영정보학연구 [Information Systems Review]
  • 간기
    계간
  • pISSN
    2982-6551
  • eISSN
    2982-6837
  • 수록기간
    1999~2026
  • 등재여부
    KCI 등재
  • 십진분류
    KDC 325 DDC 658

이 권호 내 다른 논문 / 경영정보학연구 제22권 제1호

    피인용수 : 0(자료제공 : 네이버학술정보)

    함께 이용한 논문 이 논문을 다운로드한 분들이 이용한 다른 논문입니다.

      페이지 저장