Earticle

현재 위치 Home

기술

Database metadata standardization processing model using web dictionary crawling
웹 사전 크롤링을 이용한 데이터베이스 메타데이터 표준화 처리 모델

첫 페이지 보기
  • 발행기관
    한국디지털정책학회 바로가기
  • 간행물
    디지털융복합연구 KCI 등재 바로가기
  • 통권
    제19권 제9호 (2021.09)바로가기
  • 페이지
    pp.209-215
  • 저자
    Hana Jeong, Koo-Rack Park, Young-suk Chung
  • 언어
    영어(ENG)
  • URL
    https://www.earticle.net/Article/A399824

※ 기관로그인 시 무료 이용이 가능합니다.

4,000원

원문정보

초록

영어
Data quality management is an important issue these days. Improve data quality by providing consistent metadata. This study presents algorithms that facilitate standard word dictionary management for consistent metadata management. Algorithms are presented to automate synonyms management of database metadata through web dictionary crawling. It also improves the accuracy of the data by resolving homonym distinction issues that may arise during the web dictionary crawling process. The algorithm proposed in this study increases the reliability of metadata data quality compared to the existing passive management. It can also reduce the time spent on registering and managing synonym data. Further research on the new data standardization partial automation model will need to be continued, with a detailed understanding of some of the automatable tasks in future data standardization activities.
한국어
데이터 품질 관리는 최근 중요한 이슈로 자리잡았다. 데이터베이스의 메타데이터 표준화는 데이터 품질관리 방안 중 하나이다. 본 연구에서는 일관된 메타데이터 관리를 위하여 표준단어사전 관리를 지원하는 알고리즘을 제시한 다. 해당 알고리즘은 웹 사전 크롤링을 통해 데이터베이스 메타데이터의 동의어 관리 자동화를 지원한다. 또한 웹 사전 크롤링 과정에서 생길 수 있는 동음이의어 판별 이슈를 해결하여 데이터의 정확도를 향상시킨다. 본 연구에서 제안하는 알고리즘은 기존의 수동적 관리에 비해 메타데이터 데이터 품질의 신뢰도를 높인다. 또한 이음동의어 데이터 등록 및 관리에 소비되는 시간을 단축시킬 수 있다. 새로운 데이터 표준화 부분 자동화 모델에 대한 추가 연구는 향후 데이터 표준화 프로세스에서 자동화 가능한 작업을 파악하여 진행되어야 한다.

목차

Abstract
요약
1. Introduction
2. Related Works
2.1 Database metadata standardization
2.2 Database metadata standardization
3. Proposed Method
3.1 Proposed model diagram
3.2 Process for database metadata synonyms using Web dictionaries
3.3 Synonyms crawl using Web dictionaries
3.4 Database structure
4. Results and Discussion
5. Conclusion
REFERENCES

키워드

데이터표준화 데이터 품질관리 웹 크롤러 데이터베이스 메타데이터 Data standardization Data quality management Web crawler Database Metadata.

저자

  • Hana Jeong [ 정하나 | Doctoral Student, Department of Computer Engineering, Kongju National University ]
  • Koo-Rack Park [ 박구락 | Professor, Department of Computer Engineering, Kongju National University ] Corresponding Author
  • Young-suk Chung [ 정영석 | Doctor, Department of Computer Engineering, Kongju National University ]

참고문헌

자료제공 : 네이버학술정보

간행물 정보

발행기관

  • 발행기관명
    한국디지털정책학회 [The Society of Digital Policy & Management]
  • 설립연도
    2003
  • 분야
    복합학>과학기술학
  • 소개
    디지털기술 및 산업정책, 디지털경제, 관련 산업의 연구, 전자정부, 디지털정치에 관한 제도적, 정책적 연구, 디지털경영, 전자상거래, e-비즈니스에 관한 실용적 연구, 학술연구지 발간 및 학술대회 개최 등을 통하여 디지털경제 및 디지털경영에 관련되는 국가정책 분야의 연구 및 교류를 촉진하고 국가 및 기업 정보화와 디지털산업의 발전에 공헌한다.

간행물

  • 간행물명
    디지털융복합연구 [Journal of Digital Convergence]
  • 간기
    계간
  • pISSN
    2713-6434
  • eISSN
    2713-6442
  • 수록기간
    2003~2026
  • 등재여부
    KCI 등재후보
  • 십진분류
    KDC 569 DDC 620

이 권호 내 다른 논문 / 디지털융복합연구 제19권 제9호

    피인용수 : 0(자료제공 : 네이버학술정보)

    함께 이용한 논문 이 논문을 다운로드한 분들이 이용한 다른 논문입니다.

      페이지 저장