Earticle

현재 위치 Home

개인맞춤 추천 및 복용가이드 서비스를 위한 건강기능식품 상품정보 수집 시스템 설계
Design of Product Information Collection System for Personalized Recommendation and Dose Guide Service of Health Functional Food

첫 페이지 보기
  • 발행기관
    국제차세대융합기술학회 바로가기
  • 간행물
    차세대융합기술학회논문지 KCI 등재후보 바로가기
  • 통권
    제4권 5호 (2020.10)바로가기
  • 페이지
    pp.453-463
  • 저자
    손봉기
  • 언어
    한국어(KOR)
  • URL
    https://www.earticle.net/Article/A383392

※ 기관로그인 시 무료 이용이 가능합니다.

4,200원

원문정보

초록

영어
We need product information(e.g. containing ingredient, content, dose guide, etc.) for providing personalized recommendation and dose guide service to users who lack technical expertise in health functional food. However, almost shopping malls represent detailed product information as mixture of atypical texts, text images and images. And this cause limit in crawling several types of information in shopping malls. In this paper, we propose and implement a system that collects detailed product information in various shopping malls consisting of atypical texts and text images by applying text mining and image analysis technique. Through the experiment of the proposed system, it was confirmed that more than 99% of atypical texts was extracted and more than 93% of text images. In addition, the recognition rate was 97% by correcting the error-extraction of the open source OCR engine used to convert text images into digital text. The proposed system can be used to extract meaningful information from web-based shopping malls provided in various types.
한국어
건강기능식품에 대한 전문지식이 부족한 사용자에게 개인맞춤 추천 및 복용가이드 서비스를 제공하기 위 해서는 개인 특성정보뿐만 아니라 함유성분, 함유량, 복용방법 등의 상세한 상품정보가 필요하다. 하지만 대부분의 건강기능식품 쇼핑몰이 상품정보를 비정형 텍스트, 텍스트 이미지, 영상이 혼합된 형태로 제공하고 있어, 다양한 형태의 정보 수집에 한계가 있다. 이 논문에서는 다수의 쇼핑몰을 대상으로 텍스트 마이닝과 영상분석 기술을 이 용하여 비정형 텍스트와 텍스트 이미지 형태로 제공되는 상품 상세정보를 수집할 수 있는 시스템을 제안하고 구 현한다. 제안 시스템의 실험을 통해, 텍스트 형태의 상품정보는 99%이상 추출하고, 텍스트 이미지 형태의 상품정 보는 93%이상 수집하는 것을 확인하였다. 또한, 텍스트 이미지를 디지털 텍스트로 변환하기 위해 사용한 오픈소 스 OCR 엔진의 오추출을 교정하여 인식률 97%를 기록하였다. 제안한 시스템은 다양한 형태로 제공되는 웹기반 쇼핑몰에서 의미있는 정보 추출에 활용될 수 있다.

목차

요약
Abstract
Ⅰ. 서론
Ⅱ. 관련 연구
2.1 건기식 추천 및 복용가이드 서비스
2.2 건기식 쇼핑몰 상품정보 형태 분석
Ⅲ. 제안 시스템 설계
3.1 시스템 구성
3.2 건기식 크롤러 설계
3.3 텍스트 마이너 설계
3.4 이미지 마이너 설계
3.5 데이터베이스 설계
Ⅳ. 시스템 구현 및 평가
4.1 구현 환경
4.2 구현 결과
4.3 시스템 평가
Ⅴ. 결론
REFERENCES

키워드

건강기능식품 상품정보 텍스트 마이닝 이미지 마이닝 광학문자인식 정보 메타데이터 Health Functional Food Product Information Text Mining Image Mining OCR (Optical Character Recognition) Information Metadata

저자

  • 손봉기 [ Bongl-Ki Son | 서원대학교 컴퓨터공학과 교수 ] Corresponding Author

참고문헌

자료제공 : 네이버학술정보

간행물 정보

발행기관

  • 발행기관명
    국제차세대융합기술학회 [International Next-generation Convergence technology Association]
  • 설립연도
    2017
  • 분야
    복합학>기술정책
  • 소개
    Ever since next generation convergence technology became one of the most important industries in the nation, computing professionals have encountered a growing number of challenges. Along with scholars and colleagues in related fields, they have gathered in avariety of forums and meetings over the last few decades to share their knowledge, experiences and the outcome of their research. These exchanges have led to the founding of the International Next-generation Convergence technology (INCA) on December 1, 2015. INCA was registered as an incorporated association under the Ministry of Information and Communications. The main purpose of the organization is to improve our society by achieving the highest capability possible in next generation convergence technology.

간행물

  • 간행물명
    차세대융합기술학회논문지 [The Journal of Next-generation Convergence Technology Association]
  • 간기
    월간
  • pISSN
    2508-8270
  • 수록기간
    2017~2026
  • 등재여부
    KCI 등재
  • 십진분류
    KDC 506 DDC 606

이 권호 내 다른 논문 / 차세대융합기술학회논문지 제4권 5호

    피인용수 : 0(자료제공 : 네이버학술정보)

    함께 이용한 논문 이 논문을 다운로드한 분들이 이용한 다른 논문입니다.

      페이지 저장