웹 크롤링 이용한 크레페 검색 시스템 설계

김효종; 한군희; 신승수

216.73.217.75

개인회원 가입

개인회원
기관회원

개인회원 로그인

개인회원 가입으로 더욱 편리하게 이용하세요. 개인회원 가입

아이디/비밀번호를 잊으셨나요? 아이디/비밀번호 찾기

기관회원 로그인

소속기관에서 검색되지 않는 기관은 무료원문다운이 불가능합니다. 개인회원 가입 후 유료구매를 하시거나 소속기관 도서관에 이용문의해 주세요.

Home

기술

웹 크롤링 이용한 크레페 검색 시스템 설계
Crepe Search System Design using Web Crawling

발행기관

한국디지털정책학회 바로가기
간행물

디지털융복합연구 KCI 등재 바로가기
통권

제15권 제11호 (2017.11)바로가기
페이지

pp.261-269
저자

김효종, 한군희, 신승수
언어

한국어(KOR)
URL

https://www.earticle.net/Article/A313984

※ 기관로그인 시 무료 이용이 가능합니다.

4,000원

원문정보

초록

영어: The purpose of this paper is to provide a search system using a method of accessing the web in real time without using a database server in order to guarantee the up-to-date information in a single network, rather than using a plurality of bots connected by a wide area network Design. The method of the research is to design and analyze the system which can search the person and keyword quickly and accurately in crepe system. In the crepe server, when the user registers information, the body tag matching conversion process stores all the information as it is, since various styles are applied to each user, such as a font, a font size, and a color. The crepe server does not cause a problem of body tag matching. However, when executing the crepe retrieval system, the style and characteristics of users can not be formalized. This problem can be solved by using the html_img_parser function and the Go language html parser package. By applying queues and multiple threads to a general-purpose web crawler, rather than a web crawler design that targets a specific site, it is possible to utilize a multiplier that quickly and efficiently searches and collects various web sites in various applications.

한국어: 본 연구의 목적은 광역 네트워크로 연결된 다수의 봇을 활용한 방식이 아닌 단일 네트워크에서 정보의 최신성을 보장하기 위해 데이터베이스 서버를 사용하지 않고 실시간으로 웹에 접속하여 정보를 불러오는 방식을 사용한 검색 시스템 을 설계하는 것이다. 연구의 방법은 크레페 시스템에서 신속하고 정확한 인물과 키워드 검색을 할 수 있는 시스템을 설계하 고 분석한다. 크레페 서버는 본문 태그 매칭 변환 과정은 사용자가 정보를 등록할 경우 글자체, 글자 크기, 색상등과 같이 사용자마다 여러 스타일이 적용되어 그 자체가 정보가 되기 때문에 모든 정보를 그대로 저장하게 된다. 크레페 서버는 본문 태그 매칭 문제점이 발생되지 않는다. 그러나 크레페 검색 시스템을 실행할 때에는 사용자들의 스타일 및 특성을 정형 화할 수 없다. 이러한 문제점을 html_img_parser 함수와 Go언어의 html 파서 패키지를 사용하면 해결할 수 있다. 특정 사이트를 대상으로 하는 웹 크롤러 설계가 아닌 범용 웹 크롤러에 큐와 다중 스레드를 적용하여 다양한 웹 사이트를 빠르고 효율적으로 탐색, 수집한 빅 데이터를 다양한 응용 분야에 활용될 수 있을 것이다.

요약
Abstract
1. 서론
2. 관련연구
  2.1 디지털 큐레이션
  2.2 크레페 시스템
  2.3 웹 크롤러
3. 크레페 검색 시스템
  3.1 시스템 구성
  3.2 검색 시스템 설계
  3.3 Crawler Module
4. 분석
  4.1 구현 환경
  4.2 웹 크롤링 분석
  4.3 검색 시스템 분석
5. 결론
REFERENCES

키워드

디지털 큐레이션 콘텐츠 웹 크롤러 검색 시스템 키워드 검색 모듈 Digital Curation Contents Web Crawler Search system Keyword search Module

저자

김효종 [ Hyo-Jong Kim | 동명대학교 정보보보학과 ]
한군희 [ Kun-Hee Han | 백석대학교 정보통신학부 ]
신승수 [ Seung-Soo Shin | 동명대학교 정보보보학과 ] Corresponding author

참고문헌

자료제공 : 네이버학술정보

간행물 정보

발행기관

발행기관명

한국디지털정책학회 [The Society of Digital Policy & Management]
설립연도
2003
분야
복합학>과학기술학
소개
디지털기술 및 산업정책, 디지털경제, 관련 산업의 연구, 전자정부, 디지털정치에 관한 제도적, 정책적 연구, 디지털경영, 전자상거래, e-비즈니스에 관한 실용적 연구, 학술연구지 발간 및 학술대회 개최 등을 통하여 디지털경제 및 디지털경영에 관련되는 국가정책 분야의 연구 및 교류를 촉진하고 국가 및 기업 정보화와 디지털산업의 발전에 공헌한다.

간행물

간행물명

디지털융복합연구 [Journal of Digital Convergence]
간기
계간
pISSN
2713-6434
eISSN
2713-6442
수록기간
2003~2026
등재여부
KCI 등재후보
십진분류
KDC 569 DDC 620

이 권호 내 다른 논문 / 디지털융복합연구 제15권 제11호

피인용수 : 0건 (자료제공 : 네이버학술정보)

함께 이용한 논문 이 논문을 다운로드한 분들이 이용한 다른 논문입니다.

출처 : 네이버학술정보

0개의 논문이 장바구니에 담겼습니다.

페이지 저장

소속기관 조회

이용자님의 소속기관(단체)이 서비스에 가입되어 있는지 확인해 보십시오.
기관회원에 소속되어 있는 이용자는 원문을 무료로 이용할 수 있습니다.

상호: 주식회사 학술교육원 I 대표: 노방용 I 사업자등록번호: 122-81-88227 I 통신판매업신고번호: 제2008-인천부평-00176호 I 정보보호책임자: 이두영
주소: (21319)인천광역시 부평구 영성중로 50 미래타워 701호 I 전화: 0505-555-0740 I 팩스: 0505-555-0741 I 이메일: earticle@earticle.net

음성지원 및 돋보기 서비스

Earticle

웹 크롤링 이용한 크레페 검색 시스템 설계
Crepe Search System Design using Web Crawling

원문정보

초록

목차

키워드

저자

참고문헌

간행물 정보

발행기관

간행물

이 권호 내 다른 논문 / 디지털융복합연구 제15권 제11호

피인용수 : 0건 (자료제공 : 네이버학술정보)

함께 이용한 논문 이 논문을 다운로드한 분들이 이용한 다른 논문입니다.

Earticle

웹 크롤링 이용한 크레페 검색 시스템 설계 Crepe Search System Design using Web Crawling

원문정보

초록

목차

키워드

저자

참고문헌

간행물 정보

발행기관

간행물

이 권호 내 다른 논문 / 디지털융복합연구 제15권 제11호

피인용수 : 0건 (자료제공 : 네이버학술정보)

함께 이용한 논문 이 논문을 다운로드한 분들이 이용한 다른 논문입니다.

웹 크롤링 이용한 크레페 검색 시스템 설계
Crepe Search System Design using Web Crawling