基于潜在语义分析的随机分块文本检索算法

赵亚慧; 金小峰; 崔荣一

216.73.217.178

개인회원 가입

개인회원
기관회원

개인회원 로그인

개인회원 가입으로 더욱 편리하게 이용하세요. 개인회원 가입

아이디/비밀번호를 잊으셨나요? 아이디/비밀번호 찾기

기관회원 로그인

소속기관에서 검색되지 않는 기관은 무료원문다운이 불가능합니다. 개인회원 가입 후 유료구매를 하시거나 소속기관 도서관에 이용문의해 주세요.

Home

基于潜在语义分析的随机分块文本检索算法
Random Blocking Text Retrieval Algorithm Based on Latent Semantic Analysis
기우잠재어의분석적수궤분괴문본검색산법

발행기관

한국어정보학회 바로가기
간행물

한국어정보학 바로가기
통권

제11권 2호 (2009.12)바로가기
페이지

pp.112-116
저자

赵亚慧, 金小峰, 崔荣一
언어

중국어(CHI)
URL

https://www.earticle.net/Article/A121373

※ 기관로그인 시 무료 이용이 가능합니다.
※ 학술발표대회집, 워크숍 자료집 중 4페이지 이내 논문은 '요약'만 제공되는 경우가 있으니, 구매 전에 간행물명, 페이지 수 확인 부탁 드립니다.

4,000원

원문정보

초록

영어: A fast text retrieval algorithm using the idea of random blocking for massive‐content text based on
Latent Semantic Analysis is proposed in this paper. Firstly, by fully considering the correlation between terms, retrieve and massive‐content text are represented in lower‐dimensional space and the model is improved using the way of singular value decomposition. Secondly, a random blocking query method is used for the retrieval of paragraphs which take the cosine similarity as the fitness function between the retrieve and massive‐content text and then the candidate paragraphs are output when there similarity value are higher than threshold. Experiments show that the proposed method has high performance in text retrieval by considering the semantic information fully and can achieve text retrieval quickly.

중국어: 本文基于潜在语义分析技术提出了一种对大容量文本进行随机分块的快速文本检索算法。首先，充分考虑了词项之间的相关性，在低维空间中表示待检索文本的各个段落与检索文本，利用奇异值分解方法模型对其进行了改进；其次，利用随机分块检索算法，以检索文本和待检索文本各段落之间的余弦相似度作为适应度函数进行检索，将相似度超过阈值的候选段落输出；通过对实验结果分析，本文算法充分考虑文本语义信息，检索效果较好，能够实现快速文本检索。

摘要
Abstract
0. 引言
1. 设计方案
2. 关键技术的实现
  2.1 分词
  2.2 文本表示
  2.3 潜在语义索引LSI）与奇异值分解方法(SVD)
3. 基于潜在语义分析的随机分块文本检索算法
4. 实验结果及分析
  4.1 实验过程
  4.2 实验结果评估指标
  4.3 结果与分析
5. 结束语
参考文献

키워드

Text Information Retrieval VSM LSA Random Blocking Retrieval Algorithm 文本信息检索向量空间模型潜在语义分析随机分块检索算法

저자

赵亚慧 [ 조아혜 | China 133002 延吉延边大学工学院计算机科学与技术系智能信息处理研究室 ]
金小峰 [ 김소봉 | China 133002 延吉延边大学工学院计算机科学与技术系智能信息处理研究室 ]
崔荣一 [ 최영일 | China 133002 延吉延边大学工学院计算机科学与技术系智能信息处理研究室 ]

참고문헌

자료제공 : 네이버학술정보

간행물 정보

발행기관

발행기관명

한국어정보학회 [Korean Language Information Science Society]
설립연도
1990
분야
인문학>언어학
소개
학술적인 연구를 통하여 국어정보처리에 관련된 이론 체계를 정립하고, 산업계와의 긴밀한 협동을 통하여 정보처리 기술을 향상 시키면서 정보산업의 성장을 돕고, 대중적인 교육과 홍보를 통하여 발전된 정보 처리의 기술을 보급하므로써 국어의 문화적 가치를 높히고 국어정보 처리 기술의 국제적 지위향상과 표준화에 기여하고자 합니다.

간행물

간행물명

한국어정보학 [韓國語情報學]
간기
반년간
pISSN
2005-1891
수록기간
1999~2019
십진분류
KDC 706 DDC 406

이 권호 내 다른 논문 / 한국어정보학 제11권 2호

피인용수 : 0건 (자료제공 : 네이버학술정보)

함께 이용한 논문 이 논문을 다운로드한 분들이 이용한 다른 논문입니다.

출처 : 네이버학술정보

0개의 논문이 장바구니에 담겼습니다.

페이지 저장

소속기관 조회

이용자님의 소속기관(단체)이 서비스에 가입되어 있는지 확인해 보십시오.
기관회원에 소속되어 있는 이용자는 원문을 무료로 이용할 수 있습니다.

상호: 주식회사 학술교육원 I 대표: 노방용 I 사업자등록번호: 122-81-88227 I 통신판매업신고번호: 제2008-인천부평-00176호 I 정보보호책임자: 이두영
주소: (21319)인천광역시 부평구 영성중로 50 미래타워 701호 I 전화: 0505-555-0740 I 팩스: 0505-555-0741 I 이메일: earticle@earticle.net

음성지원 및 돋보기 서비스

Earticle

基于潜在语义分析的随机分块文本检索算法
Random Blocking Text Retrieval Algorithm Based on Latent Semantic Analysis
기우잠재어의분석적수궤분괴문본검색산법

원문정보

초록

목차

키워드

저자

참고문헌

간행물 정보

발행기관

간행물

이 권호 내 다른 논문 / 한국어정보학 제11권 2호

피인용수 : 0건 (자료제공 : 네이버학술정보)

함께 이용한 논문 이 논문을 다운로드한 분들이 이용한 다른 논문입니다.

Earticle

基于潜在语义分析的随机分块文本检索算法 Random Blocking Text Retrieval Algorithm Based on Latent Semantic Analysis 기우잠재어의분석적수궤분괴문본검색산법

원문정보

초록

목차

키워드

저자

참고문헌

간행물 정보

발행기관

간행물

이 권호 내 다른 논문 / 한국어정보학 제11권 2호

피인용수 : 0건 (자료제공 : 네이버학술정보)

함께 이용한 논문 이 논문을 다운로드한 분들이 이용한 다른 논문입니다.

基于潜在语义分析的随机分块文本检索算法
Random Blocking Text Retrieval Algorithm Based on Latent Semantic Analysis
기우잠재어의분석적수궤분괴문본검색산법