검색 기능은 준비 중입니다.
검색 기능은 준비 중입니다.

The original paper is in English. Non-English content has been machine-translated and may contain typographical errors or mistranslations. ex. Some numerals are expressed as "XNUMX".
Copyrights notice

The original paper is in English. Non-English content has been machine-translated and may contain typographical errors or mistranslations. Copyrights notice

Fast Algorithms for k-Word Proximity Search 빠른 알고리즘 k- 단어 근접 검색

Kunihiko SADAKANE, Hiroshi IMAI

  • 조회수

    0

  • 이것을 인용

요약 :

우리는 방대한 양의 문서를 검색할 때 검색 결과를 좁히기 위해 여러 개의 키워드를 지정하고 결합 쿼리를 사용하는 경우가 많습니다. 검색된 문서에는 모든 키워드가 포함되어 있지만 일반적으로 키워드의 위치는 고려되지 않습니다. 결과적으로 검색 결과에는 의미 없는 문서가 일부 포함되어 있습니다. 따라서 문서 내 키워드의 근접성에 따라 문서 순위를 매기는 것이 효과적입니다. 이 순위는 일종의 텍스트 데이터 마이닝으로 간주됩니다. 본 논문에서는 주어진 키워드가 모두 인접한 위치에 나타나는 문서를 찾는 두 가지 알고리즘을 제안합니다. 하나는 평면 ​​스윕 알고리즘을 기반으로 하고 다른 하나는 분할 정복 접근 방식을 기반으로 합니다. 두 알고리즘 모두에서 실행됩니다. O(n 기록 n) 시간 n 주어진 키워드의 발생 횟수입니다. 우리는 대규모 HTML 파일 모음에 대해 알고리즘을 실행하고 그 효과를 확인합니다.

발행
IEICE TRANSACTIONS on Fundamentals Vol.E84-A No.9 pp.2311-2318
발행일
2001/09/01
공개일
온라인 ISSN
DOI
원고의 종류
PAPER
범주
알고리즘 및 데이터 구조

작성자

키워드