검색 기능은 준비 중입니다.
검색 기능은 준비 중입니다.

The original paper is in English. Non-English content has been machine-translated and may contain typographical errors or mistranslations. ex. Some numerals are expressed as "XNUMX".
Copyrights notice

The original paper is in English. Non-English content has been machine-translated and may contain typographical errors or mistranslations. Copyrights notice

Monotone Increasing Binary Similarity and Its Application to Automatic Document-Acquisition of a Category 모노톤 증가 이진 유사성 및 카테고리 자동 문서 획득에의 적용

Izumi SUZUKI, Yoshiki MIKAMI, Ario OHSATO

  • 조회수

    0

  • 이것을 인용

요약 :

주어진 짧은 텍스트로 동일한 카테고리의 문서를 획득하는 기술을 도입합니다. 주어진 텍스트를 트레이닝 문서로 간주하여 시스템은 문서 도메인(또는 전체 웹) 중에서 가장 유사한 문서, 또는 충분히 유사한 문서를 마크업합니다. 그런 다음 시스템은 표시된 문서를 훈련 세트에 추가하여 세트를 학습하고 더 이상 표시되는 문서가 없을 때까지 이 프로세스를 반복합니다. 단조롭게 증가하는 속성을 학습하면서 유사도로 설정하면 시스템은 1) 더 이상 표시할 문서가 남지 않도록 올바른 타이밍을 감지하고 2) 분류기가 사용하는 임계값을 결정할 수 있습니다. 또한 어떤 용어의 가중치를 가중치의 p-norm으로 나누는지에 대한 정규화 과정이 제한된다는 조건에서 훈련 문서를 이진 방식으로 인덱싱하는 선형 분류기는 단조 증가 특성을 만족하는 유일한 인스턴스이다. . 제안된 기법의 타당성은 웹에서 무작위로 선택된 영어 및 독일어 문서를 사용하여 이진 유사성 검사를 통해 확인되었습니다.

발행
IEICE TRANSACTIONS on Information Vol.E91-D No.11 pp.2545-2551
발행일
2008/11/01
공개일
온라인 ISSN
1745-1361
DOI
10.1093/ietisy/e91-d.11.2545
원고의 종류
Special Section PAPER (Special Section on Knowledge, Information and Creativity Support System)
범주
지식 습득

작성자

키워드