검색 기능은 준비 중입니다.
검색 기능은 준비 중입니다.

The original paper is in English. Non-English content has been machine-translated and may contain typographical errors or mistranslations. ex. Some numerals are expressed as "XNUMX".
Copyrights notice

The original paper is in English. Non-English content has been machine-translated and may contain typographical errors or mistranslations. Copyrights notice

Translation of Untranslatable Words -- Integration of Lexical Approximation and Phrase-Table Extension Techniques into Statistical Machine Translation 번역할 수 없는 단어의 번역 - 어휘 근사치 및 구문표 확장 기술을 통계적 기계 번역에 통합

Michael PAUL, Karunesh ARORA, Eiichiro SUMITA

  • 조회수

    0

  • 이것을 인용

요약 :

본 논문에서는 기존의 구문 기반 통계기계번역(SMT) 시스템을 사용하여 번역할 수 없는 OOV(Out of Vocabulary) 단어를 처리하는 방법을 제안합니다. 특정 OOV 단어에 대해 어휘 근사 기술을 사용하여 훈련 데이터에서 발생하는 철자 및 굴절 단어 변형을 식별합니다. 그러면 소스 문장의 모든 OOV 단어가 훈련 코퍼스에서 찾은 적절한 단어 변형으로 대체되어 입력의 OOV 단어 수가 줄어듭니다. 또한, 이러한 단어 번역의 적용 범위를 늘리기 위해 원래 구문 테이블에 단일 단어 항목이 없지만 문맥에만 나타나는 모든 소스 언어 단어에 대해 새로운 구문 번역을 추가하여 SMT 번역 모델을 확장합니다. 더 큰 문구. 힌디어를 영어, 중국어, 일본어로 번역하기 위해 제안된 방법의 효율성을 조사합니다.

발행
IEICE TRANSACTIONS on Information Vol.E92-D No.12 pp.2378-2385
발행일
2009/12/01
공개일
온라인 ISSN
1745-1361
DOI
10.1587/transinf.E92.D.2378
원고의 종류
Special Section PAPER (Special Section on Natural Language Processing and its Applications)
범주
기계 번역

작성자

키워드