검색 기능은 준비 중입니다.
검색 기능은 준비 중입니다.

The original paper is in English. Non-English content has been machine-translated and may contain typographical errors or mistranslations. ex. Some numerals are expressed as "XNUMX".
Copyrights notice

The original paper is in English. Non-English content has been machine-translated and may contain typographical errors or mistranslations. Copyrights notice

Imbalanced Data Over-Sampling Method Based on ISODATA Clustering ISODATA 클러스터링 기반 불균형 데이터 오버샘플링 방법

Zhenzhe LV, Qicheng LIU

  • 조회수

    0

  • 이것을 인용

요약 :

클래스 불균형은 머신러닝 분야에서 직면한 과제 중 하나입니다. 기존 분류기는 소수 클래스 데이터를 예측하기가 어렵습니다. 불균형한 데이터를 처리하지 않으면 분류기의 효과가 크게 감소합니다. 기존 분류기가 다수 클래스 데이터에 치중하고 소수 클래스 데이터를 무시하는 문제를 해결하기 위해 반복적 자기 조직화 데이터 분석 기술 알고리즘(ISODATA) 클러스터링을 기반으로 한 불균형 데이터 오버샘플링 방법을 제안한다. 소수 클래스는 ISODATA에 따라 서로 다른 하위 클러스터로 나뉘며 각 하위 클러스터는 샘플링 비율에 따라 오버 샘플링되므로 샘플링된 소수 클래스 데이터도 원래 소수 클래스 데이터의 불균형을 따릅니다. 새로운 소수 클래스 데이터와 다수 클래스 데이터로 구성된 새로운 불균형 데이터는 SVM과 Random Forest 분류기를 통해 분류됩니다. KEEL 데이터 세트의 12개 데이터 세트에 대한 실험에서는 이 방법이 더 나은 G-평균과 F-값을 가지며 분류 정확도가 향상됨을 보여줍니다.

발행
IEICE TRANSACTIONS on Information Vol.E106-D No.9 pp.1528-1536
발행일
2023/09/01
공개일
2023/06/12
온라인 ISSN
1745-1361
DOI
10.1587/transinf.2022EDP7190
원고의 종류
PAPER
범주
인공지능, 데이터마이닝

작성자

Zhenzhe LV
  Yantai University
Qicheng LIU
  Yantai University

키워드