Results (
Indonesian) 2:
[Copy]Copied!
b
dirata-ratakan Akurasi:
Rand Statistik:
Folkes dan Mallows Indeks:
Dalam Bagian IV dan Bagian V, kita akan menggunakan DF, TC, TVQ dan
TV metode untuk mengurangi dimensi fitur empat
dataset: FBlS, REI, TR45 dan TR41. Kemudian klaster validitas
kriteria akan digunakan untuk mengevaluasi efek dari fitur ini
metode seleksi.
A. Dataset
kinerja klasifikasi Teks bervariasi pada berbagai
dataset. Jadi kami memilih empat dataset teks yang berbeda untuk mengevaluasi
kinerja metode seleksi fitur. The
karakteristik berbagai koleksi dokumen yang digunakan dalam kami
percobaan dirangkum dalam Tabel 1.
Data yang mengatur FBlS adalah dari Broadcast Luar Negeri Informasi
Data Jasa dari TREC-5 [16]. Data set REI adalah dari Reuters-
21.578 teks koleksi tes kategorisasi Distribusi 1.0 [17].
Data set TR45 dan TR4 1 yang berasal dari TREC-6
koleksi. Untuk semua set data, kami menggunakan stop-daftar untuk menghapus
kata-kata umum, dan kata-kata itu berasal menggunakan Porter
akhiran-stripping algoritma [18].
Being translated, please wait..
