Results (
Indonesian) 2:
[Copy]Copied!
masing-masing. Kami juga melakukan percobaan menggunakan k tradisional - berarti algoritma untuk perbandingan. Berikut nilai-nilai k ditetapkan untuk jumlah cluster, yang 27 dan 229, masing-masing, untuk COR¬PUS-1 dan CORPUS-2, masing-masing. Nilai-nilai S menggunakan k-cara yang 0,21 dan 0,35 untuk-CORPUS 1 dan CORPUS-2, masing-masing. Hal ini jelas bahwa SOM melebihi k-cara dalam percobaan kami.
Kami melakukan proses evaluasi lainnya untuk membuktikan effec¬tiveness dari KCM. Karena KCM mengungkapkan kata kunci tematik penting terjadi di set mendasari halaman Web, kita harus memastikan bahwa kata kunci tersebut benar-benar penting dalam halaman Web tersebut. Umumnya pentingnya kata kunci dapat diukur dengan jumlah kejadian, yaitu frekuensi istilah (tf), dalam dokumen. Oleh karena itu, kita dapat mengukur frekuensi jangka rata dari ki kata kunci di KCM sebagai berikut: X 1 TFI ¼ TFI; j; jKij dj2Ki mana TFI; j 2 D0; 1th adalah frekuensi jangka dinormalisasi dari ki di dokumen-ment dj dan Ki adalah himpunan dokumen yang berlabel ke neu¬ron sama ki. Kami kemudian menghitung nilai rata-rata TFI atas semua kata kunci dalam KCM. Ketika nilai rata-rata ini mendekati 1, kita harus mempertimbangkan ini kata kunci diidentifikasi penting dalam dokumen yang mendasari mereka. Dalam percobaan kami, nilai rata-rata adalah 0,59 dan 0,67 untuk CORPUS-1 dan CORPUS-2, masing-masing. Hal ini diffi¬cult untuk menilai kebaikan hasilnya. Jadi kita dihitung nilai dasar-line untuk perbandingan dengan mengganti setiap kata kunci dalam KCM dengan kata kunci yang dipilih secara acak. Nilai-nilai dasar untuk COR¬PUS-1 dan CORPUS-2 kemudian 0,21 dan 0,23, masing-masing. Kami
Being translated, please wait..