Results (
Indonesian) 1:
[Copy]Copied!
Pengetahuan penemuan kerangkaBab ini akan menjelaskan berbagai langkah analisis dan teknikdigunakan. Kita akan mengikuti kerangka kerja untuk penemuan pengetahuan dalam database (KDD)tugas-tugas yang dijelaskan oleh Tan et al. [3]:Untuk tugas-tugas pertambangan data, input data biasanya besar dalam ukuran, yaitu terdiridari banyak pengamatan, banyak variabel, atau keduanya. Hubungan antarapengamatan dan atribut sering tidak diketahui. Kadang-kadang, data adalah diformat yang tidak segera tunduk kepada analisis numerik, misalnya,input data mungkin terdiri dari kamera gambar. Dalam kebanyakan kasus, data saat inibentuk tidak akan mampu menjawab pertanyaan penelitian.Langkah preprocessing menyiapkan data mentah untuk analisis efisien. Langkah ini mungkintermasuk berbagai proses yang diperlukan, seperti fitur ekstraksi, yaitu generasivariabel terus menerus atau diskrit yang berguna dari input; pengurangan dimensi,atau transformasi dimensi tinggi data ke dalam jumlah yang lebih rendah baruvariabel; pilihan fitur, atau membuang tidak informatif variabel untuk meningkatkanakurasi dan kinerja sementara tetap mempertahankan lain dalam dimensi asli merekadan unit; normalisasi, atau transformasi data varians nol berarti dan unit untuk analisis lebih tidak bias; atau subsetting. Berguna lainnya proses tidakdisebutkan oleh Tan et al. bisa dapat melakukan data cleaning, menggabungkan data dari beberapasumber, dan tuduhan, rekonstruksi lengkap masukan data untuk nantiGunakan dengan algoritma numerik atau statistik yang memerlukan data lengkap matriks.Penggalian data secara luas dapat dibagi menjadi dua kategori. Salah satunya deskriptifpemodelan, mana tujuan adalah untuk mengungkap hubungan, pola dan kelompokhadir dalam data. Yang lainnya adalah model prediktif, mana tujuan adalah untuk memprediksibeberapa atribut yang menggunakan atribut lainnya. Prediksi bisa baik mengambil bentukklasifikasi mana pengamatan diperkirakan akan menjadi anggota dari dua atau lebihset yang ditentukan atau kelas, atau regresi yang mana variabel terus-menerus diperkirakan.Akhirnya, hasil dari langkah pertambangan data opsional menjadi postprocessed.Output sering divisualisasikan, ditafsirkan, mengubah, atau disaring untuk fokus padabidang minat.Hasil dari proses adalah informasi. Perbedaan utama antara informasi dan data mentah adalah bahwa informasi yang terstruktur, diringkas, dansegera berguna untuk pengambilan keputusan.
Being translated, please wait..
