Results (
Indonesian) 2:
[Copy]Copied!
 
d. Gunakan atribut berarti untuk mengisi nilai yang hilang: 
Sebagai contoh, anggaplah bahwa pendapatan rata-rata AllElectronics 
pelanggan adalah $ 28,000.Use nilai ini untuk mengganti nilai yang hilang untuk 
pendapatan. 
E. Gunakan atribut berarti untuk semua sampel milik sama 
kelas sebagai tuple yang diberikan: Misalnya, jika mengklasifikasi pelanggan 
menurut risiko kredit, mengganti nilai yang hilang dengan 
nilai rata-rata pendapatan bagi pelanggan di risiko kredit yang sama 
kategori seperti yang dari yang diberikan tuple. 
f. Menggunakan nilai yang paling mungkin untuk mengisi nilai yang hilang: ini 
dapat ditentukan dengan regresi, alat berbasis inferensi menggunakan 
formalisme Bayesian, atau pohon keputusan induksi. Misalnya, 
menggunakan pelanggan lain atribut dalam set data Anda, Anda mungkin 
membangun pohon keputusan untuk memprediksi nilai-nilai yang hilang untuk 
pendapatan. 
B) Data Bising 
"Apa kebisingan?" Kebisingan adalah kesalahan acak atau varians dalam 
variabel yang diukur. Mengingat atribut numerik seperti, katakanlah, 
harga, bagaimana bisa kita "halus" keluar data untuk menghilangkan kebisingan? 
Mari kita lihat data berikut teknik smoothing. 
a. Binning metode: [1] metode Binning halus data 
diurutkan. Nilai dengan berkonsultasi dengan "lingkungan", atau nilai-nilai di sekitarnya 
Nilai yang diurutkan didistribusikan ke sejumlah "ember", atau 
sampah. Karena metode binning berkonsultasi lingkungan 
nilai-nilai, mereka melakukan smoothing lokal. Gambar menggambarkan beberapa 
teknik Binning. Dalam contoh ini, data harga yang pertama 
diurutkan dan kemudian dibagi menjadi sampah sama-frekuensi ukuran 3 
(yaitu, setiap bin berisi 3 nilai). Di smoothing dengan cara bin, 
setiap nilai dalam bin diganti dengan nilai rata-rata sampah. 
Sebagai contoh, rata-rata nilai 4, 8, dan 15 di Bin 1 adalah 9. 
Oleh karena itu, setiap nilai asli di bin ini digantikan oleh 
nilai 9. Demikian pula, smoothing oleh median bin dapat digunakan, 
di mana setiap nilai bin digantikan oleh median bin. Di 
smoothing oleh batas-batas bin, minimum dan maksimum 
nilai dalam sebuah bin diberikan diidentifikasi sebagai batas bin. 
Setiap nilai bin kemudian diganti dengan nilai batas terdekat. 
Secara umum, semakin besar lebar, semakin besar efek dari 
smoothing. Atau, sampah mungkin sama-lebar, di mana 
rentang interval nilai pada masing-masing bin adalah konstan. 
Tidak sangat mudah.
Being translated, please wait..
