Results (
Indonesian) 2:
[Copy]Copied!
d. Gunakan atribut berarti untuk mengisi nilai yang hilang:
Sebagai contoh, anggaplah bahwa pendapatan rata-rata AllElectronics
pelanggan adalah $ 28,000.Use nilai ini untuk mengganti nilai yang hilang untuk
pendapatan.
E. Gunakan atribut berarti untuk semua sampel milik sama
kelas sebagai tuple yang diberikan: Misalnya, jika mengklasifikasi pelanggan
menurut risiko kredit, mengganti nilai yang hilang dengan
nilai rata-rata pendapatan bagi pelanggan di risiko kredit yang sama
kategori seperti yang dari yang diberikan tuple.
f. Menggunakan nilai yang paling mungkin untuk mengisi nilai yang hilang: ini
dapat ditentukan dengan regresi, alat berbasis inferensi menggunakan
formalisme Bayesian, atau pohon keputusan induksi. Misalnya,
menggunakan pelanggan lain atribut dalam set data Anda, Anda mungkin
membangun pohon keputusan untuk memprediksi nilai-nilai yang hilang untuk
pendapatan.
B) Data Bising
"Apa kebisingan?" Kebisingan adalah kesalahan acak atau varians dalam
variabel yang diukur. Mengingat atribut numerik seperti, katakanlah,
harga, bagaimana bisa kita "halus" keluar data untuk menghilangkan kebisingan?
Mari kita lihat data berikut teknik smoothing.
a. Binning metode: [1] metode Binning halus data
diurutkan. Nilai dengan berkonsultasi dengan "lingkungan", atau nilai-nilai di sekitarnya
Nilai yang diurutkan didistribusikan ke sejumlah "ember", atau
sampah. Karena metode binning berkonsultasi lingkungan
nilai-nilai, mereka melakukan smoothing lokal. Gambar menggambarkan beberapa
teknik Binning. Dalam contoh ini, data harga yang pertama
diurutkan dan kemudian dibagi menjadi sampah sama-frekuensi ukuran 3
(yaitu, setiap bin berisi 3 nilai). Di smoothing dengan cara bin,
setiap nilai dalam bin diganti dengan nilai rata-rata sampah.
Sebagai contoh, rata-rata nilai 4, 8, dan 15 di Bin 1 adalah 9.
Oleh karena itu, setiap nilai asli di bin ini digantikan oleh
nilai 9. Demikian pula, smoothing oleh median bin dapat digunakan,
di mana setiap nilai bin digantikan oleh median bin. Di
smoothing oleh batas-batas bin, minimum dan maksimum
nilai dalam sebuah bin diberikan diidentifikasi sebagai batas bin.
Setiap nilai bin kemudian diganti dengan nilai batas terdekat.
Secara umum, semakin besar lebar, semakin besar efek dari
smoothing. Atau, sampah mungkin sama-lebar, di mana
rentang interval nilai pada masing-masing bin adalah konstan.
Tidak sangat mudah.
Being translated, please wait..
