Results (
Indonesian) 1:
[Copy]Copied!
Penting untuk menyadari bahwa teknik ini tidak dapat meyakinkan menentukannilai tes kesalahan, karena itu akan memerlukan akses ke aktual klasifikasi ditetapkan tes, sementara hanya pelatihan set tersedia. Namun, merekadapat memberikan perkiraan kesalahan diharapkan tes. [7: 7,12] Sementara ini adalah yang terbaikperkiraan kami dapat membuat, kita harus tetap waspada untuk kejutan yang mungkin timbuldalam praktek.Tuning modelUntuk setiap model, ada satu atau lebih hyperparameters, yaitu parameter padamodel level, yang mempengaruhi struktur internal model dan cara itudilatih. Sebagai contoh, dalam jaringan saraf, kita dapat memilih jumlah internalnode. Hyperparameters ini sering mempengaruhi ketepatan model; Jadi, kamiharus mencari yang optimal set hyperparameters. Kita dapat melakukan ini dengan pelatihanbeberapa model dan membandingkan memperkirakan cross-divalidasi kesalahan mereka. Ini adalahdisebut tuning model atau model parameter tuning.Untuk mengatasi masalah DMC, kita memilih model yang terbaik dengan meminimalkan dua yang berbedaperkiraan kesalahan: pertama, kesalahan biner tes default ketika memberikan kelas binerPrediksi (yaitu hanya 'order' atau 'tidak ada order'); kedua, DMC menguji kesalahan yang menggunakanfungsi kesalahan berdasarkan diperkirakan probabilitas sebagaimana ditentukan oleh DMC [2] danseperti yang diberikan dalam persamaan 2.1. Dengan mempertimbangkan perbedaan linier antara diamatihasil (nomor 0 atau 1) dan diperkirakan kemungkinan, mengambil kesalahan DMCmempertimbangkan bahwa kita bisa mengirimkan sebagai prediksi kemungkinan bahwa order akan««««ditempatkan, yaitu nilai dari 0 ke 1.errDMC = Xsaya| orderi − predictioni | (2.1)Perhatikan bahwa kesalahan DMC sejumlah kesalahan untuk semua pengamatan; oleh karena ituini juga tergantung pada jumlah pengamatan. Untuk kelompok menghasilkan hanyaPrediksi biner, kesalahan DMC adalah jumlah kesalahan pada tespengamatan. Kami akan memberikan kesalahan DMC maupun biner dimana tepat.Biasanya, akurasi diberikan sebagai pecahan nilai antara 0 dan 1. Untuk membuatbermakna perbandingan antara dua kesalahan perkiraan, kita mendefinisikan ukuran akurasi DMC jadi itu, misalnya, errDMC berarti per observasi 0.3akan mengakibatkan accDMC 0,7:accDMC =n − errDMCn(2.2)Dengan metode evaluasi yang diuraikan, sekarang kita akan membahas prediksimodel yang digunakan. Untuk hasil evaluasi model bila diterapkan ke berbagaimodel, lihat bagian 3.4.4.2.5.2 hutan acakAcak hutan adalah model prediksi populer dan serbaguna. Hutan acakalgoritma didasarkan pada pohon keputusan. Sebuah pohon keputusan adalah model prediksi yang lebih tua.Untuk memahami acak hutan, kita pertama harus mencakup pohon keputusan.Pohon-pohon keputusanSebuah pohon keputusan dibuat dari data pelatihan oleh iteratively membelah pelatihanpengamatan ke subkumpulan atau cabang-cabang pohon. Untuk setiap node pohon internal,kondisi Split dibuat pada nilai fitur (misalnya usia > 50). Thealgoritma mencoba untuk menemukan perpecahan yang menciptakan Pembagian administratif yang paling 'murni'data, yaitu perpecahan mengarah ke sub-kelompok yang paling membedakan pengamatan kekelas. [3: 4.3.2] Ada banyak algoritma untuk tumbuh sebuah pohon keputusan, sepertisebagai ID3, C4.5, C5.0, KERANJANG, dan MARS. [7: 9.2]Kami akan menggambarkan hasil dengan membangun sebuah pohon keputusan yang menggunakan pohon RPaket [8]. Sebagai rangkaian pelatihan, kami menggunakan set data Iris terkenal Fisher [9], yangberisi pengukuran pada berbagai bunga Iris, serta spesies mereka (setosa,versicolor, atau Crassostrea). Untuk kejelasan dan merencanakan lebih mudah, kami hanya akan menggunakan duamenghadirkan fitur di data set: kelopak panjang dan lebar kelopak. Kita akan menggunakanFitur ini untuk memprediksi jenis bunga.Seperti dapat dilihat pada gambar 2.3, algoritma pohon keputusan menghasilkan modeluntuk data yang sederhana dan mudah untuk menafsirkan. Membuat prediksi untuk barupengamatan dari model dilakukan dengan memulai pada akar pohon, kemudianiteratively bergerak turun cabang yang cocok dengan fitur pengamatan.Pada akhirnya, kami berakhir di sebuah node sehelai daun pohon. Node daun diberi labeldengan kelas yang kita akan memprediksi.
Being translated, please wait..
