Results (
Indonesian) 2:
[Copy]Copied!
1) DATA PEMBERSIHAN 
data dunia nyata cenderung secara lengkap, berisik dan tidak konsisten. pembersihan data rutinitas mencoba untuk mengisi nilai-nilai yang hilang, menghaluskan suara sementara mengidentifikasi outliers, dan benar 
inkonsistensi dalam data [2]. 
a) Cara untuk menangani nilai-nilai yang hilang: 
a. Abaikan tupel: ini biasanya dilakukan ketika label kelas hilang. Metode ini sangat tidak efektif, kecuali tuple berisi beberapa atribut dengan nilai-nilai yang hilang. Hal ini terutama 
miskin ketika persentase nilai yang hilang per atribut bervariasi. 
B. Isikan nilai yang hilang secara manual: pendekatan ini memakan waktu dan mungkin tidak layak diberi data yang besar dengan nilai-nilai yang hilang. 
C. Gunakan konstan global untuk mengisi nilai yang hilang: mengganti semua nilai atribut hilang oleh konstan yang sama, seperti label seperti "tidak diketahui". jika nilai yang hilang diganti dengan, mengatakan tidak diketahui 
maka program pertambangan mungkin keliru berpikir bahwa mereka membentuk sebuah konsep menarik, karena mereka semua memiliki nilai umum - yang dari "tidak diketahui". Oleh karena itu, meskipun metode ini sederhana, itu 
tidak mudah.
Being translated, please wait..
