Results (
Indonesian) 2:
[Copy]Copied!
 
aku aku aku. Gunakan konstan global untuk mengisi nilai yang hilang 
iv. Gunakan atribut berarti untuk mengisi nilai yang hilang 
v. Gunakan atribut berarti untuk semua sampel 
milik. Kelas yang sama 
vi.Use nilai yang paling mungkin untuk mengisi missing 
value 
b) Data Bising: 
i. Binning 
ii. Clustering 
iii. Regresi 
c) Data yang tidak konsisten 
2) Integrasi Data dan Transformasi Data 
a) Integrasi data 
b) Transformasi data 
i.Smoothing 
ii.Aggregation 
iii.Generalization 
iv.Normalization 
v. Atribut konstruksi 
pengurangan 3) Data 
a) Data kubus agregasi 
b) atribut bagian pilihan 
c) pengurangan Dimensi. 
D) Data Sampling. 
E) pengurangan Numerosity 
f) Discretization dan hirarki konsep generasi 
1) DATA PEMBERSIH 
data dunia nyata cenderung secara lengkap, berisik dan tidak konsisten 
membersihkan DATA rutinitas mencoba untuk mengisi nilai-nilai yang hilang, 
menghaluskan suara sementara mengidentifikasi outliers, dan benar 
inkonsistensi dalam data [2]. 
a) Cara untuk menangani nilai-nilai yang hilang: 
a. Abaikan tupel: ini biasanya dilakukan ketika label kelas 
hilang. Metode ini sangat tidak efektif, kecuali tuple 
berisi beberapa atribut dengan nilai-nilai yang hilang. Hal ini terutama 
miskin ketika persentase nilai yang hilang per atribut 
bervariasi. 
B. Isikan nilai yang hilang secara manual: pendekatan ini adalah waktu 
memakan dan mungkin tidak layak diberi data yang besar set dengan 
nilai-nilai yang hilang. 
C. Gunakan konstan global untuk mengisi nilai yang hilang: mengganti semua 
nilai atribut hilang oleh konstan yang sama, seperti label seperti 
"tidak diketahui". jika nilai yang hilang diganti dengan, mengatakan tidak diketahui 
maka program pertambangan mungkin keliru berpikir bahwa mereka membentuk 
sebuah konsep menarik, karena mereka semua memiliki nilai umum - 
yang dari "tidak diketahui". Oleh karena itu, meskipun metode ini sederhana, itu 
tidak mudah.
Being translated, please wait..
