Results (
Indonesian) 2:
[Copy]Copied!
aku aku aku. Gunakan konstan global untuk mengisi nilai yang hilang
iv. Gunakan atribut berarti untuk mengisi nilai yang hilang
v. Gunakan atribut berarti untuk semua sampel
milik. Kelas yang sama
vi.Use nilai yang paling mungkin untuk mengisi missing
value
b) Data Bising:
i. Binning
ii. Clustering
iii. Regresi
c) Data yang tidak konsisten
2) Integrasi Data dan Transformasi Data
a) Integrasi data
b) Transformasi data
i.Smoothing
ii.Aggregation
iii.Generalization
iv.Normalization
v. Atribut konstruksi
pengurangan 3) Data
a) Data kubus agregasi
b) atribut bagian pilihan
c) pengurangan Dimensi.
D) Data Sampling.
E) pengurangan Numerosity
f) Discretization dan hirarki konsep generasi
1) DATA PEMBERSIH
data dunia nyata cenderung secara lengkap, berisik dan tidak konsisten
membersihkan DATA rutinitas mencoba untuk mengisi nilai-nilai yang hilang,
menghaluskan suara sementara mengidentifikasi outliers, dan benar
inkonsistensi dalam data [2].
a) Cara untuk menangani nilai-nilai yang hilang:
a. Abaikan tupel: ini biasanya dilakukan ketika label kelas
hilang. Metode ini sangat tidak efektif, kecuali tuple
berisi beberapa atribut dengan nilai-nilai yang hilang. Hal ini terutama
miskin ketika persentase nilai yang hilang per atribut
bervariasi.
B. Isikan nilai yang hilang secara manual: pendekatan ini adalah waktu
memakan dan mungkin tidak layak diberi data yang besar set dengan
nilai-nilai yang hilang.
C. Gunakan konstan global untuk mengisi nilai yang hilang: mengganti semua
nilai atribut hilang oleh konstan yang sama, seperti label seperti
"tidak diketahui". jika nilai yang hilang diganti dengan, mengatakan tidak diketahui
maka program pertambangan mungkin keliru berpikir bahwa mereka membentuk
sebuah konsep menarik, karena mereka semua memiliki nilai umum -
yang dari "tidak diketahui". Oleh karena itu, meskipun metode ini sederhana, itu
tidak mudah.
Being translated, please wait..
