Knowledge discovery frameworkThis c

Knowledge discovery framework
This chapter will describe the various steps of the analysis and the techniques
used. We will follow the framework for knowledge discovery in databases (KDD)
tasks described by Tan et al. [3]:
For data mining tasks, the input data is usually large in size, i.e. it consists
of many observations, many variables, or both. The relationships between
observations and attributes are often not known. Sometimes, the data is in a
format that does not immediately yield to numerical analysis, for instance, the
input data might consist of camera images. In most cases, the data in its current
form will not be able to answer the research question.
A preprocessing step readies the raw data for efficient analysis. This step might
include various necessary processes, such as feature extraction, i.e. the generation
of useful continuous or discrete variables from the input; dimensionality reduction,
or the transformation of high-dimensional data into a lower number of new
variables; feature selection, or throwing away uninformative variables to improve
accuracy and performance while retaining others in their original dimensions
and units; normalization, or the transformation of data to zero mean and unit variance for more unbiased analysis; or subsetting. Other useful processes not
mentioned by Tan et al. could be data cleaning, combining data from several
sources, and imputation, the reconstruction of incomplete input data for later
use with numerical or statistical algorithms that require full data matrices.
Data mining can broadly be divided into two categories. One is descriptive
modeling, where the goal is to uncover relationships, patterns, and clusters
present in the data. The other is predictive modeling, where the goal is to predict
some attribute using other attributes. Prediction can either take the form of
classification where an observation is predicted to be a member of two or more
pre-defined sets or classes, or regression where a continuous variable is estimated.
Finally, the results from the data mining step can optionally be postprocessed.
The output is often visualized, interpreted, transformed, or filtered to focus on
areas of interest.
The result of the process is information. The key difference between information and raw data is that the information is structured, summarized, and
immediately useful for decision making.

0/5000

From: -

To: -

Results (Indonesian) 1: [Copy]

Copied!

Pengetahuan penemuan kerangkaBab ini akan menjelaskan berbagai langkah analisis dan teknikdigunakan. Kita akan mengikuti kerangka kerja untuk penemuan pengetahuan dalam database (KDD)tugas-tugas yang dijelaskan oleh Tan et al. [3]:Untuk tugas-tugas pertambangan data, input data biasanya besar dalam ukuran, yaitu terdiridari banyak pengamatan, banyak variabel, atau keduanya. Hubungan antarapengamatan dan atribut sering tidak diketahui. Kadang-kadang, data adalah diformat yang tidak segera tunduk kepada analisis numerik, misalnya,input data mungkin terdiri dari kamera gambar. Dalam kebanyakan kasus, data saat inibentuk tidak akan mampu menjawab pertanyaan penelitian.Langkah preprocessing menyiapkan data mentah untuk analisis efisien. Langkah ini mungkintermasuk berbagai proses yang diperlukan, seperti fitur ekstraksi, yaitu generasivariabel terus menerus atau diskrit yang berguna dari input; pengurangan dimensi,atau transformasi dimensi tinggi data ke dalam jumlah yang lebih rendah baruvariabel; pilihan fitur, atau membuang tidak informatif variabel untuk meningkatkanakurasi dan kinerja sementara tetap mempertahankan lain dalam dimensi asli merekadan unit; normalisasi, atau transformasi data varians nol berarti dan unit untuk analisis lebih tidak bias; atau subsetting. Berguna lainnya proses tidakdisebutkan oleh Tan et al. bisa dapat melakukan data cleaning, menggabungkan data dari beberapasumber, dan tuduhan, rekonstruksi lengkap masukan data untuk nantiGunakan dengan algoritma numerik atau statistik yang memerlukan data lengkap matriks.Penggalian data secara luas dapat dibagi menjadi dua kategori. Salah satunya deskriptifpemodelan, mana tujuan adalah untuk mengungkap hubungan, pola dan kelompokhadir dalam data. Yang lainnya adalah model prediktif, mana tujuan adalah untuk memprediksibeberapa atribut yang menggunakan atribut lainnya. Prediksi bisa baik mengambil bentukklasifikasi mana pengamatan diperkirakan akan menjadi anggota dari dua atau lebihset yang ditentukan atau kelas, atau regresi yang mana variabel terus-menerus diperkirakan.Akhirnya, hasil dari langkah pertambangan data opsional menjadi postprocessed.Output sering divisualisasikan, ditafsirkan, mengubah, atau disaring untuk fokus padabidang minat.Hasil dari proses adalah informasi. Perbedaan utama antara informasi dan data mentah adalah bahwa informasi yang terstruktur, diringkas, dansegera berguna untuk pengambilan keputusan.

Being translated, please wait..

Results (Indonesian) 2:[Copy]

Copied!

Being translated, please wait..

Results (Indonesian) 3:[Copy]

Copied!

Being translated, please wait..

Other languages

The translation tool support: Afrikaans, Albanian, Amharic, Arabic, Armenian, Azerbaijani, Basque, Belarusian, Bengali, Bosnian, Bulgarian, Catalan, Cebuano, Chichewa, Chinese, Chinese Traditional, Corsican, Croatian, Czech, Danish, Detect language, Dutch, English, Esperanto, Estonian, Filipino, Finnish, French, Frisian, Galician, Georgian, German, Greek, Gujarati, Haitian Creole, Hausa, Hawaiian, Hebrew, Hindi, Hmong, Hungarian, Icelandic, Igbo, Indonesian, Irish, Italian, Japanese, Javanese, Kannada, Kazakh, Khmer, Kinyarwanda, Klingon, Korean, Kurdish (Kurmanji), Kyrgyz, Lao, Latin, Latvian, Lithuanian, Luxembourgish, Macedonian, Malagasy, Malay, Malayalam, Maltese, Maori, Marathi, Mongolian, Myanmar (Burmese), Nepali, Norwegian, Odia (Oriya), Pashto, Persian, Polish, Portuguese, Punjabi, Romanian, Russian, Samoan, Scots Gaelic, Serbian, Sesotho, Shona, Sindhi, Sinhala, Slovak, Slovenian, Somali, Spanish, Sundanese, Swahili, Swedish, Tajik, Tamil, Tatar, Telugu, Thai, Turkish, Turkmen, Ukrainian, Urdu, Uyghur, Uzbek, Vietnamese, Welsh, Xhosa, Yiddish, Yoruba, Zulu, Language translation.