Rabu, 27 Agustus 2014

Tahapan Dalam Data Mining

Inilah Tahapan-Tahapan  Dalam Data Mining

Pada tahapan Data mining akan diuraikan tahap-tahap umum dari data mining tapi perlu diingat sebelum seorang analis menerapkan tahapan-tahapan data mining tersebut, sebagai prasyarat penerapan data mining, diperlukan pemahaman terhadap data dan proses diperolehnya data tersebut. Berikut tahapan dalam data mining.

1. Basis Data Relasional
Saat ini, hampir semua Data bisnis disimpan dalam basis data relasional. Sebuah model basis data relasional dibangun dari serangkaian tabel, setiap tabel disimpansebagai sebuah file. Sebuah tabel relasional terdiri dari baris dan kolom. Kebanyakan model basis data relasional saat ini dibangun diatas lingkungan OLTP. OLTP (Online Transaction Processing ) adalah tipe akses yang digunakan oleh bisnis yang membutuhkan transaksi konkuren dalam jumlah besar. Bentuk data yang tersimpandalam basis data relasional inilah yang dapat diolah oleh sistem Data mining. 

2. Ekstraksi Data
Data-data yang dikumpulkan dalam proses transaksi seringkali ditempatkan pada lokasi yang berbeda-beda. Maka dari itu dibutuhkan kemampuan dari sistem utuk dapat mengumpulkan data dengan cepat. Jika data tersebut disimpan dalam kantor regional, seringkali data tersebut diupload ke sebuah server yang lebih terpusat. Ini bias dilakukan secara harian, mingguan, atau bulanan tergantung jumlah data, keamanandan biaya. Data dapat diringkas dulu sebelum dikirimkan ke tempat penyimpanan pusat.Sebagai contoh, sebuah toko perangkat keras mungkin mengirim data yang menunjukanbahwa 10 rol kabel telah terjual pada hari ini oleh karyawan nomer 10 dibandingpengiriman data detail transaksi. 

3. Transformasi Data
Transformasi data melakukan peringkasan data dengan mengasumsikan bahwa data telah tersimpan dalam tempat penyimpanan tunggal. Pada langkah terakhir, data telah diekstrak dari banyak basis data ke dalam basis data tunggal. Tipe peringkasan yang dikerjakan dalam langkah ini mirip dengan peringkasan yang dikerjakan selama tahap ekstraksi. Beberapa perusahaan memilih untuk memangkas data dalam sebuah tempat penyimpanan tunggal. Fungsi fungsi Agregate yang sering digunakan antara lain. 

4. Pembersihan Data
Data-data yang telah terkumpul selanjutnya akan mengalami proses pembersihan. Proses pembersihan data dilakukan untuk membuang record yang keliru, menstandarkan attribut-attribut, merasionalisasi struktur data, dan mengendalikan data yang hilang. Data yang tidak konsisten dan banyak kekeliruan membuat hasil Data mining tidak akurat. Adalah sangat penting untuk membuat data konsisten dan seragam. Pembersihan data juga dapat membantu perusahaan untuk mengkonsolidasikan record. ini sangatberguna ketika sebuah perusahaan mempunyai banyak record untuk seorang pelanggan. Setiap record atau file pelanggan mempunyai nomor pelanggan yang sama, tetapi informasi dalam tiap filenya berbeda. 

5. Bentuk Standar
Selanjutnya setelah data mengalami proses pembersihan maka data ditransfer kedalam bentuk standar. Bentuk standar adalah bentuk data yang akan diakses olehalgoritma Data mining. Bentuk standar ini biasanya dalam bentuk spreadsheet like. Bentuk spreadsheet bekerja dengan baik karena baris merepresentasikan kasus dan kolom merepresentasikan feature. 

6. Reduksi Data dan Feature
Setelah data berada dalam bentuk standar spreadsheet perlu dipertimbangkan untuk mereduksi jumlah feature. Ada beberapa alasan untuk mengurangi jumlah feature dalam spreadsheet kita. Sebuah bank mungkin mempunyai ratusan feature ketika hendak memprediksi resiko kredit. Hal ini berarti perusahaan mempunyai data dalam jumlah yang sangat besar. Bekerja dengan data sebanyak ini membuat algoritma prediksi menurun kinerjanya. 

7. Menjalankan Algoritma
Setelah semua proses diatas dikerjakan, maka algoritma data mining sudah siap untukdijalankan.