14 Definisi Data Mining Beserta Latar Belakang, Proses Dan Tekniknya Lengkap

Posted on

Definisi Data Mining

Data mining atau penggalian data merupakan proses yang memperkerjakan satu atau lebih teknik (pola) pembelajaran komputer untuk mengekstraksi serta  menganalisis suatu pengetahuan dengan cara otomatis. Definisi lain ialah pembelajaran berbasis induksi (induction-based learning) merupakan proses pembentukan definisi konsep umum yang dilakukan dengan cara mengobservasi contoh spesifik dari konsep-konsep yang akan dipelajari. Knoeledge Discovery in Database (KDD) merupakan sebuah penerapan metode saintifik pada data mining. Dalam konteks ini data mining adalah satu langkah dari proses KDD.

Data mining mempunyai beberapa nama alternatif, walaupun  definisi eksaknya berbeda, sperto KDD, analisis pola, arkeologi data, intelegensia bisnis, serta pemanenan informasi. Data mining diperlukan pada saat data tersedia terlalu banyak (contohnya data yang didapat dari sistem basis data perusahaan, e-commerce, data bionformatika, serta data saham), namun tidak tahu pola apa yang bisa didapatkan.

Latar Belakang dari Data Mining

Perkembangan yang sangat pesat pada bidang pengumpulan data serta teknologi penyimpanan di berbagai bidang, yang dapat menghasilkan basis data yang terlalu besar. Tetapi, data yang sudah dikumpulkan jarang dilihat lagi, sebab terlalu panjang, membosankan, serta tidak menarik. Sering, keputusan yang katanya berdasarkan data- bibuat tidak lagi berdasarkand ata, namun dari intuisi para pembuat keputusan, sehingga, lahirlah cabang ilmu penggalian data tersebut.

Analisis data tanpa memakai otomasi dari penggalian data merupakan hal yang tidak memungkinkan lagi, jika 1) data terlalu banyak 2) dimensionalitas data terlalu besar, 3) data terlampau kompleks untuk dianalisis manual ( contohnya: data time series, data spatiotemporal, data multimedia, data streams).

Proses Pencarian Pola

Penggalian data adalah salah satu bagian dari proses pencarian pola. Berikut ini urutan proses pencarian pola:

loading...
  1. Pembersihan Data: yaitu menghapus data pengganggu (noise) dan mengisi data yang hilang.
  2. Integrasi Data: yaitu menggabungkan berbagai sumber data.
  3. Pemilihan Data: yaitu memilih data yang relevan.
  4. Transformasi Data: yaitu mentransformasi data ke dalam format untuk diproses dalam penggalian data.
  5. Penggalian Data: yaitu menerapkan metode cerdas untuk ekstraksi pola.
  6. Evaluasi pola: yaitu mengenali pola-pola yang menarik saja.
  7. Penyajian pola: yaitu memvisualisasi pola ke pengguna.
Definisi Data Mining
Definisi Data Mining

Teknik Penggalian data

Pada dasarnya, fungsi data mining dibagi menjadi dua, yaitu deskripsi dan prediksi. Berikut ini beberapa fungsi data mining yang sering digunakan:

  1. Karakterisasi : yaitu menggeneralisasi, meringkas, dan karakteristik data yang kontras.
  2. Penggalian mengulangi pola: pola pencarian asosiasi (asosiasi aturan) atau pola intra-transaksi, atau pola pembelian yang terjadi dalam satu transaksi.
  3. Klasifikasi: yaitu untuk mengembangkan model yang dapat mengklasifikasikan obyek berdasarkan atributnya. kelas Target sudah tersedia dalam data sebelumnya, sehingga fokusnya adalah bagaimana mempelajari data yang ada untuk mengklasifikasikan sendiri klasifikator.
  4. Prediksi: yang memprediksi nilai yang tidak diketahui atau nilai yang hilang, menggunakan model klasifikasi.
  5. Pengguguran analisis / Cluster: bahwa kelompok berbagai objek data berdasarkan kesamaan. kelas target tidak tersedia dalam data sebelumnya, sehingga fokusnya adalah untuk memaksimalkan intraclass kesamaan dan meminimalkan kemiripan antara kelas.
  6. Analisis outlier: proses pengenalan data yang tidak konsisten dengan perilaku umum data lainnya. Contoh: mengenali suara dan pengecualian dalam data.
  7. Analisis tren dan evolusi: termasuk analisis regresi, penggalian pola sekuensial, analisis periodisitas, dan analisis berdasarkan kemiripan.

Proses Interaktif Dan Interatif

Data mining merupakan sebuah proses interaktif serta interatif untuk mendapatkan sebuah pola atau model baru yang sudah sempurna, bermanfaat serta dapat dimengerti dalam suatu database yang sangat besar (mossive database).

  1. Sempurna : Bisa digeneralisasi untuk masa yang akan datang.
  2. Baru: Apa yang sedang tidak diketahui
  3. Bermanfaat: Dapat dipakai untuk melakukan sebuah tindakan
  4. Interaktif: Memerlukan interaksi manusia dalam prosesnya.
  5. Iteratif: Memerlukan sejumlah proses yang berulang

Data mining berisi pencarian trend atau pola yang dimau dalam database besar untuk membantu pengembalian keputusan diwaktu yang akan datang. Model atau pola ini dikenali oleh perangkat tertentu yang dapat memberikan suatu analisa data yang bermanfaat serta berwawasan yang kemudian dapat dikaji atau dipelajari dengan lebih teliti, yang mungkin saja memakai perangkat pendukung keputusan yang lainnya.

Demikian Penjelasan Tentang 14 Definisi Data Mining Beserta Latar Belakang, Proses Dan Tekniknya Lengkap Semoga Bermanfaat Untuk Semua Pembaca GuruPendidikan.Com 😀


No ratings yet.

Please rate this