√ 14 Pengertian Data Mining, Fungsi, Proses, Tahapan Dan Tekniknya

Diposting pada

√ 14 Pengertian Data Mining, Fungsi, Proses, Tahapan Dan Tekniknya

Definisi Data Mining

  • Data mining atau penggalian data merupakan proses yang memperkerjakan satu atau lebih teknik (pola) pembelajaran komputer untuk mengekstraksi serta  menganalisis suatu pengetahuan dengan cara otomatis. Definisi lain ialah pembelajaran berbasis induksi (induction-based learning) merupakan proses pembentukan definisi konsep umum yang dilakukan dengan cara mengobservasi contoh spesifik dari konsep-konsep yang akan dipelajari. Knoeledge Discovery in Database (KDD) merupakan sebuah penerapan metode saintifik pada data mining. Dalam konteks ini data mining adalah satu langkah dari proses KDD.

 

  • Data mining mempunyai beberapa nama alternatif, walaupun  definisi eksaknya berbeda, sperto KDD, analisis pola, arkeologi data, intelegensia bisnis, serta pemanenan informasi. Data mining diperlukan pada saat data tersedia terlalu banyak (contohnya data yang didapat dari sistem basis data perusahaan, e-commerce, data bionformatika, serta data saham), namun tidak tahu pola apa yang bisa didapatkan.

Latar Belakang dari Data Mining

Perkembangan yang sangat pesat pada bidang pengumpulan data serta teknologi penyimpanan di berbagai bidang, yang dapat menghasilkan basis data yang terlalu besar. Tetapi, data yang sudah dikumpulkan jarang dilihat lagi, sebab terlalu panjang, membosankan, serta tidak menarik. Sering, keputusan yang katanya berdasarkan data- bibuat tidak lagi berdasarkand ata, namun dari intuisi para pembuat keputusan, sehingga, lahirlah cabang ilmu penggalian data tersebut.

Baca Juga :  Sejarah Terbentuknya Tentara Nasional Indonesia Menurut Ahli Sejarah

Analisis data tanpa memakai otomasi dari penggalian data merupakan hal yang tidak memungkinkan lagi, jika 1) data terlalu banyak 2) dimensionalitas data terlalu besar, 3) data terlampau kompleks untuk dianalisis manual ( contohnya: data time series, data spatiotemporal, data multimedia, data streams).


Proses Pencarian Pola

Penggalian data adalah salah satu bagian dari proses pencarian pola. Berikut ini urutan proses pencarian pola:

  1. Pembersihan Data: yaitu menghapus data pengganggu (noise) dan mengisi data yang hilang.
  2. Integrasi Data: yaitu menggabungkan berbagai sumber data.
  3. Pemilihan Data: yaitu memilih data yang relevan.
  4. Transformasi Data: yaitu mentransformasi data ke dalam format untuk diproses dalam penggalian data.
  5. Penggalian Data: yaitu menerapkan metode cerdas untuk ekstraksi pola.
  6. Evaluasi pola: yaitu mengenali pola-pola yang menarik saja.
  7. Penyajian pola: yaitu memvisualisasi pola ke pengguna.
√ 14 Pengertian Data Mining, Fungsi, Proses, Tahapan Dan Tekniknya
Definisi Data Mining

Konsep Data Mining

√ 14 Pengertian Data Mining, Fungsi, Proses, Tahapan Dan Tekniknya
Konsep Data Mining

Data Mining merupakan bagian yang terintegrasi dari Knowledge Discovery in Databases (KDD). Bertujuan untuk proses transformasi data mentah menjadi informasi berguna.

Jika di gambarkan secara detail tahapan KDD menjadi 5 tahap. Berikut Tahapannya :

1. Seleksi

Bertujuan mentransformasikan data mentah ke format yang sesuai untuk analisis. Terdiri atas proses seleksi fitur, reduksi dimensionalitas, normalisasi dan subsetting data. Proses penyeleksian atau segmentasi data menurut beberapa criteria. Misal, Orang – orang yang mempunyai mobil.

2. Preprocessing

Bertujuan untuk menjamin bahwa hasil proses data mining yang diintegrasikan pada system penunjang keputusan, benar-benar hasil yang valid. Proses pembersihan data, dimana informasi yang tidak dibutuhkan dibuang. Misal, Jenis kelamin pasien untuk analisis kehamilan.

Data dikonfigurasi ulang untuk memastikan format yang konsisten karena berasal dari berbagai sumber. Misal, Jenis kelamin disimpan dengan bentuk f atau m dan 1 atau 0.

Baca Juga :  Pasar Uang : Pengertian, Instrumen, Dan Jenis Beserta Perbedaannya Secara Lengkap

3. Transformasi

Proses transformasi sehingga data menjadi berguna dan dapat ditelusuri.

4. Data Mining

Proses yg berfokus pada ekstraksi pola-pola data. Pola dapat didefinisikan sebagai sekumpulan fakta-fakta (data) F, bahasa L, dan beberapa measure of certainty (pengukuran kepastian) C.
Suatu pola dinyatakan S dalam L menggambarkan keterhubungan antara subset Fs dari F dengan kepastian c dimana S adalah simpel dibandingkan perhitungan semua fakta dalam Fs.

5. Interpretasi & Evaluasi

Pola diidentifikasi sistem, lalu diinterpretasikan sebagai pengetahuan yg dapat digunakan untuk mendukung pengambilan keputusan manusia, contoh :

  • Tugas, prediksi & klasifikasi.
  • Meringkas konten suatu database.
  • Menjelaskan fenomena yang diamati.

Teknik Penggalian data

Pada dasarnya, fungsi data mining dibagi menjadi dua, yaitu deskripsi dan prediksi. Berikut ini beberapa fungsi data mining yang sering digunakan:

  1. Karakterisasi : yaitu menggeneralisasi, meringkas, dan karakteristik data yang kontras.
  2. Penggalian mengulangi pola: pola pencarian asosiasi (asosiasi aturan) atau pola intra-transaksi, atau pola pembelian yang terjadi dalam satu transaksi.
  3. Klasifikasi: yaitu untuk mengembangkan model yang dapat mengklasifikasikan obyek berdasarkan atributnya. kelas Target sudah tersedia dalam data sebelumnya, sehingga fokusnya adalah bagaimana mempelajari data yang ada untuk mengklasifikasikan sendiri klasifikator.
  4. Prediksi: yang memprediksi nilai yang tidak diketahui atau nilai yang hilang, menggunakan model klasifikasi.
  5. Pengguguran analisis / Cluster: bahwa kelompok berbagai objek data berdasarkan kesamaan. kelas target tidak tersedia dalam data sebelumnya, sehingga fokusnya adalah untuk memaksimalkan intraclass kesamaan dan meminimalkan kemiripan antara kelas.
  6. Analisis outlier: proses pengenalan data yang tidak konsisten dengan perilaku umum data lainnya. Contoh: mengenali suara dan pengecualian dalam data.
  7. Analisis tren dan evolusi: termasuk analisis regresi, penggalian pola sekuensial, analisis periodisitas, dan analisis berdasarkan kemiripan.
Baca Juga :  Hubungan Internasional : Pengertian, Tujuan, Asas, Dan Pola Beserta Sarananya Secara Lengkap

Fungsi Umum Data Mining

Fungsi dalam data mining bisa diartikan sebagai sub kegiatan yang ada dalam data mining rangka menemukan, menggali, atau menambang pengetahuan. Secara global fungsi utama data mining adalah sebagai berikut .

A.  Klasifikasi

√ 14 Pengertian Data Mining, Fungsi, Proses, Tahapan Dan Tekniknya
Klasifikasi Data Mining

Proses untuk menyatakan suatu objek kesalah satu kategori yang sudah didefinisikan sebelumnya. Proses pembelajaran fungsi target (model klasifikasi)  yang memetakan setiap sekumpulan atribut x (input) kesalah satu kelas yang didefinisikan sebelumnya.

  • Input : sekumpulan record (training set).
  • Setiap record terdiri atas sekumpulan atribut, salah satu atribut adalah kelas. Mencari model untuk atribut kelas sebagai fungsi dari nilai-nilai untuk atribut yang lain.

Tujuannya adalah record-record yang sebelumnya tidak terlihat dinyatakan kelasnya seakurat mungkin. Ada banyak sekali algoritma yang terdapat pada teknik klasifikasi , berberapa diantaranya seperti :

  • Holte
  • Prism
  • Naïve Bayes
  • ID3
  • K-Nearest Neighbor

B.  Pengelompokan / Clustering

√ 14 Pengertian Data Mining, Fungsi, Proses, Tahapan Dan Tekniknya
Clustering Data Mining

Clustering adalah metode penganalisaan data yang tujuannya adalah untuk mengelompokkan data dengan karakteristik yang sama ke suatu ‘wilayah’ yang sama dan data dengan karakteristik yang berbeda ke ‘wilayah’ yang lain.

Perbedaan clustering dengan classification

Dataset yang digunakan pada clustering tidak menampilkan class / target attribute, sedangkan dataset yang digunakan pada classification mutlak harus menampilkan class / target attribute.

Pengetahuan yang dihasilkan oleh metode clustering berupa cluster hasil pengelompokan, sedangkan pengetahuan yang dihasilkan oleh metode classification berupa selain cluster (bisa Decision Tree, Ruleset, Weight pada BackPropagation, dan lain-lain).

clustering dipakai ketika tidak diketahuinya bagaimana data harus dikelompokkan. Jumlah kelompok diasumsikan sendiri tanpa ditentukan terlebih dahulu.

Keluaran pendekatan ini adalah data yang sudah dikelompokkan. Sedangkan classification, terdapat informasi mengenai bagaimana data tersebut dikelompokkan.

Kemudian dilakukan training pada sistem dengan data yang sudah diberikan label (ke dalam kelompok manakah data tersebut dikelompokkan), selanjutnya sistem akan mengklasifikasikan data-data yang baru ke dalam kelompok yang ada. Tidak akan ada pertambahan kelompok.

Algoritma yang sering di pakai untuk pengelompokan data adalah Algoritma K-Means.

C.  Asosiasi

√ 14 Pengertian Data Mining, Fungsi, Proses, Tahapan Dan Tekniknya
Asosiasi Data Mining

Analisis asosiasi atau association rule mining adalah teknik data mining untuk menemukan aturan assosiatif antara suatu kombinasi item.

Contoh aturan assosiatif dari analisa pembelian di suatu pasar swalayan adalah dapat diketahuinya berapa besar kemungkinan seorang pelanggan membeli roti bersamaan dengan susu.

Dengan pengetahuan tersebut pemilik pasar swalayan dapat mengatur penempatan barangnya ataumerancang kampanye pemasaran dengan memakai kupon diskon untuk kombinasi barang tertentu.

Analisis asosiasi menjadi terkenal karena aplikasinya untuk menganalisa isi keranjang belanja di pasar swalayan. Analisis asosiasi juga sering disebut dengan istilah market basket analysis.

 

Analisis asosiasi dikenal juga sebagai salah satu teknik data mining yang menjadi dasar dari berbagai teknik data mining lainnya.

Khususnya salah satu tahap dari analisis asosiasi yang disebut analisis pola frequensi tinggi (frequent pattern mining) menarik perhatian banyak peneliti untuk menghasilkan algoritma yang efisien.

Penting tidaknya suatu aturan assosiatif dapat diketahui dengan dua parameter, support (nilai penunjang) yaitu persentase kombinasi item tersebut dalam database dan confidence (nilai kepastian) yaitu kuatnya hubungan antar item dalam aturan assosiatif.

 

Aturan assosiatif biasanya dinyatakan dalam bentuk :

{roti, mentega} _ {susu} (support = 40%, confidence = 50%)

Yang artinya : “50% dari transaksi di database yang memuat item roti dan mentega juga memuat item susu. Sedangkan 40% dari seluruh transaksi yang ada di database memuat ketiga item itu.”

Dapat juga diartikan : “Seorang konsumen yang membeli roti dan mentega punya kemungkinan 50% untuk juga membeli susu. Aturan ini cukup signifikan karena mewakili 40% dari catatan transaksi selama ini.”

Analisis asosiasi didefinisikan suatu proses untuk menemukan semua aturan assosiatif yang memenuhi syarat minimum untuk support (minimum support) dan syarat minimum untuk confidence (minimum confidence).

Algoritma yang biasa digunakan untuk analisis asosiasi adalah Algoritma A Priori.

Penerapan data mining sebagai cabang dari bidang ilmu komputer sudah cukup banyak digunakan dalam bidang industry bisnis dan lainnya. Sehingga bisa sangat membantu jika di gunakan dengan tepat.
Demikian ulasan tentang pengertian data mining dan konsepnya dari saya, semoga bisa membantu dan menambah pengetahuan anda tentang data mining.


Proses Interaktif Dan Interatif

Data mining merupakan sebuah proses interaktif serta interatif untuk mendapatkan sebuah pola atau model baru yang sudah sempurna, bermanfaat serta dapat dimengerti dalam suatu database yang sangat besar (mossive database).

  1. Sempurna : Bisa digeneralisasi untuk masa yang akan datang.
  2. Baru: Apa yang sedang tidak diketahui
  3. Bermanfaat: Dapat dipakai untuk melakukan sebuah tindakan
  4. Interaktif: Memerlukan interaksi manusia dalam prosesnya.
  5. Interatif: Memerlukan sejumlah proses yang berulang

Data mining berisi pencarian trend atau pola yang dimau dalam database besar untuk membantu pengembalian keputusan diwaktu yang akan datang. Model atau pola ini dikenali oleh perangkat tertentu yang dapat memberikan suatu analisa data yang bermanfaat serta berwawasan yang kemudian dapat dikaji atau dipelajari dengan lebih teliti, yang mungkin saja memakai perangkat pendukung keputusan yang lainnya.

Demikian Penjelasan Tentang 14 Definisi Data Mining Beserta Latar Belakang, Proses Dan Tekniknya Lengkap Semoga Bermanfaat Untuk Semua Pembaca GuruPendidikan.Com 😀