Home » Kuliah IT » Database » Pengertian Data Mining dan Data Set

Pengertian Data Mining dan Data Set

by Anindya Putri Arunawati
by Anindya Putri Arunawati

Data Mining

Data mining sering disebut sebagai knowledge discovery in database (KDD). KDD adalah kegiatan yang meliputi pengumpulan, pemakaian data, historis untuk menemukan keteraturan, pola atau hubungan dalam set data berukuran besar (Santoso. 2007) sedangkan menurut pramudiono (2006) Data Mining adalah analisis otomatis dari data yang berjumlah besar atau kompleks dengan tujuan untuk menemukan pola atau kecenderungan yang penting biasanya tidak disadari keberadaannya.

Jadi dapat diartikan bahwa data mining adalah proses pengumpulan atau penambangan data sehingga menghasilkan suatu pengetahuan atau informasi baru. Hasil dari data mining ini sering kali diintegrasikan dengan decision support system (DSS).

Data mining adalah bagian integral dari knowledge discovery in databases (KDD). Keseluruhan KDD untuk konversi raw data ke dalam informasi yang baru ditunjukkan pada gambar dibawah ini:

Data Set

Dalam data mining data yang diinput data yang akan diproses disebut juga data set. Data set ini merupakan kumpulan dari objek-objek data atau yang sering disebut record, point, vector, pattern, event, observation, case, atau bahkan data.

Terdapat bermacam-macam cara untuk merepresentasikan data set contohnya yaitu atribut yang digunakan untuk menggambarkan jenis objek ( bisa berupa kulitatif maupun kuantitatif ).

Atribut ini adalah faktor atau parameter yang menyebabkan class/label/target terjadi. Contoh data set ini adalah bias data-data yang diambil dari social media twitter, intagram ataupun data-data public lainya.

You may also like