Teknik Data Mining

  • Whatsapp
proses data mining

Perkembangan teknologi informasi yang semakin canggih saat ini, telah menghasilkan banyak tumpukan data, pertambahan data yang semakin banyak akan menimbulkan pertanyaan besar, yaitu “apa yang dapat dilakukan dari tumpukan data tersebut?”. Untuk menjawab pertanyaan tersebut, dapat diterapkan sebuah teknologi basis data yand dikenal dengan data mining.

Data mining dapat diterapkan untuk menggali nilai tambah dari suatu kumpukan data berupa pengetahuan yang selama ini tidak diketahui secara manual. Terdapat beberapa teknik yang digunakan dalam data mining, salah satu teknik data mining adalah clasification. Diantara algoritma yang sering digunakan dalam teknik klasifikasi yaitu algoritma C4.5

Pembahasan

Data Mining adalah proses yang menggunakan teknik statistik, matematika, kecerdesan buatan, dan machine learning untuk mengekstraksi dan mengindentifikasi informasi yang bermamfaat dan pengetahuan yang terkait dari berbagai database besar (Mujib,et al,2013).

Data Mining merupakan salah satu cabang ilmu komputer yang relatif baru. Definisi lain dari data mining dapat diartikan sebagai serangkaian proses untuk menggali nilai tambah berupa informasi yang selama ini tidak diketahui secara manual dari suatu basisdata dengan melakukan proses ekstraksi dan menggali pola penting dari data yang ada (Rizky dan Niya,2013).

A. Tahapan dalam Data Mining

Tuntutan dari data mining salah satunya adalah ketika diterapkan pada data berkala besar adalah diperlukan metodologi sistematis tidak hanya ketika melakukan analisa saja tetapi juga ketika mempersiapkan data dan jugak melakukan interpretasi dari hasilnya sehingga dapat menjadi aksi ataupun keputusan yang bermamfaat. Sebagai suatu rangkaian proses, data mining dapat dibagi menjadi beberapa tahap proses yang diilustrasikan pada gambar. Tahap-tahap tersebut bersifat interaktif, pemakai terlibat langsung atau dengan perantaraan knowledge base (Mujib,st al,2008)

Tahap-Tahap Data Mining

Tahap-tahap data mining adalah sebagai berikut:

  • Pembersihan data (data cleaning) : Pembersihan data merupakan proses menghilangkan noise dan data yang tidak konsisten atau data tidak relevan.
  • Integrasi data (data integration) : Integrasi data merupakan penggabungan data dari berbagai database ke dalam satu database baru.
  • Seleksi data (data selection) : Data yang ada pada database sering kali tidak semuanya dipakai, oleh karena itu hanya data yang sesuai untuk dianalisis yang akan diambil dari database.
  • Transformasi data (data transformation) : Data diubah atau digabung ke dalam format yang sesuai untuk diproses dalam data mining.
  • Proses mining : Merupakan suatu proses utama saat metode diterapkan untuk menemukan pengetahuan berharga dan tersembunyi dari data. Beberapa metode yang dapat digunakan berdasarkan pengelompokan data mining dapat dilihat pada Gambar.
Model data mining
  • Evaluasi pola (pattern evaluation) : Untuk mengindentifikasi pola-pola menarik ke dalam knowledge based yang ditemukan.
  • Presentasi pengetahuan (knowledge presentation) : Merupakan visualisasi dan penyajian pengetahuan mengenai metode yang digunakan untuk memperoleh pengetahuan yang diperoleh pengguna.

B. Pengelompokkan Data Mining

Pengelompokkan data mining dibagi menjadi beberpa kelompok, menurut Kurini dan Luthfi (2009), yaitu:

a. Deskripsi : Merupakan cara untuk menggambarkaan pola dan kecendrungan yang terdapat dalam data yang dimiliki.

Merupakan cara untuk menggambarkaan pola dan kecendrungan yang terdapat dalam data yang dimiliki.

b. Estimasi : Hampir sama dengan klasifikasi, kecuali variable terget estimasi lebih ke arah numerik daripada kearah kategori. Model yang dibangun menggunakan record lengkap yang menyediakan nilai variable terget sebagai nilai prediksi.

c. Prediksi : Menerangkan sebuah nilai yang belum diketahui dan juga memperkirakan nilai untuk masa mendatang.

d. Klasifikasi: Dalam klasifikasi terdapat terget variable kategori, mosal penggolongan pendapatan dapat diposahkan dalam tiga kategori, tinggi, sedang, dan rendah.

e. Pengklasteran : Merupakan pengelompokkan record, pengamatan, atau memperhatikan dan membentuk kelas objek-objek yang memiliki kemiripan.

f. Asosiasi : Bertugas menentukan atribut yang muncul dalam satu waktu. dalam dunia bisnis lebih umum disebut analsisi keranjang belanja.

C. Klasifikasi

Seiring dengan perkembangan pengetahuian data mining dan komponen-komponenya, data mining tidak lagi dimonopoli oleh bidang teknologi informasi. Pemakainya telah semakin meluas ke bidang lain misalnya pada bidang kesehatan, pertanian, asuransi, dan lai-lain (Mardiani,2012).

Khusus untuk fungsionalistas data mining menggunakan klasifikasi, beberapa penelitian telah dilakukan misalnya oleh Wisaeng (2013) yang menggunakan pembentukan pohon klaisifikasi untuk UCI repository dengan membandingkan efektifitas dari beberapa algoritma yaitu algoritma functional tree, logistic model tree, REP tree, dan best decision tree. Penelitian Rthee dan Mathur (2013) mengaplikasikan Algoritma ID3, algoritma C4.5 dan CART untuk mempredikasi kinerja mehasiswa dalam ujian akhir, sehingga membantu pengajar dalam mengidentifikasi kelemahan dan memperbaiki kinerja mereka.

Penelitian yang telah dilakukan berkaitan dengan klasifikasi data mining juga dilakukan oleh ogheneovo dan Asagba (2013) terhadap klasifikasi SQL query khususnya terhadap SQL injection attack menggunakan algoritma C4.5 Pinky (2014) dalam mengklasifikasikan lalu lintas menggunakan pendekatan supervised learning dan building time sehingga mampu mendetksi pengacau lalu lintas dan memberikan pelayanan terbaik kepada users. Penelitian lain dilakukan oleh Patil et al (2014) dalam melakukan klasifikasi terhadap data yang tidak pasti (uncrtain) dengan tujuan mengukur kesalahan untuk bergai kelas dengan menggunakan algoritma Algoritma C4.5.

Leave a Reply

Your email address will not be published. Required fields are marked *