Lompat ke konten Lompat ke sidebar Lompat ke footer

PENGERTIAN DAN SEJARAH DATA MINING

all about data mining, data mining history

Data mining didefinisikan sebagai satu set teknik yang digunakan secara otomatis untuk mengeksplorasi secara menyeluruh dan membawa ke permukaan relasi-relasi yang kompleks pada set data yang sangat besar. Set data yang dimaksud di sini adalah set data yang berbentuk tabulasi, seperti yang banyak diimplementasikan dalam teknologi manajemen basis data relasional. Akan tetapi, teknik-teknik data mining dapat juga diaplikasikan pada representasi data yang lain, seperti domain data spatial, berbasis text, dan multimedia (citra).

Sejarah Perkembangan Data Mining

Awal mula ditemukannya data  mining dapat dilihat kembali ke akhir tahun 1980-an pada saat istilah tersebut mulai digunakan, paling tidak dalam kalangan komunitas riset. Pada awalnya terdapat sedikit perdebatan tentang makna dan cakupan dari istilah tersebut dan sampai saat ini pertentangan tersebut masih terjadi. Dalam arti luas data mining dapat didefenisikan sebagai sekumpulan mekanisme dan teknik yang direalisasikan dalam perangkat lunak untuk mengekstrak informasi tersembunyi dari kumpulan data. Pengertian tersembunyi dalam defenisi tersebut sangat penting, misalkan query yang dilakukan dalam SQL meskipun sangat rumit tetapi bukanlah data mining. Begitu juga dengan istilah informasi harus diinterpretasikan dalam arti yang luas. 

Postingan Terkait : Karakteristik Mesin Instruksi (Machine Instruction) yang Dilakukan Oleh CPU

Sebelum tahun 1990-an data mining umumnya dikenal sebagai sub proses dalam lingkup lebih besar yang disebut Knowledge Discovery in Databases (KDD). Meskipun dalam konteks modern dari data mining KDD akan lebih sesuai, karena sumber pengetahuan bukan lagi terbatas pada database. Sub proses dalam cakupan KDD yaitu, data mining terkait dengan penemuan akan “informasi tersembunyi”. Sub proses lainnya yang juga merupakan bagian dari KDD di antaranya persiapan data (warehousing, data cleaning, pre-process) dan analisis serta visualisasi dari hasil. 

Untuk beberapa tujuan praktis KDD dan data mining sering dianggap sinonim, tetapi secara teknis ternyata yang satu merupakan sub proses dari yang lain. Data yang digunakan dalam proses data mining pada awalnya hanya untuk data dalam bentuk tabel (relasional) mengingat keterbatasan kemampuan komputasi saat itu. Dengan peningkatan kemampuan komputasi, maka waktu komputasi (meskipun tetap menjadi isu penting) tidak lagi menjadi persoalan utama dan digantikan dengan tujuan lain yakni akurasi dan keinginan untuk menambang data yang jauh lebih besar. 

Saat ini, dalam konteks data bentuk tabel telah diperlakukan secara khusus dengan teknik yang tersendiri. Hal ini dapat dilihat dari banyaknya sistem seperti SPSS yang melakukan penambangan data dari dalam tabel. Akan tetapi, jenis data yang tersedia secara digital semakin banyak dan berasal dari berbagai sumber berbeda. Jenis data saat ini sangat beragam seperti gambar, teks, video, multimedia, graf dan jaringan. Hal ini membuat kajian data mining terus berkembang dan terus menghadirkan tantangan baru. 

Popularitas data mining terus meningkat secara signifikan pada tahun 1990-an, terutama dengan pelaksanaan sejumlah konferensi yang dikhususkan pada kajian tersebut, seperti: ACM SIGKDD annual conference tahun 1995, European PKDD and Pacific/Asia (PAKDD) pada tahun 1997. IEEE ICDM mulai diadakan pada tahun 2001 sebagai konferensi SIAM yang pertama. Hal ini meningkatkan popularitas data mining yang secara bersamaan didukung oleh kemajuan teknologi, kemampuan CPU dan media yang menyimpan data dalam jumlah besar dan mengolahnya dalam waktu yang lebih cepat. Menjadi hal biasa untuk perusahaan komersial untuk memelihara data dalam berbagai bentuk yang dapat dibaca komputer, dan dalam kebanyakan kasus digunakan untuk mendukung aktivitas bisnis dan pemikiran bahwa data tersebut dapat “ditambang” sering masih dianggap sebagai prioritas kedua. 

Era tahun 1990-an juga ditandai dengan penggunaan kartu kesetiaan pelanggan yang memungkinkan perusahaan untuk mencatat belanjaan dari setiap pelanggan. Data yang tersimpan dalam volume besar tersebut dapat “ditambang” untuk mengetahui pola/perilaku pembelian oleh masing-masing pelanggan. Popularitas data mining terus berkembang sampai hari ini terlebih dengan kemungkinan menambang data dari data yang tidak standar (non tabular). 


Posting Komentar untuk "PENGERTIAN DAN SEJARAH DATA MINING"