Assalammu’alaikum..
Sekedar berbagi hasil UAS Take Home Jurnalisme tentang data mining. Semoga bermanfaat ^^
“Kita kaya akan data, tapi miskin akan informasi” begitulah kalimat yang diungkapkan oleh Jiawei Han, pakar basis data. Perkembangan teknologi informasi telah memungkinkan kita untuk menyimpan berbagai macam data. Mulai dari data transaksi penjualan dan pembelian barang, data pengiriman SMS, hingga data-data yang bersifat rahasia. Namun, tentu saja tidak semua data bersifat penting dan dapat menjadi informasi bagi pemilik datanya. Bagaikan kumpulan bahan tambang yang mahal di antara batu-batu yang kurang bernilai artinya, informasi atau data yang penting dan menarik tersembunyi di antara setumpuk data yang tidak menarik. Oleh karena itu, kita membutuhkan cara untuk menambang informasi dari data. Teknologi tersebut dinamakan penambangan data atau data mining.
Data mining merupakan suatu cara untuk mengekstraksi pola dari data berukuran besar. Pola yang dihasilkan dapat menjadi informasi yang menarik bagi pemilik data. Misalnya, pola gejala penyakit atau pola pembelian suatu produk makanan dan minuman bayi. Karena dihasilkan dari data yang merupakan representasi fakta yang tercatat, pola yang dihasilkan dari proses data mining ini juga merupakan representasi fakta yang kebenarannya tergantung pada kebenaran data.
Data mining merupakan multidisiplin ilmu yang terdiri atas teknologi basis data, statistik, pembelajaran mesin, komputasi performansi tinggi, pengenalan pola, visualisasi data, temu balik informasi, dan pemrosesan gambar dan sinyal. Pada dasarnya, kita dapat menghasilkan pola dari tumpukan data mentah dengan menggunakan perhitungan statistik biasa. Namun, menghasilkan pola dari data yang berukuran sangat besar tentu saja tidak manusiawi. Oleh karena itu, pekerjaan menghasilkan pola diserahkan kepada mesin.
Bagaimana data mining dapat menghasilkan pola dari tumpukan data mentah? Metode paling sederhana yaitu dengan menghitung kemunculan suatu kejadian terhadap kejadian lainnya dalam data. Kemungkinan kemunculan suatu kejadian terhadap kejadian lain merupakan sebuah pola. Misalnya, perhitungan pembelian susu bayi dan pembelian tisu dalam satu transaksi di supermarket menghasilkan pola: 70% pembeli susu bayi juga membeli tisu. Metode penghitungan munculnya beberapa kejadian yang muncul secara bersamaan tersebut lazim disebut dengan analisis keranjang atau market basket analysis.
Membuat mesin belajar dari data merupakan metode lain yang dapat digunakan untuk menghasilkan pola pada data. Dalam metode ini, data dibagi menjadi dua jenis yaitu data latih (training data) dan data uji (testing data). Mesin mengolah training data untuk membentuk suatu pola. Pola tersebut lalu diuji kebenarannya dengan mengelompokkan testing data. Semakin banyak testing data yang dikelompokkan dengan benar, semakin akurat suatu pola. Contohnya, melalui pembelajaran mesin dihasilkan pola yang menghubungkan jenis mobil yang dibeli terhadap pendapatan dan pekerjaan pembeli mobil. Untuk menguji kebenaran pola tersebut, kita menggunakan pola untuk ‘menebak’ jenis mobil bila diketahui pendapatan dan pekerjaan pembeli mobil. Semakin banyak jumlah ‘tebakan’ yang benar, semakin akurat pola yang dihasilkan.
Pola yang dihasilkan berguna untuk ‘menebak’ fakta yang belum terjadi terhadap catatan data. Sebagai contoh, jika kita ingin mengetahui prediksi jenis mobil yang akan dibeli oleh seseorang, kita dapat menggunakan pola pembelian mobil yang sudah terbentuk sebelumnya. Mesin akan secara otomatis menghasilkan ‘tebakan’ jenis mobil terhadap data pendapatan dan pekerjaan orang tersebut berdasarkan pola yang sudah terbangun.
Salah satu perusahaan konsultan internasional, Nielsen Company memanfaatkan teknologi data mining ini dalam membantu klien-kliennya. Nielsen Buzzmetrics yang merupakan anak perusahaan dari Nielsen Company membantu klien-kliennya dengan menganalisis tulisan pelanggan yang bersebaran di internet tentang sebuah produk. Penelitiannya membuktikan bahwa tulisan pelangan terhadap suatu produk relatif lebih dipercaya bila dibandingkan dengan iklan dari produk itu sendiri. Nielsen Buzzmetrics lalu menggunakan teknologi data mining untuk menganalisis pesan-pesan yang ditulis oleh pelanggan dalam media internet secara otomatis. Misalnya, data mining dipergunakan untuk menganalisis kepuasan pelanggan terhadap produk tertentu. Dengan demikian, perusahaan penghasil produk tersebut terbantu untuk merumuskan strategi untuk memperbaiki produknya.
Teknologi data mining dapat membantu kita untuk menemukan pola yang menarik dari tumpukan data. Pola yang telah ditambang tersebut dapat membantu manusia untuk merumuskan kebijakan dan strategi. Namun, pola yang telah ditambang tidak akan benar bila data yang ada bukan merupakan catatan fakta yang sebenarnya. Manusia sebagai pengguna teknologi berperan penting dalam kebermanfaatan teknologi itu sendiri.
Referensi : Jiawei Han.2006. Data Mining Concepts and Techniques. Elsevier

Posted by Asop on May 22, 2010 at 3:19 pm
Oke, bukan untuk anak Teknik Pertambangan.