Rabu, 11 Maret 2009

Penggerombolan Parameter Regresi Dengan Error-Based Clustering

Teknik analisis gerombol adalah suatu proses pengorganisasian data yang sangat besar kedalam kelompok-kelompok yang lebih kecil dengan data yang memiliki kemiripan ditempatkan pada kelompok yang sama sedangkan yang kurang mirip ditempakan dalam kelompok yang berbeda. Teknik ini diharapkan mampu mengungkapkan informasi yang tersimpan dalam data sehingga bisa membantu dalam pengambilan keputusan yang tepat terkait dengan kajian yang sedang dilakukan.
Pemanfaatan data yang tidak standar yaitu tidak dalam bentuk vektor dalam dimensi ruang p, sering kali menjadi kendala dalam penggunaan analisis gerombol tradisonal. Untuk dapat menggunakan teknik analisis gerombol tradisional, data terlebih dahulu harus dirubah ke dalam struktur yang diinginkan untuk mempermudah analisis. Namun tidak jarang dalam proses mengubah struktur data awal menjadi struktur data baru banyak informasi yang hilang. Beberapa contoh teknik yang digunakan untuk mengubah struktur data yaitu menghitung rataan, mereduksi data dengan teknik analisis komponen utama ataupun menggunakan model-model statistik yang lain. Dalam setiap teknik ini disajikan statistik varians-kovarian atau matriks kekeliruan (measurement error) yang terkait dengan hasil perubahan struktur data tersebut yang merupakan ukuran informasi yang hilang selama proses tranformasi. Hasil transformasi ini kemudian dijadikan unit pengamatan baru yang digerombolkan tanpa memperhatikan matriks kekeliruan yang menyertai setiap unit pengamatan baru tersebut.
Analisis gerombol klasik yang didasarkan pada jarak kuadrat Euclidean memiliki kelemahan yaitu tidak mempertimbangkan adanya informasi kekeliruan ataupun unsur ketidakpastian yang terkait dengan data. Memasukkan informasi kekeliruan dalam proses penggerombolan akan memberikan hasil pengelompokkan yang berbeda dan tentunya lebih baik dibandingkan dengan analisis gerombol tradisional seperti K-means dan Ward’s hierarchical clustering.
Salah satu pendekatan baru dalam metode penggerombolan yang memasukkan informasi kekeliruan yang terkait dengan data adalah metode error-based clustering (Kumar, 2007). Dalam metode error-based clustering dikembangkan model statistik dan algoritma penggerombolan yang melibatkan measurement error. Terdapat dua algoritma penggerombolan dalam error-based clustering yaitu (1) hError, yaitu algoritma pengelompokkan hirarki yang menghasilkan sebuah rangkaian gerombol tersarang, (2) kError, yaitu algoritma partisi, yang mempartisi data menjadi beberapa gerombol spesifik

Tidak ada komentar:

Posting Komentar