Skip to main content

Analisis Kluster


Analisis kluster adalah analisis yang mengumpulkan objek atau data kepada kumpulan-kumpulan tertentu yang sama cirinya dan membezakan data daripada kluster-kluster lainnya. Kumpulan ini di kenali sebagai kluster. Analisis ini juga dikenali sebagai analisis segmentasi atau analisis taksonomi bergantung pada bidang dan objektif yang berlainan. Teknik analisa ini merupakan sebahagian daripada teknik yang banyak digunakan dalam analisis data secara matematik statistik serta digunakan dalam pelbagai bidang seperti, pengenalan pola, analisis gambar, pembelajaran mesin dan sebagainya.


Perlu juga di beri perhatian bahawa tidak ada kelas yang sudah ditentukan sebelum analisis kluster dibuat.


Kegunaan analisis kluster adalah untuk mengesan kluster atau kumpulan yang wujud dalam data berjumlah besar dan mempunyai dimensi tinggi serta agak sukar dikesan melalui visual. Data dalam jumlah yang kecil antara analisa atau kaedah yang boleh digunakan adalah distance matrix atau graf atau plot bertaburan (scatterplot) untuk mengesan kluster-kluster jika terdapat dalamnya. 


Antara contoh penggunaan analisis kluster seperti dalam bidang psikiatri, karakter atau sifat gejala oleh pesakit akan digunakan untuk mengelaskan pesakit kepada kluster-kluster tertentu, lalu memudahkan rawatan khusus diberikan mengikut kluster-kluster yang ada. 


Lain daripada itu, dalam bidang pemasaran pula, analisis kluster akan membantu pemasar untuk merekacipta iklan produk atau perkhidmatan mengikut kluster atau kumpulan secara lebih tertempu. Ini secara tidak langsung akan mengoptimalkan setiap perbelanjaan iklan tanpa membazir iklan pada sasaran yang tidak memahami iklan tersebut atau tidak berminat dengan iklan tersebut.


Dalam pada itu, perlu diingatkan bahawa analisa kluster bukanlah mekanisma sesuai untuk membezakan pembolehubah yang relevan atau tidak relevan. Oleh itu, pemilihan pembolehubah sesuai dalam analisis kluster perlulah bersandarkan kepada pertimbangan konseptual. Ini amat penting kerana kluster yang terbentuk akan boleh jadi amat bergantung pada pembolehubah yang disertakan.


Jenis-jenis Kluster

Kembali kepada perbincangan berkaitan analisis kluster, analisis ini terdapat tiga jenis. Pertama adalah analisis kluster hierarki. Kluster ini sesuai bagi saiz sampel kurang daripada 250. Dalam pada itu, bilangan kluster dalam data yang telah dikutip dapat dikenalpasti melalui analisis ini.


Kedua, adalah analisis kluster k-min atau dalam bahasa inggeris dikenali k-means clustering. Bagi analisis ini pula, data akan dipecahkan ke beberapa bilangan kluster yang di tetapkan sebelum analisa di jalankan. Analisis jenis kedua ini sesuai bagi data yang melebihi angka 250.

Ketiga, dan terakhir adalah analisis kluster dua langkah atau dikenali sebagai two-steps clustering dalam bahasa inggeris. Analisis ini pula bertujuan untuk membantu penganalisa untuk mengenal pasti dan membina pra-kluster beserta mengkategorikan pra-kluster itu.


Syarat-syarat Sebelum Menggunakan Analisis Kluster

  • Data dalam bentuk skala ordinal, skala selang atau skala nisbah

  • Skala perlu diselaraskan jika di ukur pada skala yang berbeza





Popular posts from this blog

G*Power Perisian Bagi Pengiraan Sampel Saiz.

Penggunaan Gpower kerap menekan kepada tiga langkah berikut: Memilih ujian statistik yang sesuai atau padan dengan masalah yang di kaji. Memilih di antara lima jenis analisis kuasa (power analysis) yang di sediakan. Sediakan parameter input yang di perlukan analasis dan klik pada “calculate” Pada Langkah 1, pendekatan yang digunakan untuk memilih ujian statistic (statistical test) adalah melalui dua pendekatan, iaitu distribution based atau design-based approach . Distribution-based approach to the test selection Melalui pendekatan distribution-based , pendekatan pertama adalah melihat pada kumpulan umum ujian statistik menggunakan '' Test family'' menu yang terdapat di window atau tingkap utama.   Ujian statitik ( Statistical test ) menu akan berubah mengikut pilihan di dalam '' Test family'' . Ujian-ujian yang ada akan selaras mengikut pada '' test family'' yang di pilih sahaja. Design-based approach to the test se

Ujian Analisa Sehala MANOVA

Perbezaan analisa ini dengan ANOVA adalah pembolehubah bersandarnya mempunyai lebih daripada satu . Manakala, pembolehubah bebas adalah sama seperti ANOVA yang mempunyai pelbagai kumpulan. Analisa sehala MANOVA juga mempunyai sarat ujian statistik di dalamnya dan tidak dapat memberi maklumat secara spesifik kumpulan yang berbeza signifikan di antara satu sama lain. Ujian ini hanya akan memberi maklumat sekurang-kurang dua kumpulan adalah berbeza. Oleh sebab, kebiasaan penggunaan analisa ini oleh pengkaji akan melibatkan tiga, empat atau lebih kumpulan. Oleh itu penggunaan ujian post-hoc adalah penting untuk mengetahui perbezaan kumpulan selebihnya itu. Bagi mendapat analisa yang sah dan berkualiti, beberapa andaian perlu di penuhi dahulu sebelum menggunakan analisa MANOVA. Pembolehubah bersandar mestilah dalam skala selang atau nisbah. Pembolehubah bebas a.k.a pembolehubah tidak bersandar mestilah mempunyai beberapa kumpulan yang bebas atau dengan kata lain dalam skala ordina

ANOVA vs MANOVA

Perbezaan utama di antara ANOVA dan MANOVA adalah jumlah bilangan pembolehubah bersandar ( dependent variable ). Walaupun begitu, jika terdapat pembolehubah bersandar lebih daripada satu, masih bukan masalah dan merupakan pilihan lain jika pengkaji mahu untuk menguji secara berasingan menggunakan analisa ANOVA bagi setiap pembolehubah bersandar itu. Jadi, kenapa perlu menggunakan pengiraan MANOVA ini berbanding beberapa analisa menggunakan ANOVA jika terdapat pembolehubah bersandar yang lebih daripada satu seperti dua, tiga atau empat pembolehubah bersandar? Terdapat dua sebab utama, MANOVA berpotensi menggantikan ANOVA dalam beberapa keadaan. Pertama melibatkan teori yang logik dan kedua melibatkan statistiknya. Sebagai contoh: Skormatematik + skorfizik + skorkimia sebagai fungsi kepada ( as a function of ) minuman tambahan ( tiga tahap / level ) Minuman tambahan, pembolehubah tidak bersandar atau bebas dengan tiga tahap ( levels ) : minuman kurma, minuman madu dan minuma