Skip to main content

Analisis Kluster


Analisis kluster adalah analisis yang mengumpulkan objek atau data kepada kumpulan-kumpulan tertentu yang sama cirinya dan membezakan data daripada kluster-kluster lainnya. Kumpulan ini di kenali sebagai kluster. Analisis ini juga dikenali sebagai analisis segmentasi atau analisis taksonomi bergantung pada bidang dan objektif yang berlainan. Teknik analisa ini merupakan sebahagian daripada teknik yang banyak digunakan dalam analisis data secara matematik statistik serta digunakan dalam pelbagai bidang seperti, pengenalan pola, analisis gambar, pembelajaran mesin dan sebagainya.


Perlu juga di beri perhatian bahawa tidak ada kelas yang sudah ditentukan sebelum analisis kluster dibuat.


Kegunaan analisis kluster adalah untuk mengesan kluster atau kumpulan yang wujud dalam data berjumlah besar dan mempunyai dimensi tinggi serta agak sukar dikesan melalui visual. Data dalam jumlah yang kecil antara analisa atau kaedah yang boleh digunakan adalah distance matrix atau graf atau plot bertaburan (scatterplot) untuk mengesan kluster-kluster jika terdapat dalamnya. 


Antara contoh penggunaan analisis kluster seperti dalam bidang psikiatri, karakter atau sifat gejala oleh pesakit akan digunakan untuk mengelaskan pesakit kepada kluster-kluster tertentu, lalu memudahkan rawatan khusus diberikan mengikut kluster-kluster yang ada. 


Lain daripada itu, dalam bidang pemasaran pula, analisis kluster akan membantu pemasar untuk merekacipta iklan produk atau perkhidmatan mengikut kluster atau kumpulan secara lebih tertempu. Ini secara tidak langsung akan mengoptimalkan setiap perbelanjaan iklan tanpa membazir iklan pada sasaran yang tidak memahami iklan tersebut atau tidak berminat dengan iklan tersebut.


Dalam pada itu, perlu diingatkan bahawa analisa kluster bukanlah mekanisma sesuai untuk membezakan pembolehubah yang relevan atau tidak relevan. Oleh itu, pemilihan pembolehubah sesuai dalam analisis kluster perlulah bersandarkan kepada pertimbangan konseptual. Ini amat penting kerana kluster yang terbentuk akan boleh jadi amat bergantung pada pembolehubah yang disertakan.


Jenis-jenis Kluster

Kembali kepada perbincangan berkaitan analisis kluster, analisis ini terdapat tiga jenis. Pertama adalah analisis kluster hierarki. Kluster ini sesuai bagi saiz sampel kurang daripada 250. Dalam pada itu, bilangan kluster dalam data yang telah dikutip dapat dikenalpasti melalui analisis ini.


Kedua, adalah analisis kluster k-min atau dalam bahasa inggeris dikenali k-means clustering. Bagi analisis ini pula, data akan dipecahkan ke beberapa bilangan kluster yang di tetapkan sebelum analisa di jalankan. Analisis jenis kedua ini sesuai bagi data yang melebihi angka 250.

Ketiga, dan terakhir adalah analisis kluster dua langkah atau dikenali sebagai two-steps clustering dalam bahasa inggeris. Analisis ini pula bertujuan untuk membantu penganalisa untuk mengenal pasti dan membina pra-kluster beserta mengkategorikan pra-kluster itu.


Syarat-syarat Sebelum Menggunakan Analisis Kluster

  • Data dalam bentuk skala ordinal, skala selang atau skala nisbah

  • Skala perlu diselaraskan jika di ukur pada skala yang berbeza





Popular posts from this blog

G*Power Perisian Bagi Pengiraan Sampel Saiz.

Penggunaan Gpower kerap menekan kepada tiga langkah berikut: Memilih ujian statistik yang sesuai atau padan dengan masalah yang di kaji. Memilih di antara lima jenis analisis kuasa (power analysis) yang di sediakan. Sediakan parameter input yang di perlukan analasis dan klik pada “calculate” Pada Langkah 1, pendekatan yang digunakan untuk memilih ujian statistic (statistical test) adalah melalui dua pendekatan, iaitu distribution based atau design-based approach . Distribution-based approach to the test selection Melalui pendekatan distribution-based , pendekatan pertama adalah melihat pada kumpulan umum ujian statistik menggunakan '' Test family'' menu yang terdapat di window atau tingkap utama.   Ujian statitik ( Statistical test ) menu akan berubah mengikut pilihan di dalam '' Test family'' . Ujian-ujian yang ada akan selaras mengikut pada '' test family'' yang di pilih sahaja. Design-based approach to the test se...

Krejcie & Morgan sample size calculator

Krejcie & Morgan Sample Size Calculator Enter Population Size (N): Calculate Sample Size Recommended Sample Size (n): 📘 About This Calculator This calculator uses the Krejcie & Morgan (1970) formula to estimate the minimum sample size required when the total population size is known. It is commonly used in social sciences, education, and health research. The formula is: n = (X² × N × P × (1 − P)) / (d² × (N − 1) + X² × P × (1 − P)) X² = 3.841 (for 95% confidence level) P = 0.5 (maximum variability) d = 0.05 (±5% precision) 📚 Citation Krejcie, R.V., & Morgan, D.W. (1970). Determining Sample Size for Research Activities . Educational and Psychological Measurement, 30 (3), 607–610. https://doi.org/10.1177/001316447003000308

ANOVA vs MANOVA

Perbezaan utama di antara ANOVA dan MANOVA adalah jumlah bilangan pembolehubah bersandar ( dependent variable ). Walaupun begitu, jika terdapat pembolehubah bersandar lebih daripada satu, masih bukan masalah dan merupakan pilihan lain jika pengkaji mahu untuk menguji secara berasingan menggunakan analisa ANOVA bagi setiap pembolehubah bersandar itu. Jadi, kenapa perlu menggunakan pengiraan MANOVA ini berbanding beberapa analisa menggunakan ANOVA jika terdapat pembolehubah bersandar yang lebih daripada satu seperti dua, tiga atau empat pembolehubah bersandar? Terdapat dua sebab utama, MANOVA berpotensi menggantikan ANOVA dalam beberapa keadaan. Pertama melibatkan teori yang logik dan kedua melibatkan statistiknya. Sebagai contoh: Skormatematik + skorfizik + skorkimia sebagai fungsi kepada ( as a function of ) minuman tambahan ( tiga tahap / level ) Minuman tambahan, pembolehubah tidak bersandar atau bebas dengan tiga tahap ( levels ) : minuman kurma, minuman madu dan minuma...