Skip to main content

Analisis Kluster


Analisis kluster adalah analisis yang mengumpulkan objek atau data kepada kumpulan-kumpulan tertentu yang sama cirinya dan membezakan data daripada kluster-kluster lainnya. Kumpulan ini di kenali sebagai kluster. Analisis ini juga dikenali sebagai analisis segmentasi atau analisis taksonomi bergantung pada bidang dan objektif yang berlainan. Teknik analisa ini merupakan sebahagian daripada teknik yang banyak digunakan dalam analisis data secara matematik statistik serta digunakan dalam pelbagai bidang seperti, pengenalan pola, analisis gambar, pembelajaran mesin dan sebagainya.


Perlu juga di beri perhatian bahawa tidak ada kelas yang sudah ditentukan sebelum analisis kluster dibuat.


Kegunaan analisis kluster adalah untuk mengesan kluster atau kumpulan yang wujud dalam data berjumlah besar dan mempunyai dimensi tinggi serta agak sukar dikesan melalui visual. Data dalam jumlah yang kecil antara analisa atau kaedah yang boleh digunakan adalah distance matrix atau graf atau plot bertaburan (scatterplot) untuk mengesan kluster-kluster jika terdapat dalamnya. 


Antara contoh penggunaan analisis kluster seperti dalam bidang psikiatri, karakter atau sifat gejala oleh pesakit akan digunakan untuk mengelaskan pesakit kepada kluster-kluster tertentu, lalu memudahkan rawatan khusus diberikan mengikut kluster-kluster yang ada. 


Lain daripada itu, dalam bidang pemasaran pula, analisis kluster akan membantu pemasar untuk merekacipta iklan produk atau perkhidmatan mengikut kluster atau kumpulan secara lebih tertempu. Ini secara tidak langsung akan mengoptimalkan setiap perbelanjaan iklan tanpa membazir iklan pada sasaran yang tidak memahami iklan tersebut atau tidak berminat dengan iklan tersebut.


Dalam pada itu, perlu diingatkan bahawa analisa kluster bukanlah mekanisma sesuai untuk membezakan pembolehubah yang relevan atau tidak relevan. Oleh itu, pemilihan pembolehubah sesuai dalam analisis kluster perlulah bersandarkan kepada pertimbangan konseptual. Ini amat penting kerana kluster yang terbentuk akan boleh jadi amat bergantung pada pembolehubah yang disertakan.


Jenis-jenis Kluster

Kembali kepada perbincangan berkaitan analisis kluster, analisis ini terdapat tiga jenis. Pertama adalah analisis kluster hierarki. Kluster ini sesuai bagi saiz sampel kurang daripada 250. Dalam pada itu, bilangan kluster dalam data yang telah dikutip dapat dikenalpasti melalui analisis ini.


Kedua, adalah analisis kluster k-min atau dalam bahasa inggeris dikenali k-means clustering. Bagi analisis ini pula, data akan dipecahkan ke beberapa bilangan kluster yang di tetapkan sebelum analisa di jalankan. Analisis jenis kedua ini sesuai bagi data yang melebihi angka 250.

Ketiga, dan terakhir adalah analisis kluster dua langkah atau dikenali sebagai two-steps clustering dalam bahasa inggeris. Analisis ini pula bertujuan untuk membantu penganalisa untuk mengenal pasti dan membina pra-kluster beserta mengkategorikan pra-kluster itu.


Syarat-syarat Sebelum Menggunakan Analisis Kluster

  • Data dalam bentuk skala ordinal, skala selang atau skala nisbah

  • Skala perlu diselaraskan jika di ukur pada skala yang berbeza





Popular posts from this blog

Krejcie & Morgan sample size calculator

Krejcie & Morgan Sample Size Calculator Enter Population Size (N): Calculate Sample Size Recommended Sample Size (n): 📘 About This Calculator This calculator uses the Krejcie & Morgan (1970) formula to estimate the minimum sample size required when the total population size is known. It is commonly used in social sciences, education, and health research. The formula is: n = (X² × N × P × (1 − P)) / (d² × (N − 1) + X² × P × (1 − P)) X² = 3.841 (for 95% confidence level) P = 0.5 (maximum variability) d = 0.05 (±5% precision) 📚 Citation Krejcie, R.V., & Morgan, D.W. (1970). Determining Sample Size for Research Activities . Educational and Psychological Measurement, 30 (3), 607–610. https://doi.org/10.1177/001316447003000308

G*Power Perisian Bagi Pengiraan Sampel Saiz.

Penggunaan Gpower kerap menekan kepada tiga langkah berikut: Memilih ujian statistik yang sesuai atau padan dengan masalah yang di kaji. Memilih di antara lima jenis analisis kuasa (power analysis) yang di sediakan. Sediakan parameter input yang di perlukan analasis dan klik pada “calculate” Pada Langkah 1, pendekatan yang digunakan untuk memilih ujian statistic (statistical test) adalah melalui dua pendekatan, iaitu distribution based atau design-based approach . Distribution-based approach to the test selection Melalui pendekatan distribution-based , pendekatan pertama adalah melihat pada kumpulan umum ujian statistik menggunakan '' Test family'' menu yang terdapat di window atau tingkap utama.   Ujian statitik ( Statistical test ) menu akan berubah mengikut pilihan di dalam '' Test family'' . Ujian-ujian yang ada akan selaras mengikut pada '' test family'' yang di pilih sahaja. Design-based approach to the test se...

Ujian ANOVA sehala (one-way ANOVA)

Ujian-T (t-test) di gunakan untuk mengenali perbezaan min di antara dua kumpulan. Bagaimana pula jika kumpulan yang ingin di bandingkan mempunyai lebih daripada dua kumpulan? Jawapannya adalah menggunakan ANOVA. Jika kumpulan pembolehubah dua kumpulan, maka keputusan daripada ANOVA sehala ( one-way ANOVA ) dan ujian-t (independent t-test) adalah sama. Pengkaji boleh memastikan keputusan di dapati daripada senario di atas dengan menggunakan formula t 2 = F . Terdapat dua jenis ujian ANOVA sehala, iaitu ujian ANOVA sehala untuk pengukuran berulang (masa berlainan ( longitudinal data ) atau keadaan berbeza-beza) dan ujian ANOVA sehala untuk sampel-sampel bebas (data di kumpul daripada beberapa sampel yang bebas antara satu sama lain). Syarat-syarat sebelum menggunakan ANOVA sehala. Sebelum menggunakan ujian ANOVA sehala beberapa syarat perlu di penuhi. Antaranya adalah, pembolehubah bersandar dalam skala selang atau skala nisbah. Kedua, pembolehubah tidak bersandar dalam bentuk kate...