Cara Cari Centroid dalam Analisis Clustering

Posted on
Pengarang: Judy Howell
Tarikh Penciptaan: 1 Julai 2021
Tarikh Kemas Kini: 15 November 2024
Anonim
Analisis Klaster dengan Metode Centroid dengan  SPSS dan STATCAL, Disertai Perhitungan Manual
Video.: Analisis Klaster dengan Metode Centroid dengan SPSS dan STATCAL, Disertai Perhitungan Manual

Kandungan

Analisis kluster adalah kaedah mengatur data ke dalam kumpulan wakil berdasarkan ciri-ciri yang serupa. Setiap ahli cluster mempunyai lebih banyak kesamaan dengan anggota lain dari cluster yang sama daripada dengan anggota kumpulan lain. Titik paling terkenal dalam kumpulan dipanggil centroid. Biasanya, ini adalah min bagi nilai-nilai mata data dalam kumpulan.

    Atur data. Jika data terdiri daripada pembolehubah tunggal, histogram mungkin sesuai. Jika dua pembolehubah terlibat, graf data pada satah koordinat. Sebagai contoh, jika anda melihat ketinggian dan berat kanak-kanak sekolah di dalam bilik darjah, plot titik data untuk setiap kanak-kanak pada graf, dengan berat paksi mendatar dan ketinggian paksi menegak. Jika lebih daripada dua pembolehubah terlibat, matriks mungkin diperlukan untuk memaparkan data.

    Kelompokkan data ke dalam kelompok. Setiap kelompok harus terdiri daripada mata data yang paling dekat dengannya. Dalam contoh ketinggian dan berat badan, kumpulan setiap titik data yang kelihatan rapat bersama. Bilangan kluster, dan sama ada setiap titik data harus berada dalam kelompok, mungkin bergantung kepada tujuan kajian.

    Untuk setiap kelompok, tambahkan nilai semua ahli.Sebagai contoh, jika kumpulan data terdiri daripada titik (80, 56), (75, 53), (60, 50), dan (68,54), jumlah nilai akan (283, 213).

    Sebarkan jumlahnya dengan bilangan ahli cluster. Dalam contoh di atas, 283 dibahagikan dengan empat adalah 70.75, dan 213 dibahagikan dengan empat adalah 53.25, jadi centroid kumpulan adalah (70.75, 53.25).

    Plot centroids kluster dan tentukan sama ada mana-mana mata lebih dekat dengan centroid kluster lain daripada mereka kepada centroid kumpulan mereka sendiri. Jika mana-mana mata lebih dekat dengan centroid yang berbeza, kembalikan semula mereka ke kluster yang mengandungi centroid yang lebih dekat.

    Ulangi Langkah 3, 4 dan 5 hingga semua titik data berada dalam kumpulan yang mengandungi centroid yang mana mereka paling dekat.

    Petua