Analisis Algoritma K-Medoids Clustering Dalam Pengelompokan Penyebaran Covid-19 Di Indonesia
Analisis Algoritma K-Medoids Clustering Dalam Pengelompokan Penyebaran Covid-19 Di Indonesia
Analisis Algoritma K-Medoids Clustering Dalam Pengelompokan Penyebaran Covid-19 Di Indonesia
Sukma Sindi, Weni Ratnasari Orktapia Ningse, Irma Agustika Sihombing, P.P.P.A.N.W
Fikrul Ilmi R.H.Zer, Dedy Hartama
Program Studi Teknik Informatika, STIKOM Tunas Bangsa Pematangsiantar,
Jl. Jend. Sudirman Blok A No.1,2 dan 3, Kota Pematangsiantar 21111 - Indonesia
skmsindi@gmail.com, weni.oktapia21@gmail.com, Irmasihombibg006@gmail.com,
fikrulilmizer@gmail.com, dedyhartama@amiktunasbangsa.ac.id
Abstract - At the beginning of March Indonesia was entering the corona outbreak virus (COVID) Every day the case of
Covid-19 distribution in Indonesia continued to increase. the community is issued to conduct social distance to cut the
distribution of COVID-19 distribution distributed in various regions. In Indonesia, therefore, the data that has been
accommodated is certainly a lot, from the data it can be seen patterns - selection patterns of distribution of COVID-19
distribution are based on test scores, This study uses the K-Medoids method so that the distribution patterns of COVID-19
distribution can be used for the community. K-Medoids is a method of grouping Analytical sections that aim to get a set of k-
clusters among the data that most require an object in the collection of data. The results of the new COVID-19 research
grouping show the community produced from various regions in Indonesia. Characteristics with a body temperature above
36.9 ◦ c and with fever and cough resolution supported by one of the characteristics of COVID-19 symptoms.
Kata Kunci - K-Medoids Algorithm, Clustering, Data Mining, COVID-19, Data Grouping
Abstrak - Pada awal maret Indonesia sedang di landa masuknya wabah virus corona (covid) Setiap hari kasus penyebaran
covid-19 di indonesia terus meningkat. masyarakat diminta untuk melakukan social distancing guna mamutus rantai
penyebaran covid-19 yang tersebar diberbagai wilayah.di Indonesia. Oleh karena itu, data yang telah ditampung pastinya
banyak sekali, dari data tersebut dapat dilihat pola – pola penentuan pengelompokan penyebaran covid-19 dilakukan
berdasarkan nilai tes, Penelitian ini menggunakan metode K-Medoids agar dapat diketahui pola pemilihan penentuan
pengelompokan penyebaran covid-19 bagi masyarakat. K-Medoids merupakan metode Analitis partisional clustering yang
bertujuan untuk mendapatkan suatu set k-cluster di antara data yang paling mendekati suatu objek dalam pengelmpokan suatu
data.. Hasil penelitian pengelompokan penyebaran covid-19 baru menunjukkan bahwa masyarakat yang berasal dari berbagai
wilayah di Indonesia. Cirri-ciri dengan suhu badan di atas 36,9◦ c dan dengan disertai demam dan batuk berkelanjutan
menunjukkan salah satu ciri-ciri gejalah covid-19
Kata Kunci - Algoritma K-Medoids, Clustering, Data Mining, Covid-19, Pengelompokan Data
166
(Jurnal Teknologi Informasi) Vol.4, No.1, 2020 P-ISSN 2580-7927| E-ISSN 2615-2738
Descriptive mining, yaitu proses untuk Jika S<0, maka ganti objek dengan data cluster
menemukan karakteristik penting dari data dalam satu untuk memperoleh sekelompok k objek yang
basis data. Teknik data mining yang termasuk baru sebagai medoids.
descriptive mining adalah clustering, asosiation, dan 6. Ulangi tahap ke 3 sampai 5 hingga tidak terjadi
sequential mining [2]. perubahan medoid, sehingga didapatkan cluster
beserta anggota cluster masing-masing.
B. Clustering Kemudian untuk mendapatkan nilai k di sebuah
data yang ada di clustering K-Medoid dilakukan
Clustering merupakan suatu proses
di dalam proses clustering dapat dipilih dengan
pengelompokkan record suatu , observasi, atau bersasarkan nilai DBI (Davies Bouldin Index)
mengelompokkan kelas yang memiliki kesamaan terkecil.
objek. Perbedaan clustering dengan klasifikasi yaitu
tidak adanya variabel target dalam melakukan suatu
pengelompokan pada proses clustering. Clustering II. METODE PENELITIAN
sering dilakukan sebagai untuk langkah awal dalam
Dalam metode ini cara untuk memperoleh dan
proses data mining saat melakukkan suatu metode
mengumpulkan data-data ilmiah yang dibutuhkan
analisis. Terdapat banyak algoritma Clustering yang
dengan fungsi dan tujuan tertentu. Metode penelitian
telah digunakan oleh peneliti sebelumnya seperti K-
dapat dilihat pada gambar 1(Juninda and Andri, 2019)
Means, Improved K-Means, Fuzzy C-Means,
DBSCAN, K-Medoids (PAM), CLARANS dan Fuzzy
Substractive. Setiap algortima memiliki kelebihan dan
kekurangan masing-masing, namun prinsip algoritma
sama, yaitu mengelompokkan data sesuai dengan
karakteristik dan mengukur jarak kemiripan antar data
dalam satu kelompok [3].
C. Algoritma K-Medoids
K-Medoids merupakan suatu algoritma yang
digunakan untuk menemukan medoids didalam sebuah
kelompok (cluster) yang merupakan titik pusat dari
suatu kelompok (cluster). Algoritma K-Medoids lebih
baik dibandingkan dengan K-Means karena pada K-
Medoids kita menemukan k sebagai objek yang
representatif untuk meminimalkan jumlah
ketidaksamaan objek data, sedangkan pada K-Means
menggunakan jumlah jarak euclidean distances untuk
objek data[4]. Langkah-langkah algoritma K-Medoids
sebagai berikut: Gambar 1. Metode Penelitian
1. Inisialisasi pusat cluster sebanyak k (jumlah
cluster).
2. Alokasikan setiap data (objek) ke cluster terdekat A. Identifikasi Masalah
menggunakan ukuran jarak Euclidean Distance Dalam penelitian ini, identifikkasi masalah
dengan persamaan: x bertujuan untuk mengetahui seberapa banyak
n
pengelompokan pada masalah kasus covid-1 di
(¿¿ i yi )2 ;1, 2,3, . nd Indonesia menggunakan metode K-Medoids
i 1
Clustering . Dan mencari akar masal dengan table data
( x , y) ¿ x y ¿ ¿ ..........(1) yang kita punya dengan table yang kita miliki tersebut
3. Pilih secara acak objek pada masing-masing melonjaknya angka penyebaran wabah menjadi akar
cluster sebagai kandidat medoid baru. pokok permasalahan ini.
4. Hitung jarak setiap objek yang berada pada setiap B. Pengumpulan Data
masing-masing cluster dengan menempuh
medoids baru. Pada pengumpulan Data dilakukan dari objek
5. Hitung total simpangan (S) dengan menghitung yang kita telitih dimana data yang kita peroleh dari
nilai total distance baru – total distance lama. Kementrian Kesehatan Indonesia. Data yang
167
(Jurnal Teknologi Informasi) Vol.4, No.1, 2020 P-ISSN 2580-7927| E-ISSN 2615-2738
digunakan menggunakan 3 variabel yaitu, kasus 7. Jika menetapkan dari perhitung nilai lowest
positif, kasus sembuh, dan kasus meninggal. average dissimilarity (bi). Perhitungan b(i)
menggunakan persamaan (4).
C. Pengolahan Data awal 8. Untuk menghitung nilai silhouette coefficient (si).
Dari data yang sudah kita miliki, kemudian Perhitungan s(i) melakukan persamaan untuk
akan kita olah dengan menggunakan metode K- mengenal mutu terbaik dari cluster.
Medoids Clustering. Untuk mengetahui
pengelompokan data sehingga data akan menampilkan
hasil akhir dari pengelompokan Clustering. III. HASIL DAN PEMBAHASAN
168
(Jurnal Teknologi Informasi) Vol.4, No.1, 2020 P-ISSN 2580-7927| E-ISSN 2615-2738
169
(Jurnal Teknologi Informasi) Vol.4, No.1, 2020 P-ISSN 2580-7927| E-ISSN 2615-2738
170
(Jurnal Teknologi Informasi) Vol.4, No.1, 2020 P-ISSN 2580-7927| E-ISSN 2615-2738
171
(Jurnal Teknologi Informasi) Vol.4, No.1, 2020 P-ISSN 2580-7927| E-ISSN 2615-2738
172
(Jurnal Teknologi Informasi) Vol.4, No.1, 2020 P-ISSN 2580-7927| E-ISSN 2615-2738
173