KLASIFIKASI DAN ANALISIS SENTIMEN DATA SMS CENTER BUPATI PAMEKASAN MENGGUNAKAN NAIVE BAYES DENGAN MAD SMOOTHING
Abstrak
Pemerintah Daerah Kabupaten Pamekasan memiliki data keluhan dan kritik dari masyarakat dalam bentuk SMS yang berasal dari Aplikasi SMS Center Bupati. Data tersebut dapat digunakan sebagai bahan untuk melakukan evaluasi, yaitu dengan mengelompokkan atau mengklasifikasikan data SMS tersebut kedalam beberapa kategori seperti Pendidikan, Kesehatan, Infrastruktur, Kriminalitas, Pelayanan Administraasi, Olahraga, Pemerintahan, Pertanian, Usaha Kecil Menengah, Ketertiban, dan lain-lain. Kemudian dilakukan proses analisis sentimen untuk setiap kategori. Dari hasil klasifikasi dapat diketahui prosentase jumlah SMS untuk setiap kategori serta prosentase SMS positif dan negatif untuk masing-masing kategori, sehingga dapat dievaluasi sektor-sektor yang masih banyak permasalahan dan dapat dilakukan proyeksi untuk memperbaiki sektor tersebut.
Dalam penelitian ini metode Naive Bayes digunakan untuk proses klasifikasi karena teknik ini dikenal sebagai teknik yang paling baik dalam hal waktu komputasi dibandingkan teknik algoritma data mining lainnya . dan untuk metode smoothing yang sertakan adalah Modified Asolute Discounting (MAD) dengan tujuan untuk memperbaiki kinerja dari metode Naive Bayes.
Pada penelitian ini rata-rata akurasi klasifikasi menggunakan Naive Bayes dengan MAD Smoothing sebesar 76,83%, bahkan dalam salah satu ujicoba klasifikasi mencapai akurasi 82,68%. Kesalahan klasifikasi sering disebabkan oleh tidak seimbangnya jumlah SMS di setiap kelas pada data latih. Dan persentase SMS Positif hanya 0,52 % dari total SMS sebanyak 2134 SMS.