Naive Bayes Dalam Menentukan Penerima Bantuan Langsung Tunai

Pendahuluan

Studi kasus ini bertujuan untuk menentukan penerima Bantuan Langsung Tunai (BLT) dengan memanfaatkan algoritma Naive Bayes. Dalam situasi pandemi, banyak masyarakat yang memerlukan bantuan keuangan. Penentuan penerima bantuan ini seringkali memerlukan pendekatan berbasis data untuk memastikan distribusi yang adil dan efektif. Algoritma Naive Bayes memungkinkan kita menganalisis data penerima berdasarkan atribut/kriteria yang memengaruhi kelayakan mereka untuk menerima bantuan.

Bantuan Langsung Tunai Penyaluran Dana BLT Penerimaan BLT

Dataset

Dataset yang digunakan dalam studi ini berasal dari data pemerintah lokal yang mengelola penerima bantuan sosial, seperti Program Keluarga Harapan (PKH) dan Bantuan Pangan Non-Tunai (BPNT). Data ini meliputi berbagai atribut yang relevan dengan status kelayakan penerima bantuan.

location

Sumber Data: Data Kantor Desa Perkebunan Air Batu III/IX dan Kantor Desa Sei Alim Ulu

Jumlah Data:

154 data penerima bantuan

Data Training:

80% (123 data)

Data Testing:

20% (31 data)

Dataset ini telah melalui tahap preprocessing, termasuk penghapusan data yang tidak lengkap dan normalisasi untuk memastikan analisis dapat dilakukan secara akurat.

Atribut/Kriteria yang Mempengaruhi Penerima BLT

Beberapa atribut/kriteria yang memengaruhi keputusan penerima BLT dalam studi kasus ini adalah:

Jenis Kelamin:

Laki-laki atau Perempuan

Program PKH:

Ya atau Non

BPNT (Bantuan Pangan Non Tunai):

Ya atau Non

Kehilangan Pekerjaan:

Ya atau Tidak

Tidak Terdata:

Terdata atau Tidak Terdata

Anggota Keluarga Sakit Kronis:

Ya atau Tidak

Analisis Kriteria

Kriteria ini dianalisis untuk menentukan probabilitas penerima BLT berdasarkan status akhir: Layak (C1) atau Tidak Layak (C0).

Algoritma Naive Bayes

Algoritma Naive Bayes memprediksi peluang berdasarkan data historis, menggunakan teorema Bayes. Keunggulannya meliputi kemudahan implementasi, kecepatan perhitungan, dan efisiensi data.

P(C|X) = P(X|C) ⋅ P(C) / P(X)

Keterangan:

  • P(C|X): Probabilitas kelas C (Layak atau Tidak Layak) diberikan data X (fitur/kriteria).
  • P(X|C): Probabilitas fitur X diberikan kelas C.
  • P(C): Probabilitas prior untuk kelas C.
  • P(X): Probabilitas fitur X di seluruh kelas.

Dengan pendekatan ini, kita dapat menghitung probabilitas penerima yang layak atau tidak layak untuk menerima BLT berdasarkan atribut/kriteria yang ada. Pada akhir perhitungan, status penerima ditentukan sebagai berikut:

  • Jika hasil perhitungan menunjukkan bahwa P(C0|X) > P(C1|X), yang berarti data tersebut diklasifikasikan sebagai Tidak Layak.
  • Jika hasil perhitungan menunjukkan bahwa P(C1|X) > P(C0|X), yang berarti data tersebut diklasifikasikan sebagai Layak.