SUMBER
DATA
Data yang digunakan adalah data karyawan yg berada di table karyawan meliputi :
NP, Nama keryawan, umur, Jenis Kelamin, pendidikan, Agama, Level (junior dan senior) lama kerja (th)
Metode yang digunakan adalah :
Metode pohon keputusan
Metode ini merupakan salah satu dari teknik yang ada pada
klasifikasi . metode pohon keputusan mengubah fakta yang sangat besar menjadi
pohon keputusan yang merepresantikan aturan. Pohon keputusan juga berguna untuk
mengekplorasi data, menemukan hubungan tersembunyi antara jumlah calon variable
input dengan sebuah variable target.
Data dalam pohon keputusan biasanya dinyataka dalam bentuk
table dengan atribut dan record, atribut menyatakan suatu parameter yang
disebut sebagai kriteria dalam pembentukan pohon.
Algoritma C4.5
Algoritma C4.5 merupakan pengembangan dari algoritma ID3.
Algoritma C4.5 dan ID3 diciptakan oleh seoran peneliti dibidang kecerdasan
buatan bernama Rose quinlan pada akhir
tahun 1970-an. Algoritma C4.5 membuat pohon keputusan dari atas ke bawah,
dimana atribut paling atas merupakan akar, dan yang paling bawah dinamakan daun.
Secara umum, algoritma C4.5 untuk membangun sebuah pohon keputusan
adalah sebagai berikut :
§
Hitung jumlah data, jumlah data berdasarkan
anggota atribut hasil dengan syarat tertentu. Untuk proses pertama syaratnya
masih kosong
§
Pilih atribut sebagai Node.
§
Buat cabang untuk tiap-tiap anggota dari Node
§
Periksa
apakah nilai entropy dari anggota Node ada yang bernilai nol. Jika ada,
tentukan daun yang terbentuk. Jika seluruh nilai entropy anggota Node adalah
nol, maka proses pun berhenti.
§
Jika ada anggota Node yang memiliki nilai
entropy lebih besar dari nol, ulangi lagi proses dari awal dengan Node sebagai
syarat sampai semua anggota dari Node bernilai nol.
Node adalah atribut yang mempunyai nilai gain tertinggi dari
atribut-aribut yang ada. Untuk menghitung nilai gain suatu atribut digunakan
rumus seperti yang tertera dalam persamaan berikut:
Nilai yg terbentuk
Setelah
pohon keputusan terbentuk, masukkan data-data yang belum mempunyai jadwal
kerja. Kemudian proses pembentukan jadwal kerja baru akan dimulai. Jadwal kerja
yang baru, dibentuk berdasarkan rule-rule yang mempunyai nilai akurasi
tertinggi.
Berikut ini rule-rule yang dipakai untuk membuat jadwal
kerja yang baru di atas:
- Jika Umur = Umur3 maka Jadwal = B
- Jika Umur = Umur2 dan JenisKelamin = L maka Jadwal = A
- Jika Umur = Umur2 dan JenisKelamin = P maka Jadwal = B
- Jika Umur = Umur2 dan Pendidikan = SMA maka Jadwal = A
- Jika Umur = Umur2 dan Pendidikan = SMK dan Level = Junior maka Jadwal = A
- Jika Umur = Umur2 dan Pendidikan = SMA dan Level = Senior maka Jadwal = B
- Jika Umur = Umur2 dan JenisKelamin = L maka Jadwal = A
- Jika Umur = Umur2 dan JenisKelamin = P maka Jadwal = B
- Jika Umur = Umur2 dan Pendidikan = SMA maka Jadwal = A
- Jika Umur = Umur2 dan Pendidikan = SMK dan Level = Junior maka Jadwal = A
- Jika Umur = Umur2 dan Pendidikan = SMA dan Level = Senior maka Jadwal = B
Rule-rule tersebut berasal dari pohon keputusan yang dibuat
berdasarkan data bulan januari 2011. Pohon keputusan januari 2011 dipilih
karena memiliki tingkat akurasi paling tinggi diantara pohon keputusan lainnya.
Tingkat akurasi pohon keputusan januari 2011 mencapai 87% dengan rincian
sebagai berikut.







EmoticonEmoticon