Data dan metode


                                           SUMBER DATA
                                                                                





Data yang digunakan adalah data karyawan yg berada di table karyawan meliputi :
NP, Nama keryawan, umur, Jenis Kelamin, pendidikan, Agama, Level (junior dan senior) lama kerja (th)
Metode yang digunakan adalah :
                                                       Metode pohon keputusan
Metode ini merupakan salah satu dari teknik yang ada pada klasifikasi . metode pohon keputusan mengubah fakta yang sangat besar menjadi pohon keputusan yang merepresantikan aturan. Pohon keputusan juga berguna untuk mengekplorasi data, menemukan hubungan tersembunyi antara jumlah calon variable input dengan sebuah variable target.
Data dalam pohon keputusan biasanya dinyataka dalam bentuk table dengan atribut dan record, atribut menyatakan suatu parameter yang disebut sebagai kriteria dalam pembentukan pohon.

                                    

                                                                               
                                                             Algoritma C4.5

Algoritma C4.5 merupakan pengembangan dari algoritma ID3. Algoritma C4.5 dan ID3 diciptakan oleh seoran peneliti dibidang kecerdasan buatan bernama  Rose quinlan pada akhir tahun 1970-an. Algoritma C4.5 membuat pohon keputusan dari atas ke bawah, dimana atribut paling atas merupakan akar, dan yang paling bawah dinamakan daun.
                       Secara umum, algoritma C4.5 untuk membangun sebuah pohon keputusan adalah sebagai berikut :
§  Hitung jumlah data, jumlah data berdasarkan anggota atribut hasil dengan syarat tertentu. Untuk proses pertama syaratnya masih kosong
§  Pilih atribut sebagai Node. 
§  Buat cabang untuk tiap-tiap anggota dari Node
§   Periksa apakah nilai entropy dari anggota Node ada yang bernilai nol. Jika ada, tentukan daun yang terbentuk. Jika seluruh nilai entropy anggota Node adalah nol, maka proses pun berhenti.
§  Jika ada anggota Node yang memiliki nilai entropy lebih besar dari nol, ulangi lagi proses dari awal dengan Node sebagai syarat sampai semua anggota dari Node bernilai nol.
Node adalah atribut yang mempunyai nilai gain tertinggi dari atribut-aribut yang ada. Untuk menghitung nilai gain suatu atribut digunakan rumus seperti yang tertera dalam persamaan berikut:


                                                               


Nilai yg terbentuk
                

              Setelah pohon keputusan terbentuk, masukkan data-data yang belum mempunyai jadwal kerja. Kemudian proses pembentukan jadwal kerja baru akan dimulai. Jadwal kerja yang baru, dibentuk berdasarkan rule-rule yang mempunyai nilai akurasi tertinggi.
                

Berikut ini rule-rule yang dipakai untuk membuat jadwal kerja yang baru di atas:
- Jika Umur = Umur3 maka Jadwal = B
- Jika Umur = Umur2 dan JenisKelamin = L maka Jadwal = A
- Jika Umur = Umur2 dan JenisKelamin = P maka Jadwal = B 
- Jika Umur = Umur2 dan Pendidikan = SMA maka Jadwal = A 
- Jika Umur = Umur2 dan Pendidikan = SMK dan Level = Junior maka Jadwal = A 
- Jika Umur = Umur2 dan Pendidikan = SMA dan Level = Senior maka Jadwal = B

Rule-rule tersebut berasal dari pohon keputusan yang dibuat berdasarkan data bulan januari 2011. Pohon keputusan januari 2011 dipilih karena memiliki tingkat akurasi paling tinggi diantara pohon keputusan lainnya. Tingkat akurasi pohon keputusan januari 2011 mencapai 87% dengan rincian sebagai berikut.
                      



EmoticonEmoticon