aspBlog: October 2018

Pembahasan tabel nilai siswa/siswi menggunakan Teknik klasifikas, Regresi dan Klasterisasi pada Data Mining

October 18, 2018 Add Comment

Sebelumnya saya akan menjelaskan beberapa teknik yang terdapat pada mining berikut :

1. Klasifikasi

Klasifikasi adalah menentukan sebuah record data baru ke salah satu dari beberapa kategori (atau klas) yang telah didefinisikan sebelumnya. Disebut juga dengan “supervised learning

2. Regresi (Regression)

Memprediksi nilai dari suatu variabel kontinyu yang diberikan berdasarkan nilai dari variabel yang lain, dengan mengasumsikan sebuah model ketergantungan linier atau nonlinier.

3. Mempartisi data-set menjadi beberapa sub-set atau kelompok sedemikian rupa sehingga elemen- elemen dari suatu kelompok tertentu memiliki set properti yang di share bersama, dengan tingkat similaritas yang tinggi dalam satu kelompok dan tingkat similaritas antar kelompok yang rendah.

Data diatas merupakan data nilai siswa/I sekolah menengah kejuruan kelas tahun ajaran 2017 SMT II. Ada beberapa data yang saya telah ubah seperti, NISN, TTL dan ALAMAT dikarenakan data tersebut bersifat pribadi tidak untuk disebar luaskan. Dari data tersebut saya mencoba mengaplikasikan ke 3 teknik data mining. Dimulai dari menetukan Atribut dan Object dari data tersebut.

Atribut : Merupakan nila data yang terdapat pada suatu object yang berasal dari class, atribut merepresentasikan karakteristik dari suatu object. berupa NISN. NAMA, JENIS KELAMIN, TTL, ALAMAT KELAS NILAI MATA PELAJARAN
Object : Semua hal yang ada dalam dunia nyata , baik kongkrit maupun abstrak Contoh pada table di atas adalah : siswa/I, (object kongkrit) jadawal pelajaran (object abstrak)

Adapun tujuan mengklasifikasikan adalah untuk mementukan Atribut dan Object pada sebuah data yang akan diolah dan untuk mengimplentasikan teknik data mining dalam sebuah tabel data nilai mahasiswa/i. demikian penjalasan singkat yang saya buat, nantikan penjelasan berikutnya. Terimakasih

Data dan metode

October 11, 2018 Add Comment

SUMBER DATA

Data yang digunakan adalah data karyawan yg berada di table karyawan meliputi :
NP, Nama keryawan, umur, Jenis Kelamin, pendidikan, Agama, Level (junior dan senior) lama kerja (th)
Metode yang digunakan adalah :

Metode pohon keputusan

Metode ini merupakan salah satu dari teknik yang ada pada klasifikasi . metode pohon keputusan mengubah fakta yang sangat besar menjadi pohon keputusan yang merepresantikan aturan. Pohon keputusan juga berguna untuk mengekplorasi data, menemukan hubungan tersembunyi antara jumlah calon variable input dengan sebuah variable target.

Data dalam pohon keputusan biasanya dinyataka dalam bentuk table dengan atribut dan record, atribut menyatakan suatu parameter yang disebut sebagai kriteria dalam pembentukan pohon.

Algoritma C4.5

Algoritma C4.5 merupakan pengembangan dari algoritma ID3. Algoritma C4.5 dan ID3 diciptakan oleh seoran peneliti dibidang kecerdasan buatan bernama Rose quinlan pada akhir tahun 1970-an. Algoritma C4.5 membuat pohon keputusan dari atas ke bawah, dimana atribut paling atas merupakan akar, dan yang paling bawah dinamakan daun.

Secara umum, algoritma C4.5 untuk membangun sebuah pohon keputusan adalah sebagai berikut :

§ Hitung jumlah data, jumlah data berdasarkan anggota atribut hasil dengan syarat tertentu. Untuk proses pertama syaratnya masih kosong

§ Pilih atribut sebagai Node.

§ Buat cabang untuk tiap-tiap anggota dari Node

§ Periksa apakah nilai entropy dari anggota Node ada yang bernilai nol. Jika ada, tentukan daun yang terbentuk. Jika seluruh nilai entropy anggota Node adalah nol, maka proses pun berhenti.

§ Jika ada anggota Node yang memiliki nilai entropy lebih besar dari nol, ulangi lagi proses dari awal dengan Node sebagai syarat sampai semua anggota dari Node bernilai nol.

Node adalah atribut yang mempunyai nilai gain tertinggi dari atribut-aribut yang ada. Untuk menghitung nilai gain suatu atribut digunakan rumus seperti yang tertera dalam persamaan berikut:

Nilai yg terbentuk

Setelah pohon keputusan terbentuk, masukkan data-data yang belum mempunyai jadwal kerja. Kemudian proses pembentukan jadwal kerja baru akan dimulai. Jadwal kerja yang baru, dibentuk berdasarkan rule-rule yang mempunyai nilai akurasi tertinggi.

Berikut ini rule-rule yang dipakai untuk membuat jadwal kerja yang baru di atas:

- Jika Umur = Umur3 maka Jadwal = B
- Jika Umur = Umur2 dan JenisKelamin = L maka Jadwal = A
- Jika Umur = Umur2 dan JenisKelamin = P maka Jadwal = B
- Jika Umur = Umur2 dan Pendidikan = SMA maka Jadwal = A
- Jika Umur = Umur2 dan Pendidikan = SMK dan Level = Junior maka Jadwal = A
- Jika Umur = Umur2 dan Pendidikan = SMA dan Level = Senior maka Jadwal = B

Rule-rule tersebut berasal dari pohon keputusan yang dibuat berdasarkan data bulan januari 2011. Pohon keputusan januari 2011 dipilih karena memiliki tingkat akurasi paling tinggi diantara pohon keputusan lainnya. Tingkat akurasi pohon keputusan januari 2011 mencapai 87% dengan rincian sebagai berikut.

Klasifikasi Data Karyawan Untuk Menentukan Jadwal Kerja Menggunakan Metode Decision Tree

October 05, 2018 2 Comments

halloo.. sebelumnya perkenalkan nama saya Angga, seorang mahasiswa STMIK Nusa Mandiri kampus Depok dan selain menjadi mahasiswa saya juga seorang pekerja. saya bekerja disalah satu Perbankan milik pemerintah di daerah Jakarta Selatan Indonesia.
oke, Saat ini ini saya mendapat tugas mata kuliah DATA MINING untuk membuat sebuah blog yang membahas tentang METODE, PERMASALAHAN YANG SEDANG TERJADI DAN KESIMPULANNYA. sumber Jurnal tgl 03-Juni-2013 Budanis Dwi Meilani Achmad dan Fauzi Slamat berjudul "Klasifikasi Data Karyawan Untuk Menentukan Jadwal Kerja Menggunakan Metode Decision Tree "

Data mining merupakan suatu proses untuk menemukan informasi-informasi yang bermanfaat dari sekumpulan database yang berukuran besar. Salah satu teknik yang ada pada data mining adalah klasifikasi. Dengan menerapkan teknik klasifikasi pada data-data karyawan dan jadwal kerja, diharapkan nantinya dapat menghasilkan suatu pola-pola tertentu. Dan dari pola-pola tersebut dapat dibuat jadwal kerja yang baru. menggunakan adalah metode Decision Tree dan algoritma yang digunakan untuk membentuk pohon keputusan adalah algoritma C4.5. Metode Decision Tree merupakan metode yang merubah fakta yang sangat besar menjadi sebuah pohon keputusan yang mereprentasikan aturan-aturan. Pohon keputusan ini juga berguna untuk mengeksplorasi data, serta menemukan hubungan tersembunyi antara sejumlah calon variabel input dengan sebuah variabel target. Banyak algoritma yang dapat dipakai dalam pembentukan pohon keputusan, antara lain ID3, C4.5, CART. Algoritma C4.5 merupakan pengembangan dari algoritma ID3. Algoritma C4.5 membuat pohon keputusan dari atas ke bawah, dimana atribut paling atas merupakan akar, dan yang paling bawah dinamakan daun. Kata kunci: Data mining, jadwal kerja, Decision Tree, algoritma C4.5.

PERMASALAHAN
Permalasalahan yang terjadi adalah sulit menentukan jadwal kerja karyawan sehingga banyak nya karyawan yang jadwal pekerjaannya tidak beraturan. Dengan menerapkan teknik klasifikasi pada data-data karyawan dan jadwal kerja, diharapkan nantinya dapat menghasilkan suatu pola-pola tertentu.

METODE

Metode yang digunakan dalam jurnal ini adalah METODE DECISION TREE merupakan salah satu metode yang ada pada teknik klasifikasi dalam data mining, Metode pohon keputusan mengubah fakta yang sangat besar menjadi pohon keputusan yang merepresentasikan aturan.
Pohon keputusan juga berguna untuk mengekplorasi data, menemukan hubungan tersembunyi antara sejumlah calon variabel input dengan sebuah variabel target.
Data dalam pohon keputusan biasanya dinyatakan dalam bentuk tabel dengan atribut dan record.

KESIMPULAN

Dari perancangan dan pembuatan Aplikasi Penjadwalan Kerja ini, dapat ditarik kesimpulan bahwa:

1. Aplikasi Penjadwalan Kerja ini mampu membuat jadwal kerja baru berdasarkan jadwal kerja lama dengan menggunakan metode Decision Tree.

2. Aplikasi Penjadwalan Kerja ini akan memudahkan user dalam membuat jadwal kerja karena aplikasi ini mampu membuat jadwal kerja dengan waktu yang singkat.

3. Rule yang digunakan adalah rule januari 2011 karena rule tersebut memiliki nilai akurasi paling tinggi yaitu sebesar 87%.

4. Atribut hasil yang digunakan adalah atribut jadwal. Jika atribut lain yang digunakan, maka pohon keputusan tidak akan terbentuk karena kurangnya jumlah data.

5. Data baru yang diinputkan harus memiliki atribut pada pohon. Jika ada salah satu atribut pada pohon yang tidak disertakan pada data baru, maka jadwal kerja yang baru tidak akan terbentuk.

aspBlog

Pembahasan tabel nilai siswa/siswi menggunakan Teknik klasifikas, Regresi dan Klasterisasi pada Data Mining

Data dan metode

Klasifikasi Data Karyawan Untuk Menentukan Jadwal Kerja Menggunakan Metode Decision Tree

Kategori

Kategori