Data Mining – Konsep Pohon Keputusan

Ditulis pada 24 November 2009 oleh Fairuz El Said

Pohon Keputusan

Pada sesi ini akan dibahas secara ringkas konsep salah satu metode data mining yaitu pohon keputusan. Bahasan meliputi:

Latar Belakang Pohon Keputusan
Pengertian Pohon Keputusan
Manfaat Pohon Keputusan
Kelebihan Pohon Keputusan
Kekurangan Pohon Keputusan
Model Pohon Keputusan
Algoritman C.45
Contoh-contoh aplikasi

Latar Belakang Pohon Keputusan

Di dalam kehidupan manusia sehari-hari, manusia selalu dihadapkan oleh berbagai macam masalah dari berbagai macam bidang. Masalah-masalah ini yang dihadapi oleh manusia tingkat kesulitan dan kompleksitasnya sangat bervariasi, mulai dari yang teramat sederhana dengan sedikit faktor-faktor yang berkaitan dengan masalah tersebut dan perlu diperhitungkan sampai dengan yang sangat rumit dengan banyak sekali faktor-faktor turut serta berkaitan dengan masalah tersebut dan perlu untuk diperhitungkan. Untuk menghadapi masalah-masalah ini, manusia mulai mengembangkan sebuah sistem yang dapat membantu manusia agar dapat dengan mudah mampu untuk menyelesaikan masalah-masalah tersebut. Adapun pohon keputusan ini adalah sebuah jawaban akan sebuah sistem yang manusia kembangkan untuk membantu mencari dan membuat keputusan untuk masalah-masalah tersebut dan dengan memperhitungkan berbagai macam factor yang ada di dalam lingkup masalah tersebut. Dengan pohon keputusan, manusia dapat dengan mudah melihat mengidentifikasi dan melihat hubungan antara faktor-faktor yang mempengaruhi suatu masalah dan dapat mencari penyelesaian terbaik dengan memperhitungkan faktor-faktor tersebut. Pohon keputusan ini juga dapat menganalisa nilai resiko dan nilai suatu informasi yang terdapat dalam suatu alternatif pemecahan masalah. Peranan pohon keputusan ini sebagai alat Bantu dalam mengambil keputusan (decision support tool) telah dikembangkan oleh manusia sejak perkembangan teori pohon yang dilandaskan pada teori graf. Kegunaan pohon keputusan yang sangat banyak ini membuatnya telah dimanfaatkan oleh manusia dalam berbagai macam sistem pengambilan keputusan.

Pengertian Pohon Keputusan

Pohon yang dalam analisis pemecahan masalah pengambilan keputusan adalah pemetaan mengenai alternatif-alternatif pemecahan masalah yang dapat diambil dari masalah tersebut. Pohon tersebut juga memperlihatkan faktor-faktor kemungkinan/probablitas yang akan mempengaruhi alternatif-alternatif keputusan tersebut, disertai dengan estimasi hasil akhir yang akan didapat bila kita mengambil alternatif keputusan tersebut.

Manfaat Pohon Keputusan

Pohon keputusan adalah salah satu metode klasifikasi yang paling populer karena mudah untuk diinterpretasi oleh manusia. Pohon keputusan adalah model prediksi menggunakan struktur pohon atau struktur berhirarki. Konsep dari pohon keputusan adalah mengubah data menjadi pohon keputusan dan aturan-aturan keputusan. Manfaat utama dari penggunaan pohon keputusan adalah kemampuannya untuk mem-break down proses pengambilan keputusan yang kompleks menjadi lebih simpel sehingga pengambil keputusan akan lebih menginterpretasikan solusi dari permasalahan. Pohon Keputusan juga berguna untuk mengeksplorasi data, menemukan hubungan tersembunyi
antara sejumlah calon variabel input dengan sebuah variabel target. Pohon keputusan memadukan antara
eksplorasi data dan pemodelan, sehingga sangat bagus sebagai langkah awal dalam proses pemodelan bahkan ketika
dijadikan sebagai model akhir dari beberapa teknik lain. Sering terjadi tawar menawar antara keakuratan
model dengan transparansi model. Dalam beberapa aplikasi, akurasi dari sebuah klasifikasi atau prediksi adalah satu-satunya hal yang ditonjolkan, misalnya sebuah perusahaan direct mail membuat sebuah model yang akurat untuk
memprediksi anggota mana yang berpotensi untuk merespon permintaan, tanpa memperhatikan bagaimana atau mengapa model tersebut bekerja.

Kelebihan Pohon Keputusan

Kelebihan dari metode pohon keputusan adalah:

Daerah pengambilan keputusan yang sebelumnya kompleks dan sangat global, dapat diubah menjadi lebih simpel dan spesifik.
Eliminasi perhitungan-perhitungan yang tidak diperlukan, karena ketika menggunakan metode pohon keputusan maka sample diuji hanya berdasarkan kriteria atau kelas tertentu.
Fleksibel untuk memilih fitur dari internal node yang berbeda, fitur yang terpilih akan membedakan suatu kriteria dibandingkan kriteria yang lain dalam node yang sama. Kefleksibelan metode pohon keputusan ini meningkatkan kualitas keputusan yang dihasilkan jika dibandingkan ketika menggunakan metode penghitungan satu tahap yang lebih konvensional
Dalam analisis multivariat, dengan kriteria dan kelas yang jumlahnya sangat banyak, seorang penguji biasanya perlu untuk mengestimasikan baik itu distribusi dimensi tinggi ataupun parameter tertentu dari distribusi kelas tersebut. Metode pohon keputusan dapat menghindari munculnya permasalahan ini dengan menggunakan criteria yang jumlahnya lebih sedikit pada setiap node internal tanpa banyak mengurangi kualitas keputusan yang dihasilkan.

Kekurangan Pohon Keputusan

Terjadi overlap terutama ketika kelas-kelas dan criteria yang digunakan jumlahnya sangat banyak. Hal tersebut juga dapat menyebabkan meningkatnya waktu pengambilan keputusan dan jumlah memori yang diperlukan.
Pengakumulasian jumlah eror dari setiap tingkat dalam sebuah pohon keputusan yang besar.
Kesulitan dalam mendesain pohon keputusan yang optimal.
Hasil kualitas keputusan yang didapatkan dari metode pohon keputusan sangat tergantung pada bagaimana pohon tersebut didesain.

Model Pohon Keputusan

Pohon keputusan adalah model prediksi menggunakan struktur pohon atau struktur berhirarki. Contoh dari pohon keputusan dapat dilihat di Gambar berikut ini.

Model Pohon Keputusan (Pramudiono,2008)

Disini setiap percabangan menyatakan kondisi yang harus dipenuhi dan tiap ujung pohon menyatakan kelas data. Contoh di Gambar 1 adalah identifikasi pembeli komputer,dari pohon keputusan tersebut diketahui bahwa salah satu kelompok yang potensial membeli komputer adalah orang yang berusia di bawah 30 tahun dan juga pelajar. Setelah sebuah pohon keputusan dibangun maka dapat digunakan untuk mengklasifikasikan record yang belum ada kelasnya. Dimulai dari node root, menggunakan tes terhadap atribut dari record yang belum ada kelasnya tersebut lalu mengikuti cabang yang sesuai dengan hasil dari tes tersebut, yang akan membawa kepada internal node (node yang memiliki satu cabang masuk dan dua atau lebih cabang yang keluar), dengan cara harus melakukan tes lagi terhadap atribut atau node daun. Record yang kelasnya tidak diketahui kemudian diberikan kelas yang sesuai dengan kelas yang ada pada node daun. Pada pohon keputusan setiap simpul daun menandai label kelas. Proses dalam pohon keputusan yaitu mengubah bentuk data (tabel) menjadi model pohon (tree) kemudian mengubah model pohon tersebut menjadi aturan (rule).

ALGORITMA C4.5

Salah satu algoritma induksi pohon keputusan yaitu ID3 (Iterative Dichotomiser 3). ID3 dikembangkan oleh J. Ross Quinlan. Dalam prosedur algoritma ID3, input berupa sampel training, label training dan atribut. Algoritma C4.5 merupakan pengembangan dari ID3. Sedangkan pada perangkat lunak open source WEKA mempunyai versi sendiri C4.5 yang dikenal sebagai J48.

Algoritma C4.5

Pohon dibangun dengan cara membagi data secara rekursif hingga tiap bagian terdiri dari data yang berasal dari kelas yang sama. Bentuk pemecahan (split) yang digunakan untuk membagi data tergantung dari jenis atribut yang digunakan dalam split. Algoritma C4.5 dapat menangani data numerik (kontinyu) dan diskret. Split untuk atribut numerik yaitu mengurutkan contoh berdasarkan atribut kontiyu A, kemudian membentuk minimum permulaan (threshold) M dari contoh-contoh yang ada dari kelas mayoritas pada setiap partisi yang bersebelahan, lalu menggabungkan partisi-partisi yang bersebelahan tersebut dengan kelas mayoritas yang sama. Split untuk atribut diskret A mempunyai bentuk value (A) ε X dimana X ⊂ domain(A).

Jika suatu set data mempunyai beberapa pengamatan dengan missing value yaitu record dengan beberapa nilai variabel tidak ada, Jika jumlah pengamatan terbatas maka atribut dengan missing value dapat diganti dengan nilai rata-rata dari variabel yang bersangkutan.[Santosa,2007]

Untuk melakukan pemisahan obyek (split) dilakukan tes terhadap atribut dengan mengukur tingkat ketidakmurnian pada sebuah simpul (node). Pada algoritma C.45 menggunakan rasio perolehan (gain ratio). Sebelum menghitung rasio perolehan, perlu menghitung dulu nilai informasi dalam satuan bits dari suatu kumpulan objek. Cara menghitungnya dilakukan dengan menggunakan konsep entropi.

S adalah ruang (data) sampel yang digunakan untuk pelatihan, p+ adalah jumlah yang bersolusi positif atau mendukung pada data sampel untuk kriteria tertentu dan p- adalah jumlah yang bersolusi negatif atau tidak mendukung pada data sampel untuk kriteria tertentu. ntropi(S) sama dengan 0, jika semua contoh pada S berada dalam kelas yang sama. Entropi(S) sama dengan 1, jika jumlah contoh positif dan negative dalam S adalah sama. Entropi(S) lebih dari 0 tetapi kurang dari 1, jika jumlah contoh positif dan negative dalam S tidak sama [Mitchell,1997].Entropi split yang membagi S dengan n record menjadi himpunan-himpunan S1 dengan n1 baris dan S2 dengan n2 baris adalah :

Kemudian menghitung perolehan informasi dari output data atau variabel dependent y yang dikelompokkan berdasarkan atribut A, dinotasikan dengan gain (y,A). Perolehan informasi, gain (y,A), dari atribut A relative terhadap output data y adalah:

nilai (A) adalah semua nilai yang mungkin dari atribut A, dan yc adalah subset dari y dimana A mempunyai nilai c. Term pertama dalam persamaan diatas adalah entropy total y dan term kedua adalah entropy sesudah dilakukan pemisahan data berdasarkan atribut A.

Untuk menghitung rasio perolehan perlu diketahui suatu term baru yang disebut pemisahan informasi (SplitInfo). Pemisahan informasi dihitung dengan cara :

bahwa S1 sampai Sc adalah c subset yang dihasilkan dari pemecahan S dengan menggunakan atribut A yang mempunyai sebanyak c nilai. Selanjutnya rasio perolehan (gain ratio) dihitung dengan cara :

Contoh Aplikasi

Credit Risk

Berikut ini merupakan contoh dari salah satu kasus resiko kredit (credit risk) yang menggunakan decision tree untuk menentukan apakah seorang potential customer dengan karakteristik saving, asset dan income tertentu memiliki good credit risk atau bad credit risk.

Dapat dilihat pada gambar tersebut, bahwa target variable dari decision tree tersebut atau variable yang akan diprediksi adalah credit risk dengan menggunakan predictor variable : saving, asset, dan income. Setiap nilai atribut dari predictor variable akan memiliki cabang menuju predictor variable selanjutnya, dan seterusnya hingga tidak dapat dipecah dan menuju pada target variable.

Penentuan apakah diteruskan menuju predictor variable (decision node) atau menuju target variable (leaf node) tergantung pada keyakinan (knowledge) apakah potential customer dengan nilai atribut variable keputusan tertentu memiliki keakuratan nilai target variable 100% atau tidak. Misalnya pada kasus di atas untuk saving medium, ternyata knowledge yang dimiliki bahwa untuk seluruh potential customer dengan saving medium memiliki credit risk yang baik dengan keakuratan 100%. Sedangkan untuk nilai low asset terdapat kemungkinan good credit risk dan bad credit risk.

Jika tidak terdapat pemisahan lagi yang mungkin dilakukan, maka algoritma decision tree akan berhenti membentuk decision node yang baru. Seharusnya setiap branches diakhiri dengan “pure” leaf node, yaitu leaf node dengan target variable yang bersifat unary untuk setiap records pada node tersebut, di mana untuk setiap nilai predictor variable yang sama akan memiliki nilai target variable yang sama. Tetapi, terdapat kemungkinan decision node memiliki “diverse” atributes, yaitu bersifat non‐unary untuk nilai target variablenya, di mana untuk setiap record dengan nilai predictor variable yang sama ternyata memiliki nilai target variable yang berbeda. Kondisi tersebut menyebabkan tidak dapat dilakukan pencabangan lagi berdasarkan nilai predictor variable. Sehingga solusinya adalah membentuk leaf node yang disebut “diverse” leaf node, dengan menyatakan level kepercayaan dari diverse leaf node tersebut. Misalnya untuk contoh data berikut ini :

Dari training data tersebut kemudian disusunlah alternatif untuk candidate split, sehingga setiap nilai untuk predictor variable di atas hanya membentuk 2 cabang, yaitu sebagai berikut:

Kemudian untuk setiap candidate split di atas, dihitung variabel‐variabel berikut berdasarkan training data yang dimiliki. Adapun variabel‐variabel tersebut, yaitu :

,di mana

Adapun contoh hasil perhitungannya adalah sebagai berikut :

Dapat dilihat dari contoh perhitungan di atas, bahwa yang memiliki nilai goodness of split * Φ(s/t) + yang terbesar, yaitu split 4 dengan nilai 0.64275. Oleh karena itu split 4 lah yang akan digunakan pada root node, yaitu split dengan : assets = low dengan assets = {medium, high}.

Untuk penentuan pencabangan, dapat dilihat bahwa dengan assets=low maka didapatkan pure node leaf, yaitu bad risk (untuk record 2 dan 7). Sedangkan untuk assets = {medium, high} masih terdapat 2 nilai, yaitu good credit risk dan bad credit risk. Sehingga pencabangan untuk assets = {medium, high} memiliki decision node baru. Adapun pemilihan split yang akan digunakan, yaitu dengan menyusun perhitungan nilai Φ(s/t) yang baru tanpa melihat split 4, record 2 dan 7.

Demikian seterusnya hingga akhirnya dibentuk leaf node dan membentuk decision tree yang utuh (fully grown form) seperti di bawah ini :

Sistem Pakar Diagnosa Penyakit (Kusrini)

Dalam aplikasi ini terdapat tabel-tabel sebagai berikut:

Tabel Rekam_Medis, berisi data asli rekam medis pasien
Tabel Kasus, beisi data variabel yang dapat mempengaruhi kesimpulan diagnosis dari pasien-pasien yang ada, misalnya Jenis Kelamin, Umur, Daerah_Tinggal, Gejala_1 s/d gejala_n, Hasil_Tes_1 s/d Hasi_Tes_n. Selain itu dalam tabel ini juga memiliki field Hasil_Diagnosis.

Tabel Aturan, berisi aturan hasil ekstrak dari pohon keputusan.

Proses akuisisi pengetahuan yang secara biasanya dalam sistem pakar dilakukan oleh sistem pakar, dalam sistem ini akan dillakukan dengan urutan proses ditunjukkan pada gambar berikut:

Hasil pembentukan pohon keputusan bisa seperti pohon keputusan yang tampak pada gambar:

Lambang bulat pada pohon keputusan melambangkan sebagai node akar atau cabang (bukan daun) sedangkan kotak
melambangkan node daun. Jika pengetahuan yang terbentuk beruka kaidah produksi dengan format:
Jika Premis Maka Konklusi Node-node akar akan menjadi Premis dari aturan sedangkan node daun akan menjadi bagian konklusinya. Dari gambar pohon keputusan pada gambar 4, dapat dibentuk aturan sebagai berikut:

Jika Atr_1 = N_1
Dan Atr_2 = N_4
Dan Atr_3 = N_9
Maka H_1
Jika Atr_1 = N_1
Dan Atr_2 = N_4
Dan Atr_3 = N_10
Dan Atr_4 = N_11
Maka H_2
Jika Atr_1 = N_1
Dan Atr_2 = N_4
Dan Atr_3 = N_10
Dan Atr_4 = N_12
Maka H_2
Jika Atr_1 = N_1
Dan Atr_2 = N_5
Maka H_4
Jika Atr_1 = N_2
Maka H_5
Jika Atr_1 = N_3
Dan Atr_5 = N_6
Maka H_6
Jika Atr_1 = N_3
Dan Atr_5 = N_7
Maka H_7
Jika Atr_1 = N_3
Dan Atr_5 = N_8
Maka H_8

Model case based reasoning dapat digunakan sebagai metode akuisisi pengetahuan dalam aplikasi system pakar diagnosis penyakit. Aturan yagn dihasilkan system ini mampu digunakan untuk mendiagnosis penyakit didasarkan pada data-data pasien. Dalam penentuan diagnosis penyakit belum diimplementasikan derajat kepercayaan terhadap hasil diagnosis tersebut.

Referensi:

Kusrini, Hartati, Penggunaan Penalaran Berbasis Kasus Untuk Membangun Basis Pengetahuan Dalam Sistem Diagnosis Penyakit
Teknik Klasifikasi Pohon Keputusan Untuk Memprediksi Kebangkrutan Bank Berdasarkan Rasio Keuangan Bank
Pramudiono, Iko. Pengantar Data Mining: Menambang Permata Pengetahuan di Gunung Data. http://www.ilmukomputer.com
Kusrini, 2006, Sistem Pakar Teori dan Aplikasi, Penerbit Andi Offset, Yogyakarta.
Santosa, Budi. 2007. Data Mining : Teknik Pemanfaatan Data untuk keperluan Bisnis. Graha Ilmu. Yogyakarta.
Tan, Pang-Ning, Michael Steinbach, and Vipin Kumar. 2004. Introduction to Data Mining.
Website WEKA. http://www.cs.waikato.ac.nz/ml/weka/.
Witten, Ian H. dan Eibe Frank. 2005. Data Mining: Practical machine learning tools and techniques,2nd Edition. Morgan Kaufmann. San Francisco.

Lihat Juga:

Data Mining – Konsep Jaringan Syaraf Tiruan

79 thoughts on “Data Mining – Konsep Pohon Keputusan”

fina ayu pada 9 Desember 2009 pukul 8:49 am berkata:

manfaat pohon keputusannya mana?

Balas ↓
- Fairuz El Said pada 9 Desember 2009 pukul 9:15 am berkata:
  
  sabar..tunggu ya..
  
  Balas ↓
  - rizal pada 20 Januari 2016 pukul 1:28 pm berkata:
    
    permisi mas.. saya lagi TA. saya minta tolang gmna caranya mengcleaning data sample yg kita ambil. karna data na terlalu bnyak, saya menggunakan metode dicesion tree (judulnya mendiagnosa penyakit mata menggunakan metode dicesion tree)
rahmadi pada 6 Januari 2010 pukul 8:41 am berkata:

gimana bkin google seo nya pak?

Balas ↓
- Fairuz El Said pada 6 Januari 2010 pukul 12:43 pm berkata:
  
  Baca di kategori diblog and seo
  
  Balas ↓
incubusen pada 13 Maret 2010 pukul 4:31 am berkata:

pak punya sejarah berawalnya ada decision tree ga???
tx

Balas ↓
Alexander Burhani Marda pada 22 Maret 2010 pukul 2:13 pm berkata:

pak klo decision tree untuk produksi perikanan bagaimana pak?
balas di email aja ya pak

Balas ↓
- Fairuz El Said pada 22 Maret 2010 pukul 8:50 pm berkata:
  
  domain mungkin diperjelas judulnya, misalnya sistem pendukung keputusan penentuan bibit ikan pada tambak menggunakan decision tree..
  
  Balas ↓
Vita fajar pada 27 April 2010 pukul 2:46 pm berkata:

Wah makasih mas membantu. Saya buat sispak kelayakan Kredit. Jd tambah referensinya dah.

Balas ↓
- Fairuz El Said pada 28 April 2010 pukul 5:51 pm berkata:
  
  Semoga bermafaat
  
  Balas ↓
- agus triono pada 3 Januari 2012 pukul 1:16 pm berkata:
  
  bagaimna menentukan atribut sedangkan nilai gain tiap atributnya sama???
  mohon penjelasannya!!!!!
  
  Balas ↓
franz pada 1 Juni 2010 pukul 9:22 pm berkata:

Terimakasih Pak,,ini sangat membantu saya..
saya sedang menyusun skripsi saya tentang pohon keputusan..
saya mau bertanya,dan saya akan sangat berterimakasih atas masukannya,,
selain algoritma pohon keputusan c4.5,,algoritma apa lagi yang setara mutunya dengan itu?

trims…

Balas ↓
- Fairuz El Said pada 2 Juni 2010 pukul 1:59 pm berkata:
  
  ID3, link ini mungkin bisa membantu anda:
  
  Klik untuk mengakses candy-bachelor.pdf
  
  atau
  
  http://www.codeproject.com/KB/recipes/ID3/ID3_src.zip
  
  Balas ↓
  - franz pada 2 Juli 2010 pukul 12:34 pm berkata:
    
    terimakasih banyak Pak..
    sangat-sangat membantu…
    oya pak,,bagaimana dengan C5?
    
    apakah Bapak sudah pernah eksplorasi?
    kalau pernah atau ada referensi biuat saya,,mohon bantuannya untuk share ya pak..
    thanx…
  - Fairuz El Said pada 3 Juli 2010 pukul 5:40 am berkata:
    
    Untuk C5 Belum pernah. Terimkasih juga sudah berkunjung
  - franz pada 6 Juli 2010 pukul 3:08 pm berkata:
    
    bagaimana dengagn c4.5 pak?
  - franz pada 6 Juli 2010 pukul 4:47 pm berkata:
    
    oya Pak..
    link yang Bapak berikan pada saya untuk source code ID3.
    kalau dengan C4.5 atau SCART atau CHAID ada gak Pak?
Dhita pada 2 Juni 2010 pukul 6:51 pm berkata:

Permisi pak saya dhita mau bertanya tentang pohon keputusan dengan algoritma ID3. saya masih bingung dalam penggunaannya….dan pembuatan programnya bisa kah anda membantu saya dalam hal ini…
dengan menggunakan turbo C

sekian dari saya,
terima kasih

Dhita

Balas ↓
- Fairuz El Said pada 3 Juni 2010 pukul 3:04 am berkata:
  
  ID3, c45, c50 adalalah algoritma untuk induksi pembentukan pohon berdasarkan data-data yang telah ada. Saya sarankan anda membaca buku Data mining tulisan Ibu Kusrini atau Link ini mungkin bisa membantu anda:
  
  Klik untuk mengakses candy-bachelor.pdf
  
  atau
  
  http://www.codeproject.com/KB/recipes/ID3/ID3_src.zip
  
  Balas ↓
  - Dhita pada 5 Juni 2010 pukul 2:10 pm berkata:
    
    Trima Kasih..
    Buku Ibu Kusrini judul buku dan penerbitnya apa ya??
  - Fairuz El Said pada 5 Juni 2010 pukul 10:54 pm berkata:
    
    Data Mining penerbitnya andi ofset
  - dhita pada 8 Juni 2010 pukul 12:41 pm berkata:
    
    klo nilai gain yg terbesar tapi lebih dari satu terus yang dipilih yg mana???
  - jamal pada 20 Juli 2010 pukul 3:48 pm berkata:
    
    http://www.codeproject.com/KB/recipes/ID3/ID3_src.zip
    
    file kok g bisa di implementasikan…. ???
elsa pada 20 Juni 2010 pukul 10:26 am berkata:

pak, klo pake c.50 gmn pak??kriteria decission tree minimal brp y pak??

Balas ↓
arlan pada 24 Juni 2010 pukul 11:45 am berkata:

terima kasih atas pencerahannya

Balas ↓
erwin pada 28 Juli 2010 pukul 3:27 am berkata:

Pak, saya mau tanya pak tau g konsep y cased based reasioning yang berhirarki?? terus contoh kasus y seperti apa???

Balas ↓
- Fairuz El Said pada 28 Juli 2010 pukul 8:51 pm berkata:
  
  Kalo gak salah nih cased based reasioning yang berhirarki sering disebut dengan Stratifieed case-based reasoning metode ini biasanya digunakan untuk kasus penelusuran (pencarian), pencocokan dan adaptasi. Algoritma Stratified-CBR menggunakan kembali solusi yang tersimpan ditiap tingkatan abstraksi. Setiap kasus dicocokkan dengan pustaka kasus yang disimpan dalam abstraksi berjenjang tersebut. Proses pecocokan dimulai pada top level bergerak ke anak2nya (level lebih rendah) sampai ditemukan pustaka kasus yang sesuai dengan kasus yang dicari, proses dapat saja dilakukan hingga padatingkat abstraksi terendah jika pada level diatas tidak ada yang match. Pemafaat Stratified-CBR penggunaanya sama denga algoritma CBR yang lain, perbedaanya hanya pada metodenya saja. Semoga jawaban ini benar hehehe…maaf.
  
  Balas ↓
diah pada 19 September 2010 pukul 7:04 am berkata:

Pak bagaimana dengan proses pruning yang terjadi pada algoritma C4.5. Bisa minta tolong penjelasannya.

Terima kasih

Balas ↓
anto pada 26 September 2010 pukul 7:00 pm berkata:

saya punya data pengguna internet per rumah tanggad dengan var-var bantu lainya untuk 1 prov. apakah model pohon keputusan bisa digunakan untuk menentukan klasifikasi pengguna internet? atau pakai metode data mining apa yang paling cocok?.tks

Balas ↓
nana pada 14 Oktober 2010 pukul 9:36 am berkata:

sya udh putus asa dgn program algo c4.5 sya yg kacau..
tol. sya ..bagaimna cara menggunakan weka sebagai engine tetapi interface input n putnya dibuat dg php..
trimakshhhh

Balas ↓
Idham pada 29 November 2010 pukul 6:49 am berkata:

pak ada refrensi buat klasifikasi pelanggan potenasiasl ga

Balas ↓
- Fairuz El Said pada 29 November 2010 pukul 11:09 am berkata:
  
  Coba anda baca Buku “Data Mining untuk Aplikasi Bisnis” yang dibuat oleh SPSS..
  
  Balas ↓
zefy pada 22 Desember 2010 pukul 1:26 am berkata:

makasih materinya pak

Balas ↓
viva pada 12 Januari 2011 pukul 9:52 am berkata:

kalo pohon keputusan itu bisa memberikan lebih dari 1 keputusan g pak??
contohnya nanti hasil yg sudah ada di OR kan dengan hasil yang berikutnya…

dan kalo pakai algoritma biasa bsa tdak pak?

Balas ↓
- Fairuz El Said pada 20 Januari 2011 pukul 6:40 pm berkata:
  
  Tidak bisa lebih dari satu. Bisanya hanya satu atau tidak memiliki keputusan samasekali. Bisa dengan algoritma biasa dengan cara memasukkan secara manual pohon keputusannya dengan menggunakan tabel keputusan.
  
  Balas ↓
Eka pada 28 Februari 2011 pukul 11:24 am berkata:

klo buku decision tree id3 tanpa gain ato dengan gain apa yah jdul ma pnerbitx ???
saya udh xari pi kgk ktemu2, tlg yah bwt skripsi neh…

Balas ↓
- Fairuz El Said pada 1 Maret 2011 pukul 7:17 am berkata:
  
  Coba baca ibu Kusrini, Andi offset, atau bisa juga car ebook di 4shared
  
  Balas ↓
Eka pada 28 Februari 2011 pukul 11:31 am berkata:

thx sblomx….

Balas ↓
- Fairuz El Said pada 1 Maret 2011 pukul 7:21 am berkata:
  
  sama2 mas eka
  
  Balas ↓
Eka pada 4 Maret 2011 pukul 1:52 pm berkata:

klo buku yg tnpa gain apa yah ???

Balas ↓
ifna pada 17 Maret 2011 pukul 8:27 pm berkata:

kak fairuz el said, ifna minta ijin copy materi data mining.

Balas ↓
- Fairuz El Said pada 19 Maret 2011 pukul 3:32 am berkata:
  
  Boleh banget Dek Ifna..
  
  Balas ↓
andrew pada 1 April 2011 pukul 8:52 am berkata:

klo implementasinya dalam php ada ga pak?
saya bingung waktu pembentukan tree nya

Balas ↓
- Fairuz El Said pada 1 April 2011 pukul 4:12 pm berkata:
  
  Implementasinya bisa menggunakan tabel keputusan.
  
  Balas ↓
  - andrew pada 1 April 2011 pukul 10:09 pm berkata:
    
    maaf pak tanya lagi, ada saran untuk membangun klasifikasi dari dokumen? jadi saya pakai token yang paling berbobot dari korpus. Yang saya bingungkan adalah ketika token sudah dipakai sebagai 1 atribut, bgaimana supaya token tersebut tidak dipilih lagi dari database.
    mengingat dalam 1 level di tree ada kemungkinan atribut yang sama terpakai lagi (dengan rule yang berbeda tentunya), misal di level 2 ada kemungkinan atribut “A” terpakai lagi sebanyak 4x (level 0 adalah atribut pertama)
    trima kasih atas sarannya
  - Fairuz El Said pada 2 April 2011 pukul 4:53 pm berkata:
    
    Mohon maaf mas Andrew saya belum begitu paham struktur dan relasi database yang digunakan.
    Menurut saya, bisa saja anda menambahkan field untuk menandai token yang sudah digunakan oleh suatu atribut, sehingga bisa difilter.
Zulkarnain Nasution pada 11 Mei 2011 pukul 10:27 am berkata:

Pak klo desain tree untuk stimulasi da intervensi dini tumbuh kembang balita gmana???

Balas ↓
- Fairuz El Said pada 25 Mei 2011 pukul 8:14 am berkata:
  
  maaf domainnya saya tidak begitu paham..boleh minta knowledge basenya? sekedar berbagi
  
  Balas ↓
Jerry pada 1 Juni 2011 pukul 11:04 am berkata:

mau tanya pak, saya kurang begitu paham dg sistem pakar,. kalau diterapkan “diagnosa penyakit ayam” pohon keputusannya jd seperti apa ya pak,..
punya bahan gambaran yang bisa dijadikan inferensi gak pak,.

Balas ↓
agus triono pada 1 Juni 2011 pukul 12:41 pm berkata:

Asslkm. maaf Pak Fairuz mengganggu.
saya maun nanya bapak ada nggak buku tentang algoritma C4.5 soalnya saya sedang menyusun TA tentang Algoritma tsb….

Balas ↓
Dephie Mauriza pada 6 Juli 2011 pukul 9:36 pm berkata:

pak,cari referensi buku C45 dmn ya??thanks

Balas ↓
- Fairuz El Said pada 14 Juli 2011 pukul 12:52 pm berkata:
  
  Ada sih tapi bahasa Inggris..cari saja 4Shared.com
  
  Balas ↓
didi pada 5 Oktober 2011 pukul 12:56 pm berkata:

mas, punya rumus php untuk perhitungan metode case base reasoning gak??

Balas ↓
- Fairuz El Said pada 6 Oktober 2011 pukul 7:52 am berkata:
  
  Maad mas Didik, kebetulan belum punya.
  
  Balas ↓
adi pada 10 Oktober 2011 pukul 7:44 pm berkata:

makasih gan, lumayan buat referensi tugas kuliah nih..hehe

Balas ↓
apri pada 13 Desember 2011 pukul 6:39 pm berkata:

pak klo decision tree untuk desain produk bagaimana? balas via email aja y pak

Balas ↓
yusuf pada 15 Januari 2012 pukul 6:44 pm berkata:

pak kalau saya punya data kwalitas beras, bisa tidak saya pake decision tree dan kalau boleh, bapak kasih saran datanya akan dibuat seperti apa..?

Balas ↓
yusuf pada 15 Januari 2012 pukul 6:51 pm berkata:

pak punya literatur untuk masalah gain pada c4.5

Balas ↓
Reza pada 23 Januari 2012 pukul 7:01 pm berkata:

Selamat malam kak Fairuz, TA saya tentang sistem pakar prediksi drop out mahasiswa menggunakan c5.0 . kira2 buku decision tree judulnya apa ya? trus pengarangnya siapa? terima kasih kak 😀

Balas ↓
yusuf pada 30 Januari 2012 pukul 10:57 pm berkata:

Pak Fairus, terimakasih atas refrensinya, oh ya pak, apakah sebelum kita membiat model decision tree harus menghilangkan duplikat, bila saya pakai RapidMiner

Balas ↓
- evi susanti pada 22 September 2014 pukul 9:05 am berkata:
  
  Assallamualaikum mas yusuf,maaf mas saya mau tanya mas punya buku rapidminer,kira” beli dimana ya mas,saya dari di toko online tidak ada mas,trimakasih
  
  Balas ↓
Citra pada 15 Mei 2012 pukul 6:54 pm berkata:

assalamualaikum kak fairus, kak saya mau minta tolong pencerahan nich..saya membuat TA tentang decision tree dgn c4.5 untuk mengukur berat badan domba..gimana yah kak untuk buat program nya,,dan jika ada buku yang pas dengan judul saya kira” apa ya?makasih kak 🙂

Balas ↓
- Fairuz El Said pada 15 Mei 2012 pukul 8:56 pm berkata:
  
  Wah variabelnya apa tuh untuk menghitung. Datanya seperti apa untuk membentuk pohonnya.
  
  Balas ↓
murien pada 20 Juli 2012 pukul 7:47 am berkata:

kalau ada lebih dari satu nilai gain yang sama, bagaimana kita membentuk root ny Pak..
dengan memilih salah satu atau kita jadikan itu semua root ny..
terima kasih..

Balas ↓
Rahmi Juwita Sukma pada 3 Oktober 2012 pukul 11:50 pm berkata:

selamat malam pak saya mau tanya tentang skripsi saya, kebetulan saya melakukan penelitian dengan memakai algoritma c45,,,tatapi saya bingung dalam pengolahan datanya, apakah saya boleh konsultasi dengan bapak??kalo boleh tau email bapak apa??terima kasih

Balas ↓
taufiq pada 14 Oktober 2012 pukul 9:35 am berkata:

baru saya mendapat permasalahan, untuk menentukan suatu atribut sebagai akar adalah dengan nilai gain tertinggi. dan ternyata nilai atribut dengan gain tertinggi itu tidak ada yang merujuk pada 1 keputusan. apakah ini salah satu soal yg tdk memiliki keputusan ?

Balas ↓
tri budhiarti (@cicikTrie) pada 7 November 2012 pukul 7:55 pm berkata:

selamat malam pak saya mau tanya tentang skripsi saya, kebetulan saya membuat skripsi ttg minat masyarakat dalam memilih smartphone dengan memakai algoritma c45,,,tatapi saya bingung dalam pengolahan datanya, apakah saya boleh konsultasi dengan bapak??kalo boleh tau email bapak apa??mksih 🙂

Balas ↓
Fauzan Ardhi Wicaksono pada 10 November 2012 pukul 10:50 am berkata:

Permisi.. sy mau tanya..
untuk pemilihan atribut..pada algoritma CART..saya baca menggunakan indeks Gini..hanya krg mengerti..
lalu sy cari refrensi lain..utk pmilihan atribut bs pakai nilai goodness.. sperti yang bpk contohkan…
nah yg sy mau tanya apa bedanya indeks gini dan nilai goodness itu..? samakah atau bagaimana..? mohon penjelasannya..

terima kasih sebelumnya…

Balas ↓
kimi pada 7 Mei 2013 pukul 6:28 pm berkata:

Maaf numpang tanya apa kah ssorng hrus mengerti algoritma c 4 5 dlm pmbuatan sispak?

Balas ↓
- Fairuz El Said pada 20 Juni 2013 pukul 10:05 am berkata:
  
  Enggak juga ada banyak metode yang lain
  
  Balas ↓
alpy pada 1 Oktober 2013 pukul 4:58 pm berkata:

assallamualaikum, permisi pak.
saya sudah coba hitung pohon keputusan menggunakan id3, dan didapat Information Gain (IG) tertingginya yang dijadikan node awal, lalu kan ada itu atribut daun(cabangnya dibawah) masih tanda tanya ada perbedaan. Dan yang tanda tanya itu ada 2 cabang kiri dan tengah sedangkan dikananya sdh didapat keputusanya.
Yang saya tanyakan cabang mana dulu yang dicari? kiri atau tengah?

Balas ↓
julmonz pada 15 Oktober 2013 pukul 9:31 pm berkata:

permisi pak, saya mau tanya gimana cara manualnya menentukan split point dari data numerikal? makasih

Balas ↓
reza pada 3 November 2013 pukul 11:16 pm berkata:

Pak, kalo kita punya data penjualan rokok
kira2 penerapan data mining nya gimana ya pak?

Balas ↓
fat pada 24 Maret 2014 pukul 7:38 am berkata:

makasih ea pak ats materix

Balas ↓
Habidan pada 15 Mei 2014 pukul 1:24 pm berkata:

pak mau , punya source code ID3?

Balas ↓
affan pada 30 Juli 2014 pukul 2:17 pm berkata:

saya boleh minta flowchart untuk proses post pruningnya pak??

Balas ↓
Bi Dan Thành Thị pada 13 Januari 2015 pukul 1:42 pm berkata:

maaf mau tanya, kan sy bikin model pohonnya udah jadi di program , nah lo sy mau bikin modelnya dg bentuk yg ada bulat, kotak itu pka software apa ya??? lo pke word atau excel kn gk mungkin soalnya modelnya panjang bgt..

Balas ↓
- Fairuz El Said pada 21 Maret 2015 pukul 6:24 pm berkata:
  
  Pake Visio aja mbak
  
  Balas ↓
Liesly Jayaputra pada 8 Desember 2015 pukul 2:53 pm berkata:

pak saya masi awam dengan pohon keputusan …. apakah contoh aplikasinya hanya bisa dengan penyelesaian algoritma? dan saya kurang menegerti apa hubungan kredit risk dengan tabel rekam medis ya pak?

Balas ↓