Kenali 3 Model Algoritma Supervised Learning

Belajar Data Science di Rumah 02-Maret-2021

https://dqlab.id/files/dqlab/cache/2f06ef5b341f9c60395837808b260ae7_x_Thumbnail800.png

Kamu mungkin sudah mengenal jenis Algoritma yang satu ini, yap. Sesuai dengan tajuk artikel ini akan membahas tentang Algoritma Supervised Learning khususnya untuk model Classification. Tapi, agar lebih terarah kami akan mengulas sedikit mengenai apa itu Algoritma Supervised Learning. Algoritma Supervised Learning merupakan jenis algoritma yang tidak bisa belajar sendiri tetapi harus diberi contoh terlebih dahulu dengan cara memberi label pada dataset yang kita punya. Memberi label disini artinya adalah dataset kita telah diberikan nilai kebenarannya yang akan dijadikan sebagai nilai target atau nilai acuan. Supervised Learning dapat membantu suatu organisasi dalam memecahkan berbagai masalah real yang dalam skala besar, seperti mengklasifikasikan spam dalam folder terpisah di kotak masuk email kamu.

Algoritma Supervised Learning dibagi menjadi 3 model yaitu, model Classification, Regression, dan Forecasting. Masing-masing model tersebut memiliki kegunaan yang berbeda-beda dan kamu dapat digunakan sesuai dengan kebutuhan kamu. Tapi, pada artikel kali ini kami khusus akan mengulas tentang jenis Model Classification saja. Classification atau klasifikasi artinya mengelompokkan hasil yang ada di dalam kelas. Jika kita memberi label input menjadi 2 kelas berbeda, itu disebut klasifikasi biner. Untuk lebih jelasnya yuk, langsung simak 3 jenis Model Classification di Algoritma Supervised Learning.

1. NaÃ¯ve Bayes Classifier

Tipe model Classification pertama yang akan kami bahas adalah NaÃ¯ve Bayes Classifier. Sesuai dengan namanya, NaÃ¯ve Bayes Classifier merupakan model klasifikasi yang mengadopsi prinsip dari Teorema Bayes. Yang artinya keberadaan satu fitur tidak mempengaruhi fitur lainnya di setiap kemungkinan hasil tertentu. Model ini juga mudah digunakan dan sangat berguna untuk kumpulan data yang sangat besar. Oleh karena itu, NaÃ¯ve Bayes dikenal unggul bahkan dapat mengungguli metode klasifikasi yang sangat canggih lainnya.

Teorema Bayes memberikan cara untuk menghitung probabilitas.Perhatikan persamaan di bawah ini:

P (A|B) = P(B|A)P(A)P(B)

Jika asumsi independensi berlaku, pengklasifikasi Naive Bayes berperforma lebih baik dibandingkan dengan model lain seperti regresi logistik dan kamu memerlukan lebih sedikit data training. Ini berkinerja baik dalam kasus variabel masukan kategorikal dibandingkan dengan variabel numerik. Untuk variabel numerik, diasumsikan berdistribusi normal (kurva lonceng, yang merupakan asumsi kuat). Meskipun begitu, disisi lain model ini juga dikenal sebagai penduga yang buruk, sehingga keluaran probabilitas dari predict_proba tidak dianggap terlalu serius. Batasan lain dari Naive Bayes adalah asumsi prediktor independen. Dalam kehidupan nyata, hampir tidak mungkin kita mendapatkan seperangkat prediktor yang sepenuhnya independen.

2. Support Vector Machine

SVM termasuk dalam model Classification atau regression pada Algoritma Supervised Learning, tapi lebih banyak digunakan dalam masalah klasifikasi. Dengan model SVM, kita memplot setiap item data sebagai titik dalam ruang n-dimensi (dimana n adalah jumlah fitur yang kamu miliki) dengan nilai di setiap fitur tersebut menjadi nilai koordinat tertentu. Kemudian, kita akan melakukan klasifikasi dengan menemukan hyperplane yang membedakan kedua kelas dengan sangat baik. Selain itu, dalam SVM terdapat beberapa parameter yang dapat membantu meningkatkan performa model yaitu, parameter kernel, gamma, dan C. SVM dapat bekerja sangat baik karena terdapat margin pembatas antar kelas, dan efektif di ruang dimensi tinggi. Tapi, model ini tidak cocok jika diterapkan pada dataset yang besar karena akan memakan waktu yang lama untuk pemodelan pada data training, dan performanya kurang baik jika kumpulan data memiliki lebih banyak gangguan, yaitu kelas target yang tumpang tindih.

3. Decision Tree

Merupakan salah satu algoritma klasifikasi yang paling mudah dan populer untuk dipahami dan diinterpretasikan. Model Decision Tree yang satu keluarga dengan Algoritma Supervised Learning. Sama seperti model SVM, model Decision Tree dapat digunakan untuk klasifikasi atau regresi juga. Tujuan penggunaan Decision Tree adalah untuk membuat model data training yang dapat digunakan untuk memprediksi kelas atau nilai variabel target dengan mempelajari aturan keputusan sederhana yang disimpulkan dari data training. Dimana node internal merepresentasikan fitur dari sebuah dataset, cabang merepresentasikan aturan keputusan dan setiap node leaf merepresentasikan hasilnya. Meskipun termasuk model yang mudah untuk dipahami dan representasikan, tapi karena berisi banyak lapisan, itu yang mungkin membuat model ini rumit.

4. Yuk Mulai Belajar Menjadi Data Scientist Bersama DQLab!

Gunakan Kode Voucher "DQTRIAL", dan simak informasi di bawah ini mendapatkan 30 Hari FREE TRIAL:

Buat Akun Gratis dengan Signup di DQLab.id/signup
Buka academy.dqlab.id dan pilih menu redeem voucher
Redeem voucher "DQTRIAL" dan check menu my profile untuk melihat masa subscription yang sudah terakumulasi.
Selamat, akun kamu sudah terupgrade, dan kamu bisa mulai Belajar Data Science GRATIS 1 bulan.

Penulis: Rian Tineges

Editor : Annissawd