PROMO PUNCAK LEBARAN DISKON 99%
Belajar Data Science 6 Bulan BERSERTIFIKAT hanya Rp 99K!

0 Hari 4 Jam 58 Menit 13 Detik

Cara Kerja Machine Learning: Hal yang Wajib Kamu Tahu Saat Membuat Model Machine Learning

Belajar Data Science di Rumah 10-Juni-2021
https://dqlab.id/files/dqlab/cache/5f0bb4f45b36b65fd60ca2563930abc9_x_Thumbnail800.jpg

Teknologi selalu berkembang dan juga menyajikan berbagai potensi yang menarik seiringnya waktu. Perkembangan teknologi juga dapat mendukung banyak sektor kehidupan masyarakat serta memberikan dampak yang signifikan dalam kehidupan sehari- hari. Namun apakah kamu pernah kamu mendengar kata Machine Learning? Jika pernah, apakah kamu paham bagaimana cara kerja Machine Learning? Machine Learning adalah aplikasi dari disiplin ilmu kecerdasan buatan (Artificial Intelligence) yang menggunakan teknik statistika untuk menghasilkan suatu model otomatis dari sekumpulan data, dengan tujuan memberikan suatu program kemampuan untuk "belajar".

Salah satu kemajuan teknologi yang signifikan dalam mempermudah banyak hal adalah adanya teknologi Machine Learning. Penggunaan Machine Learning bertujuan untuk memberikan pengguna seperti seorang asisten pribadi untuk membantu mengelola hidup. Selain itu penerapan teknologi ini mampu meningkatkan sistem transportasi, sistem perawatan kesehatan, atau penerapan aplikasi keamanan, Pernahkah kamu terpikirkan bagaimana cara perusahaan transportasi seperti Gojek memobilisasi manusia, barang, dan uang, sehingga terjadi jutaan transaksi antara banyak pihak mulai dari pelanggan, pengemudi, merchant, hingga berbagai jenis penyedia jasa lainnya. Semua itu memungkinkan terjadi karena adanya sistem algoritma Machine Learning. Dalam artikel DQLab kali ini, kamu akan mempelajari bagaimana sebenarnya Machine Learning bekerja dalam membuat, melatih dan menerapkan suatu model. Penasaran? Simak pembahasan berikut ini!

  

1. Pengumpulan Data

Langkah pertama dalam pembuatan model Machine Learning yaitu mengumpulkan data. Semakin banyak dan semakin bagus kualitas data yang dikumpulkan, maka semakin baik performa model Machine Learning yang akan dihasilkan. Terdapat beberapa metode dalam pengumpulan data contohnya seperti Web Scraping dan Data Mining. Data Mining sendiri merupakan proses pengumpulan data dari berbagai sumber seperti website untuk keperluan analisis dan sebagainya. Untuk Web Scraping sendiri merupakan salah satu metode dari Data Mining. Web Scraping biasanya dilakukan dengan menggunakan program automaton yang telah diprogram sebelumnya untuk mengambil value yang berada di website tersebut. Terdapat dua metode untuk melakukan Web Scraping, pertama dengan Metode Curl/Request langsung dari Website, kemudian yang kedua memproses File HTML yang didapat dari Request tersebut dalam kasus Website yang dinamis maka diperlukan Scraping dengan metode Integrated Browser.


Baca juga : 3 Jenis Algoritma Machine Learning yang Dapat Digunakan di Dunia Perbankan

 

2. Eksplorasi Data

Sebelum masuk ke dalam tahap membuat model Machine Learning, kita perlu mengubah data yang dikumpulkan tadi agar dapat digunakan menjadi input dalam proses Machine Learning. Beberapa teknik yang paling sering digunakan untuk mempersiapkan data input ini yaitu menangani Missing Value. Dalam dunia data, kehilangan data (Missing Value) ini sering terjadi. Penyebab dari Missing Value ini terjadi bisa karena kesalahan dalam pengumpulan data, field kosong pada saat survey, terjadinya data corrupt, atau pengukuran yang tidak dapat digunakan (applicable). Missing Values biasanya diwakili dengan indikator "Nan" atau "Null". Masalahnya adalah kebanyakan algoritma yang ada, tidak bisa menangani Missing Value sehingga kita harus menangani nilai - nilai seperti itu sebelum memasukkannya ke dalam model Machine Learning kita.

Selanjutnya, pada tahap kedua dilakukan pembagian jenis data dengan memisahkan data menjadi 3 bagian, pertama data yang akan dilatih (training data), kedua data yang akan digunakan untuk validasi (validation data), dan yang terakhir adalah data yang digunakan untuk percobaan prediksi (test data).

 

3. Validasi Model

Saat membuat model Machine Learning, kita harus yakin bahwa model yang dibuat merupakan model terbaik yang akan memberikan hasil maksimal dan akurat. Oleh karena itu, kita perlu melakukan validasi terhadap model sebelum digunakan untuk produksi. Validasi model, tahapan ketiga ini dilakukan uji validasi model yang telah ada dengan validation data. Validasi model adalah mengukur kinerja model dengan menghitung segala bentuk tingkat kesalahan prediksi pada model. Tujuannya adalah dengan mengetahui kinerja model dapat membantu kita untuk mengoptimalkan parameter pada model itu sendiri sehingga model jauh lebih akurat. Selain itu validasi dilakukan untuk mendapatkan feedback dari analisa yang dilakukan. Kita juga dapat memilih model dengan algoritma terbaik karena setiap algoritma memiliki karakteristik yang berbeda. Dan yang terpenting adalah kita dapat mengetahui seberapa baik kinerja model tersebut sebelum digunakan dalam produksi.

 

4. Test Model

Tahapan test model atau uji model adalah perbandingan kinerja model yang telah divalidasi dengan data prediksi, lalu mengaplikasikan data yang sudah terlatih dengan menciptakan prediksi data baru. Selanjutnya test model dapat digunakan dengan mengaplikasikan model yang sudah dilatih untuk membuat prediksi data baru. Selanjutnya model dapat disesuaikan dengan memperbaiki kinerja algoritma dengan data yang lebih banyak dengan fitur yang berbeda dan parameter yang disesuaikan. Model yang baik adalah model yang bisa menjelaskan data tanpa terpengaruh oleh data noise. Jika model hanya bisa menghafal pola dalam jumlah yang kecil, makan dilakukan pengoptimalan agar model fokus terhadap data yang relevan dan meningkatkan peluang model untuk menggeneralisasikannya lebih baik.

Pada dasarnya, akurasi awal dari model Machine Learning biasanya sangat buruk. Sebab pada awalnya program ini "tidak tahu apa-apa". Namun, seiring berjalannya waktu, semakin sering kita melatih program atau model tersebut, maka akan semakin banyak contoh-contoh yang dapat dipelajari oleh program, maka program ini akan semakin "cerdas" dan akurat.


Baca juga : Belajar Data Science: Pahami Penggunaan Machine Learning pada Python 


5. Tingkatkan Kemampuanmu dengan Belajar Machine Learning Bersama DQLab

Dari penjelasan diatas, kita dapat memahami bahwa Machine Learning akan terus belajar selama ia digunakan. Jadi tidak heran jika Machine Learning sering digunakan, maka tingkat akurasinya pun akan semakin baik dibanding dengan model yang dihasilkan di awal-awal. Hal ini dikarenakan Machine Learning akan banyak belajar seiring waktu pemakaian selama pengguna menggunakannya.

Ingin tahu lebih lanjut mengenai Machine Learning serta bagaimana membuat suatu model Machine Learning? Kunjungi langsung situs DQLab dan buat Akun Gratis dengan Signup di DQLab.id/signup dan nikmati pengalaman belajar bersama DQLab dengan mengakses module gratis "Introduction to Data Science". Kamu bisa mulai memperdalam ilmu kamu mengenai algoritma Machine Learning dan membangun portofolio datamu dengan belajar bersama DQLab!

 

Penulis : Salsabila Miftah Rezkia

Editor : Annissa Widya Davita


Mulai Karier
sebagai Praktisi
Data Bersama
DQLab

Daftar sekarang dan ambil langkah
pertamamu untuk mengenal
Data Science.

Buat Akun


Atau

Sudah punya akun? Login