Metode Pengolahan Data : 3 Jenis Analisis Regresi yang Sering Digunakan
Pengolahan data statistik adalah hal yang mutlak untuk dikuasai ketika kamu memutuskan untuk terjun ke dunia Data Science. Tentunya hal ini terjadi bukan tanpa alasan, melainkan karena ilmu Statistika menjadi salah satu ilmu yang menjadi dasar dari Data Science. Itulah mengapa menguasai ilmu pemrograman dan bisnis saja tidak cukup untuk menjadi ahli di bidang Data Science.
Metode pengolahan data yang dapat digunakan dalam Data Science sangatlah banyak, namun bukan berarti semua metode akan cocok dengan data yang dimiliki. Itulah mengapa kita harus mengenali data yang dimiliki sebelum menentukan metode yang digunakan. Salah satu metode yang banyak digunakan adalah analisis regresi. Analisis regresi ini, masuk ke dalam Machine Learning yang bersifat Supervised Learning.
Ternyata analisis regresi terbagi lagi menjadi beberapa bagian. Dalam artikel ini, kita akan membahas beberapa jenis analisis regresi yang kerap kali digunakan. Penasaran kan? Simak artikelnya!
1. Analisis Regresi Linier Sederhana
Analisis ini merupakan analisis regresi yang hanya terdiri terdiri dari satu variabel dependen dan satu variabel independen. Variabel Metode ini adalah metode pertama yang dipelajari untuk memahami konsep dari regresi sendiri. Di dalam regresi ini, variabel independen ini akan digunakan untuk menjelaskan atau memprediksi hasil dari variabel dependen. Nah, lalu bagaimana jika ada dua atau lebih variabel independen, metode apa yang seharusnya digunakan? Di poin selanjutnya akan dijelaskan lebih lanjut, jadi baca sampai selesai ya!
Baca juga : Ini yang Akan Kamu Pelajari di Kelas Data Science DQLab!
2. Analisis Regresi Linier Berganda
Analisis regresi berganda hampir sama dengan analisis regresi linier sederhana, dimana untuk memprediksi nilai dependen atau yang lebih dikenal dengan variabel Y memerlukan variabel independen atau yang lebih dikenal dengan variabel X. Hal yang membedakan antara regresi ini dengan regresi linier sederhana adalah jumlah variabel yang digunakannya. Di regresi linear berganda, kita bisa menggunakan mulai dari dua bahkan lebih variabel independen. Namun bisa jadi tidak semua variabel mempengaruhi variabel Y. Untuk mendapatkan model terbaik, kita hanya perlu memilih variabel yang berpengaruh ke variabel Y saja.
3. Analisis Regresi Logistik
Analisis regresi ini cukup berbeda jika dibandingkan dengan dua analisis regresi sebelumnya. Analisis regresi logistik terbilang cukup rumit, karena biasanya digunakan untuk menentukan probabilitas dari suatu kejadian, seperti ya atau tidak, hidup atau mati, dan lain sebagainya. Umumnya untuk menggunakan regresi logistik, variabel dependen nya (variabel Y) akan bersifat kategorik. Analisis Regresi Logistik kemudian terbagi menjadi analisis regresi logistik biner dan analisis regresi logistik multinomial.
Baca juga : Mengenal Profesi Data Scientist
4. Yuk, TEMUKAN SUMBER DATA UNTUK BANGUN PORTFOLIO GRATIS DI DQLAB SELAMA 1 BULAN!
Gunakan Kode Voucher "DQTRIAL", dan simak informasi dibawah ini mendapatkan 30 Hari FREE TRIAL:
Buat Akun Gratis dengan Signup di DQLab.id/signup
Buka academy.dqlab.id dan pilih menu redeem voucher
Redeem voucher "DQTRIAL" dan check menu my profile untuk melihat masa subscription yang sudah terakumulasi.
Selamat, akun kamu sudah terupgrade, dan kamu bisa mulai Belajar Data Science GRATIS 1 bulan.