BEDUG MERIAH Diskon 95%
Belajar Data 6 BULAN Bersertifikat hanya Rp150K!

0 Hari 0 Jam 22 Menit 2 Detik

Top 3 Materi Data Science Untuk Pemula

Belajar Data Science di Rumah 27-Maret-2021
https://dqlab.id/files/dqlab/cache/0c8049ef4d504efebcdf20299c363127_x_Thumbnail800.jpeg

Data science adalah salah satu bidang terpanas saat ini. Revolusi digital telah menciptakan banyak sekali data sepanjang waktu. Bukan tidak mungkin, jika saat ini perusahaan, industri maupun lembaga pemerintahan membutuhkan data sebagai alat bantu dalam pengambilan keputusan bisnis. Popularitas data science telah menunjukkan eksistensinya di mata dunia. Berkaca dari negeri Bollywood, pekerjaan bidang data science di India dan secara global telah melonjak selama lima tahun terakhir ini. Keberhasilannya dalam menjalankan industri dapat dikaitkan dengan penelitian yang lebih baik, implementasi proyek, dan pertumbuhan umum dalam big data dan data science. Perkembangan ini menarik perhatian para teknisi yang mencoba berkarir di bidang data. Begitu pula di Indonesia, saat ini banyak sekali menjamurnya lembaga penyedia yang menawarkan materi data science sebagai materi utama dalam kursus data baik berbayar maupun gratis.


Bagi anda pemula dalam bidang data tentunya asing dengan kehadiran data science. Menurut Data Robot, data science merupakan ilmu yang menggabungkan sebuah kemahiran di bidang ilmu tertentu dengan keahlian pemrograman, matematika, dan statistik. Materi data science tentunya pasti tidak akan jauh-jauh dari ketiga intisari ilmu tersebut yang membentuk sebuah disiplin ilmu baru yaitu Data Science. Bagi pemula, materi data science dipandang sebagai materi yang terbilang baru dan sulit diterima pada awalnya. Hal ini dikarenakan perbedaan background keilmuan maupun tingkat kedekatan yang tidak terlalu dekat dengan ilmu tersebut. Tentu hal tersebut di awal akan kesulitan. Namun jangan khawatir karena bagi kalian para pemula, kalian bisa menemukan segudang materi-materi data science dengan jalan satu-satunya adalah mengikuti course data. Materi yang diajarkan tentunya bersumber dari data expert di bidangnya. Tapi kira-kira sahabat data penasaran tidak sih apa aja materi yang biasanya diajarkan di data science. Pada artikel DQLab kali ini, kita akan membahas mengenai top 3 materi data science bagi pemula. Artikel ini tentunya menjawab rasa penasaran kamu khususnya materi-materi terkait data science. So, jangan lewatkan artikel ini ya, stay tune and keep scrolling on this article guys!


1. Data Preparation

Data Preparation atau bisa disebut juga dengan data preprocessing adalah suatu proses/langkah yang dilakukan untuk membuat data mentah menjadi data yang berkualitas(input yang baik untuk data mining tools). Pentingnya data perlu dilakukan preprocessing karena dalam data mentah masih terdapat data yang incomplete, yaitu data yang kekurangan nilai atribut atau hanya mengandung agregat data (contoh : address = " "). Kedua adalah noisy, yaitu data yang masih mengandung error dan outliers (contoh : salary = -10) dan yang terakhir adalah inconsistent, yaitu data yang mengandung diskrepansi dalam code dan nama atau singkatnya datanya tidak konsisten (contoh : dulu rating = 1,2,3 sekarang a,b,c). Materi ini seringkali diajarkan pada data science agar tidak terjadi kesalahan dalam analisis data. Berdasarkan penggunaan tahapan data preparation menyatakan bahwa jika data inputnya tidak berkualitas, maka hasil data mining juga tidak akan berkualitas. Keputusan yang berkualitas pasti berasal/berdasarkan data yang berkualitas. Sehingga dengan adanya data preparation diharapkan tidak terjadi Garbage In Garbage Out.


Baca juga : Belajar Data Science Secara Otodidak? Berikut langkah-langkahnya!


2. Data Cleaning

Ibarat rumah yang kumuh dan kotor, begitu pula dengan sistem. Terutama yang memiliki data yang besar mengindikasikan data yang rusak. Jika dibiarkan, data yang rusak tersebut akan mempengaruhi kinerja dari sistem tersebut. Karena hal tersebut, data tersebut harus dibersihkan. Salah satu caranya adalah dengan data cleaning. Data cleaning atau yang disebut juga dengan data scrubbing merupakan suatu proses analisa mengenai kualitas dari data dengan mengubah. Bisa juga pengelola mengoreksi ataupun menghapus data tersebut. Data yang dibersihkan tersebut adalah data yang salah, rusak, tidak akurat, tidak lengkap dan salah format. Berdasarkan survey yang diselenggarakan oleh Figure Eight pada tahun 2016, diperoleh bahwa, rata-rata seorang Data Scientist menghabiskan waktu sebesar 57% untuk membersihkan dan meng-organize data. Proses "membersihkan" data merupakan salah satu step yang sangat penting, karena data yang "kotor" akan mempengaruhi tingkat akurasi dari analisis maupun prediksi yang akan dilakukan. Oleh karena itu, tidak jarang jikalau sub materi ini sangat penting khususnya pemula di bidang untuk belajar data science.


Baca juga : Mulai Belajar Data Science GRATIS bersama DQLab selama 1 Bulan Sekarang!


3. Exploratory Data Analysis

Exploratory Data Analysis (EDA) adalah bagian dari proses data science. EDA menjadi sangat penting sebelum melakukan feature engineering dan modeling karena dalam tahap ini kita harus memahami datanya terlebih dahulu. Exploratory Data Analysis memungkinkan analyst memahami isi data yang digunakan, mulai dari distribusi, frekuensi, korelasi dan lainnya. Dalam prakteknya, curiosity atau keingintahuan atas suatu data/permasalahan sangat penting dalam proses ini. Selain itu, perlunya pemahaman konteks data juga diperhatikan karena akan menjawab masalah masalah dasar. Sebagai gambaran, bayangkan anda bersama teman-teman berencana untuk berkumpul di waktu libur, untuk menentukan tempat berkumpul, anda mulai untuk mendata beberapa kedai kopi yang ada. Kemudian anda akan membandingkan beberapa aspek dari setiap kedai kopi yang ada untuk menentukan tempat yang paling cocok, mulai dari tempat mana yang memiliki pelayanan paling baik, harga yang terjangkau, kecepatan Wifi yang memadai dan memiliki spot foto terbaik, tidak berhenti disitu kemudian anda juga akan meminta beberapa saran dari teman-teman anda mengenai gambaran dari beberapa kedai yang sebelumnya anda tentukan. Setelah anda memiliki gambaran mengenai isi dan kualitas dari beberapa kedai anda akan lebih mudah untuk menentukan dimana anda dan bersama teman-teman anda berkumpul. Proses memahami aspek-aspek dari cafe tersebutlah yang disebut dengan EDA


4. Yuk, Belajar Data Science Gratis di DQLab Selama 1 Bulan!


Gunakan Kode Voucher "DQTRIAL", dan simak informasi di bawah ini mendapatkan 30 Hari FREE TRIAL: 

1.Buat Akun Gratis dengan Signup di DQLab.id/signup 

2.Buka academy.dqlab.id dan pilih menu redeem voucher 

3.Redeem voucher "DQTRIAL" dan check menu my profile untuk melihat masa subscription yang sudah terakumulasi. 

4.Selamat, akun kamu sudah terupgrade, dan kamu bisa mulai Belajar Data Science GRATIS 1 bulan.


Penulis: Reyvan Maulid Pradistya


Mulai Karier
sebagai Praktisi
Data Bersama
DQLab

Daftar sekarang dan ambil langkah
pertamamu untuk mengenal
Data Science.

Buat Akun


Atau

Sudah punya akun? Login