PROMO PUNCAK LEBARAN DISKON 99%
Belajar Data Science 6 Bulan BERSERTIFIKAT hanya Rp 99K!

1 Hari 11 Jam 19 Menit 48 Detik

Kenali Fungsi Pandas Python untuk Analisis Data

Belajar Data Science di Rumah 27-Mei-2022
https://dqlab.id/files/dqlab/cache/638e88af6d44afe374bbdaa2de50088a_x_Thumbnail800.jpg

Pandas adalah salah satu library python yang digunakan untuk analisis data. Pandas dibangun pertama kali oleh Wes McKinney pada tahun 2008 untuk tools analisis kuantitatif yang powerful dan fleksibel. Saat ini pandas masuk kedalam salah satu library python yang sangat populer. 


Pandas dibangun di atas dua library python yaitu matplotlib untuk visualisasi data dan NumPy untuk operasi matematika. Pandas berperan sebagai wrapper yang membantu kita untuk mengakses berbagai fungsi matplotlib dan NumPy dengan script code yang lebih sedikit.


Pandas dapat digunakan untuk berbagai hal khususnya di di bidang analisis data. Dengan banyaknya fungsi yang dimiliki, kita bisa menyelesaikan pekerjaan menggunakan python dengan script yang lebih pendek dan lebih cepat. Fungsi-fungsi pada pandas banyak digunakan oleh praktisi data khususnya ketika menangani data berukuran besar yang tidak bisa diolah dengan tools konvensional. 


Pada artikel kali ini DQLab akan membahas berbagai fungsi pandas python yang bisa digunakan untuk membantu kita dalam proses analisis data. Penasaran? Yuk kita simak bersama!


1. read_csv()

Fungsi read_csv() membantu kita untuk membaca file comma-separated values atau biasa dikenal dengan CSV menjadi dataframe pandas. Kita hanya perlu menuliskan path tempat file kita disimpan. Dengan fungsi ini kita juga bisa membaca file yang delimiternya bukan koma, misalnya regex atau tab. Namun perlu diingat, ketika kita ingin menuliskan path tempat file kita disimpan, kita perlu menuliskannya di dalam tanda petik satu atau petik dua. Coba perhatikan contoh penulisannya berikut ini.

python


Baca juga: Contoh Coding Sederhana Python Bagi Beginner


2. head()

Fungsi head() digunakan untuk menampilkan baris pertama dari baris ke-n pada dataset. Jika ditulis by default seperti df.head() maka akan muncul 5 baris pertama pada dataframe. Jika kita ingin menampilkan beberapa row, kita bisa menuliskan angka di dalam kurung, tapi angkanya harus bilangan bulat, ya! Agar lebih mudah dipahami, yuk simak gambar di bawah ini!

python


3. Fungsi describe()

Fungsi describe() digunakan untuk menampilkan statistik deskriptif dari data frame atau series. Output dari fungsi ini berisi rangkuman central tendency dan sebaran dari dataset. Fungsi describe() membantu kita untuk mendapatkan overview dari dataset. 

python


4. Fungsi astype()

astype() adalah fungsi pandas python yang digunakan untuk mengubah data menjadi tipe tertentu. Fungsi ini sangat berguna ketika kita ingin mengubah kumpulan data yang formatnya tidak tepat pada suatu dataset. Misalnya, jika ada data float yang berubah menjadi string, kita bisa mengubah data tersebut menjadi float kembali. 

python


Baca juga: Belajar Python: Mengenal Array pada Bahasa Pemrograman Python


Selain empat fungsi di atas, pandas juga memiliki fungsi yang lain yang akan sangat berguna ketika kita menganalisis data menggunakan python. Yuk belajar cara menggunakan library pandas dengan python bersama DQLab! 


Klik button di bawah ini atau sign up melalui DQLab.id untuk mengakses modul gratis "Introduce to Data Science" dari DQLab dan FREE ebook 24 jam sebagai pelengkap belajarmu. Selamat belajar!


Penulis: Galuh Nurvinda K

Editor: Annissa Widya Davita

Mulai Karier
sebagai Praktisi
Data Bersama
DQLab

Daftar sekarang dan ambil langkah
pertamamu untuk mengenal
Data Science.

Buat Akun


Atau

Sudah punya akun? Login