Buat Akun DQLab & Akses Kelas Data Science Python, R, SQL, Excel GRATIS

Yuk, Belajar Pandas Python Sederhana Bersama DQLab!

Belajar Data Science di Rumah 12-Agustus-2022
https://dqlab.id/files/dqlab/cache/ff27c80c6eb9a069ea819d89cb14fb71_x_Thumbnail800.jpg

Pyhton memiliki library yang cukup lengkap yang bisa digunakan untuk membuat program python menjadi semakin lebih sederhana dan nyaman bagi programmer karena tidak perlu menulis kode yang sama berulang kali untuk program yang berbeda.


Saat ini, python memiliki lebih dari 137.000 library yang dapat membantu kamu dalam membuat program bagi untuk Data Analysis, Artificial Intelligence (AI), Machine Learning, tapi juga sangat powerfull untuk web apps dan GUI. Salah satu library python yang sering digunakan ketika kamu menggeluti bidang data scientist adalah pandas. 


Pandas merupakan library python yang open source dan mudah digunakan untuk membuat tabel, mengubah dimensi data , mengecek data dan lainnya. Sesuai dengan singkatannya Pandas yaitu Python Data Analysis, pandas sering digunakan untuk data manipulation. Untuk membersihkan data mentah ke dalam sebuah bentuk yang bisa untuk diolah dan lainnya. Selanjutnya tentang library pandas mari simak artikel dibawah ini!


1. Mengimport Library Pandas

Dalam python memeng library pandas belum secara default terinstall. Jadi, kita perlu menginstallnya terlebih dahulu sebelum menggunakannya. Untuk dapat menginstall pandas, kamu bisa menjalankan perintah dengan menggunakan pip ataupun bisa menggunakan Anaconda

pip install pandas

Dengan menggunakan library Anaconda, kita bisa menginstallnya dengan perintah berikut,

conda install pandas

Jika sudah berhasil melakukan instalasi Pandas, kita dapat menggunakannya untuk melakukan manipulasi data dengan cara import modul tersebut pada projek yang akan kita buat.

import pandas as pd
import numpy as np

python


Baca juga: Coding Python Sederhana untuk Data Visualization, Yuk!


2. Membaca File CSV dengan Pandas

Pandas memungkinkan kita untuk membaca dan menganalisis dari berbagai jenis data seperti CSV, JSON, XLSX, HTML, XML. Kali ini kita akan sama-sama belajar bagaimana cara membaca data dari sumber data tersebut dengan menggunakan library pandas dan fungsi read_csv() untuk membaca file format CSV.


Untuk membaca file CSV kita gunakan fungsi read_csv() umumnya nilai dalam format CSV dipisahkan oleh koma sehingga parameter separator fungsi read_csv() adalah koma

python


3. Membuat DataFrame dengan Pandas

Series merupakan struktur data dasar dalam Pandas. Series diibaratkan sebagai array satu dimensi sama halnya dengan numpy array, hanya bedanya mempunyai index dan index tersebut dapat kita kontrol dari setiap elemen tersebut.  Perintah dasar untuk membuat sebuah series dengan Pandas adalah

pandas.Series(data=None, index=None, dtype=None, name=None, copy=False, fastpath=False)

  • Parameter data, diisi dengan data yang akan dibuat series. Struktur data yang bisa ditampung berupa integer, float, dan juga string. 

  • Parameter index, diisi dengan index dari series. Jumlah index harus sama dengan jumlah data. Jika kita tidak mengisi parameter index, maka series akan memiliki index integer seperti halnya array biasa. 

  • Parameter dtype, diisi dengan tipe data dari series, dan parameter copy untuk copy data, secara default akan bernilai false.

Berdasarkan sintaks di atas, kita akan membuat contoh series menggunakan Python list ataupun numpy sebagai contoh data untuk membuat series.


python

 

Baca juga: Belajar Python: Mengenal Array pada Bahasa Pemrograman Python

 

4. Pandas Digunakan untuk Apa Saja?

python

Pandas banyak digunakan di berbagai sektor, terutama di bidang data analyst. Pandas juga memiliki banyak fungsi antara lain: Data cleansing, Data fill, Normalisasi data, Penggabungan dan penyatuan data, Visualisasi data, Analisis statistik, Inspeksi data, dan Memuat dan menyimpan data.


Selain fungsi-fungsi yang disebutkan di atas, Pandas juga memungkinkan penggunanya untuk membuat DataFrame sekaligus melakukan analisis serta manipulasi dan penyimpanan database. Pandas juga dapat dimanfaatkan untuk membersihkan datasets pada machine learning.


Dengan modul dan materi yang update, belajar python menggunakan bahasa menjadi lebih mudah dan terstruktur bersama DQLab. Karena terdiri dari modul-modul up-to-date dan sesuai dengan penerapan industri yang disusun oleh mentor-mentor professional.


Yuk, belajar terstruktur dan lebih interaktif caranya dengan Sign Up sekarang untuk #MulaiBelajarData di DQLab:

  • Buat Akun Gratis dengan Signup di DQLab.id/signup atau isi form dibawah ini ya!

  • Selesaikan modulenya, dapatkan sertifikat & reward menarik dari DQLab


Subscribe DQLab.id untuk Akses Semua Module Premium! cukup dengan Sign up sekarang di DQLab.id untuk nikmati pengalaman belajar yang seru dan menyenangkan!

Mulai Karier
sebagai Praktisi
Data Bersama
DQLab

Daftar sekarang dan ambil langkah
pertamamu untuk mengenal
Data Science.

Buat Akun


Atau

Sudah punya akun? Login