PROMO PUNCAK LEBARAN DISKON 99%
Belajar Data Science 6 Bulan BERSERTIFIKAT hanya Rp 99K!

1 Hari 14 Jam 42 Menit 52 Detik

Kupas Tuntas Pandas Python dari Salah Satu Modul DQLab

Belajar Data Science di Rumah 08-September-2022
https://dqlab.id/files/dqlab/cache/86b1a504cc46bc04ab63029470567e90_x_Thumbnail800.jpg

Pandas menjadi salah satu library Python yang paling sering dipakai oleh Data Scientist. Hal ini karena Pandas dapat digunakan bersamaan dengan library lain dalam Data Science. Meskipun dalam Python ada banyak sekali library yang bisa dimanfaatkan, namun library yang umum digunakan dalam menyelesaikan permasalahan Data Science bisa dihitung jari. Salah satu library tersebut adalah Pandas.


Pandas ini bersifat open source yang artinya dapat digunakan oleh siapa saja secara bebas dan gratis, dimana library ini dapat digunakan untuk menyediakan berbagai struktur data serta memanipulasi data.


Sesuai dengan singkatannya Pandas yaitu Python Data Analysis, Pandas sering digunakan untuk data manipulation. Untuk membersihkan data mentah ke dalam sebuah bentuk yang bisa untuk diolah dan lainnya. Sebelum memproses data tentu kita perlu mengumpulkan data yang dibutuhkan misalnya dengan mengakses dari database. Pandas adalah library dengan fungsi untuk mempermudah pekerjaan tersebut.


Pada artikel kali ini, DQLab akan spill salah satu module yang ada di DQLab yang berjudul Manipulation Data with Pandas – Part 1. Di sini, kita akan mempelajari langkah-langkah yang diperlukan untuk mengolah data menggunakan fungsi dari Pandas. Untuk lebih memahami apa saja yang ada dalam library Pandas, yuk kita bahas bersama!


1. Memanggil Library Pandas

Dalam Python memang library Pandas belum secara default terinstall. Jadi, kita perlu menginstalnya terlebih dahulu sebelum menggunakannya. Untuk dapat menginstall Pandas, kamu bisa menjalankan perintah dengan menggunakan pip ataupun bisa menggunakan Anaconda

Dengan menggunakan pip:

pip install pandas

Dengan menggunakan library Anaconda, kita bisa menginstallnya dengan perintah berikut,

conda install pandas

Jika sudah berhasil melakukan instalasi Pandas, kita dapat menggunakannya untuk melakukan manipulasi data dengan cara import modul tersebut pada projek yang akan kita buat.

import pandas as pd
import numpy as np

 python


Baca juga: Belajar Coding Python untuk Pemula & Praktik Langsung, Yuk!


2. Data Frame dan Series

Di Pandas terdapat 2 kelas data baru yang digunakan sebagai struktur dari spreadsheet:

python

  • Series: berupa satu kolom bagian dari tabel dataframe dengan bentuk 1 dimensional numpy array sebagai basis data nya. Series ini terdiri dari 1 tipe data, bisa berupa integer, string, float, dan lain-lain.

  • DataFrame: merupakan gabungan dari Series serta berbentuk rectangular data yang merupakan tabel spreadsheet itu sendiri. Karena dibentuk dari banyak series, tiap seriesnya biasanya memiliki 1 tipe data. Itu berarti, 1 dataframe bisa memiliki banyak tipe data.

Seperti pada contoh berikut, kita akan mencoba membuat sebuah series bernama number_list dan dataframe bernama matrix_list.

python


3. Membuat Data Frame dari List

Sebelum mulai melakukan analisa serta manipulasi pada data di Pandas, tentunya kita memerlukan sebuah data untuk menunjang keperluan tersebut. Data tersebut bisa kita buat sendiri ataupun dengan melakukan loading dari alamat url tertentu. 


Namun kali ini, kita akan membuat data sendiri yang berupa series dan dataframe. Untuk membuat series atau dataframe, kita bisa membuatnya dari berbagai macam tipe data container/mapping di Python, seperti list, dictionary, maupun numpy array.


Berikut contoh sederhana membuat data dari List:

python


4. Membuat Data Frame dari Dictionary

Setelah membuat series dan dataframe dari list, kali ini kita akan membuat kedua jenis data tersebut dari dictionary. Sekedar buat pengingat saja, dictionary merupakan kumpulan data yang strukturnya terdiri dari key dan value.


Berikut contoh sederhana membuat data dari Dictionary:

python

5. Membuat Data Frame dari Numpy Array

Setelah list dan dictionary, pada bagian ini kita akan membuat series dan dataframe yang bersumber dari numpy array. Numpy array sendiri merupakan kumpulan data yang terdiri atas berbagai macam tipe data, mutable, tapi dibungkus dalam array oleh library Numpy.

Berikut contoh sederhana membuat data dari Numpy Array:

python


Baca juga: Belajar Python: Mengenal Array pada Bahasa Pemrograman Python


Sudahkah kamu berhasil download dan install Python di perangkatmu? Sekarang kamu bisa menjalankannya dan coba membuat program sederhana dengan Python. Terdapat banyak macam library yang digunakan dalam Data Science selain Pandas sesuai dengan fungsinya masing-masing.


Sobat data bisa mempelajari coding Python yang lebih mendalam dan detail dengan mengakses modul Premium yang tersedia di DQLab. Ada banyak sekali pembahasan yang dituang dalam berbagai modul dengan menggunakan bahasa pemrograman Python.


Tidak hanya itu, begitu sobat data berlangganan modul premium, maka kamu  juga bisa menikmati modul pembelajaran dengan menggunakan bahasa pemrograman lainnya, seperti R dan SQL.


Namun bagi kamu si pecinta gratisan, tenang aja! DQLab juga sudah menyediakan FREE modul yang bisa kamu jadikan dasar pembelajaran Pythonmu. Yuk, tunggu apa lagi? Buruan SIGN UP di DQLab.id!


Penulis: Salsabila MR

Editor: Annisa Widya Davita



Mulai Karier
sebagai Praktisi
Data Bersama
DQLab

Daftar sekarang dan ambil langkah
pertamamu untuk mengenal
Data Science.

Buat Akun


Atau

Sudah punya akun? Login