Buat Akun DQLab & Akses Kelas Data Science Python, R, SQL, Excel GRATIS

Library Python yang Digunakan Untuk Keperluan Data Science

Belajar Data Science di Rumah 13-April-2021
https://dqlab.id/files/dqlab/cache/7ed419e0e8044faabb53a72d55436137_x_Thumbnail800.jpg

Python adalah salah satu Bahasa pemrograman yang sangat populer di kalangan programmer. Python diciptakan oleh Guido van Rossum pada tahun 1991. Berbeda dengan Bahasa pemrograman lain seperti, C++ dan Java, Python dianggap lebih mudah dipelajari khususnya bagi pemula. Sintaks yang sederhana, mudah diingat, dan dibaca karena Python menekankan pada aspek kemudahan dalam membaca kodenya. Selain itu, Python juga dapat digunakan diberbagai sistem operasi seperti Windows, Mac OS, Linux, dan lain sebagainya.

Menariknya lagi, Bahasa pemrograman Python didukung oleh banyak library yang gratis. Apa yang dimaksud dengan library? Library pada Python merupakan sebutan untuk kode program tambahan yang digunakan dalam kebutuhan tertentu. Python mempunyai lebih dari 140.000 library yang dikembangkan melalui open source project sehingga kamu yang sebagai pemula, bisa belajar dengan gratis! Berikut ini tiga library yang wajib diketahui ketika kamu belajar Python!


1. Library NumPy

Library yang pertama ini merupakan singkatan dari Numerical Python. Fungsi dari modul ini untuk membantu para data scientist menangani permasalahan angka-angka. Berfokus pada scientific computing, NumPy memiliki kemampuan dalam membentuk objek N-dimensional array yang mirip dengan MATLAB. NumPy memudahkan penggunanya dalam operasi Aljabar Linear seperti Vektor dan Matriks.

Import numpy as np

#menghasilkan a 3 by 3 identity matrix

matrix_one = np.eye(3)

matrix_one

#menghasilkan 3 by 3 matrix lainya for perkalian

matrix_two = np.arange(1,10).reshape(3,3)

matrix_two

#mengalikan dua array

matrix_multiply = np.dot(matrix_one, matrix_two)

matrix_multiply 



Baca juga : Belajar Data Science: Kenali Dasar Bahasa Pemrograman Python yang Cocok bagi Pemula



2. Library  Pandas

Pandas adalah library kedua yang wajib dipelajari pemula dalam belajar Python. Dengan berdasarkan sistem dataframe, modul ini dapat memuat sebuah file ke dalam tabel virtual menyerupai spreadsheet. Pandas juga berfungsi mengolah suatu data seperti teknik join, distinct, group by, agregasi, dan teknik lainnya seperti pada SQL. Bedanya, ini dilakukan pada tabel. Kelebihan dari library ini juga dapat membaca file dari berbagai format seperti .txt, .csv, dan .tsv. Contoh penggunaan library Pandas seperti berikut,

import pandas as pd

d={'Name':pd.Series(['Alfrick','Michael','Wendy','Paul','Dusan','George','Andreas','Irene','Sagar','Simon','James','Rose']),'Years of Experience':pd.Series([5,9,1,4,3,4,7,9,6,8,3,1]),'Programming Language':pd.Series(['Python','JavaScript','PHP','C++','Java','Scala','React','Ruby','Angular','PHP','Python','JavaScript'])}

 

Selanjutnya membuat Dataframe,

df = pd.DataFrame(d) 


Sehingga output yang dihasilkan seperti berikut

Name Programming       Language           Years of Experience

0   Alfrick        Python             5

1   Michael      JavaScript           9

 Wendy           PHP               1

3   Paul            C++               4

4   Dusan           Java              3

5   George          Scala             4

6   Andreas         React             7

7     Irene            Ruby             9

8     Sagar         Angular             6

9     Simon            PHP              8

10  James          Python             3

11     Rose          JavaScript         1


 

3. Library  Matplotlib

Data yang telah diolah akan sebaiknya ditampilkan sejelas dan sebagus mungkin. Library Matplotlib ini akan membantu dalam menampilkan hasil analisis berupa grafik berwarna dengan lebih rapi dan menarik. Ada dua jenis plot dalam menampilkan data yaitu secara 2D dan 3D. Sehingga data bisa ditampilkan sesuai dengan kebutuhan. Matplotlib ini merupakan library yang paling sering digunakan oleh data science dalam menyajikan datanya ke dalam visual yang lebih menarik.

import matplotlib.pyplot as plt

plt.plot([1,2,3,4])

plt.ylabel('some numbers')

plt.show()

 

Baca juga :  Python : Kenali 3 Buku yang Akan Mempercepat Kamu Dalam Belajar Python


4. Yuk Mulai Belajar Menjadi Data Scientist Bersama DQLab!       


Gunakan Kode Voucher "DQTRIAL", dan simak informasi di bawah ini mendapatkan 30 Hari FREE TRIAL:

  1. Buat Akun Gratis dengan Signup di DQLab.id/signup

  2. Buka academy.dqlab.id dan pilih menu redeem voucher 

  3. Redeem voucher "DQTRIAL" dan check menu my profile untuk melihat masa subscription yang sudah terakumulasi. 

  4. Selamat, akun kamu sudah terupgrade, dan kamu bisa mulai Belajar Data Science GRATIS 1 bulan.


    Penulis : Salsabila Miftah

    Editor : Annissa Widya Davita


      Mulai Karier
      sebagai Praktisi
      Data Bersama
      DQLab

      Daftar sekarang dan ambil langkah
      pertamamu untuk mengenal
      Data Science.

      Buat Akun


      Atau

      Sudah punya akun? Login