DICARI! Yang Mau Belajar Data Science Disc. 96%
Belajar Data 6 BULAN Bersertifikat hanya Rp120K!

0 Hari 0 Jam 24 Menit 36 Detik

Cara Download dan Install Library Python Untuk Pemula

Belajar Data Science di Rumah 08-Maret-2022
https://dqlab.id/files/dqlab/cache/16123c0804154cbb4704ac66bd94b552_x_Thumbnail800.jpg

Python adalah salah satu bahasa pemrograman yang sangat populer di kalangan ilmuwan data dan pengembang perangkat lunak untuk memenuhi pekerjaan yang berhubungan dengan data. Python diciptakan oleh Guido van Rossem pada tahun 1991.


Berbeda dengan Bahasa pemrograman lain seperti, C++ dan Java, Python dianggap lebih mudah dipelajari khususnya bagi pemula. Sintaks yang sederhana, mudah diingat, dan dibaca karena Python menekankan pada aspek kemudahan dalam membaca kodenya. Selain itu, Python juga dapat digunakan diberbagai sistem operasi seperti Windows, Mac OS, Linux, dan lain sebagainya.


Tidak hanya tugas yang berkaitan dengan data, Python dapat digunakan untuk memprediksi hasil, mengotomatisasi tugas, merampingkan proses serta menawarkan wawasan seputar intelijen bisnis. Menariknya lagi, Bahasa pemrograman Python didukung oleh banyak library yang gratis. Apa yang dimaksud dengan library? Library pada Python merupakan sebutan untuk kode program tambahan yang digunakan dalam kebutuhan tertentu.


Python mempunyai lebih dari 140.000 library yang dikembangkan melalui open source project sehingga kamu yang sebagai pemula, bisa belajar dengan gratis dan jauh lebih mudah. Sahabat data pastinya pernah mendengar beberapa jenis library bahkan pernah menggunakannya untuk membantu memproses data, melakukan pemodelan dan visualisasi data.


Lalu apa saja ya library yang umum digunakan untuk melakukan pemrosesan data di Python dan bagaimanakah proses instalasinya? Berikut ini empat library yang wajib diketahui ketika kamu belajar Python di DQLab!

 

1. NumPy

Library yang pertama ini merupakan singkatan dari Numerical Python. Fungsi dari modul ini untuk membantu para Data Scientist menangani permasalahan angka-angka. Berfokus pada scientific computing, NumPy memiliki kemampuan dalam membentuk objek N-dimensional array yang mirip dengan MATLAB. NumPy memudahkan penggunanya dalam operasi Aljabar Linear seperti Vektor dan Matriks.


Sebelum menggunakan library Numpy, kita harus mendownload library tersebut dan menginstalnya secara bertahap. 

  • Buka jendela CMD

  • Kemudian jalankan command berikut,

    Python “m pip install numpy

  • Selanjutnya kita uji library Numpy apakah sudah berhasil diinstall pada Python dengan menjalankan IDLE Python lalu mengetikkan perintah berikut,

    Import numpy as np

  • Berikut contoh program Python yang dijalankan menggunakan library Numpy

 

Baca juga: Belajar Python: Mengenal Array pada Bahasa Pemrograman Python

 

2. Pandas

Pandas adalah library kedua yang wajib dipelajari pemula dalam belajar Python. Dengan berdasarkan sistem dataframe, modul ini dapat memuat sebuah file ke dalam tabel virtual menyerupai spreadsheet. Salah satu fitur unggulan dari library ini adalah kemampuannya dalam menerjemahkan operasi yang kompleks dengan mengandalkan data dari satu atau dua perintah saja.


Pandas pun memiliki banyak sekali keunggulan dalam pengelompokan, penggabungan, dan jufa pemfilteran data. Pandas juga berfungsi mengolah suatu data seperti teknik join, distinct, group by, agregasi, dan teknik lainnya seperti pada SQL. Bedanya, ini dilakukan pada tabel. Kelebihan dari library ini juga dapat membaca file dari berbagai format seperti .txt, .csv, dan .tsv. 


Sebelum menggunakan library Pandas, kita harus mendownload library tersebut dan menginstalnya secara bertahap. 

  • Buka jendela CMD

  • Kemudian jalankan command berikut,

    Python “m pip install pandas

  • Selanjutnya kita uji library Pandas apakah sudah berhasil diinstall pada Python dengan menjalankan IDLE Python lalu mengetikkan perintah berikut,

    Import pandas as pd


Contoh penggunaan library Pandas seperti berikut,


Selanjutnya membuat Dataframe,

 


Sehingga output yang dihasilkan seperti berikut,


 

3. Matplotlib

Data yang telah diolah akan sebaiknya ditampilkan sejelas dan sebagus mungkin. Library Matplotlib ini akan membantu dalam menampilkan hasil analisis berupa grafik berwarna dengan lebih rapi dan menarik. Ada dua jenis plot dalam menampilkan data yaitu secara 2D dan 3D. Sehingga data bisa ditampilkan sesuai dengan kebutuhan. Matplotlib ini merupakan library yang paling sering digunakan oleh Data Scientist dalam menyajikan datanya ke dalam visual yang lebih menarik.


Sebelum menggunakan library Matplotlib, kita harus mendownload library tersebut dan menginstalnya secara bertahap. 

  • Buka jendela CMD

  • Lakukan upgrade pip terlebih dulu jika belum melakukan upgrade dengan perintah,

    Python.exe pip install “upgrade pip

  • Kemudian jalankan command berikut,

    Python “m pip install matplotlib

  • Selanjutnya kita uji library Matplotlib apakah sudah berhasil diinstall pada Python dengan menjalankan IDLE Python lalu mengetikkan perintah berikut,

    Import matplotlib as plt


Mari kita coba menggunakan library ini dengan melakukan plot pada fungsi sederhana. Ketik kode berikut dengan code editor.


4. Scikit-Learn

Scikit-Learn merupakan library Machine Learning open source berbasis Python yang bisa digunakan dalam Data Science. Kelebihan Scikit-Learn adalah penggunaan API yang mudah serta kecepatannya saat melakukan tolok ukur yang berbeda dalam dataset. Sklearn kompatibel dengan NumPy dan SciPy. Ini artinya kamu akan dapat beroperasi dengan library-library yang berbeda untuk Python dengan mudah.


Scikit-Learn memberikan sejumlah fitur untuk keperluan Data Science seperti algoritma Regresi, pengelompokan, algoritma Naive Bayes, algoritma Decision Tree, parameter tuning, data preprocessing tool, export/import model, Machine learning pipeline  dan algoritma klasifikasi termasuk gradien, K-means, mesin dukungan vektor, DBSCAN, dan juga mampu beroperasi dengan SciPy dan NumPy.


Sebelum menggunakan library Scikit-Learn, kita harus mendownload library tersebut dan menginstalnya secara bertahap. 

  • Buka jendela CMD

  • Lakukan upgrade pip terlebih dulu jika belum melakukan upgrade dengan perintah,

    Python.exe pip install “upgrade pip

  • Untuk menginstall Scikit-learn ada beberapa hal yang perlu diperhatikan, yaitu:

    • Python version (>= 2.6 or >= 3.3),

    • NumPy version (>= 1.6.1),

    • SciPy version (>= 0.9).

  • Kemudian jalankan command berikut,

    pip install “U scikit-learn

  • Selanjutnya kita uji library Matplotlib apakah sudah berhasil diinstall pada Python dengan menjalankan IDLE Python lalu mengetikkan perintah berikut,

    Import sklearn


Berikut ini contoh penggunaan library Sklearn atau Scikit-learn, kita akan membuat data set mengenai data perkiraan harga rumah di Boston Amerika. Scikit-learn sendiri telah memberikan playground atau dataset yang bisa kita pakai secara langsung dan gratis. Data nya pun juga real. Berikut sekilas code atau perintahnya menggunakan library Sklearn.


Baca juga: Tips dan Cara Membuat Portfolio Data dari Python Streamlit


5. Mulai Belajar Python untuk Data Science

Sudahkah kamu berhasil download dan install Python di perangkatmu? Sekarang kamu bisa menjalankannya dan coba membuat program sederhana dengan Python. Beberapa library yang digunakan dalam Data Science yaitu Pandas, Numpy, dan Matplotlib. Pahami penggunaan masing-masing library tersebut. Kamu juga bisa membuat database sederhana untuk proses komputasi atau mengambil dataset dengan download dari Kaggle atau web scraping.


Yuk, mulai belajar Python bareng para mentor data dengan daftar di DQLab.id! Banyak event yang bisa kamu ikuti dan juga job connector, loh!


Penulis : Salsabila MR

Editor : Annissa Wdiya Davita

 

 


Mulai Karier
sebagai Praktisi
Data Bersama
DQLab

Daftar sekarang dan ambil langkah
pertamamu untuk mengenal
Data Science.

Buat Akun


Atau

Sudah punya akun? Login