PROMO PUNCAK LEBARAN DISKON 99%
Belajar Data Science 6 Bulan BERSERTIFIKAT hanya Rp 99K!

1 Hari 9 Jam 16 Menit 9 Detik

Kursus Data Science Online: Berkenalan dengan Bahasa Pemrograman R

Belajar Data Science di Rumah 21-Maret-2021
https://dqlab.id/files/dqlab/cache/e5c147fada403d97a28f073ebdc49240_x_Thumbnail800.png

R adalah bahasa pemrograman yang banyak digunakan oleh data scientist untuk menganalisis data di perusahaan besar, seperti Google, Airbnb, Facebook, dan lain sebagainya. Bahasa pemrograman ini dikembangkan oleh Ross Ihaka dan Robert Gentleman pada tahun 1993 dan saat ini memiliki fitur metode statistika dan grafik yang lengkap. Bahasa pemrograman R dapat digunakan untuk membangun algoritma machine learning, regresi linier, time series, inferensi statistik, dan lain sebagainya. Saat ini bahasa pemrograman R tidak hanya digunakan oleh akademisi tetapi juga digunakan oleh ahli profesional di berbagai industri. Analisis data pada bahasa pemrograman R dimulai dengan membuat program, melakukan transformasi, membuat model, dan terakhir mempresentasikan hasilnya. 


Saat ini sudah banyak tools yang dapat digunakan untuk menganalisis data. Namun, sebagian besar data scientist di dunia menggunakan bahasa pemrograman R dan Python. Kedua bahasa pemrograman ini digunakan karena memiliki bahasa yang mudah dipahami, powerful, dan bersifat open source. Kedua bahasa pemrograman ini memiliki plus dan minus masing-masing. Namun, pada artikel kali ini kita hanya akan "berkenalan" dengan bahasa pemrograman R. Sudah siap mengenal R lebih dalam? Yuk kita mulai!

1. Tipe Data pada R

Tipe dan struktur  data yang bisa dibaca oleh bahasa pemrograman R adalah data skalar, vektor (numerik, karakter, dan logika), matriks, data frame, dan list. Variabel adalah salah satu tipe data dasar dalam R yang menyimpan nilai dan termasuk kedalam komponen penting dalam bahasa pemrograman R, khususnya untuk seorang data scientist. Variabel dalam bahasa pemrograman R dapat menyimpan angka, objek, hasil statistik, vektor, dataset, dan hasil prediksi dari model yang telah dibangun. Untuk menggunakan variabel pada bahasa pemrograman R, kita perlu memberi nama pada variabel tersebut.


Dalam pemberian nama, ada aturan-aturan khusus seperti nama tidak boleh mengandung unsur spasi. Kita bisa mengganti spasi dengan tanda baca "_". Misalnya jika kita ingin memberi nama "kelas A" pada sebuah variabel, kita bisa menuliskan namanya menjadi "kelas_A". Selain variabel, dalam bahasa pemrograman R juga ada istilah vektor. Vektor adalah larik dengan ukuran satu dimensi. Kita bisa membuat vektor dengan semua tipe data.  Cara paling mudah untuk membangun struktur data vektor di R adalah dengan menggunakan perintah c.


Baca juga : Awali Kursus Data Science Gratis Di Era Pandemi Bersama DQLab


2. Faktor dalam Bahasa Pemrograman R

Faktor dalam bahasa pemrograman R adalah variabel yang digunakan untuk mengkategorikan dan menyimpan data yang memiliki sejumlah nilai berbeda dan terbatas. Faktor dalam bahasa pemrograman R juga dikenal dengan variabel kategorik yang menyimpan nilai data string dan integer sebagai label. Faktor banyak digunakan dalam pemodelan statistik dan analisis data eksplorasi. Dalam dataset, ada dua jenis variabel, yaitu kategori dan kontinu. Dalam statistik deskriptif, variabel kategori nilainya terbatas dan biasanya didasarkan pada kelompok tertentu, misalnya variabel kategori berupa negara, tahun, jenis kelamin, pekerjaan, dan lain sebagainya. Sedangkan variabel kontinu nilainya tidak terbatas baik berupa bilangan bulat maupun desimal, misalnya pendapatan, harga saham, usia, dan lain sebagainya. Untuk membuat variabel kategorik di interface R, kita cukup menuliskan sintaks factor(x = character(), levels, labels = levels, ordered = is.ordered(x)). x adalah vektor data kategorik dalam R yang harus berupa string atau integer (tidak boleh desimal). Levels adalah vektor nilai yang mungkin diambil oleh x. Argumen ini opsional, nilai defaultnya adalah daftar unik item vektor x. Labels adalah tambahan label ke x data kategorik, misalnya 1 dapat digunakan sebagai label laku-laki dan 0 bisa digunakan sebagai label perempuan. Ordered adalah perintah untuk menentukan apakah level harus diurutkan dalam data kategorik atau tidak.

3. Fungsi dalam Bahasa Pemrograman R

Fungsi dalam bahasa pemrograman R juga disebut dengan instruksi. Programer atau data scientist membangun sebuah fungsi untuk menghindari pengulangan tugas atau mengurangi kompleksitas. Di dalam bahasa pemrograman R ada banyak fungsi built-in. R akan mencocokan parameter input dengan argumen fungsinya, baik berdasarkan nilai atau posisi lalu mengeksekusi fungsi tersebut. Fungsi pada bahasa pemrograman R dibagi menjadi tiga jenis, yaitu fungsi umum, fungsi matematika, dan fungsi statistika. Fungsi umum merupakan fungsi yang sering digunakan dan beberapa pengguna R sudah familiar dengan fungsi ini. Beberapa contoh fungsi umum dalam bahasa pemrograman R adalah cbind(), rbind(), range(), sort(), dan order(). Masing-masing fungsi ini memiliki tugas tertentu.


Fungsi matematika adalah fungsi yang ada dalam operasi matematika seperti abs(x) untuk mengambil nilai absolute dari x, log(x, basis=y) untuk mengambil algoritma dari x dengan basis y, exp(x) untuk menghitung eksponensial dari x, sqrt(x) untuk mencari nilai akar kuadrat dari x, dan lain sebagainya. Fungsi statistika adalah fungsi yang digunakan dalam ilmu statistika seperti mean(x) untuk mencari rata-rata dari x, median(x) untuk menghitung median dari variabel x, var(x) untuk menghitung varian dari variabel x, dan lain sebagainya.


Baca juga : Kursus Data Science Jakarta: Tips Cermat Belajar Data Science bersama DQLab!


4. Yuk Mulai Belajar Menjadi Data Scientist Bersama DQLab!       


Gunakan Kode Voucher "DQTRIAL", dan simak informasi di bawah ini mendapatkan 30 Hari FREE TRIAL:

  1. Buat Akun Gratis dengan Signup di DQLab.id/signup

  2. Buka academy.dqlab.id dan pilih menu redeem voucher 

  3. Redeem voucher "DQTRIAL" dan check menu my profile untuk melihat masa subscription yang sudah terakumulasi. 

  4. Selamat, akun kamu sudah terupgrade, dan kamu bisa mulai Belajar Data Science GRATIS 1 bulan.


    Penulis : Galuh Nurvinda

    Editor : Annissa Widya Davita


      Mulai Karier
      sebagai Praktisi
      Data Bersama
      DQLab

      Daftar sekarang dan ambil langkah
      pertamamu untuk mengenal
      Data Science.

      Buat Akun


      Atau

      Sudah punya akun? Login