BEDUG MERIAH Diskon 95%
Belajar Data 6 BULAN Bersertifikat hanya Rp150K!

0 Hari 2 Jam 45 Menit 51 Detik

Sedang Membangun Portofolio Data? Gunakan Macam-Macam Data Ini Dalam Proyek mu Selanjutnya!

Belajar Data Science di Rumah 15-Oktober-2020
https://dqlab.id/files/dqlab/cache/7fa960f5f03b4a2518a72a7c0c517457_x_Thumbnail800.jpg

Ada dua cara untuk memulai suatu proyek Data Science, antara kamu memiliki ide yang ingin kamu lakukan, kemudian kamu mencari data set yang akan digunakan untuk mewujudkan ide kamu tersebut. Atau, kamu menemukan data set menarik yang menginspirasi kamu untuk memulai proyek baru. Jadi bisa bermulai dari ide, atau dari data.


Seringkali, sebagai pemula, kamu mungkin akan sedikit kebingungan, mencari-cari waktu dan kondisi yang tepat untuk memulai sebuah proyek. Bagi saya, tempat awal yang baik adalah selalu menemukan data set menarik yang memicu rasa penasaran saya. Nah, artikel ini tentang inspirasi dataset untuk kamu gunakan dalam proyek selanjutnya. Saat kamu menemukan data set yang menarik, dengan begitu banyak potensi yang memicu kreativitas dalam diri kamu dan kamu tidak bisa tidak menggunakannya untuk membangun sesuatu yang hebat.


Dimanapun kamu berada dalam perjalanan belajar Data Science, baik itu baru memulai, atau mencoba mengembangkan keterampilan kamu dan mungkin membangun keterampilan baru, tidak ada cara yang lebih baik untuk meningkatkan skill ketimbang mempraktikkannya. Semakin banyak proyek yang kamu buat, semakin lancar dan kuat kemampuan Data Science yang akan kamu dapatkan, dan portofolio kamu akan menjadi semakin baik dan menarik. Penasaran apa saja macam-macam data set tersebut? Simak terus penjelasannya ya!


    1. Data Produk Amazon

    Data Produk Amazon berisi tinjauan (review) produk dan metadata dari Amazon, termasuk 142,8 juta review dari Mei 1996 - Juli 2014. Dataset ini mencakup tinjauan (peringkat, teks, suara kegunaan), metadata produk (deskripsi, informasi kategori, harga, merek, dan gambar fitur), dan tautan (juga grafik yang dilihat / juga dibeli).

    Kumpulan data ini akan memberi kamu pemahaman dasar tentang masalah bisnis nyata dan membantu kamu memahami dan mengekstrak tren penjualan selama bertahun-tahun.


    Apa yang dapat kamu lakukan dengan kumpulan data produk Amazon?

    • kamu dapat menggunakan kumpulan data ini untuk menganalisis sentimen (Sentiment Analysis), yang merupakan salah satu aplikasi pemrosesan bahasa alami (NLP, Natural Language Processing) yang paling populer.

    • Dataset ini adalah data pemrosesan teks (Text Processing), yang dapat kamu gunakan untuk membangun semua jenis model NLP.

    • kamu juga dapat menggunakan kumpulan data ini untuk membangun model tren produk dan memprediksi tren masa depan berdasarkan model tren tersebut.


    Baca Juga :Teknik Pengolahan Data : Mengenal Missing Values dan Cara-Cara Menanganinya


      2. Data Statistik Video Youtube

      YouTube mengelola daftar video trending teratas yang terus diperbarui di platfornya. Untuk menentukan video trending teratas di suatu tahun, YouTube menggunakan berbagai faktor, termasuk mengukur interaksi pengguna (jumlah penayangan, pembagian, komentar, dan suka). Data statistik video YouTube adalah catatan harian dari video YouTube yang paling tren.


      Bagaimana cara menggunakan data set Statistik Video YouTube?

      • Melakukan analisis sentimen pada berbagai jenis video dan menemukan pola.

      • Mengkategorikan video YouTube berdasarkan komentar dan statistik mereka. Dengan menggunakan hasilnya, kamu dapat membangun database kamu sendiri, yang video-video tersebut cenderung lebih melibatkan audiens.

      • Melatih algoritma Machine Learning seperti RNN untuk menghasilkan komentar YouTube.

      • Gunakan daftar video populer tahun-tahun sebelumnya untuk membuat model Machine Learning yang memprediksi daftar video trending teratas di masa mendatang.


        3. Data SMS Spam

        Saat ini, kita dikelilingi oleh spam di sekitar kita, email spam, iklan spam, dan SMS spam. Dataset spam SMS berisi sekumpulan pesan SMS dalam bahasa Inggris sebanyak 5.574 pesan, yang ditkamui sebagai spam. Kumpulan data ini mewakili pesan spam yang berbeda sebagai entri dari file CSV agar mudah dibaca dan diekstrak. File CSV data set berisi dua kolom, satu untuk klasifikasi pesan sebagai spam atau bukan, dan yang lainnya adalah teks mentah pesan.


        Bagaimana kamu dapat menggunakan Data SMS Spam?

        • kamu dapat menggunakan algoritma klasifikasi (Classification) Machine Learning untuk membuat pengklasifikasi pesan spam, lalu mengujinya pada beberapa pesan untuk melabeli mereka sebagai aman atau spam.

        • kamu dapat membuat model dan melatih dataset ini untuk memprediksi dan mendeteksi pesan spam.


        Baca Juga :Yuk Kenali Macam Macam Data untuk Hindari Kekeliruan Dalam Pengolahannya


          4. Yuk Mulai Bangun Portofolio Datamu Bersama DQLab!"

          Terapkan ilmunya sekarang dengan bergabung bersama platform belajar online DQLab! Selain bisa meningkatkan ilmu data yang dimiliki, kamu juga bisa membangun portofolio datamu di DQLab guna mempersiapkan dirimu berkarir di industri data.

          Sign Up untuk nikmati module GRATIS "Introduction to Data Science" dengan pengalaman belajar yang seru menyenangkan serta aplikatif pada industri nyata! Untuk kamu yang ingin mulai belajar Data Science atau siap berkarir jadi Data Analyst, Data Scientist, dan Data Engineer, persiapkan diri kamu dengan tepat sekarang. Tidak ada kata terlambat untuk belajar. Yuk #MulaiBelajarData di DQLab.

          Dengan belajar di DQLab, kamu bisa:

          • Menerapkan teknik mengolah data kotor, hasilkan visualisasi data dan model prediksi dengan studi kasus Retail dan Finansial

          • Dapatkan sesi konsultasi langsung dengan praktisi data lewat data mentoring

          • Bangun portofolio data langsung dari praktisi data Industri

          • Akses Forum DQLab untuk berdiskusi.

          Simak informasi di bawah ini untuk mengakses gratis module "Introduction to Data Science":

          1. Buat Akun Gratis dengan Signup di DQLab.id/signup

          2. Akses module Introduction to Data Science

          3. Selesaikan modulenya, dapatkan sertifikat & reward menarik dari DQLab

          Penulis : Jihar Gifari

          Editor : Annissa Widya

          Mulai Karier
          sebagai Praktisi
          Data Bersama
          DQLab

          Daftar sekarang dan ambil langkah
          pertamamu untuk mengenal
          Data Science.

          Buat Akun


          Atau

          Sudah punya akun? Login