Yuk, Kenali 3 Jenis Data Pada Big Data yang Wajib Kamu Tahu!
Seperti yang kita ketahui, Big Data digambarkan dengan kumpulan data yang memiliki jumlah yang besar. Akan tetapi pada kenyataannya, Big Data bukan hanya masalah ukuran yang besar, tetapi juga data yang memiliki jenis data yang sangat beragam dan laju pertumbuhannya yang tinggi.
Big Data memiliki tiga karakteristik, salah satunya adalah variety (variasi). Variety disini maksudnya adalah data pada Big Data memiliki berbagai macam jenis data. Dimulai dari jenis data yang terstruktur hingga seiring berkembangnya teknologi Big Data, jenis data mulai tidak terstruktur. Lalu apa bedanya dari masing-masing jenis data tersebut? Yuk, simak penjelasannya!
1. Data Berstruktur
Jenis data structured (data tradisional) dapat diproses, disimpan, dan diambil dalam format tetap. Jenis data ini disimpan dalam bentuk tabel, baris dan kolom yang normalnya disimpan dalam excel atau spreadsheet, dimana informasi pada data sangat terorganisir dan dapat dengan mudah diakses dari database dengan algoritma mesin pencari sederhana.
Contoh data terstruktur adalah, data sensor, data penjualan pada suatu perusahaan, data karyawan dalam database perusahaan dengan detail yang terstruktur seperti detail data diri karyawan, posisi pekejaan, gaji, dan lainnya ditampilkan secara terorganisir.
2. Data Semi-Terstruktur
Jenis data semi-structured merupakan jenis data yang dimasukan ke dalam sebuah tabel, tetapi skemanya tidak sama dengan tabel biasa yang hanya terdiri dari baris dan kolom. Data semi-terstruktur mengandung format data terstruktur dan tidak terstruktur. Walaupun belum diklasifikasi oleh repository tertentu (database), namun mengandung informasi yang penting. Contohnya adalah data dalam bentuk file csv, file xml, dan file json.
3. Data Tidak Berstruktur
Jenis data unstructured adalah data dengan bentuk yang tidak dikenal, harus disimpan dengan format khusus karena tidak memiliki struktur yang spesifik seperti jenis data structured. Raw data dari jenis data ini hanya dapat menghasilkan nilai setelah diproses dan dianalisa. Menyimpan data jenis ini pun memiliki kerumitan seperti memerlukan penggunaan sistem penyimpanan yang memadai, seperti database NoSQL (MongoDB dan CouchDB).
Contoh jenis data tidak terstruktur seperti data teks, berformat foto atau gambar, video, atau suara. Selain itu, bisa juga dalam bentuk keluhan pelanggan, kontrak, ataupun email internal. Contoh dari data jenis ini dapat ditemukan dalam social media, seperti komentar, likes, followers, dan data click pada setiap aktivitas di akun media sosialmu.
Baca juga: 3 Dataset Yang Harus Kamu Coba Untuk Menambah Portofolio Data Kamu
4. Yuk Mulai Belajar Untuk Mencoba Semua Jenis Data Tersebut Bersama DQLab!
Yuk mulai membangun portofolio data kamu sekarang bersama DQLab! Selain bisa meningkatkan ilmu data yang dimiliki, kamu juga bisa membangun portofolio datamu di DQLab guna mempersiapkan dirimu berkarir di industri data.
Sign Up untuk nikmati module GRATIS "Introduction to Data Science" dengan pengalaman belajar yang seru menyenangkan serta aplikatif pada industri nyata! Untuk kamu yang ingin mulai belajar Data Science atau siap berkarir jadi Data Analyst, Data Scientist, dan Data Engineer, persiapkan diri kamu dengan tepat sekarang. Tidak ada kata terlambat untuk belajar. Yuk #MulaiBelajarData di DQLab.
Dengan belajar di DQLab, kamu bisa:
Menerapkan teknik mengolah data kotor, hasilkan visualisasi data dan model prediksi dengan studi kasus Retail dan Finansial
Dapatkan sesi konsultasi langsung dengan praktisi data lewat data mentoring
Bangun portofolio data langsung dari praktisi data Industri
Akses Forum DQLab untuk berdiskusi.
Simak informasi di bawah ini untuk mengakses gratis module "Introduction to Data Science":
Buat Akun Gratis dengan Signup di DQLab.id/signup
Akses module Introduction to Data Science
Selesaikan modulenya, dapatkan sertifikat & reward menarik dari DQLab
Penulis : Salsabila Miftah Rezkia
Editor : Annissa Widya Davita
Mulai Karier
sebagai Praktisi
Data Bersama
DQLab
Daftar sekarang dan ambil langkah
pertamamu untuk mengenal
Data Science.