Mau Jadi Data Scientist? Sudahkah kamu memiliki ilmu ini?

Business Insider baru-baru ini mengeluarkan survei dan studi bahwa profesi IT nomor satu yang paling diperlukan adalah di area Big Data, yaitu Data Scientist. Sebuah profesi yang sarat akan keahlian dalam mengumpulkan, mengolahnya dengan metodologi teruji sehingga dapat dianalisa dengan baik oleh berbagai software untuk mendapatkan gambaran kondisi bisnis dan mendapatkan peluang yang tidak terlihat sebelumnya.

Berikut adalah beberapa pengetahuan dan keterampilan yang diperlukan dan disarikan oleh penulis dari portal KDNUGGETS.com.

Pengetahuan dan Keterampilan Teknis

  1. R
    R adalah software dan bahasa pemograman statistik dan pengolahan data spesifik yang sangat kaya modul. Sampai penulisan ini dibuat, telah ada 7,812 paket modul yang disumbangkan oleh komunitas ahli R yang terdiri dari kalangan akademis, industri dan programmer berpengalaman.
  2. Pengetahuan Akademis
    Pengolahan dan analisa data tentunya sarat dengan pengetahuan akademik yang mendalam sehingga dapat menguji hasil analisa data dengan tingkat keyakinan tinggi.  Disiplin ilmu murni dan terapan yang diperlukan adalah matematika dan statistik, ilmu komputer atau computer science, dan engineering.
  3. Python
    Berbeda dengan R yang dari awal dirancang untuk memudahkan pengolahan data angka, Python adalah bahasa pemograman umum. Namun, karena popularitasnya yang sangat tinggi terutama di kalangan akademis dan riset, banyak modul-modul matematika, statistik, pengolahan data umum ataupun spesifik seperti predictive analytics dikembangkan dan disumbangkan oleh komunitas. Beberapa modul yang sangat populer seperti numpy, scipy, dan scikits-learn.
  4. Hadoop
    Hadoop adalah platform komputasi terdistribusi dimana data besar dapat diolah secara paralel dan kita tidak kuatir akan kompleksitas manajemen memori, prosesor maupun harddisk. Dengan Hadoop, kita dapat memecahkan banyak masalah data kompleks dengan menggunakan aplikasi di atas platform ini seperti Hive, Flume, Pig, Hbase, dan lain-lain. Apalagi jika Anda memiliki pemograman untuk framework MapReduce dan Spark tentunya menjadi nilai tambah yang luar biasa.
  5. Database Relasional dengan Bahasa SQL
    Database relasional adalah database yang umum digunakan oleh banyak aplikasi dewasa ini. Karena banyaknya data tersimpan dengan database ‘tradisional’ ini, maka pengetahuan dan keterampilan menggunakan SQL (Structured Query Language) untuk mengakses dan mengolah database ini sangat diperlukan.
  6. Data Tidak Terstruktur
    Dengan menjamurnya sosial media dan konten yang banyak dibagikan seperti dokumen, artikel, gambar dan video.  Bagaimana software komputer ‘mencerna’ konten-konten tersebut sehingga menjadi aset informasi yang berarti dapat menjadi keunggulan kompetitif perusahaan. Misalkan, jika kita dapat mendeteksi tren berpakaian atau mengenal ikon fashion yang berpengaruh secara lokal, sebuah perusahaan ritel tentunya dapat menangkap peluang dengan mencari supplier yang tepat sebelum kompetitor menyadarinya.

Selain itu, keterampilan-keterampilan non teknis yang tidak kalah pentingnya adalah:

  1. ‘Iseng’ secara intelektual
    Keingintahuan yang tinggi tentunya membuat kita akan banyak melakukan banyak riset. Kita akan banyak berimajinasi dan menguji banyak hal yang dapat dilakukan oleh alat baik itu berupa metodogi maupun software yang telah disinggung di atas.
  2. Ketajaman Pengetahuan Bisnis
    Untuk menjadi ahli data yang dapat membantu bisnis, tentunya kita perlu mengerti permasalahan bisnis yang perlu dicari solusinya.  Dari awal, seorang data scientist perlu menjadi tandem dengan para stakeholder dalam melihat mana masalah yang perlu menjadi prioritas untuk dipecahkan, dan kemudian mengidentifikasi data yang tersedia atau mungkin diambil dari luar untuk dapat dimanfaatkan secara maksimal.
  3. Komunikasi
    Tanpa adanya keahlian komunikasi yang baik dalam menuangkan ide, menggali kebutuhan, memajukan proposal ataupun menjelaskan hasil kesimpulan analisa kepada pelaku bisnis yang non-teknis maka dipastikan hambatan akan sangat tinggi dalam menjalankan tahapan yang diperlukan. Hasil akhir tidak akan sesuai ekspektasi dan investasi di area Big Data akan dianggap gagal.

Mulai karir Anda

sebagai Data Scientist hari ini!

Mulai karir Anda

sebagai Data Scientist hari ini!