Buat Akun DQLab & Akses Kelas Data Science Python, R, SQL, Excel GRATIS!

Data Science Adalah: Sejarah Data Science, Ilmu Baru yang Saat Ini Sedang Jadi Primadona

Wede 30-Oktober-2020
https://dqlab.id/files/dqlab/cache/321b98186c18d756999bfdc3bcc9d706_x_Thumbnail800.png

Data science adalah gabungan dari beberapa ilmu seperti ilmu komputer, ilmu statistik, dan ilmu matematika. Data science berawal dari ilmu statistik dan telah berkembang menjadi konsep baru seperti artificial intelligence, machine learning, dan lain sebagainya. Seseorang yang mempelajari dan menguasai data science disebut data scientist. Semakin berkembangnya teknologi berbanding lurus dengan produksi data yang terus meningkat setiap harinya. Contoh sumber data yang biasa kita temui adalah data perilaku dan tren yang dicatat, dikumpulkan, dan disimpan oleh perusahaan.


Data science perlu waktu yang tidak sebentar hingga akhirnya dikenal dan populer seperti saat ini. Tahukah kamu siapa orang yang mempopulerkan istilah data science? DJ Patil dan Jeff Hammerbacher adalah data scientist yang pertama kali mempopulerkan data science. Keduanya tidak hanya dipuji karena mengenalkan istilah data science tetapi juga mencontohkan bagaimana bekerja sebagai data scientist menggunakan data dan menerapkannya di berbagai bidang. Setelah mengetahui sejarah singkat bagaimana munculnya istilah data science, sepertinya menarik jika kita kupas tuntas sejarah data science. Kamu setuju? Ok, let"s get started!


1. Statistika, Matematika, dan Ilmu Komputer Sebagai pondasi Data Science

Semua berawal dari John Tukey yang pada tahun 1962 menulis pergeseran dan perkembangan dunia statistik. Beliau berkata "¦ as I have watched mathematical statistics evolve, I have had cause to wonder and to doubt¦I have come to feel that my central interest is in data analysis¦". Tukey menjelaskan bahwa gabungan ilmu statistik dan ilmu komputer dapat mempersingkat waktu penyajian hasil analisis. Hasil analisis menggunakan gabungan ilmu komputer dan statistik dapat diselesaikan hanya dalam hitungan jam jauh berbeda dibandingkan pengerjaan manual yang membutuhkan waktu berhari-hari bahkan berminggu-minggu.


Pada tahun 1974, Peter Naur menulis sebuah survei singkat mengenai metode komputer dan menggunakan istilah data science. Naur mengenalkan konsep baru "The science of dealing with data, once they have been established, while the relation of the data to what they represent is delegated to other fields and sciences." Tahun 1977 sebuah asosiasi internasional untuk perhitungan statistik dibentuk. Asosiasi ini dikenal dengan IASC (International Association for Statistical Computing). Asosiasi ini memiliki misi yang berpengaruh di dunia science yaitu untuk menghubungkan metodologi statistik tradisional, teknologi komputer modern, dan pengetahuan para ahli untuk mengubah data menjadi informasi dan pengetahuan. Pada tahun ini juga Tukey Menulis makalah keduanya yang berjudul Exploratory Data Analysis atau Analisis Data Eksplorasi. Pada makalahnya ini Tukey menjelaskan alasan pentingnya menggunakan data dalam memilih hipotesis untuk diuji dan menjelaskan bahwa analisis data konfirmatori dan analisis data eksplorasi harus bekerja sama.


Pada tahun 1994, data science mulai memasuki dunia marketing. Business Week memuat berita mengenai database marketing pada cerita sampulnya yang mengungkapkan bahwa perusahaan berita telah mulai mengumpulkan sejumlah besar informasi konsumen untuk memulai iklan pemasaran baru. Namun, data yang diperoleh belum lengkap karena masih banyak informasi yang terputus sehingga pada tahun 1999, Jacob Zahavi menjelaskan perlunya alat baru untuk menangani sejumlah informasi yang tersedia untuk bisnis. Zahavi menulis "Scalability is a huge issue in data mining¦ Conventional statistical methods work well with small data sets. Today"s databases, however, can involve millions of rows and scores of columns of data¦ Another technical challenge is developing models that can do a better job analyzing data, detecting non-linear relationships and interaction between elements¦ Special data mining tools may have to be developed to address web-site decisions." di Mining Data for Nuggets of Knowledge.


Baca Juga: Data Science Adalah: Yuk Kenali Lebih Jauh Tentang Data Science!


2. Munculnya Software Data Science Pertama

Pada tahun 2001, Software-as-a-Service (SaaS) dibuat. Software Ini adalah awal dari penggunaan aplikasi berbasis Cloud. Pada tahun ini juga William S. Cleveland menyusun rencana pelatihan data scientist untuk memenuhi kebutuhan masa depan. Cleveland mempresentasikan rencananya yang berjudul Data Science: An Action Plan for Expanding the Technical Areas of the field of Statistics. Rencana ini menjelaskan bagaimana cara untuk meningkatkan pengalaman teknis, jangkauan analis data, dan menentukan enam bidang studi untuk departemen di sebuah universitas. Cleveland mengenalkan pengembangan sumber daya khusus untuk penelitian di masing-masing bidang dan rencananya juga akan digunakan untuk penelitian pemerintah dan perusahaan.


Pada tahun 2002, Committee on Data for Science and Technology dari International Council for Science menerbitkan Jurnal data science. Jurnal ini berfokus pada masalah-masalah seperti deskripsi sistem data, publikasinya di internet, aplikasi, dan masalah hukum. Pada tahun 2006, Hadoop 0.1.0 dirilis. Hadoop 0.1.0 adalah sebuah database non-relasional open source dan berbasis Nutch. Lalu pada tahun 2009, istilah NoSQL diperkenalkan kembali oleh Johan Oskarsson ketika Oskarsson menyelenggarakan diskusi tentang "open-source, non-relational databases".


Pada tahun 2011, daftar pekerjaan untuk data scientist meningkat sebesar 15%. Seminar dan konferensi data science dan big data pun meningkat. Pada tahun yang sama James Dixon, seorang CTO Pentaho mengenalkan konsep keunggulan menggunakan Data Lakes daripada Data Warehouse. Dixon menyatakan perbedaan antara Data Warehouse dan Data Lake adalah Data Warehouse membuang banyak waktu dan tenaga karena melakukan pra-kategorisasi data pada titik masuk sementara Data Lake menerima informasi menggunakan database non-relasional (NoSQL) yang hanya menyimpan dan tidak mengkategorikan data tersebut.


Menurut IBM pada tahun 2013, sekitar 90% data di dunia telah diproduksi pada tahun 2011 hingga 2012. Pada 2015, Jack Clark dari Bloomberg, menulis bahwa tahun 2015 adalah tahun penting bagi dunia artificial intelligence (AI). Di dalam Google, total proyek software yang menggunakan AI meningkat menjadi lebih dari 2.700 proyek selama tahun 2015. Selain itu dengan menggunakan teknik deep learning, pengenalan Google"s speech recognition dan Google Voice mengalami peningkatan sebesar 49%.


3. Bagaimana Perkembangan Data Science Saat Ini?

Sepanjang tahun 2000-an, berbagai jurnal akademik mulai mengakui data science sebagai disiplin ilmu yang sedang berkembang. Pada tahun 2005, National Science Board menetapkan adanya profesi data scientist yang akan mengelola dan mengumpulkan data dalam dunia digital. Pada saat ini, perusahaan juga mulai melihat data sebagai komponen yang dapat dimanfaatkan. Thomas H. Davenport, Don Cohen, dan Al Jacobson menulis dalam Babson College Working Knowledge Research Center pada tahun 2005 "Instead of competing on traditional factors, companies are beginning to employ statistical and quantitative analysis and predictive modeling as primary elements of competition."


Pada tahun 2009, belum banyak orang yang kompeten dalam bidang data science. hal ini membuat Hal Varian, seorang Google Chief Economist di perusahaan raksasa Google khawatir karena tidak banyak orang yang mampu menganalisis data gratis dari berbagai sumber. Dalam sebuah wawancara dengan McKinsey Quarterly, varian mengungkapkan kekhawatirannya "The complimentary scarce factor is the ability to understand that data and extract value from it ¦ I do think those skills”of being able to access, understand, and communicate the insights you get from the data analysis”are going to be extremely important."


Pada tahun 2010, data science mulai menjadi pusat perhatian dan didukung dengan teknologi komputasi yang semakin canggih. Hal ini merupakan kabar baik untuk varian dan sebagian besar pengamat data science.Contoh nyatanya adalah Apple yang mulai memperkenalkan iPad pada Januari 2010 dan Pada bulan Juni di tahun yang sama, Apple merilis iPhone 4. Contoh lainnya adalah pada Bulan Juli, Amazon menerbitkan siaran pers yang menyatakan bahwa untuk pertama kalinya, platform ini telah menjual lebih banyak buku Kindle daripada buku hardcover. Hal ini membuktikan bahwa konsumen mulai terbuka dengan data science yang dibalut dengan teknologi modern.


Selama beberapa tahun terakhir, data science terus berkembang dan menembus hampir ke seluruh industri. Dalam artikel tahun 2010 yang diterbitkan di The Economist, Kenneth Cukier mengatakan bahwa data scientist merupakan gabungan keterampilan pemrograman, statistika, dan story telling yang dapat menemukan "emas" di balik kumpulan data. Saat ini, data scientist sangat berharga dan perusahaan rela membayar mahal seorang data scientist untuk membantu kinerja perusahaannya. Tidak hanya itu, data science saat ini tidak hanya dapat dipelajari oleh seseorang dengan background pendidikan ilmu komputer atau statistika saja, tetapi juga bisa dipelajari oleh semua orang dengan background pendidikan yang berbeda-beda. Data science dan aplikasinya akan terus berkembang karena data akan terus diproduksi, berkembang, dan semakin besar. Buktinya, menurut Pew Research Center saat ini 95% orang Amerika memiliki beberapa jenis ponsel. Hampir delapan dari sepuluh orang dewasa AS memiliki komputer desktop atau laptop, sementara kira-kira setengahnya sekarang memiliki komputer tablet. Selain itu, menurut Accenture pada tahun 2016, 78% konsumen perawatan kesehatan memakai atau bersedia memakai teknologi untuk melacak gaya hidup dan tanda vital mereka.


Data science telah menjadi bagian penting dari bisnis dan penelitian akademis. Penerapan data science di bidang teknologi antara lain mesin penerjemah bahasa, robot, speech recognition, dan search engines. Dari segi penelitian, data science telah berkembang mencakup ilmu biologi, kesehatan, informatika, kedokteran, ilmu humaniora, dan ilmu sosial. Data science saat ini pun berpengaruh di bidang ekonomi, pemerintah, serta bisnis dan keuangan.


Baca Juga: Ingin Menjadi Data Scientist? Yuk, Kenali Kompetensi Machine Learning



4. Tidak memiliki background IT ?

Jangan khawatir, kamu tetap bisa menguasai Ilmu Data Science untuk siap berkarir di revolusi industri 4.0. Bangun proyek dan portofolio datamu bersama DQLab untuk mulai berkarir di industi! Sign up sekarang untuk #MulaiBelajarData di DQLab!

Simak informasi di bawah ini untuk mengakses gratis module "Introduction to Data Science":

  1. Buat Akun Gratis dengan Signup di DQLab.id/signup

  2. Akses module Introduction to Data Science

  3. Selesaikan modulenya, dapatkan sertifikat & reward menarik dari DQLab

  4. Subscribe DQLab.id untuk Akses Semua Module Premium!



Penulis: Galuh Nurvinda Kurniawati

Editor: Annissa Widya Davita

Mulai Karier
sebagai Praktisi
Data Bersama
DQLab

Daftar sekarang dan ambil langkah
pertamamu untuk mengenal
Data Science.

Buat Akun


Atau

Sudah punya akun? Login