· A. PENGERTIAN BIG DATA
1. Pengertian Data
(R. Kelly Rainer, 2011)
Data, menunjuk pada deskripsi dasar akan benda, event, aktivitas, dan transaksi
yang terdokumentasi, terklasifikasi,dan tersimpan tetapi tidak terorganisasi
untuk dapat memberikan suatu arti yang spesifik. Berdasarkan pengertian di atas, data merupakan hal paling mendasar yang
dibutuhkan perusahaan yang dapat diperoleh dari proses-proses operasional
sehari-hari maupun sumber-sumber luar yang akan diolah menurut keinginan
perusahaan.
2. Pengertian Informasi
(R. Kelly Rainer, 2011)
Information, merupakan data yang telah terorganisir agar dapat memberikan arti
dan nilai kepada penerima.
Berdasarkan pengertian di
atas, hasil penyusunan dan transformasi data yang dapat memberikan makna baru
kepada data tersebut.
3. Pengertian Big Data
Big
Data adalah istilah umum untuk segala kumpulan himpunan data dalam jumlah
yang sangat besar dan kompleks sehingga menjadikannya sulit untuk ditangani
atau di proses jika hanya menggunakan manajemen basis data biasa atau aplikasi
pemroses data tradisional.
Big
Data menjamin pemrosesan solusi data dengan varian baru maupun yang sudah ada
untuk memberikan manfaat nyata bagi bisnis. Namun pengolahan data dengan ukuran
dan kompleksitas besar tetap sekedar solusi teknologi kecuali jika dikaitkan
dengan tujuan bisnis.
Hal terpenting dari
Big Data bukanlah sekedar kemampuan teknis untuk mengolah data melainkan
manfaat yang dapat disadari oleh perusahaan dengan menggunakan Big Data
Analytics Terminologi Big Data diyakini berasal dari perusahaan pencarian web
yang mengolah data dengana gregasi yang terdistribusi sangat besar dan tidak
terstruktur.
Contoh Big Data dapat
berupa data yang berukuran hingga petabytes (1,024 terabytes) atau exabytes
(1,024 petabytes), seperti milyaran hingga triliunan catatan personal seseorang
yang semuanya berasal dari sumber berbeda seperti web, sales, customer service,
social media, data mobile dan sebagainya.
Data-data ini biasanya
tidak terstruktur, sering tidak lengkap dan tidak dapat diakses. Pada saat
berhadapan dengan kelompok data yang lebih besar, perusahaan menghadapi
kesulitan membuat, memanipulasi dan mengelola Big Data. Big Data sesungguhnya
masalah dalaman alisis bisnis karena tools dan prosedur standar tidak didesain
untuk mencari dan menganalisa kumpulan data yang massive.
·
B. KARAKTERISTIK BIG DATA
1. Volume
Seberapa besar data yang bisa anda olah saat
ini? Apakah dengan jumlah data yang anda miliki anda sudah lebih baik dibanding
kompetitor? Data yang ada saat ini berukuran sangat besar. Di tahun 2000 saja
tercatat 800,000 petabyte data tersimpan di seluruh dunia dan angka ini
diperkirakan akan mencapai 35 zettabyte di tahun 2020 atau bahkan lebih.
Bayangkan jika anda membutuhkan analisis terhadap 1 persen saja dari seluruh
data untuk mendapatkan keuntungan dibandingkan kompetitor anda, apakah
teknologi yang anda miliki sekarang mampu melakukannya
2. Variety
2. Variety
Selain data relasional, data
apa saja yang umum dianalisis? Dengan meledaknya jumlah sensor, dan perangkat
pintar , dan juga teknologi social networking yang menghasilkan data-data yang
akan sulit jika harus disimpan di dalam relasional database. Kita tidak akan
pernah tahu jika kita tidak menyimpan semua data yang tidak terstruktur ini
seperti halaman web, web log, search index, forum social media, email, dokumen,
data sensor, dll. Data-data seperti inilah yang mungkin akan memberikan
keuntungan jika kita mampu mengolahnya.
3. Velocity
Seberapa cepat kita dapat
memproses data yang ada? Mungkin hal itu yang pertama ada dalam benak anda
ketika anda membaca ini. Namun sebenarnya velocity di sini kita lihat dari
persepsi seberapa cepat kita mampu mendapatkan hasil analisis terhadap aliran
data yang terus mengalir di saat yang hampir bersamaan dengan datangnya data
tersebut. Bayangkan jika kita memiliki sistem yang mampu mendeteksi buronan
yang tertangkap kamera cctv, ataumendeteksi dini titik kritis seorang bayi dari
suhu tubuh, tekanan darah, denyut jantung, kecepatan bernafas bayi tersebut,
melakukan sensor terhadap kata kasar atau kata yang tidak seharusnya diucapkan
yang diucapkan pada siaran langsung di tv atau pada percakapan telepon customer
service sebuah perusahaan.
· C. CONTOH BIG DATA DALAM BERBGAI BIDANG
1. Contoh di Sektor Swasta
Perusahaan eBay.com menggunakan
dua gudang data pada 7,5 petabyte dan 40PB serta Hadoop klaster 40PB untuk
pencarian, rekomendasi, konsumen, dan merchandising . Di dalam eBay 90PB data
warehouse. Amazon.com menangani jutaan operasi back-end setiap hari, serta
pertanyaan dari lebih dari setengah juta penjual pihak ketiga . Teknologi inti
yang membuat Amazon berjalan adalah berbasis Linux dan pada 2005 mereka
memiliki tiga database Linux terbesar di dunia , dengan kapasitas 7,8 TB , 18,5
TB , dan 24,7 TB .
Walmart menangani lebih dari 1
juta transaksi nasabah setiap jam , yang diimpor ke database diperkirakan
mengandung lebih dari 2,5 petabyte ( 2.560 terabyte ) data - . Setara dengan
167 kali informasi yang terdapat dalam semua buku di Perpustakaan Kongres AS.
FICO Falcon Penipuan Kartu
Kredit Detection System melindungi 2,1 miliar akun aktif di seluruh dunia .
Volume data bisnis di seluruh
dunia , di semua perusahaan , dua kali lipat setiap 1,2 tahun , menurut
perkiraan. Windermere Real Estate menggunakan sinyal GPS anonim dari hampir 100
juta driver untuk membantu pembeli rumah baru menentukan waktu berkendara khas
mereka ke dan dari tempat kerja di berbagai kali dalam sehari .
2. Contoh di Bidang Arsitektur
2. Contoh di Bidang Arsitektur
Pada tahun 2004 , Google
menerbitkan sebuah makalah tentang proses yang disebut MapReduce yang
menggunakan arsitektur tersebut . MapReduce framework menyediakan model
pemrosesan paralel dan implementasi terkait untuk memproses sejumlah besar data
. Dengan MapReduce , query dibagi dan didistribusikan di seluruh node paralel
dan diproses secara . Hasilnya kemudian dikumpulkan dan disampaikan. Kerangka itu
sangat sukses sehingga orang lain ingin meniru algoritma . Oleh karena itu ,
sebuah implementasi dari kerangka MapReduce diadopsi oleh sebuah proyek open
source Apache Hadoop bernama
Teknologi Topological Program
Analisis Data DARPA.
3. Contoh di Bidang Pasar
" Big Data " telah
meningkatkan permintaan spesialis manajemen informasi dalam Software AG ,
Oracle Corporation , IBM , Microsoft , SAP , EMC , HP dan Dell telah
menghabiskan lebih dari $ 15 miliar untuk perusahaan perangkat lunak hanya
mengkhususkan diri dalam manajemen data dan analisis . Pada tahun 2010 ,
industri ini sendiri bernilai lebih dari $ 100 miliar dan tumbuh hampir 10
persen per tahun, tentang dua kali lebih cepat sebagai bisnis perangkat lunak
secara keseluruhan .
Negara maju membuat
meningkatnya penggunaan teknologi data-intensif Ada 4,6 miliar langganan ponsel
di seluruh dunia dan ada antara 1 miliar sampai 2 miliar orang mengakses
internet . Antara tahun 1990 dan 2005 , lebih dari 1 miliar orang di seluruh
dunia memasuki kelas menengah yang berarti semakin banyak orang yang memperoleh
uang akan menjadi melek lagi yang pada gilirannya menyebabkan pertumbuhan
informasi . Kapasitas yang efektif di dunia untuk bertukar informasi melalui
jaringan telekomunikasi adalah 281 petabyte pada tahun 1986 , 471 petabyte pada
tahun 1993 , 2,2 exabyte pada tahun 2000 , 65 exabyte pada tahun 2007 dan
diperkirakan bahwa jumlah lalu lintas yang mengalir melalui internet akan
mencapai 667 exabytes per tahun pada tahun 2013.
·
D. PENGGUNAAN BIG DATA DALAM PERUSAHAAN
· 1. IT
logs Analytics
Penyimpanan Log jangka panjang, digunakan untuk analisa proses sistem yang
sedang berjalan untuk mencegah dan menaggulangi kegagalan dalam sistem,
mengunakan hasil analisa log untuk menemukan dan mentukan secara pasti
kegagalan apa yang terjadi didalam sistem, menyiapkan langkah-langkah pasti
yang dapat digunakan sebagai solusi masalah sistem.
· 2. Fraud
Detection Pattern
Banyak
digunakan dalam Bidang keuangan atau dimana saja transaksi finasial terlibat,
Memaksimalkan pengunaan data-data yang ada untuk memberikan kemampuan unutk
mendeteksi fraud ketika transaksi sedang berlangsung
· 3. The
Social Media Pattern
Pengunaan
Big data untuk analisa media social dan sentiment pelangan, memberikan
kemampuan bagi perusahan untuk mengetahui keinginan customer secara luas,
mendapatkan feedback secara langsung, dan mengenali langsung dampak sentimen
terhadap penjualan, serta efektivitas dan penerimaan pelangan terhadap
pemasaran yang dilakukan.
· 4. The
Call centere Mantra
Penyimpanan
hasil perbincangan atau laporan customer dalam bentuk text yang kemudian
digunakan sebagai data untuk analisa masalah yang dihadapai customer,
memberikan kemampuan bagi perusahaan untuk memberikan tanggapan yang cepat
maupun secara langsung terhadap masalah yang dihadapi customer, serta kemampuan
unutk mendeteksi penurunan loyalitas customer dikarenakan masalah dan
ketidakpuasaan.
· 5. Risk:
Patterns for Modeling and Management
Memberikan
kempuaan pengunaan data secara penuh dan analisis dalam pemodelan resiko dan
menejemen resiko untuk memberikan pengetahuan akan resiko dan penanggulangannya
secara tepat dan langsung
· 6. Big
data and The Energy Sector
Memberikan
kemampuan penyimpanan dan pemrosesan data secara langsung dari berbagai
sumber(sensor), analisa dan kemudahan dalam pengenalan noise untuk
memisahkannya dari signal.
· E. PERMASALAHAN MENGENAI BIG DATA
1. Bukan Hanya Masalah Ukuran,
Tapi Lebih pada Ragam
Kini jelas bahwa Big Data bukan hanya masalah ukuran yang besar, terlebih yang menjadi ciri
khasnya adalah jenis datanya yang sangat beragam dan laju pertumbuhan maupun
frekwensi perubahannya yang tinggi. Dalam hal ragam data, Big
Data tidak hanya terdiri dari data berstruktur seperti halnya data
angka-angka maupun deretan huruf-huruf yang berasal dari sistem database
mendasar seperti halnya sistem database keuangan, tetapi juga terdiri atas data
multimedia seperti data teks, data suara dan video yang dikenal dengan istilah
data tak berstruktur. Terlebih lagi, Big Data juga mencakup data setengah berstruktur seperti halnya data e-mail
maupun XML.
Dalam hal kecepatan pertumbuhan
maupun frekwensi perubahannya, Big Data mencakup data-data yang berasal
dari berbagai jenis sensor, mesin-mesin, maupun data log komunikasi yang terus
menerus mengalir. Bahkan, juga mencakup data-data yang tak hanya data yang
berada di internal perusahaan, tetapi juga data-data di luar perusahaan seperti
data-data di Internet. Begitu beragamnya jenis data yang dicakup dalam Big
Data inilah yang kiranya dapat dijadikan patokan untuk membedakan Big
Data dengan sistem manajemen data pada umumnya.
2. Fokus
pada Trend per-Individu, Kecepatan Lebih Utama daripada Ketepatan
Hingga saat ini, pendayagunaan Big Data didominasi oleh perusahaan-perusahaan jasa berbasis Internet
seperti halnya Google dan Facebook. Data yang mereka berdayakan pun bukanlah
data-data internal perusahaan seperti halnya data-data penjualan maupun data
pelanggan, lebih menitik beratkan pada pengolahan data-data teks dan gambar
yang berada di Internet. Bila kita melihat gaya pemberdayaan data yang
dilakukan oleh perusahaan-perusahaan pada umumnya, yang dicari adalah trend yang didapat dari pengolahan data secara keseluruhan. Misalnya,
dari data konsumen akan didapat informasi tentang trendkonsumen dengan memproses data konsumen secara keseluruhan, bukan
memproses data per-konsumen untuk mendapatkan trend per-konsumen.
Dilain pihak,
perusahaan-perusahaan jasa berbasis Internet yang memanfaatkan Big Data justru memfokuskan pemberdayaan data untuk mendapatkan informasi trendper-konsumen dengan memanfaatkan atribut-atribut yang melekat pada
pribadi tiap konsumen. Sebut saja toko online Amazon yang memanfaatkan
informasi maupun atribut yang melekat pada diri per-konsumen, untuk memberikan
rekomendasi yang sesuai kepada tiap konsumen. Satu lagi, pemberdayaan data alaBig
Data ini dapat dikatakan lebih berfokus pada kecepatan ketimbang
ketepatan.
· F. ANALISA SOLUSI BIG DATA
Sejumlah vendor di pasar saat
ini mendukung solusi data yang besar . Berikut ini adalah daftar beberapa
solusi diantaranya adalah :
1. IBM ( www.ibm.com ) mengambil pendekatan perusahaan
untuk data yang besar dan mengintegrasikan seluruh platform termasuk embedding
/ bundling nya analisis . Produknya termasuk gudang ( warehouse InfoSphere )
yang memiliki built -in data-mining sendiri dan cubing kemampuan . ini baru
PureData Systems ( kemasan teknologi analisis canggih ke dalam platform sistem
terintegrasi ) mencakup banyak dikemas analitis integrasi . Produk InfoSphere
Streaming Its terintegrasi dengan Paket perangkat lunak statistik statistik
untuk Ilmu Sosial ( SPSS ) untuk mendukung real-time analisis prediktif ,
termasuk kemampuan untuk dinamis memperbarui model berdasarkan data real-time .
Hal ini bundling terbatas penggunaan lisensi Cognos Business Intelligence
dengan data kunci besar yang kemampuan platform ( kelas enterprise Hadoop ,
komputasi aliran , dan solusi gudang ) .
2. SAS ( www.sas.com ) memberikan beberapa pendekatan
untuk menganalisis data besar via infrastrukturnya analisis kinerja tinggi dan
yang statistic software . SAS menyediakan beberapa pilihan pemrosesan
terdistribusi . ini termasuk dalam database analytics , in- memory analytics ,
dan komputasi grid . Penyebaran bisa di tempat atau di awan .
3. Tableau ( www.tableausoftware.com ) , sebuah business analytics dan data perusahaan perangkat lunak
visualisasi , menawarkan kemampuan visualisasi untuk berjalan di atas peralatan
dan infrastruktur lain yang ditawarkan oleh berbagai besar mitra data,
termasuk Cirro , EMC Greenplum , Karmasphere , Teradata / Aster, HP Vertica ,
Hortonworks , ParAccel , IBM Netezza , dan sejumlah lain .
4. Oracle ( www.oracle.com ) menawarkan berbagai alat untuk
melengkapi yang besar platform data disebut Oracle Exadata . Ini termasuk
analisis canggih melalui bahasa pemrograman R , serta database in- memory
pilihan dengan Oracle Exalytics di memori mesin dan data Oracle gudang .
Exadata terintegrasi dengan platform perangkat keras nya .
5. Pentaho ( www.pentaho.com ) menyediakan analisis bisnis
open source melalui edisi komunitas dan perusahaan. Pentaho mendukung terkemuka
Distribusi Hadoop - based dan mendukung kemampuan asli, seperti NFS kinerja
tinggi sistem file mountable MapR itu .
DAFTAR PUSTAKA :
https://ediwordpressblog.wordpress.com/2016/02/22/pengertian-big-data/