BIG DATA
What : Big Data adalah sebuah sistem teknologi yang diperkenalkan untuk
menanggulangi 'ledakan informasi' seiring dengan semakin bertumbuhnya
ekosistem pengguna perangkat mobile dan data internet. Pertumbuhan
perangkat mobile dan data internet ternyata sangat mempengaruhi
perkembangan volume dan jenis data yang terus meningkat secara
signifikan di dunia maya.
Where : Didalam perusahaan-perusahaan besar dan didalam Sosial Media
When : Setiap hari, kita menciptakan 2,5 triliun byte data - begitu
banyak bahwa 90% dari data di dunia saat ini telah dibuat dalam dua tahun
terakhir saja. Data ini berasal dari mana-mana, sensor digunakan untuk
mengumpulkan informasi iklim, posting ke situs media sosial, gambar digital dan
video, catatan transaksi pembelian, dan sinyal ponsel GPS untuk beberapa nama.
Data ini adalah big data.
Why : Big data merupakan bagian dari persaingan yang sulit untuk pangsa
pasar. Ancaman utamanya adalah kemampuan pesaing untuk mengumpulkan dan
menganalisis sentimen konsumen dan menghasilkan rekomendasi di seluruh
jutaan pelanggan. Pentinguntuk dicatatbahwaancaman danpeluang yang
terkaitdengan datayang besarsering memilikiimplikasiorganisasidimana
hanyadenganperhatian senioreksekutifdapatmengatasinya. Pimpinan terlalu
sedikit memahami potensi data yang besar dalam bisnis mereka, aset data
dan kewajiban dari bisnisnya, atau pilihan strategis mereka adalah
harus membuat untuk memulai memanfaatkan data yang besar.
Who : Perusahaan-Perusahaan
yang mempunyai data yang sangat besar setiap hari nya misalnya seperti
Sosial Media, Perusahaan Sinyal GPS atau Jaringan Ponsel
How : Bagaimana cara kerja dan penggunaan Big Data :
IT logs Analytics
Penyimpanan Log jangka panjang,
digunakan untuk analisa proses sistem yang sedang berjalan untuk mencegah dan
menaggulangi kegagalan dalam sistem, mengunakan hasil analisa log untuk
menemukan dan mentukan secara pasti kegagalan apa yang terjadi didalam sistem,
menyiapkan langkah-langkah pasti yang dapat digunakan sebagai solusi masalah
sistem.
Fraud Detection Pattern
Banyak digunakan dalam Bidang keuangan atau dimana saja
transaksi finasial terlibat, Memaksimalkan pengunaan data-data yang ada untuk
memberikan kemampuan unutk mendeteksi fraud ketika transaksi sedang berlangsung
The Social Media Pattern
Pengunaan Big data untuk analisa media social dan sentiment
pelangan, memberikan kemampuan bagi perusahan untuk mengetahui keinginan
customer secara luas, mendapatkan feedback secara langsung, dan mengenali
langsung dampak sentimen terhadap penjualan, serta efektivitas dan penerimaan
pelangan terhadap pemasaran yang dilakukan.
The Call centere Mantra
Penyimpanan hasil perbincangan atau laporan customer dalam
bentuk text yang kemudian digunakan sebagai data untuk analisa masalah yang
dihadapai customer, memberikan kemampuan bagi perusahaan untuk memberikan
tanggapan yang cepat maupun secara langsung terhadap masalah yang dihadapi
customer, serta kemampuan unutk mendeteksi penurunan loyalitas customer
dikarenakan masalah dan ketidakpuasaan.
Risk: Patterns for
Modeling and Management
Memberikan kempuaan pengunaan data secara penuh dan analisis
dalam pemodelan resiko dan menejemen resiko untuk memberikan pengetahuan akan
resiko dan penanggulangannya secara tepat dan langsung
Big data and The Energy Sector
Memberikan
kemampuan penyimpanan dan pemrosesan data secara langsung dari berbagai
sumber(sensor), analisa dan kemudahan dalam pengenalan noise untuk memisahkannya dari signal.
Pengertian Data
(R.
Kelly Rainer, 2011)
Data, menunjuk pada deskripsi dasar akan benda, event, aktivitas, dan transaksi
yang terdokumentasi, terklasifikasi,dan tersimpan tetapi tidak terorganisasi
untuk dapat memberikan suatu arti yang spesifik.
Berdasarkan
pengertian di atas, data merupakan hal paling mendasar yang dibutuhkan
perusahaan yang dapat diperoleh dari proses-proses operasional sehari-hari
maupun sumber-sumber luar yang akan diolah menurut keinginan perusahaan.
Pengertian Information
(R. Kelly Rainer, 2011) Information, merupakan data
yang telah terorganisir agar dapat memberikan arti dan nilai kepada penerima.
Berdasarkan
pengertian di atas, hasil penyusunan dan transformasi data yang dapat
memberikan makna baru kepada data tersebut.
Pengertian Knowledge
(R. Kelly Rainer, 2011) Terdiri dari data atau
informasi yang telah terorganisasi dan proses untuk memberikan pemahaman,
pengalaman, dan pembelajaran, serta keahlian terhadap problema bisnis yang
sedang dihadapi.
Berdasarkan
pengertian di atas, knowledge menjadi
sarana bagi para manajer untuk membuat keputusan - keputusan yang crucial dan berdampak besar bagi perusahaan, dimana kesalahan atau
kecacatan dalam knowledge dapat
memberikan dampak buruk bagi perusahaan.
Pengertian Extract, Tranform, Load (ETL) (immon liad DWH)
(H.Inmon,
2005) ETL, proses
memasukkan data, mengintergrasikan dan menempatkannya dalam data warehouse.
Berdasarkan pengertian
tersebut, ETL adalah proses mengubah raw data sebelum masuk kedalam data
warehouse.
Pengertian Data Warehouse
(R. Kelly Rainer, 2011) Data Warehouse
adalah repository dari data-data yang
bersifat historical yang terorganisir
berdasarkan subjek yang digunakan untuk mendukung pengambilan keputusan. Data warehouse memiliki beberapa
karakter dasar seperti. Diatur oleh business dimension or subject dimana data
disusun berdasarkan subjeknya dan memiliki informasi yang relevan dengan
pemgambilan keputusan dan analisis data.consistent yaitu data memliki bentuk
yang sama disetiap atau disemua database. Historical,
data yang ada merupakan data yang tersimpan dan terkumupl dalam waktu yang lama
yang digunakan untuk forecasting dan
perbandingan untuk meliat tingakt laju suatu perusahaan. Use only analytical processing menggunakan analytical processing yang berguna unutk mengakumulasi data-data
yang ada. Multidimensional, data warehouse menyimpan data dalam lebih dari dua
dimensi seperti data cube.
Data
warehouse merupakan bagian penting dalam struktur / arsitektur suatu BI karena
posisinya sebagai tempat penyimpanan data- data yang telah terorganisasi dan
yang telah memiliki makna, maka harus memilki struktur data desain yang baik
yang dapat mensupport pengambilan data-data dan informasi secara akurat dan
cepat dari dalam data warehouse itu sendiri.
Pengertian Big Data
Menurut
(Eaton,
Dirk, Tom, George, & Paul) Big Data merupakan istilah yang berlaku untuk informasi yang tidak
dapat diproses atau dianalisis menggunakan alat tradisional.
Menurut (Dumbill, 2012) , Big Data adalah data yang melebihi
proses kapasitas dari kovensi sistem database yang ada. Data terlalu besar dan
terlalu cepat atau tidak sesuai dengan struktur arsitektur database yang ada.
Untuk mendapatkan nilai dari data, maka harus memilih jalan altenatif untuk
memprosesnya.
Berdasarkan pengertian para ahli di
atas, dapat disimpulkan bahwa Big Data adalah data yang memiliki volume besar
sehingga tidak dapat diproses menggunakan alat tradisional biasa dan harus
menggunakan cara dan alat baru untuk mendapatkan nilai dari data ini.
Bab 3
Pembahasan
3.1 Big Data
Setiap hari, kita menciptakan 2,5 triliun byte data - begitu
banyak bahwa 90% dari data di dunia saat ini telah dibuat dalam dua tahun
terakhir saja. Data ini berasal dari mana-mana, sensor digunakan untuk
mengumpulkan informasi iklim, posting ke situs media sosial, gambar digital dan
video, catatan transaksi pembelian, dan sinyal ponsel GPS untuk beberapa nama.
Data ini adalah big data.
Big Data
mengacu pada dataset yang ukurannya diluar kemampuan dari database software tools
untuk meng-capture, menyimpan,me-manage dan menganalisis. Definisi ini sengaja
dibuat subjective agar mampu digabungkan oleh definisi Big Data yang masi belum
ada baku. Ukuran big data sekitar beberapa lusin TeraByte sampai ke beberapa
PetaByte tergantung jenis Industri
Isi dari
Big Data adalah Transaksi+interaksi dan observasi atau bisa di bilang segalanya
yang berhubungan dengan jaringan internet, jaringan komunikasi, dan jaringan
satelit
Big Data dapat juga
didefinisikan sebagai sebuah masalah domain
dimana teknologi tradisional seperti relasional database tidak mampu lagi untuk
melayani.
Big data lebih dari
hanya masalah ukuran, itu adalah kesempatan untuk menemukan wawasan dalam jenis
baru dan muncul data dan konten, untuk membuat bisnis Anda lebih gesit, dan
menjawab pertanyaan yang sebelumnya dianggap di luar jangkauan Anda.
Big data dapat
di artikan kedalam 9 karakter (IBM) menurut responden
sehingga disimpulkan oleh IBM, Big data adalah data yang memiliki scope
informasi yang sangat besar, model informasi yang real-time, memiliki volume
yang besar, dan berasalkan social media data jadi dapat disimpulkan bahwa Big
data adalah dataset yang memiliki volume besar dan salah satu isinya
berdasarkan social media data, dan informasi dari Big data selalu yang terbaru
(latestdata) sehingga model informasi nya real-time, dan scope informasi nya
tidak terfocus pada industri-indrustri kecil saja atau industri-indrustri besar
saja melainkan semuanya baik industry kecil maupun besar.
3.2 Dimensi -Dimensi
Big Data
Ada 3 dimensi awal dalam Big Data
yaitu 3V: Volume, Variety dan Velocity
·
Volume
perusahaan tertimbun dengan
data yang terus tumbuh dari semua jenis sektor, dengan mudah mengumpulkan
terabyte bahkan petabyte-informasi.
Ø Mengubah 12 terabyte Tweet dibuat
setiap hari ke dalam peningkatan sentimen analisis produk.
Ø Mengkonvert 350 milliar pembacaan tahunan
untuk lebih baik dalam memprediksi kemampuan beli pasar.
Mungkin
karakteristik ini yang paling mudah dimengerti karena besarnya data. Volume
juga mengacu pada jumlah massa data, bahwa organisasi berusaha untuk
memanfaatkan data untuk meningkatkan pengambilan keputusan yang banyak
perusahaan di banyak negara. Volume data juga terus meningkat dan belum pernah
terjadi sampai sethinggi ini sehingga tidak dapat diprediksi jumlah pasti dan
juga ukuran dari data sekitar lebih kecil dari petabyte sampai zetabyte.
Dataset big data sekitar 1 terabyte sampai 1 petabyte perperusahaan jadi jika
big data digabungkan dalam sebuah organisasi / group perusahaan ukurannya
mungkin bisa sampai zetabyte dan jika hari ini jumlah data sampai 1000
zetabyte, besok pasti akan lebih tinggi dari 1000 zetabyte.
·
Variety :
Volume data yang banyak
tersebut bertambah dengan kecepatan yang begitu cepat sehingga sulit bagi kita
untuk mengelola hal tersebut. Kadang-kadang 2 menit sudah menjadi terlambat.
Untuk proses dalam waktu sensitif seperti penangkapan penipuan, data yang besar
harus digunakan sebagai aliran ke dalam perusahaan Anda untuk memaksimalkan
nilainya.
Ø Meneliti 5 juta transaksi yang
dibuat setiap hari untuk mengidentifikasi potensi penipuan
Ø Menganalisis 500 juta detail catatan
panggilan setiap hari secara real-time untuk memprediksi gejolak pelanggan
lebih cepat.
Berbagai
jenis data dan sumber data. Variasi adalah tentang mengelolah kompleksitas
beberapa jenis data, termasuk structured data, unstructured data dan
semi-structured data. Organisasi perlu mengintegrasikan dan menganalisis data
dari array yang kompleks dari kedua sumber informasi Traditional dan non
traditional informasi, dari dalam dan luar perusahaan. Dengan begitu banyaknya
sensor, perangkat pintar (smart device) dan teknologi kolaborasi sosial, data
yang dihasilkan dalam bentuk yang tak terhitung jumlahnya, termasuk text, web data, tweet, sensor data,
audio, video, click stream, log file dan banyak lagi.
·
Velocity :
Big Data adalah setiap jenis data - data baik yang terstruktur
maupun tidak terstruktur seperti teks, data sensor, audio, video, klik stream,
file log dan banyak lagi. Wawasan baru ditemukan ketika menganalisis kedua
jenis data ini bersama-sama.
·
Memantau 100 video masukan langsung
dari kamera pengintai untuk menargetkan tempat tujuan.
·
Mengeksploitasi 80% perkembangan
data dalam gambar, video, dan dokumen untuk meningkatkan kepuasan pelanggan.
Data dalam gerak. Kecepatan di mana data
dibuat, diolah dan dianalisis terus menerus. Berkontribusi untuk kecepatan yang
lebih tinggi adalah sifat penciptaan data secara real-time, serta kebutuhan
untuk memasukkan streaming data ke dalam proses bisnis dan dalam pengambilan
keputusan. Dampak Velocity latency, jeda waktu antara saat data dibuat atau
data yang ditangkap, dan ketika itu juga
dapat diakses. Hari ini, data terus-menerus dihasilkan pada kecepatan yang
mustahil untuk sistem tradisional untuk menangkap, menyimpan dan menganalisis.
Jenis tertentu dari data harus dianalisis secara real time untuk menjadi nilai
bagi bisnis.
3.3 Dimensi Ketidakpastian
data
Dalam industri untuk meningkatan
sebuah data lebih berkualitas dibutuhkan dimensi ke empat yaitu Veracity,
pencantuman Veracity dapat menekankan pengelolahan dan penanganan untuk suatu
ketidakpastian yang melekat dalam beberapa jenis data.
Daftar Pustaka
Dumbill, E. (2012). Big Data Now
Current Perspective. O'Reilly Media.
Eaton, C.,
Dirk, D., Tom, D., George, L., & Paul, Z. (n.d.). Understanding Big
Data. Mc Graw Hill.
Global Pulse.
(2012). Big Data for Development:Challenges & Opportunities.
Global Pulse.
H., I. (2006).
METADATA – CENTRALIZED AND DISTRIBUTED IN DW2.0. 3-5.
H.Immon, W.
(2005). Building the Data Warehouse, 4th Edition. Indianapolis,
Indiana: Wiley Publishing, Inc.
IBM. (n.d.). Analytics:
The real-world use of big data. Retrieved from How innovative enterprises
extract value from uncertain data: http://www-935.ibm.com/services/us/gbs/thoughtleadership/ibv-big-data-at-work.html
R. Kelly
Rainer, C. (2011). Introduction to Information Systems. John Wiley
& Sons (Asia) Pte Ltd.
Sun, H., &
Heller, P. (2012). Oracle Information Architecture. Oracle Information
Architecture.
Referensi
http://www-01.ibm.com/common/ssi/cgi-bin/ssialias?subtype=BK&infotype=PM&appname=SWGE_IM_DD_USEN&htmlfid=IMM14100USEN&attachment=IMM14100USEN.PDF
http://www.mckinsey.com/~/media/McKinsey/dotcom/Insights%20and%20pubs/MGI/Research/Technology%20and%20Innovation/Big%20Data/MGI_big_data_full_report.ashx
http://www.mckinsey.com/~/media/McKinsey/dotcom/Insights%20and%20pubs/MGI/Research/Technology%20and%20Innovation/Big%20Data/MGI_big_data_full_report.ashx
Handyka Eza Prathama
Malik Syahbadi
0 komentar:
Posting Komentar