Penjelasan Tentang Arsitektur Data Warehouse
Nama : Anan Krisna
NPM : 19312187
Kelas : IF B SP
Arsitektur data
warehouse adalah sebuah sekumpulan produk yang saling berintegrasi yang mampu
untuk melakukan proses ekstraksi dan transformasi data operasional untuk
dimasukkan ke dalam basis data agar end-user dapat melakukan sebuah analisis
dan di ambil laporan.
Arsitektur data
warehouse terdiri dari beberapa layer, yaitu sebagai berikut :
a.
Back-End
Tier
Dalam
layer back-end terdapat tiga proses yang harus dijalankan, yaitu; extraction,
transformation dan loading (ETL process). Dalam mengelola data warehouse,
proses ETL bertanggung jawab atas ekstraksi data, pembersihan dan penyesuaian,
dan berakhir pada proses loading data ke dalam data warehouse. Tujuan dari
proses ETL adalah memasukkan data ke dalam data warehouse. Sumber data bisa
berasal dari data internal (database operasional) atau eksternal suatu
organisasi atau bisa juga berasal dari data staging area.
Data
staging area merupakan database atau tempat penyimpanan intermediate yang
berada diantara data source dan data warehouse. Data staging area menyimpan
data yang diekstrak dari data source yang mengalami modifikasi berturut-turut
untuk akhirnya dimuat ke dalam data warehouse.
·
Extraction adalah proses mengumpulkan data
dari berbagai sumber data. Sumber data bisa berasal dari database operasional
atau file berbagai format. Extract merupakan proses memilih data dari satu
environment dan memindahkannya ke environment lain.
·
Transform adalah proses memodifikasi data
dari format data sumber menjadi format data warehouse sehingga data yang telah
melalui proses ekstraksi sebelumnya dapat masuk dan cocok pada skema data
warehouse yang telah ada.
·
Loading adalah proses memasukkan data
yang sudah ditransformasi ke dalam data warehouse. Jika data yang dihasilkan
telah sesuai dengan kondisi pada data warehouse, maka proses load dijalankan,
dan data dari staging area akan dipindahkan ke data warehouse.
b.
Data
Warehouse Tier
Layer
data warehouse terdiri dari enterprise data warehouse, data mart, dan metadata.
Enterprise data warehouse disimpan terpusat dan mencakup data dari seluruh
area/departemen dalam suatu organisasi. Sedangkan data mart ditujukan khusus
untuk suatu fungsional atau department tertentu dalam suatu organisasi.
Metadata
didefinisikan sebagai data about data. Terdapat dua macam metadata, yaitu;
technical metadata dan business metadata. Technical metadata menjelaskan
bagaimana data distrukturkan dan disimpan ke dalam mesin komputer. Sedangkan
business metadata menjelaskan rules, policies, dan constraints terkait dengan
data di dalam sebuah organisasi.
c. OLAP Tier
OLAP
(Online Analytical Processing) adalah suatu metode khusus untuk melakukan
analisa data yang terdapat pada media penyimpanan data dan membuat laporan
sesuai dengan keinginan user. Dalam layer OLAP terdapat OLAP server yang
menampilkan data dalam bentuk multidimensiyang bersumber dari data warehouse.
OLAP
adalah sebuah perangkat yang mampu menggunakan visualisasi multi dimensi untuk
sejumlah data yang memungkinkan untuk menganalisa strategi informasi dengan
mempercepat analisis. Informasi juga dapat di tampilkan berupa kubus (cube),
yang terdiri dari kategori deskriptif (dimension), dan nilai kuantitatif
(measure).
Beberapa
hal yang dapat dianalisa serta di kelola dalam OLAP ada beberapa hal seperti
dimensi yaitu sebuah atribut yang di tinjau atau yang akan diolah, selain itu
ada pengukur (measurement) yang dapat di gunakan sebagai besaran yang di
gunakan untuk mengukur irisan antar dimensi yang akan ditinjau, dan yang
terakhir adalah kalkulasi ini digunakan untuk mengukur menjumlahkan atau
menghitung hasil measurement yang sudah dibuat.
d. Front-End Tier
Dalam
layer front-end terdapat alat-alat yang mempermudah pengguna untuk
mengeksplorasi konten dari data warehouse. Client tool bisa berupa:
OLAP
tools. Alat yang memfasilitasi pengguna untuk mengeksplorasi konten dari data
warehouse secara interaktif dengan formulasi query yang kompleks yang
melibatkan data dalam jumlah besar.
Reporting
tools. Alat ini membantu pengguna dalam manajemen laporan yang dapat
dikeluarkan/diolah menjadi paper based report atau interactive web-based.
Statistical
tools. Alat ini digunakan untuk menganalisa dan memvisualisasikan data cube
menggunakan metode statistik.
Data
mining tools. Alat ini memungkinkan pengguna untuk menganalisa data agar
memperoleh knowledge yang bernilai sebagai pattern dan tren.
Komentar
Posting Komentar