Penjelasan Tentang Arsitektur Data Warehouse

 

Nama   : Anan Krisna

NPM    : 19312187

Kelas   : IF B SP

 

Arsitektur data warehouse adalah sebuah sekumpulan produk yang saling berintegrasi yang mampu untuk melakukan proses ekstraksi dan transformasi data operasional untuk dimasukkan ke dalam basis data agar end-user dapat melakukan sebuah analisis dan di ambil laporan.

Arsitektur data warehouse terdiri dari beberapa layer, yaitu sebagai berikut :

 

a.       Back-End Tier

Dalam layer back-end terdapat tiga proses yang harus dijalankan, yaitu; extraction, transformation dan loading (ETL process). Dalam mengelola data warehouse, proses ETL bertanggung jawab atas ekstraksi data, pembersihan dan penyesuaian, dan berakhir pada proses loading data ke dalam data warehouse. Tujuan dari proses ETL adalah memasukkan data ke dalam data warehouse. Sumber data bisa berasal dari data internal (database operasional) atau eksternal suatu organisasi atau bisa juga berasal dari data staging area.

Data staging area merupakan database atau tempat penyimpanan intermediate yang berada diantara data source dan data warehouse. Data staging area menyimpan data yang diekstrak dari data source yang mengalami modifikasi berturut-turut untuk akhirnya dimuat ke dalam data warehouse.

·         Extraction adalah proses mengumpulkan data dari berbagai sumber data. Sumber data bisa berasal dari database operasional atau file berbagai format. Extract merupakan proses memilih data dari satu environment dan memindahkannya ke environment lain.

·         Transform adalah proses memodifikasi data dari format data sumber menjadi format data warehouse sehingga data yang telah melalui proses ekstraksi sebelumnya dapat masuk dan cocok pada skema data warehouse yang telah ada.

·         Loading adalah proses memasukkan data yang sudah ditransformasi ke dalam data warehouse. Jika data yang dihasilkan telah sesuai dengan kondisi pada data warehouse, maka proses load dijalankan, dan data dari staging area akan dipindahkan ke data warehouse.

 

b.      Data Warehouse Tier

Layer data warehouse terdiri dari enterprise data warehouse, data mart, dan metadata. Enterprise data warehouse disimpan terpusat dan mencakup data dari seluruh area/departemen dalam suatu organisasi. Sedangkan data mart ditujukan khusus untuk suatu fungsional atau department tertentu dalam suatu organisasi.

Metadata didefinisikan sebagai data about data. Terdapat dua macam metadata, yaitu; technical metadata dan business metadata. Technical metadata menjelaskan bagaimana data distrukturkan dan disimpan ke dalam mesin komputer. Sedangkan business metadata menjelaskan rules, policies, dan constraints terkait dengan data di dalam sebuah organisasi.

 

c.       OLAP Tier

OLAP (Online Analytical Processing) adalah suatu metode khusus untuk melakukan analisa data yang terdapat pada media penyimpanan data dan membuat laporan sesuai dengan keinginan user. Dalam layer OLAP terdapat OLAP server yang menampilkan data dalam bentuk multidimensiyang bersumber dari data warehouse.

OLAP adalah sebuah perangkat yang mampu menggunakan visualisasi multi dimensi untuk sejumlah data yang memungkinkan untuk menganalisa strategi informasi dengan mempercepat analisis. Informasi juga dapat di tampilkan berupa kubus (cube), yang terdiri dari kategori deskriptif (dimension), dan nilai kuantitatif (measure).

Beberapa hal yang dapat dianalisa serta di kelola dalam OLAP ada beberapa hal seperti dimensi yaitu sebuah atribut yang di tinjau atau yang akan diolah, selain itu ada pengukur (measurement) yang dapat di gunakan sebagai besaran yang di gunakan untuk mengukur irisan antar dimensi yang akan ditinjau, dan yang terakhir adalah kalkulasi ini digunakan untuk mengukur menjumlahkan atau menghitung hasil measurement yang sudah dibuat.

 

d.      Front-End Tier

Dalam layer front-end terdapat alat-alat yang mempermudah pengguna untuk mengeksplorasi konten dari data warehouse. Client tool bisa berupa:

OLAP tools. Alat yang memfasilitasi pengguna untuk mengeksplorasi konten dari data warehouse secara interaktif dengan formulasi query yang kompleks yang melibatkan data dalam jumlah besar.

Reporting tools. Alat ini membantu pengguna dalam manajemen laporan yang dapat dikeluarkan/diolah menjadi paper based report atau interactive web-based.

Statistical tools. Alat ini digunakan untuk menganalisa dan memvisualisasikan data cube menggunakan metode statistik.

Data mining tools. Alat ini memungkinkan pengguna untuk menganalisa data agar memperoleh knowledge yang bernilai sebagai pattern dan tren.


Komentar

Postingan Populer