Penjelasan Snowflake Schema Data Warehouse

Nama   : Anan Krisna

NPM    : 19312187

Kelas   : IF B SP

Snowflake Schema Data Warehouse

Snowflake schema adalah database multidimensional dalam data warehouse yang berupa skema yang memiliki beberapa tabel di dalamnya yang menyerupai bentuk snowflake atau kepingan salju. skema snowflake terdiri tabel dimensi yang telah dinormalisasi. Proses normalisasi tabel-tabel dimensi pada skema snowflake ini disebut dengan proses snowflaking.

Model snowflake merupakan perluasan dari star dimana ia juga mempunyai satu atau lebih dimensi. Hanya saja pada snowflake, tabel yang berelasi pada fact table hanya tabel dimensi utama, sedangkan tabel yang lain dihubungkan pada tabel dimensi utama. Model snowflake ini hampir sama seperti teknik normalisasi (Poniah, 2010).

Karakteristik snowflake schema

Salah satu karakteristik utama dari snowflake schema adalah ukuran yang kecil, mudah juga untuk menambahkan dimensi pada skema. Tetapi karena begitu banyak tabel di dalamnya, performa skema cenderung lebih lambat. Namun, setiap dimension table-nya bisa memiliki dua atau lebih set atribut yang mendefinisikan informasi dalam grain data yang berbeda (Dilansir dari Geeks for Geeks).

Selain dalam hal kompleksitas query-nya. Skema snowflake memiliki kompleksitas query yang lebih kompleks dibandingkan dengan skema bintang. Dengan normalisasi Skema snowflake menggunakan ruang penyimpanan yang lebih kecil. Penyimpanan data pada skema snowflake lebih terorganisir dan lebih rapi.

Kelebihan Snowflake Schema

1.      Fleksible ke lebih banyak tool

OLAP database modeling tools adalah tool yang digunakan untuk analisis data dan modeling dan Tool ini pada dasarnya dibuat untuk desain memproses skema data tipe snowflake.

2.      Efesien dalam dalam penyimpanan

Dikarenakan proses snowflaking yaitu normalisasi data, yang pengulangan di data yang sama bisa dikurangi. Dengan begitu, besar data yang harus disimpan juga semakin kecil.

3.      Lebih mudah dilakukan maintenance dan update.

4.      Proses query lebih cepat pada saat proses ETL.

 

Kekurangan Snowflake Schema

1.      Skema data kompleks

Performanya bisa menurun akibat join query yang rumit. Akan tetapi, dengan berkembangnya teknologi, snowflake schema menjadi semakin cepat beberapa tahun belakangan ini. Oleh karena itu, skema ini semakin banyak digunakan dari waktu ke waktu.

2.      Proses lebih lambat

Skema ini lebih lambat dalam memproses cube data akibat join query yang kompleks.

3.      Integritas data

Skema jenis ini memiliki integritas data yang lebih rendah. Snowflake schema pada dasarnya menawarkan pengambilan data yang lebih efektif akan tetapi, tidak ada jaminan integritas data seperti struktur database tradisional yang highly–normalized.

4.      Cenderung lebih banyak waktu untuk memahami karena kompleksitasnya.

5.      Memakan waktu untuk mencari isi karena melihat strukturnya yang kompleks dan bercabang-cabang.

 

 

Komentar

Postingan Populer