Penjelasan Snowflake Schema Data Warehouse
Nama : Anan Krisna
NPM : 19312187
Kelas : IF B SP
Snowflake Schema Data Warehouse
Snowflake schema adalah database
multidimensional dalam data warehouse yang berupa skema yang memiliki beberapa
tabel di dalamnya yang menyerupai bentuk snowflake atau kepingan salju. skema
snowflake terdiri tabel dimensi yang telah dinormalisasi. Proses normalisasi
tabel-tabel dimensi pada skema snowflake ini disebut dengan proses snowflaking.
Model
snowflake merupakan perluasan dari star dimana ia juga mempunyai satu atau
lebih dimensi. Hanya saja pada snowflake, tabel yang berelasi pada fact table
hanya tabel dimensi utama, sedangkan tabel yang lain dihubungkan pada tabel dimensi
utama. Model snowflake ini hampir sama seperti teknik normalisasi (Poniah, 2010).
Karakteristik snowflake schema
Salah
satu karakteristik utama dari snowflake schema adalah ukuran yang kecil, mudah
juga untuk menambahkan dimensi pada skema. Tetapi karena begitu banyak tabel di
dalamnya, performa skema cenderung lebih lambat. Namun, setiap dimension
table-nya bisa memiliki dua atau lebih set atribut yang mendefinisikan
informasi dalam grain data yang berbeda (Dilansir dari Geeks for Geeks).
Selain
dalam hal kompleksitas query-nya. Skema snowflake memiliki kompleksitas query
yang lebih kompleks dibandingkan dengan skema bintang. Dengan normalisasi Skema
snowflake menggunakan ruang penyimpanan yang lebih kecil. Penyimpanan data pada
skema snowflake lebih terorganisir dan lebih rapi.
Kelebihan Snowflake Schema
1. Fleksible ke lebih banyak tool
OLAP database modeling tools
adalah tool yang digunakan untuk analisis data dan modeling dan Tool ini pada
dasarnya dibuat untuk desain memproses skema data tipe snowflake.
2. Efesien dalam dalam penyimpanan
Dikarenakan proses snowflaking
yaitu normalisasi data, yang pengulangan di data yang sama bisa dikurangi. Dengan
begitu, besar data yang harus disimpan juga semakin kecil.
3. Lebih mudah dilakukan maintenance
dan update.
4. Proses query lebih cepat pada
saat proses ETL.
Kekurangan Snowflake Schema
1. Skema data kompleks
Performanya bisa menurun akibat
join query yang rumit. Akan tetapi, dengan berkembangnya teknologi, snowflake
schema menjadi semakin cepat beberapa tahun belakangan ini. Oleh karena itu,
skema ini semakin banyak digunakan dari waktu ke waktu.
2. Proses lebih lambat
Skema ini lebih lambat dalam
memproses cube data akibat join query yang kompleks.
3. Integritas data
Skema jenis ini memiliki
integritas data yang lebih rendah. Snowflake schema pada dasarnya menawarkan
pengambilan data yang lebih efektif akan tetapi, tidak ada jaminan integritas
data seperti struktur database tradisional yang highly–normalized.
4. Cenderung lebih banyak waktu
untuk memahami karena kompleksitasnya.
5. Memakan waktu untuk mencari isi
karena melihat strukturnya yang kompleks dan bercabang-cabang.
Komentar
Posting Komentar