Nine Step Methodology
Nama : Anan Krisna
NPM : 19312187
Kelas : IF B SP
Penjelasan Nine Step Methodology
Data warehouse itu sendiri
merupakan sebagai kumpulan data yang diekstrak dari sebuah database
operasional, historis, dan eksternal, yang kemudian dibersihkan atau diubah
bahkan dikelompokkan guna identifikasi dan analisis untuk pengambilan keputusan
bisnis. Dalam metodologi Ada banyak yang dapat membangun sebuah data warehouse.
Salah satunya adalah metode Kimball. Dalam
Kimball & Ross (2010) terdapat 9 langkah dalam membangun atau perancangan sebuah
data warehouse, yang dikenal dengan nine-step design methodology, jika
langkah-langkah dalam nine-step design methodology dilakukan secara berurutan
atau sistematis, maka membangun sebuah data warehouse dapat lebih baik. Menurut
Kimball & Ross (2010) Metodologi perancangan data warehouse adalah
Nine-Step Methodology yang memiliki 9 (sembilan) langkah dalam membangun sebuah
data warehouse yaitu :
1. Choosing The Process (Memilih
Proses)
Merupakan penentuan subject dari
sebuah permasalahan yang sedang terjadi kemudian melakukan penentuan proses
penting dari kegiatan operasional. Dalam memilih atau menentukan proses berarti
juga menentukan subjek utama. Subjek utama di tunjukan pada suatu kegiatan
bisnis perusahaan yang dapat menjawab dari semua pertanyaan bisnis yang penting
serta memiliki ciri-ciri tertentu. Misalnya dalam proses penetuan penjualan.
Dengan tahapan ini dalam
merancang data warehouse harus sesuai dengan kebutuhan penjualan yang
berdasarkan berbagai sumber yang berbeda atau dimensi dengan cermat dan di
analisis.
2. Choosing The Grain (Memilih Grain)
Grain merupakan suatu data dari
table fakta yang dapat di analisis dengan Memilih grain berarti melakukan
penentuan apa yang di representasikan oleh record dalam isi table fakta. Setelah
menentukan grain dari isi tabel fakta, selanjutnya dapat ditentukan tabel-tabel
dimensi yang saling berhubungan dengan tabel fakta tersebut. Grain pada tabel
fakta juga menentukan grain tabel dimensi. Pada kasus penjualan grain bisa
diperoleh dari invoice yang dikeluarkan kepada pembeli.
Pada materi Chapter 12 di mata kuliah
data warehouse di jelaskan Perancangan data pada model data warehouse itu juga
harus di sesuaikan atau berdasarkan dari tabel fakta dan dimensi, untuk itu pada
saat pemilihan sumber harus mengacu pada kemampuan untuk merepresentasikan fakta-fakta
yang di ambil dari berbagai hal sumber dimensi pada sebuah OLTP . Sebagai
contohnya Sales_order_fact, adalah mengambarkan rincian customer secara detail.
Jadi pada tahap ini sangat penting karena akan mempengaruhi seperti apa nanti
hasil dari data warehouse yang akan mudah untuk sebuah pengambilan keputusan.
3. Identifying and Conforming The Dimensions (Identifikasi
dan Menyesuaikan Dimensi)
Merupakan identifikasi dimensi
dengan detail untuk dapat mendeskripsikan sesuatu di dalam data. Dalam hubungan
ini di buat dalam bentuk table. Dimensi merupakan suatu kumpulan sudut pandang
yang penting dalam menggambarkan sebuah fakta-fakta yang terdapat pada tabel
fakta. Sebagai contoh dalam penjualan ada dimensi customer, waktu, dan jenis
produk.
Pada materi Chapter 12 di mata kuliah
data warehouse, Dimensi ini sebagai sebuah gambaran fakta-fakta pada suatu tabel
fakta, sebagai contoh setiap data pada tabel customer_dim dilengkapi dengan salah
satunya adalah cust_id, cust_number , cust_name, cust_street_address, cust_zip_code
dan lainnya
4. Choosing The Fact (Memilih Fakta)
Merupakan Memilih fakta yang akan
di gunakan jadi Masing-masing fakta memiliki data yang dapat di hitung untuk
nantinya di kemudian di tampilkan dalam bentuk laporan, graphic atau diagram. Grain
dari suatu tabel fakta akan menentukan fakta-fakta apa yang bisa digunakan.
Pada materi Chapter 12 di mata kuliah
datawarehouse Pemilihan sumber dari sebuah tabel fakta akan sangat menentukan
fakta mana yang akan digunakan. Sebagai contohnya pada penjualan ada sales_order_fact terdiri dari customer_id,
order_id, product_id, order_date yang menggambarkan fakta dari berbagai tabel
dimensi yaitu customer, order, product dan tine yang merupakan order_date.
5. Storing Pre-Calculation in The
Fact Table (Menyimpan Pre-Kalkulasi Dalam Tabel Fakta)
Merupakan setelah fakta-fakta di
pilih dari masing-masing fakta tersebut harus di kaji kembali untuk menentukan
adanya peluang untuk di gunakan pra-hitungan. Pada tahap ini, hasil perhitungan
pada sebuah atribut perlu dipertimbangkan untuk disimpan di dalam database. Hal
ini digunakan untuk mengurangi risiko kesalahan pada program setiap kali melakukan
perhitungan pada atribut-atribut tersebut.
6. Rounding Out The Dimension Tables
(Melengkapi Tabel Dimensi)
Merupakan pegembalian fakta ke
dalam table dimensi, teks itu harus intuitif dan mudah di mengerti oleh
pengguna. Dari dimensi-dimensi yang telah diidentifikasi, kemudian dibuat
deskripsi yang memuat informasi terstruktur mengenai atribut-atribut pada suatu
tabel dimensi. Lalu tabel dimensi tersebut harus dilakukan pemberian nama
keterangan secara lengkap dan mudah dipahami oleh pengguna.
Tahap ini untuk menambahkan
selengkap-lengkapnya pada table dimensi kemudian juga harus bersifat intuitif
dan mudah dipahami oleh pengguna.
7. Choosing The Duration of Database
(Memilih Durasi Dari Database)
Merupakan menetukan batas waktu
dari umur data yang di ambil dan akan dipindahkan ke table fakta. Lalu memperhatikan
tingkat akurasi yang di miliki oleh data history. Durasi waktu dari data-data
yang akan dilakukan pemasukan ke dalam data warehouse akan sangat ditentukan
pada tahap ini. Misalnya, data perusahaan tiga tahun lalu atau lebih yang diambil
dan dimasukkan ke dalam tabel fakta. Tahapan ini berkaitan dengan penyimpanan
data warehouse, katakan saja minimal batas waktu data yang kita kehendaki untuk
di analisa memiliki durasi lima tahun yang lalu
8. Tracking Slowly Changing Dimension
(Melacak Perubahan Dimensi Secara Perlahan)
Merupakan perubahan dari suatu dimensi
table yang dimana dimensi dapat di lakukan dengan 3 cara yaitu mengganti secara
langsung pada table suatu dimensi, membentuk record baru untuk setiap
pembaharuan dan perubahan data yang membentuk kolom baru yang berbeda.
Dimensi dapat berubah dengan
lambat dan menjadi sebuah masalah. Berikut terdapat tiga tipe dasar dari
perubahan dimensi yang lambat, yaitu:
·
Menulis
ulang atribut yang telah berubah
·
Membuat
record baru pada suatu dimensi
·
Membuat
suatu atribut alternatif untuk menampung nilai yang terbaru.
9. Decide the Physical Design (Menentukan
Prioritas Dan Mode Query)
Merupakan penentuan periode
proses ETL (extract, transform & load). Pada tahap ini, dilakukan
perancangan fisik dari suatu data warehouse. Selain itu, penentuan
masalah-masalah yang mungkin ada pada suatu perancangan fisiknya.
Komentar
Posting Komentar