Nine Step Methodology

Nama   : Anan Krisna

NPM    : 19312187

Kelas   : IF B SP

Penjelasan Nine Step Methodology

Data warehouse itu sendiri merupakan sebagai kumpulan data yang diekstrak dari sebuah database operasional, historis, dan eksternal, yang kemudian dibersihkan atau diubah bahkan dikelompokkan guna identifikasi dan analisis untuk pengambilan keputusan bisnis. Dalam metodologi Ada banyak yang dapat membangun sebuah data warehouse. Salah satunya adalah metode Kimball.  Dalam Kimball & Ross (2010) terdapat 9 langkah dalam membangun atau perancangan sebuah data warehouse, yang dikenal dengan nine-step design methodology, jika langkah-langkah dalam nine-step design methodology dilakukan secara berurutan atau sistematis, maka membangun sebuah data warehouse dapat lebih baik. Menurut Kimball & Ross (2010) Metodologi perancangan data warehouse adalah Nine-Step Methodology yang memiliki 9 (sembilan) langkah dalam membangun sebuah data warehouse yaitu :

1.      Choosing The Process (Memilih Proses)

Merupakan penentuan subject dari sebuah permasalahan yang sedang terjadi kemudian melakukan penentuan proses penting dari kegiatan operasional. Dalam memilih atau menentukan proses berarti juga menentukan subjek utama. Subjek utama di tunjukan pada suatu kegiatan bisnis perusahaan yang dapat menjawab dari semua pertanyaan bisnis yang penting serta memiliki ciri-ciri tertentu. Misalnya dalam proses penetuan penjualan.

Dengan tahapan ini dalam merancang data warehouse harus sesuai dengan kebutuhan penjualan yang berdasarkan berbagai sumber yang berbeda atau dimensi dengan cermat dan di analisis.

 

2.      Choosing The Grain (Memilih Grain)

Grain merupakan suatu data dari table fakta yang dapat di analisis dengan Memilih grain berarti melakukan penentuan apa yang di representasikan oleh record dalam isi table fakta. Setelah menentukan grain dari isi tabel fakta, selanjutnya dapat ditentukan tabel-tabel dimensi yang saling berhubungan dengan tabel fakta tersebut. Grain pada tabel fakta juga menentukan grain tabel dimensi. Pada kasus penjualan grain bisa diperoleh dari invoice yang dikeluarkan kepada pembeli.

Pada materi Chapter 12 di mata kuliah data warehouse di jelaskan Perancangan data pada model data warehouse itu juga harus di sesuaikan atau berdasarkan dari tabel fakta dan dimensi, untuk itu pada saat pemilihan sumber harus mengacu pada kemampuan untuk merepresentasikan fakta-fakta yang di ambil dari berbagai hal sumber dimensi pada sebuah OLTP . Sebagai contohnya Sales_order_fact, adalah mengambarkan rincian customer secara detail. Jadi pada tahap ini sangat penting karena akan mempengaruhi seperti apa nanti hasil dari data warehouse yang akan mudah untuk sebuah pengambilan keputusan.

 

3.      Identifying  and Conforming The Dimensions (Identifikasi dan Menyesuaikan Dimensi)

Merupakan identifikasi dimensi dengan detail untuk dapat mendeskripsikan sesuatu di dalam data. Dalam hubungan ini di buat dalam bentuk table. Dimensi merupakan suatu kumpulan sudut pandang yang penting dalam menggambarkan sebuah fakta-fakta yang terdapat pada tabel fakta. Sebagai contoh dalam penjualan ada dimensi customer, waktu, dan jenis produk.

Pada materi Chapter 12 di mata kuliah data warehouse, Dimensi ini sebagai sebuah gambaran fakta-fakta pada suatu tabel fakta, sebagai contoh setiap data pada tabel customer_dim dilengkapi dengan salah satunya adalah cust_id, cust_number , cust_name, cust_street_address, cust_zip_code dan lainnya

 

4.      Choosing The Fact (Memilih Fakta)

Merupakan Memilih fakta yang akan di gunakan jadi Masing-masing fakta memiliki data yang dapat di hitung untuk nantinya di kemudian di tampilkan dalam bentuk laporan, graphic atau diagram. Grain dari suatu tabel fakta akan menentukan fakta-fakta apa yang bisa digunakan.  

Pada materi Chapter 12 di mata kuliah datawarehouse Pemilihan sumber dari sebuah tabel fakta akan sangat menentukan fakta mana yang akan digunakan. Sebagai contohnya pada penjualan ada  sales_order_fact terdiri dari customer_id, order_id, product_id, order_date yang menggambarkan fakta dari berbagai tabel dimensi yaitu customer, order, product dan tine yang merupakan order_date.

 

5.      Storing Pre-Calculation in The Fact Table (Menyimpan Pre-Kalkulasi Dalam Tabel Fakta)

Merupakan setelah fakta-fakta di pilih dari masing-masing fakta tersebut harus di kaji kembali untuk menentukan adanya peluang untuk di gunakan pra-hitungan. Pada tahap ini, hasil perhitungan pada sebuah atribut perlu dipertimbangkan untuk disimpan di dalam database. Hal ini digunakan untuk mengurangi risiko kesalahan pada program setiap kali melakukan perhitungan pada atribut-atribut tersebut.

 

6.      Rounding Out The Dimension Tables (Melengkapi Tabel Dimensi)

Merupakan pegembalian fakta ke dalam table dimensi, teks itu harus intuitif dan mudah di mengerti oleh pengguna. Dari dimensi-dimensi yang telah diidentifikasi, kemudian dibuat deskripsi yang memuat informasi terstruktur mengenai atribut-atribut pada suatu tabel dimensi. Lalu tabel dimensi tersebut harus dilakukan pemberian nama keterangan secara lengkap dan mudah dipahami oleh pengguna.

Tahap ini untuk menambahkan selengkap-lengkapnya pada table dimensi kemudian juga harus bersifat intuitif dan mudah dipahami oleh pengguna.

 

7.      Choosing The Duration of Database (Memilih Durasi Dari Database)

Merupakan menetukan batas waktu dari umur data yang di ambil dan akan dipindahkan ke table fakta. Lalu memperhatikan tingkat akurasi yang di miliki oleh data history. Durasi waktu dari data-data yang akan dilakukan pemasukan ke dalam data warehouse akan sangat ditentukan pada tahap ini. Misalnya, data perusahaan tiga tahun lalu atau lebih yang diambil dan dimasukkan ke dalam tabel fakta. Tahapan ini berkaitan dengan penyimpanan data warehouse, katakan saja minimal batas waktu data yang kita kehendaki untuk di analisa memiliki durasi lima tahun yang lalu

 

8.      Tracking Slowly Changing Dimension (Melacak Perubahan Dimensi Secara Perlahan)

Merupakan perubahan dari suatu dimensi table yang dimana dimensi dapat di lakukan dengan 3 cara yaitu mengganti secara langsung pada table suatu dimensi, membentuk record baru untuk setiap pembaharuan dan perubahan data yang membentuk kolom baru yang berbeda.

Dimensi dapat berubah dengan lambat dan menjadi sebuah masalah. Berikut terdapat tiga tipe dasar dari perubahan dimensi yang lambat, yaitu:

·         Menulis ulang atribut yang telah berubah

·         Membuat record baru pada suatu dimensi

·         Membuat suatu atribut alternatif untuk menampung nilai yang terbaru.

 

9.      Decide the Physical Design (Menentukan Prioritas Dan Mode Query)

Merupakan penentuan periode proses ETL (extract, transform & load). Pada tahap ini, dilakukan perancangan fisik dari suatu data warehouse. Selain itu, penentuan masalah-masalah yang mungkin ada pada suatu perancangan fisiknya.

Komentar

Postingan Populer