Komponen Dan Fitur Data Warehouse

 

Nama    : Anan Krisna

NPM      : 19312187

Kelas     : IF B SP

 

Penjelasan Komponen Dan Fitur Data Warehouse



Komponen Data Warehouse



1.       Source Data

Source data di ibaratkan dengan gudang data dari berbagai sumber, yakni dari :

Data internal, Data eksternal, Data produksi, Data Terarsip.

 

Penjelasannya sebagai berikut :

Data internal

        Contoh: data User, Profile Konsumen, data departemen/instansi

        Data tidak bisa diabaikan, karena dalam menambah nilai informasi yang ditampilkan

Tantangannya :

        Dalam format berkas yang berbeda

        Menyambungkan dengan database per departemen atau instansi

 

Data eksternal

        Data statistik dari agen eksternal yang di dapatkan

        Mengatasi keterbatasan data dari dalam perusahaan atau instansi

        Umumnya, dibutuhkan konversi format dari data eksternal ke dalam data warehouse perusahaan

 

Data produksi

        Berasal dari bermacam-macam sistem operasional dari perusahaan

        Satu makna « sebuah akun » bisa berarti banyak dari sistem operasional yang berbeda-beda Tantangan :

        menstandardisasi perbedaan satu data dengan lainnya (berdasar sistem)

        Mengkonversi data (format, nama, atribut, dst)

        Integrasi butiran data menjadi data yang bermakna untuk disimpan

 

Data Terarsip

        Penggunaan data lawas dalam data warehouse yang biasanya akan di gunakan untuk kedepannya

        Banyak metode pengarsipan, bergantung pada tingkat ke-lawas-an data yang biasanya juga di lakukan untuk analisis data yang sekarang

        Data warehouse menyimpan snapshot historis dari data.

        Berguna untuk menganalisis tren

 

2.       Data Stagging

Data yang diekstrak dan load dalam format yang sama yang tidak merubah nilai data. ETL adalah singkatan dari extract, transform, dan load. Melansir IBM, ia merupakan proses integrasi data.

 

Extraction

        Menghadapi data source yang berbeda-beda

        External tools/in-house program

        Hasil ekstraksi data ke lingkungan fisik yang berbeda Transformation

        Cleaning

        Standardisasi data

        Kombinasi butiran data dari berbagai sumber

        Peringkasan

        Data siap = data bersih, terstandardisasi, dan teringkas Load

        Initial load biasanya besar

        Update kemudian, data warehouse cukup menambahkan perubahan data dan revisi data

 

3.       Data Storage

Merupakan media penyimpanan data yang dihasilkan dari data stagging.

Dari data storage bertugas untuk Harus mampu menampung data historis, Data storage tidak boleh di-update terlalu sering, Umumnya terbuka bagi berbagai perkakas.

 

4.       Metadata

Komponen yang memberi penjelasan  tentang data melebihi kamus data. Metadata terbagi atas sebagai berikut :

Operasional

        Katalog data dalam manajemen basis data

        Informasi mengenai data dalam Data Warehouse

 

Ekstraksi dan Transformasi

        Frekuensi ekstraksi

        Metode ekstraksi

        Aturan bisnis untuk ekstraksi

        Informasi mengenai proses transformasi

 

End-User

        Peta navigasi data warehouse

 

Pentingnya Metadata

        Menyambungkan bagian-bagian data warehouse

        Memberi informasi struktur dan konten

        Membantu end-user memahami konten

 

 

5.       Information Delivery

Penyampaian informasi pada pengguna yang mana terdapat teknik online, infraned serta email.

 

        Siapa penggunanya?

        Pengguna biasa dan pemula laporan ad hoc

        Analis bisnis kueri kompleks, analisis multidimensi, analisis statistika

        Manajer dan direktur Sistem informasi eksekutif

        Data mining

        Online query and reports

 

6.       Management and Control

Merupakan pengelolaan serta pengendalian yang ada pada data stagging serta metadata.

 

Fitur Data Warehouse



1.        Berorientasi Subjek

Data warehousing berorientasi subject artinya data warehousing didesain untuk menganalisa data berdasarkan subyek-subyek tertentu dalam organisasi, bukan pada proses atau fungsi aplikasi tertentu.

Data Warehouse menggunakan prinsip subject-oriented dan menawarkan informasi sesuai dengan tema yang merujuk pada operasi perusahaan. misalnya penjualan, pemasaran, distribusi, dll

Data warehouse tidak pernah fokus pada operasi yang sedang berlangsung. Sebaliknya, ia menekankan pada pemodelan dan analisis data untuk pengambilan keputusan.

 

2.       Data yang Terintegrasi

Data warehousing dapat menyimpan data-data yang berasal dari sumber-sumber yang terpisah kedalam suatu format yang konsisten dan saling terintegrasi satu dengan lainnya. Dengan demikian data tidak bisa dipecahpecah karena data yang ada merupakan suatu kesatuan yang menunjang keseluruhan konsep data warehousing itu sendiri.

 

Dalam Data Warehouse, Intergration berarti penggabungan beberapa data yang sama yang berasalh dari database yang berbeda. Data juga perlu disimpan dalam lokasi yang tempat yang bisa di akses semua pengguna.

Data warehouse dikembangkan untuk mengintegrasikan data dari berbagai sumber seperti mainframe, relational database, flat file,  Selain itu, sehingga penamaan dari semua data tersebut harus konsisten. Dengan Integrasi ini membantu agar analisis data menjadi lebih efektif. Konsistensi dalam konvensi penamaan bisa dilakukan terhadap atribut,ukuran,struktur dan masih banyak lainnya.

 

3.       Data time variant

zona waktu dalam gudang data lebih luas jika dibandingkan dengan sistem operasi. Data yang dikumpulkan dalam data warehouse memiliki atribut waktu tertentu yang nantinya akan di delivery berdasarkan historynya. Ini berisi unsur waktu, secara eksplisit maupun implisit.

Satu tempat di mana varians waktu dalam Datawarehouse berguna adalah ketika kita akan menampilkan data yang terkait dalam struktur record key. Masing-masing kunci yang terkandung dalam DW harus memiliki elemen waktu, baik secara implisit maupun eksplisit. Seperti hari, bulan, minggu dan tahun.

Seluruh data pada data warehousing dapat dikatakan akurat atau valid pada rentang waktu tertentu. Untuk melihat interval waktu yang digunakan dalam mengukur keakuratan suatu data warehousing, yang dapat digunakan berbagai cara.

 

4.       Non Volatile

Data Warehouse bersifat tetap dan tidak dapat dihapus, jika kamu memasukan data baru maka data yang lama tidak dihapus. Data bersifat read-only dan periodicall refresh. Hal ini juga membantu untuk menganalisis data historis dan memahami apa dan kapan itu terjadi. Tidak memerlukan proses pertukaran, restored dan concurrency control mechanisms.

Kegiatan seperti menghapus, update, dan insert dilakukan di lingkungan aplikasi saja dan diabaikan di dalam lingkungan gudang data. Hanya ada dua jenis operasi data dilakukan dalam Data Warehouse Data loading dan Data access.

Data pada data warehousing tidak di-update secara real time tetapi di refresh dari sistem operasional secara reguler. Data yang baru selalu ditambahkan sebagai suplemen bagi basisdata itu sendiri dari pada sebagai sebuah perubahan. Basisdata tersebut secara kontinyu menyerap data baru ini, kemudian secara incremental disatukan dengan data sebelumnya.

 

5.       Ringkas

Datawarehousing menyediakan kumpulam yang banyak yang di ringkas dalam ringkasan-ringkasan data operasional yang sederhana dan mudah dipahami oleh pihak manajemen jika diperlukan.

 

6.       Butiran Data (Data dari berbagai sumber)

Merupakan data yang diolah diperoleh dari berbagai sumber baik sumber internal maupun sumber eksternal.

Komentar

Postingan Populer