Komponen Dan Fitur Data Warehouse
Nama : Anan Krisna
NPM : 19312187
Kelas : IF B SP
Penjelasan Komponen Dan Fitur Data Warehouse
Komponen Data Warehouse
1.
Source
Data
Source data di ibaratkan dengan gudang data dari berbagai sumber, yakni dari :
Data internal, Data eksternal, Data
produksi, Data Terarsip.
Penjelasannya sebagai berikut :
Data internal
• Contoh: data User, Profile Konsumen, data departemen/instansi
• Data tidak bisa diabaikan, karena dalam menambah nilai informasi yang ditampilkan
Tantangannya :
• Dalam format berkas yang berbeda
• Menyambungkan dengan database per departemen atau instansi
Data eksternal
• Data statistik dari agen eksternal yang di dapatkan
• Mengatasi keterbatasan data dari dalam perusahaan atau instansi
• Umumnya, dibutuhkan konversi format dari data eksternal ke dalam data warehouse perusahaan
Data produksi
• Berasal dari bermacam-macam sistem operasional dari perusahaan
• Satu makna « sebuah akun » bisa berarti banyak dari sistem operasional yang berbeda-beda Tantangan :
• menstandardisasi perbedaan satu data dengan lainnya (berdasar sistem)
• Mengkonversi data (format, nama, atribut, dst)
• Integrasi butiran data menjadi data yang bermakna untuk disimpan
Data Terarsip
• Penggunaan data lawas dalam data warehouse yang biasanya akan di gunakan untuk kedepannya
• Banyak metode pengarsipan, bergantung pada tingkat ke-lawas-an data yang biasanya juga di lakukan untuk analisis data yang sekarang
• Data warehouse menyimpan snapshot historis dari data.
• Berguna untuk menganalisis tren
2.
Data
Stagging
Data yang diekstrak dan load dalam format yang sama yang tidak merubah nilai data. ETL adalah singkatan dari extract, transform, dan load. Melansir IBM, ia merupakan proses integrasi data.
Extraction
• Menghadapi data source yang berbeda-beda
• External tools/in-house program
• Hasil ekstraksi data ke lingkungan fisik yang berbeda Transformation
• Cleaning
• Standardisasi data
• Kombinasi butiran data dari berbagai sumber
• Peringkasan
• Data siap = data bersih, terstandardisasi, dan teringkas Load
• Initial load biasanya besar
• Update kemudian, data warehouse cukup menambahkan perubahan data dan revisi data
3.
Data
Storage
Merupakan media penyimpanan data yang dihasilkan dari data stagging.
Dari data storage bertugas untuk Harus mampu menampung data historis, Data storage tidak boleh di-update terlalu sering, Umumnya terbuka bagi berbagai perkakas.
4.
Metadata
Komponen yang memberi penjelasan tentang data melebihi kamus data. Metadata terbagi atas sebagai berikut :
Operasional
• Katalog data dalam manajemen basis data
• Informasi mengenai data dalam Data Warehouse
Ekstraksi dan Transformasi
• Frekuensi ekstraksi
• Metode ekstraksi
• Aturan bisnis untuk ekstraksi
• Informasi mengenai proses transformasi
End-User
• Peta navigasi data warehouse
Pentingnya Metadata
• Menyambungkan bagian-bagian data warehouse
• Memberi informasi struktur dan konten
• Membantu end-user memahami konten
5.
Information
Delivery
Penyampaian informasi pada pengguna yang mana terdapat teknik online, infraned serta email.
• Siapa penggunanya?
• Pengguna biasa dan pemula laporan ad hoc
• Analis bisnis kueri kompleks, analisis multidimensi, analisis statistika
• Manajer dan direktur Sistem informasi eksekutif
• Data mining
• Online query and reports
6.
Management
and Control
Merupakan pengelolaan serta pengendalian yang ada pada data stagging serta metadata.
Fitur Data Warehouse
1.
Berorientasi Subjek
Data warehousing berorientasi subject artinya data warehousing didesain untuk menganalisa data berdasarkan subyek-subyek tertentu dalam organisasi, bukan pada proses atau fungsi aplikasi tertentu.
Data Warehouse menggunakan prinsip subject-oriented dan menawarkan informasi sesuai dengan tema yang merujuk pada operasi perusahaan. misalnya penjualan, pemasaran, distribusi, dll
Data warehouse tidak pernah fokus pada operasi yang sedang berlangsung. Sebaliknya, ia menekankan pada pemodelan dan analisis data untuk pengambilan keputusan.
2.
Data
yang Terintegrasi
Data warehousing dapat menyimpan data-data yang berasal dari sumber-sumber yang terpisah kedalam suatu format yang konsisten dan saling terintegrasi satu dengan lainnya. Dengan demikian data tidak bisa dipecahpecah karena data yang ada merupakan suatu kesatuan yang menunjang keseluruhan konsep data warehousing itu sendiri.
Dalam Data Warehouse, Intergration berarti penggabungan beberapa data yang sama yang berasalh dari database yang berbeda. Data juga perlu disimpan dalam lokasi yang tempat yang bisa di akses semua pengguna.
Data warehouse dikembangkan untuk mengintegrasikan data dari berbagai sumber seperti mainframe, relational database, flat file, Selain itu, sehingga penamaan dari semua data tersebut harus konsisten. Dengan Integrasi ini membantu agar analisis data menjadi lebih efektif. Konsistensi dalam konvensi penamaan bisa dilakukan terhadap atribut,ukuran,struktur dan masih banyak lainnya.
3.
Data
time variant
zona waktu dalam gudang data lebih luas jika dibandingkan dengan sistem operasi. Data yang dikumpulkan dalam data warehouse memiliki atribut waktu tertentu yang nantinya akan di delivery berdasarkan historynya. Ini berisi unsur waktu, secara eksplisit maupun implisit.
Satu tempat di mana varians waktu dalam Datawarehouse berguna adalah ketika kita akan menampilkan data yang terkait dalam struktur record key. Masing-masing kunci yang terkandung dalam DW harus memiliki elemen waktu, baik secara implisit maupun eksplisit. Seperti hari, bulan, minggu dan tahun.
Seluruh data pada data warehousing dapat dikatakan akurat atau valid pada rentang waktu tertentu. Untuk melihat interval waktu yang digunakan dalam mengukur keakuratan suatu data warehousing, yang dapat digunakan berbagai cara.
4.
Non
Volatile
Data Warehouse bersifat tetap dan tidak dapat dihapus, jika kamu memasukan data baru maka data yang lama tidak dihapus. Data bersifat read-only dan periodicall refresh. Hal ini juga membantu untuk menganalisis data historis dan memahami apa dan kapan itu terjadi. Tidak memerlukan proses pertukaran, restored dan concurrency control mechanisms.
Kegiatan seperti menghapus, update, dan insert dilakukan di lingkungan aplikasi saja dan diabaikan di dalam lingkungan gudang data. Hanya ada dua jenis operasi data dilakukan dalam Data Warehouse Data loading dan Data access.
Data pada data warehousing tidak di-update secara real time tetapi di refresh dari sistem operasional secara reguler. Data yang baru selalu ditambahkan sebagai suplemen bagi basisdata itu sendiri dari pada sebagai sebuah perubahan. Basisdata tersebut secara kontinyu menyerap data baru ini, kemudian secara incremental disatukan dengan data sebelumnya.
5.
Ringkas
Datawarehousing menyediakan kumpulam yang banyak yang di ringkas dalam ringkasan-ringkasan data operasional yang sederhana dan mudah dipahami oleh pihak manajemen jika diperlukan.
6.
Butiran
Data (Data dari berbagai sumber)
Merupakan data yang diolah diperoleh dari berbagai sumber baik sumber internal maupun sumber eksternal.
Komentar
Posting Komentar