DATA WAREHOUSE
Diposting oleh
Rizki Aditya Saputra
| 11.9.13 at 9/11/2013 12:44:00 PM
0
komentar
Labels :
Menurut
W.H. Inmon dan Richard D.H., data
warehouse adalah koleksi data yang mempunyai sifat berorientasi
subjek,terintegrasi,time-variant, dan bersifat tetap dari koleksi data dalam
mendukung proses pengambilan keputusan management.
Sedangkan menurut Vidette
Poe, data warehouse
merupakan database yang bersifat analisis dan read only yang digunakan
sebagai fondasi dari sistem penunjang keputusan.
Data warehouse juga bisa diartikan sebagai database relasional
yang didesain lebih kepada query dan analisa dari pada proses
transaksi, biasanya mengandung history data dari proses transaksi dan
bisa juga data dari sumber lainnya.
Data warehouse memisahkan beban
kerja analisis dari beban kerja transaksi dan memungkinkan organisasi
menggabung/konsolidasi data dari berbagai macam sumber. Jadi, data warehouse merupakan metode
dalam perancangan database, yang menunjang DSS(Decission Support System) dan
EIS (Executive Information System). Secara fisik data warehouse adalah database, tapi perancangan data
warehouse dan database sangat berbeda. Dalam perancangan database tradisional
menggunakan normalisasi, sedangkan pada data warehouse normalisasi
bukanlah cara yang terbaik.
Karakteristik
data warehouse menurut Inmon dibagi menjadi 4, antara lain:
1. Subject
Oriented (Berorientasi
subject)
2.
Integrated (Terintegrasi)
3.
Time-variant (Rentang Waktu)
4.
Non-Volatile
Subject
Oriented (Berorientasi subject)
Data
Operasional
|
Data
Warehouse
|
Dirancang
berorientasi hanya pada aplikasi dan fungsi tertentu
|
Dirancang
berdasar pada subjek-subjek tertentu(utama)
|
Focusnya
pada desain database dan proses
|
Focusnya
pada pemodelan data dan desain data
|
Berisi
rincian atau detail data
|
Berisi
data-data history yang akan dipakai dalam proses analisis
|
Relasi
antar table berdasar aturan terkini (selalu mengikuti rule(aturan) terbaru)
|
Banyak
aturan bisnis dapat tersaji antara tabel-tabel
|
Tabel 5. Data Operasiaonal dan Data
Warehouse
Data warehouse berorientasi subject artinya data warehouse didesain untuk
menganalisa data berdasarkan subject-subject tertentu dalam organisasi,bukan
pada proses atau fungsi aplikasi tertentu. Data warehouse diorganisasikan
disekitar subjek-subjek utama dari perusahaan (customers,products dan sales)
dan tidak diorganisasikan pada area-area aplikasi utama (customer
invoicing,stock control dan product sales). Hal ini dikarenakan kebutuhan dari
data warehouse untuk menyimpan data-data yang bersifat sebagai penunjang suatu
keputusan, dari pada aplikasi yang berorientasi terhadap data. Jadi dengan kata
lain, data yang disimpan adalah berorientasi kepada subjek bukan terhadap
proses. Secara garis besar perbedaan antara data operasional dan data warehouse
dapat dilihat pada Tabel 2.1.
Integrated
(Terintegrasi)
Data Warehouse dapat menyimpan data-data yang
berasal dari sumber-sumber yang terpisah kedalam suatu format yang konsisten
dan saling terintegrasi satu dengan lainnya. Dengan demikian data tidak bisa
dipecah-pecah karena data yang ada merupakan suatu kesatuan yang menunjang
keseluruhan konsep data warehouse itu sendiri. Syarat integrasi sumber data
dapat dipenuhi dengan berbagai cara sepeti konsisten dalam penamaan
variable,konsisten dalam ukuran variable,konsisten dalam struktur pengkodean
dan konsisten dalam atribut fisik dari data. Contoh pada lingkungan operasional
terdapat berbagai macam aplikasi yang mungkin pula dibuat oleh developer yang
berbeda. Oleh karena itu, mungkin dalam aplikasi-aplikasi tersebut ada variable
yang memiliki maksud yang sama tetapi nama dan format nya berbeda. Variable
tersebut harus dikonversi menjadi nama yang sama dan format yang disepakati
bersama. Dengan demikian tidak ada lagi kerancuan karena perbedaan nama, format
dan lain sebagainya. Barulah data tersebut bisa dikategorikan sebagai data yang
terintegrasi karena kekonsistenannya.
Time-variant
(Rentang Waktu)
Seluruh data pada data warehouse
dapat dikatakan akurat atau valid pada rentang waktu tertentu. Untuk melihat
interval waktu yang digunakan dalam mengukur keakuratan suatu data warehouse,
kita dapat menggunakan cara antara lain :
- Cara yang paling sederhana adalah menyajikan data warehouse pada rentang waktu tertentu, misalnya antara 5 sampai 10 tahun ke depan.
- Cara yang kedua, dengan menggunakan variasi/perbedaan waktu yang disajikan dalam data warehouse baik implicit maupun explicit secara explicit dengan unsur waktu dalam hari, minggu, bulan dsb. Secara implicit misalnya pada saat data tersebut diduplikasi pada setiap akhir bulan, atau per tiga bulan. Unsur waktu akan tetap ada secara implisit didalam data tersebut.
- Cara yang ketiga,variasi waktu yang disajikan data warehouse melalui serangkaian snapshot yang panjang. Snapshot merupakan tampilan dari sebagian data tertentu sesuai keinginan pemakai dari keseluruhan data yang ada bersifat read-only.
Non-Volatile
Karakteristik keempat dari data warehouse adalah
non-volatile,maksudnya data pada
data warehouse tidak di-update secara real time tetapi di refresh
dari sistem operasional secara reguler. Data yang baru selalu ditambahkan
sebagai suplemen bagi database itu sendiri dari pada sebagai sebuah perubahan.
Database tersebut secara kontinyu menyerap data baru ini, kemudian secara
incremental disatukan dengan data sebelumnya. Berbeda dengan database
operasional yang dapat melakukan update,insert dan delete terhadap data yang
mengubah isi dari database sedangkan pada data warehouse hanya ada dua kegiatan
memanipulasi data yaitu loading data (mengambil data) dan akses data (mengakses
data warehouse seperti melakukan query atau menampilan laporan yang dibutuhkan,
tidak ada kegiatan updating data).
Langganan:
Posting Komentar (Atom)