Nama : Andri Mardiana
Kelas: TI/3D
Npm : 1103137
Pengertan Data Warehouse
Data warehouse adalah data-data yang beorientasi subjek, terintegrasi, memiliki dimensi waktu, serta merupakan koleksi tetap (non-volatile), yang digunakan dalam mendukung proses pengambilan keputusan. Sedangkan data mining muncul setelah banyak dari pemilik data baik perorangan maupun organisasi mengalami penumpukan data yang telah terkumpul selama beberapa tahun, misalnya data pembelian, data penjualan, data nasabah, data transaksi, email dan sebagainya. Kemudian muncul pertanyaan dari pemilik data tersebut, apa yang harus dilakukan terhadap tumpukan data tersebut.
Data warehouse didesain untuk kita bisa melakukan query secara cepat. Informasi diturunkan dari data lain, dilakukan rolling up untuk dijadikan ringkasan, dilakukan operasi drilling down untuk mendapatkan informasi lebih detail, atau melihat pola yang menarik atau melihat trend (kecenderungan).
Karakteristik Data Warehouse
- Subject Oriented (Berorientasi subject).Data warehouse berorientasi subject artinya data warehouse didesain untuk menganalisa data berdasarkan subject-subject tertentu dalam organisasi,bukan pada proses atau fungsi aplikasi tertentu
- Integrated (Terintegrasi). Data Warehouse dapat menyimpan data-data yang berasal dari sumber-sumber yang terpisah kedalam suatu format yang konsisten dan saling terintegrasi satu dengan lainnya. Dengan demikian data tidak bisa dipecah-pecah karena data yang ada merupakan suatu kesatuan yang menunjang keseluruhan konsep data warehouse itu sendiri.
- Time-variant (Rentang Waktu). Seluruh data pada data warehouse dapat dikatakan akurat atau valid pada rentang waktu tertentu
- Non-Volatile. Karakteristik keempat dari data warehouse adalah non-volatile,maksudnya data pada data warehouse tidak di-update secara real time tetapi di refresh dari sistem operasional secara reguler. Data yang baru selalu ditambahkan sebagai suplemen bagi database itu sendiri dari pada sebagai sebuah perubahan. Database tersebut secara kontinyu menyerap data baru ini, kemudian secara incremental disatukan dengan data sebelumnya
Dalam pendekatan dimensi, data transaksi yang dibagi menjadi baik "fakta", yang biasanya data transaksi numerik, atau "dimensi", yang merupakan informasi referensi yang memberikan konteks untuk fakta-fakta. Sebagai contoh, transaksi penjualan dapat dipecah menjadi fakta seperti jumlah produk yang dipesan dan harga yang dibayarkan untuk produk, dan masuk ke dimensi seperti tanggal order, nama pelanggan, nomor produk, agar kapal-dan tagihan-untuk lokasi , dan bertanggung jawab untuk menerima perintah penjual. Keuntungan utama dari pendekatan dimensi adalah bahwa data warehouse lebih mudah bagi pengguna untuk memahami dan menggunakan. Selain itu, pengambilan data dari data warehouse cenderung untuk beroperasi sangat cepat. Kelemahan utama dari pendekatan dimensi adalah:
1. Untuk menjaga integritas fakta dan dimensi, memuat data warehouse dengan data dari sistem operasional yang berbeda adalah rumit, dan
2. Sulit untuk memodifikasi struktur data warehouse jika organisasi mengadopsi pendekatan dimensi perubahan cara di mana ia melakukan bisnis.
Dalam pendekatan normal, data di gudang data yang disimpan berikut, untuk gelar aturan database, normalisasi. Tabel dikelompokkan bersama-sama dengan bidang studi yang mencerminkan data kategori umum (misalnya, data tentang pelanggan, produk, keuangan, dll). Keuntungan utama dari pendekatan ini adalah bahwa hal itu mudah untuk menambahkan informasi ke dalam database. Kerugian dari pendekatan ini adalah bahwa, karena jumlah meja yang terlibat, akan sulit bagi pengguna baik untuk:
1. bergabung dengan data dari sumber yang berbeda menjadi informasi yang bermakna dan kemudian
2. mengakses informasi tanpa pemahaman yang tepat dari sumber data dan struktur data dari data warehouse.
1. Untuk menjaga integritas fakta dan dimensi, memuat data warehouse dengan data dari sistem operasional yang berbeda adalah rumit, dan
2. Sulit untuk memodifikasi struktur data warehouse jika organisasi mengadopsi pendekatan dimensi perubahan cara di mana ia melakukan bisnis.
Dalam pendekatan normal, data di gudang data yang disimpan berikut, untuk gelar aturan database, normalisasi. Tabel dikelompokkan bersama-sama dengan bidang studi yang mencerminkan data kategori umum (misalnya, data tentang pelanggan, produk, keuangan, dll). Keuntungan utama dari pendekatan ini adalah bahwa hal itu mudah untuk menambahkan informasi ke dalam database. Kerugian dari pendekatan ini adalah bahwa, karena jumlah meja yang terlibat, akan sulit bagi pengguna baik untuk:
1. bergabung dengan data dari sumber yang berbeda menjadi informasi yang bermakna dan kemudian
2. mengakses informasi tanpa pemahaman yang tepat dari sumber data dan struktur data dari data warehouse.
- ·Off line Operasional Database
- Off line Data Warehouse
- ·Real Time Data Warehouse
gudang data pada tahap ini akan diperbarui setiap kali sistem operasional melakukan transaksi.
Istilah Dalam Warehouse
Istilah-istilah yang berkaitan dengan data warehouse :
1. Data Mart
Adalah suatu bagian pada data warehouse yang mendukung pembuatan laporan dan analisa data pada suatu unit, bagian atau operasi pada suatu perusahaan.
2. On-Line Analytical Processing(OLAP)
Merupakan suatu pemrosesan database yang menggunakan tabel fakta dan dimensi untuk dapat menampilkan berbagai macam bentuk laporan, analisis, query dari data yang berukuran besar.
3. On-Line Transaction Processing(OLTP)
Merupakan suatu pemrosesan yang menyimpan data mengenai kegiatan operasional transaksi sehari-hari.
4. Dimension Table
Tabel yang berisikan kategori dengan ringkasan data detail yang dapat dilaporkan. Seperti laporan laba pada tabel fakta dapat dilaporkan sebagai dimensi waktu(yang berupa perbulan, perkwartal dan pertahun).
5. Fact Table
Merupakan tabel yang umumnya mengandung angka dan data history dimana key (kunci) yang dihasilkan sangat unik, karena key tersebut terdiri dari foreign key(kunci asing) yang merupakan primary key (kunci utama) dari beberapa dimension table yang berhubungan.
6. DSS
Merupkan sistem yang menyediakan informasi kepada pengguna yang menjelaskan bagaimana sistem ini dapat menganalisa situasi dan mendukung suatu keputusan yang baik.
Manfaat Warehouse
Gudang data menyediakan model data yang umum untuk semua data tanpa bunga sumber data itu. Hal ini membuat lebih mudah untuk melaporkan dan menganalisa informasi daripada kalau beberapa model data yang digunakan untuk mengambil informasi seperti faktur penjualan, penerimaan pesanan, biaya buku besar, dll
* Sebelum memasukkan data ke dalam data warehouse, ketidakkonsistenan diidentifikasi dan diselesaikan. Hal ini sangat menyederhanakan pelaporan dan analisa.
* Informasi dalam data warehouse adalah di bawah kontrol pengguna gudang data sehingga, bahkan jika sumber data sistem ini dihapus dari waktu ke waktu, informasi di gudang dapat disimpan dengan aman untuk waktu yang lama.
* Karena mereka terpisah dari sistem operasional, data warehouse menyediakan pengambilan data tanpa memperlambat sistem operasional.
* Data gudang dapat bekerja dalam kaitannya dengan dan, karenanya, meningkatkan nilai aplikasi bisnis operasional, terutama customer relationship management (CRM) sistem.
* Data gudang memfasilitasi aplikasi sistem pendukung keputusan seperti laporan tren (misalnya, barang-barang dengan penjualan paling di daerah tertentu dalam dua tahun terakhir), laporan pengecualian, dan laporan yang menunjukkan kinerja aktual versus tujuan.
Kekurangan
Ada juga kerugian untuk menggunakan data warehouse. Beberapa di antaranya adalah:
* Data gudang tidak lingkungan optimal untuk data tidak terstruktur.
* Karena data harus diekstrak, diubah dan dimasukkan ke dalam gudang, ada unsur latency dalam data data warehouse.
* Selama hidup mereka, gudang data dapat memiliki biaya tinggi.
* Data gudang bisa mendapatkan usang relatif cepat. Ada biaya penyampaian informasi suboptimal bagi organisasi.
* Ada sering garis tipis antara gudang data dan sistem operasional. Gandakan, fungsionalitas mahal dapat dikembangkan. Atau, fungsi dapat dikembangkan di gudang data yang, dalam retrospeksi, seharusnya dikembangkan dalam sistem operasional
Keuntungan Data Warehouse
Data warehouse merupakan pendekatan untuk menyimpan data dimana sumber-sumber data yang heterogen(yang biasanya tersebar pada beberapa database OLTP) dimigrasikan untuk penyimpanan data yang homogen dan terpisah. Keuntungan yang didapatkan dengan menggunakan data warehouse tersebut dibawah ini (Ramelho).
Data diorganisir dengan baik untuk query analisis dan sebagai bahan untuk pemrosesan transaksi.
- Perbedaan diantara struktur data yang heterogen pada beberapa sumber yang terpisah dapat diatasi.
- Aturan untuk transformasi data diterapkan untuk memvalidasi dan mengkonsolidasi data apabila data dipindahkan dari database OLTP ke data warehouse.
- Masalah keamanan dan kinerja bisa dipecahkan tanpa perlu mengubah sistem produksi.
Istilah-istilah yang berhubungan dengan data warehouse
Istilah-istilah yang berkaitan dengan data warehouse antara lain:
1. Data Mart
Adalah suatu bagian pada data warehouse yang mendukung pembuatan laporan dan analisa data pada suatu unit, bagian atau operasi pada suatu perusahaan.
2. On-Line Analytical Processing(OLAP)
Merupakan suatu pemrosesan database yang menggunakan tabel fakta dan dimensi untuk dapat menampilkan berbagai macam bentuk laporan, analisis, query dari data yang berukuran besar.
3. On-Line Transaction Processing(OLTP)
Merupakan suatu pemrosesan yang menyimpan data mengenai kegiatan operasional transaksi sehari-hari.
4. Dimension Table
Tabel yang berisikan kategori dengan ringkasan data detail yang dapat dilaporkan. Seperti laporan laba pada tabel fakta dapat dilaporkan sebagai dimensi waktu(yang berupa perbulan, perkwartal dan pertahun).
5. Fact Table
Merupakan tabel yang umumnya mengandung angka dan data history dimana key (kunci) yang dihasilkan sangat unik, karena key tersebut terdiri dari foreign key(kunci asing) yang merupakan primary key (kunci utama) dari beberapa dimension table yang berhubungan.
6. DSS
Merupkan sistem yang menyediakan informasi kepada pengguna yang menjelaskan bagaimana sistem ini dapat menganalisa situasi dan mendukung suatu keputusan yang baik.
Tugas-tugas Data warehouse
Ada empat tugas yang bisa dilakukan dengan adanya data warehouse menurut Williams, keempat tugas tersebut yaitu :
a. Pembuatan laporan
Pembuatan laporan merupakan salah satu kegunaan data warehouse yang paling umum dilakukan. Dengan menggunakan query sederhana didapatkan laporan perhari,perbulan, pertahun atau jangka waktu kapanpun yang diinginkan.
b. On-Line Analytical Processing (OLAP)
Dengan adanya data warehouse,semua informasi baik detail maupun hasil summary yang dibutuhkan dalam proses analisa mudah didapat. OLAP mendayagunakan konsep data multi dimensi dan memungkinkan para pemakai menganalisa data sampai mendetail, tanpa mengetikkan satupun perintah SQL. Hal ini dimungkinkan karena pada konsep multi dimensi, maka data yang berupa fakta yang sama bisa dilihat dengan menggunakan fungsi yang berbeda. Fasilitas lain yang ada pada sofware OLAP adalah fasilitas rool-up dan drill-down. Drill-down adalah kemampuan untuk melihat detail dari suatu informasi dan roll-up adalah kebalikannya.
c. Data mining
Data mining merupakan proses untuk menggali(mining) pengetahuan dan informasi baru dari data yang berjumlah banyak pada data warehouse, dengan menggunakan kecerdasan buatan (Artificial Intelegence), statistik dan matematika. Data mining merupakan teknologi yang diharapkan dapat menjembatani komunikasi antara data dan pemakainya.
Beberapa solusi yang diberikan data mining antara lain :
1. Menebak target pasar
Data mining dapat mengelompokkan (clustering) model-model pembeli dan melakukan klasifikasi terhadap setiap pembeli dan melakukan klasifikasi terhadap setiap pemebeli sesuai dengan karakteristik yang diinginkan.
2. Melihat pola beli dari waktu ke waktu
Data mining dapat digunakan untuk melihat pola beli dari waktu ke waktu.
3. Cross-market analysis
Data mining dapat dimanfaatkan untuk melihat hubungan antara satu produk dengan produk lainnya.
4. Profil pelanggan
Data mining bisa membantu pengguna untuk melihat profil pembeli sehingga dapat diketahui kelompok pembeli tertentu cenderung kepada suatu produk apa saja.
5. Informasi summary
Data mining dapat membuat laporan summary yang bersifat multi dimensi dan dilengkapi dengan informasi statistik lainnya.
d. Proses informasi executive
Data warehouse dapat membuat ringkasan informasi yang penting dengan tujuan membuat keputusan bisnis, tanpa harus menjelajahi keseluruhan data. Dengan menggunakan data warehouse segala laporan telah diringkas dan dapat pula mengetahui segala rinciannya secara lengkap, sehingga mempermudah proses pengambilan keputusan. Informasi dan data pada laporan data warehouse menjadi target informative bagi user.