Makalah Basis Data Terdistribusi




BAB I

PENDAHULUAN


A.    Latar Belakang

Dalam sebuah basis data terdistribusi, basis data disimpan pada beberapa komputer. Komputer-komputer dalam sebuah sistem terdistribusi berhubungan satu sama lain melalui bermacam-macam media komunikasi seperti high-speed buses atau jalur telepon. Sebuah sistem basis data terdistribusi berisikan sekumpulan site, di mana tiap-tiap site dapat berpartisipasi dalam pengeksekusian transaksi-transaksi yang mengakses data pada satu site atau beberapa site. Tiap-tiap site dapat memproses transaksi lokal yaitu sebuah transaksi yang mengakses data pada satu site di mana transaksi telah ditentukan. Sebuah site juga dapat mengambil bagian dalam mengeksekusi transaksi global yaitu transaksi yang mengakses data pada site yang berbeda di mana transaksi telah ditentukan, atau transaksi yang mengakses data pada beberapa site yang berbeda.

B.   Batasan Masalah

Dalam batasan masalah, penulis menjelaskan mengenai Sistem dan desain basis data terdistribusi serta fragmentasi dan replikasi dalam system basis data terdistribusi.

C.  Tujuan

Tujuan dari pembuatan makalah ini adalah :

1.        Mempelajari mengenai sistem dan desain system basis data terdistribusi

2.        Memahami metode-metode yang terdapat pada materi sistem basis data terdistribusi.


BAB II

PEMBAHASAN



A.  Pengertian dari Basis Data Terdistribusi

Basis Data Terdistribusi adalah kumpulan data logic yang saling berhubungan secara fisik terdistribusi dalam jaringan komputer, yang tidak tergantung dari program aplikasi sekarang maupun masa yang akan datang.

File merupakan kumpulan data yang dirancang untuk suatu aplikasi atau sekumpulan aplikasi

yang dekat hubungannya.

Contoh Basis Data Terdistribusi :

1.      Misalnya sebuah bank yang memiliki banyak cabang, bahkan di sebuah kota bias terdiri dari beberapa cabang / kantor.

2.      Masing-masing lokasi memiliki jaringan lokal sendiri, dan semua jaringan local itu dihubung kan satu sama lain membentuk sebuah jaringan nasional.

3.        Struktur Basis Data Terdistribusi

4.      Sebuah sistem basis data terdistribusi hanya mungkin dibangun dalam sebuah sistem jaringan komputer.

Topologi Jaringan :

1.        Topologi bintang (star).

2.        Topologi Cincin (Ring).

3.        Topologi Bus.


Perbedaan utama di antara berbagai topologi di atas terletak pada :


1.      Biaya Instalasi ; Biaya dalam membangun hubungan link antar simpul.

2.      Biaya Komunikasi ; Waktu dan biaya dalam pengoperasian sistem berupa pengiriman data dari satu simpul kesimpulan lain.

3.      Kehandalan ; Frekuensi/tingkat kegagalan komunikasi yang terjadi.

4.      Ketersediaan ; Tingkat kesiapan data yang dapat diakses sebagai antisipasi kegagalan komunikasi.

a.        Jenis Transaksi

1)       Transaksi Lokal ; Transaksi yang mengakses data pada suatu simpul (mesin/server) yang sama dengan simpul dari mana transaksi tersebut dijalankan.

2)       Transaksi Global ; Transaksi yang membutuhkan pengaksesan data di simpul yang berbeda dengan simpul dimana transaksi tersebut dijalankan, atau transaksi dari sebuah simpul yang membutuhkan pengaksesan data ke sejumlah simpul lainnya.

b.   Ciri-ciri Basis Data Terdistribusi

1)        Data disimpan di sejumlah tempat.

2)        Prosessor pada tempat yang berbeda tersebut dihubungkan dengan jaringan computer.

3)      Sistem basis data terdistribusi bukan terdiri dari sekumpulan file yang berada pada berbagai tempat tetapi pada sebuah basis data di berbagai tempat.

4)      Setiap tempat secara mandiri memproses permintaan user yang membutuhkan akses ke data di tempat tersebut dan juga mampu untuk memproses data yang tersimpan di tempat lain.


c.         Keuntungan yang diberikan oleh sistem basis data terdistribusi.

1)        Pengelolaan secara transparan data yang terdistribusi.

2)        Mengacu pada struktur organisasi.

3)        Meningkatkan untuk berbagi dan otonomi local.

4)        Meningkatkan ketersediaan data.

5)        Meningkatkan kehandalan.

6)        Meningkatkan performasi kerja.

7)        Memudahkan pengembangan sistem.

d.   Kerugian yang diberikan oleh sistem basis data terdistribusi

1)        Kompleksitas manajemen.

2)        Kontrol integritas lebih sulit.

3)        Biaya pengembangan.

4)        Keamanan.

5)        Sulitnya standarisasi.

6)        Menambah kebutuhan penyimpanan.

7)        Lebih sulit dalam mengatur lingkungan data.

e.         Desain Basis Data Terdistribusi.

1)      Ada beberapa pendekatan yang berkaitan dengan penyimpanan data/tabel dalam sebuah sistem basis data terdistribusi, yaitu :

a)      Replikasi adalah adalah suatu teknik untuk melakukan copy dan pendistribusian data dan objek-objek database dari satu database ke database lain dan melaksanakan sinkronisasi antara database sehingga konsistensi data dapat terjamin. Pengertian lain :


1.        Sistem memelihara sejumlah salinan/duplikat tabel-tabel data.

2.        Setiap salinan tersimpan dalam simpul yang berbeda, yang menghasilkan replikasi data.

b)   Fragmentasi adalah sebuah fenomena di ruang penyimpanan yang digunakan secara tidak efisien, mengurangi kapasitas penyimpanan. Istilah ini juga digunakan untuk menunjukkan tempat yang gersang itu sendiri. Pengertian lain :

1.        Data dalam tabel dipilah dan disebar ke dalam sejumlah fragmen.

2.        Tiap fragmen disimpan di sejumlah simpul yang berbeda-beda.

3.      Fragmentasi dapat berbentuk fragmentasi horizontal (pemilahan record data) atau fragmentasi vertikal (pemilahan field/atribut data).

c). Replikasi dan Fragmentasi :

1.        Merupakan kombinasi dari replikasi dan fragmentasi.

2.        Data/tabel dipilah dalam sejumlah fragmen.

3.        Sistem lalu mengelola sejumlah salinan dari masing-masing fragmen tadi di sejumlah simpul.

d). Replikasi Data




a.         Ketersediaan yang tinggi.

b.        Peningkatan Keparalelan (Increased paralelism).

c.       Peningkatan beban pengubahan data (Increased overhead on upate). e). Fragmentasi Data

Dapat diterapkan operasi union ataupun operasi natural join. Contoh ; Tabel nasabah bank dengan struktur dan data sebagai berikut : nasabah = (no_nas, nama_nas, alamat_nas, kota, saldo_simpan, saldo pinjam).


Perbedaan DDBMS dengan Sistem Sentral Hardware

1.        Ada banyak komputer yang disebut sites atau nodes.

2.      Site-site ini terhubung oleh jaringan komunikasi untuk mengirim data dan perintah-perintah di antara site-site tersebut.

B.   Sistem Basis Data Terdistribusi

Jaringan Komputer adalah sebuah sistem yang terdiri dari beberapa perangkat Komputer serta perangkat lain pendukung komputer yang saling berhubungan satu dengan yang lain nya . Koneksi Jaringan dapat menggunakan kabel atau disebut wired Network atau bisa juga tanpa kabel atau wireless Network. Dalam Jaringan Komputer kita dapat melakukan pertukaran data, sharing informasi. Dalam Suatu Jaringan komputer terdapat suatu induk jaringan atau disebut dengan Server . sedangkan pengakses server, di sebut Client.

Konsep Database Terdistribusi adalah terpusatnya suatu database di suatu titik yang kemudian dikoneksikan dengan jaringan bisa internet ataupun intranet untuk melayani beberapa terminal yang tersambung di setiap host komputer. Intinya, database tidak di taruh di setiap PC namun ada satu induk PC yang di gunakan untuk menshare database.

1.      Distributed Database adalah suatu database yang penyimpanan nya tidak di letakkan semua di taruh di pc umum. Kebanyakan, distributed database di letakkan di Pc induk ( Server ) lalu kemudian komputer lain yang terkoneksi dengan nya dapat saling memanfaatkan database.

2.      Database Management System Terdistribusi adalah Sebuah system yang menyusun, mengatur suatu cara atau proses agar database dapat terdistribusi dengan benar dan tepat sasaran

Contoh dari penerapan Distributed Database antara lain suatu Bank nasional atau swasta yang memiliki cabang disuatu tempat. Di dalam kantor bank tersebut terdapat jaringan Ethernet



atau local yang berfungsi untuk pertukaran data dalam lingkup kantor atau local saja. Namun Bank cabang tersebut juga terkoneksi ke server bank pusat yang berisi data data Nasabah .

Database Bank pusat ini bisa disebut distributed database, karena tidak hanya bank yang pusat saja yang dapat menggunakan database tersebut, namun Cabang dari bank tersebut juga bisa mengakses nya.

1.   Keuntungan Dan Kerugian Menggunakan DBMS

Keuntungan Menggunakan DBMS

a.         Controlling Redundancy

Dengan adanya DBMS maka kemungkinan terjadi redundansi mengecil, meskipun database nantinya di pakai secara bersama dan simultan namun DBMS memiliki suatu system sendiri untuk mencegah terjadinya hal tersebut, tentunya dengan beberapa option

b.   Restricting unauthorized access

DBMS mempunyai suatu system yang bisa mengatur previlage user. Setiap user mempunyai hak akses sendiri sendiri, ada yang hanya diijinkan untuk retrieve data, ada lagi yang di ijinkan untuk update data juga DBMS mempunya otorisasi khusus untuk tiap tiap user

c.         Providing persistent storage for program object and data structures

Ini merupakan salah satu bentuk konsep database berorientasi objek . Contoh : misalkan tipe record dalam pascal adalah C++. Nilai dari variable program akan di hapus setiap program selesai itu disebut persistence. Dari contoh tersebut, kita dapat melihat bahwa DBMS mempunyai system yang berorientasi objek, dengan begitu, format format yang tidak sesuai akan di konversi sehingga dapat berfungsi.


d.   Permitting inferencing and actions using rules

Sistem database deduktif memiliki kemampuan mendefinisikan rule deduksi untuk menginfer informasi baru. Misal menentukan siswa dalam masa percobaan. Ini dideklarasikan sebagai rule. Pada DBMS tradisional, kode program prosedural seperti ini secara eksplisit perlu ditulis. Tetapi jika rule diubah, yang tepat diubah adalah rule deduksi yang dideklarasikan daripada mengk oding prosedur programnya. Sistem database aktif menyediakan rule yang aktif yang dapat secara otomatis menginisialisasi aksi.

e.         Providing multiple user interfaces

Karena tipe user ada sangat banyak tipe berdasarkan skill dan pengetahuan teknik , DBMS dapat menyediakan interface yang sesuai dengan user tersebut

f.        Representing complex relationships among data

Di dalam database, ada banyak sekali data yang saling berhubungan. DBMS memiliki kemampuan untuk mempresentasikan relasi yang kompleks demi memmudahkan pengguna

g.   Providing backup and recovery

Dengan menggunakan DBMS maka kegiatan backup dan recover database dapat tersusun dan terjadwal, sehingga apabila terjadi kesalahan dapat segera di restore dengan fasilitas recovery ini

2.   Kerugian menggunakan DBMS

a.         Kebutuhan hardware yang sangat baik dengan spesifikasi tinggi

`Tidak dapat dipungkiri, dengan menggunakan DBMS, kita membutuhkan hardware yang memimiliki spesifikasi tinggi yang tentunya berharga mahal. Kualitas hardware dan koneksi jaringan sangat mempengaruhii alur data dari DBMS ini.


3.   Adanya biaya tambahan untuk perawatan Hardware dan Software

Tentunya dengan kita mengaplikasikan DBMS dibutuhkan maintenance atau perawatan berkala pada hardware ataupun software yang kita pakai, tentunya dengan biaya tambahan lagi .
4.   Harga Software yang mahal

Server database menggunakan Software yang cukup mahal harganya , dengan demikian dapat juga menambah biaya dari suatu proyek yang menggunakan DBMS

5.   Kompleksnya manajemen yang sangat tinggi

Meskipun DBMS ini di rancang untuk mengatasi kekompleks an data yang tinggi, namun kadang user nya sendiri yang bingung atau masih belum terbiasa menggunakan aplikasi nya, dengan begitu di butuhkan waktu untuk mempelajari nya.

Menggunakan DBMS memang menawarkan banyak kelebihan dari segi apapun. namun, kita harus melihat apakah DBMS mutlak diperlukan dalam suatu proyek database. akan lebih baik menggunakan model tradisional saja jika memang aplikasi nya sederhana dan tidak sering mengalami perubahan. Kemudian multiple user tidak di perlukan. dengan begitu maka kita dapat lebih efisien dalam mengolah database.

C.  Desain Basis Data Terdistribusi

Seperti halnya proses perancangan sistem lainnya, perancangan basis data terdistribusi juga memerlukan serangkaian proses analisis dan desain. Termasuk di dalam proses ini adalah analisis kebutuhan beserta proses-proses perancangan, yakni desain secara konseptual bersama dengan desain tampilan (view) informasi; desain distribusi yang melibatkan pengaturan pembagian data; kemudian desain fisik (lihat gambar).

Bagian proses perancangan basis data terdistribusi

Sebelum belajar lebih jauh tentang database terdistribusi, ada baik kita mengingat kembali tentang data, informasi, database (basis data), dan jaringan Komputer serta pengertian



database terdistribusi itu sendiri yang diharapkan biasa berguna dalam mempejalari desain database terdistribusi ini nantinya.

1. Data

Data merupakan fakta di dunia nyata atau kenyataan yang menggambarkan suatu kejadian-kejadian dan kesatuan nyata. Data dapat berupa angka-angka, huruf-huruf,simbolsimbol atau karakter khusus atau gabungan darinya.

2.   Informasi

Informasi adalah data atau kumpulan data yang sudah diolah. jadi Sumber dari informasi adalah data. Dimana dengan informasi diharapkan seseorang akan lebih mudah memahami sekaligus dapat digunakan utuk mengambil keputusan.

3.   Basisdata (database)

Basis data (database) merupakan kumpulan file (data) yang saling berinteraksi atau berhubungan yang diatur sedemikian rupa. Paradigm pengolahan data pada database system merupakan perpindahan dari paradigma file system (data diolah oleh masing-masing aplikasi). Program aplikasi tidak berpengaruh oleh perubahan yang terjadi pada data, begitu juga sebaliknya.

4.          DBMS

DBMS (database management system) merupakan satu set program yang berguna untuk mendefinisikan, mengatur, dan memproses database serta aplikasi-aplikasinya.

5.   Jaringan komputer

Jaringan komputer merupakan sekumpulan komputer dan perangkat yang saling terhubung antara satu dengan lainnya. Dimana pada awalnya dibuat dengan tujuan menyelamatkan data (ARPANET).


6.   Databases terdistribusi

Databases terdistribusi sebagai berikut :

1.      Kumpulan data yang digunakan bersama yang saling berhubung secara logic tetapi tersebar secara fisik pada suatu jaringan komputer.

2.        Database yang disimpan pada beberapa komputer didistribusi dalam sebuah sistem terdistribusi

melalui media komunikasi seperti high speed buses atau telepone line.

7.          DDBS

DDBS (distributed database system) merupakan gabungan dari dua pendekatan pengolahan data yang sama sekali berlawanan yaitu database dan jaringan computer. Dimana tujuan utama database system adalah untuk mengintegrasikan data dan sentralisasi, sehingga akses (deskripsi, manipulasi dan control) terhadap sangat terkontrol. Sedangkan jaringan computer bertujuan untuk membuat mode kerja yang benar-benar menghindari terjadinya sentralisasi beban kerja.

D.  Fragmentasi

Dalam basis data terdistribusi, fragmentasi dilakukan pada relasi-relasi yang ada pada basis data. Fragmentasi membagi suatu relasi yang ada menjadi sejumlah fragmen atau pecahan relasi yang tetap mempertahankan keutuhan informasi semula. Kelebihan dari fragmentasi, yang menjadi alasan dilakukannya adalah dimungkinkannya pemrosesan data secara paralel dan penempatan tupel relasi, yang berisi sejumlah informasi, pada tempat yang tepat, yaitu yang paling membutuhkannya. Fragmentasi sendiri terbagi atas empat jenis, yaitu:

Primary horizontal: sebuah relasi R(A1, …, An) difragmentasi berdasarkan himpunan predikat-predikat relasi PR = {p1, …, pn}. Tiap-tiap predikat merupakan perbandingan yang digunakan dalam aljabar relasional, yang dapat melibatkan operator perbandingan =, ?, <, atau >.



Derived horizontal: pembuatan partisi suatu relasi R berdasarkan partisi yang dibuat pada relasi lain, misalkan S. Satu atau beberapa atribut di R mengacu kepada primary key pada S.

Vertical: fragmentasi ini dilakukan dengan memisah-misahkan atribut-atribut dari skema relasi R ke dalam skema-skema Ri. Setiap fragmen relasi harus memiliki primary key relasi asli.
Hybrid: fragmentasi yang mempunyai pola campuran dari ketiga relasi di atas

1. Ilustrasi Fragmentasi Misalkan ada dua relasi sebagai berikut: PEGAWAI(NoPeg, NamaPeg, Posisi, Gaji, NoDep) DEPT(NoDep, NamaDep, Lokasi)

Contoh fragmentasi untuk tiga jenis fragmentasi yang telah disebutkan di atas adalah sebagai berikut:

a.       Dalam fragmentasi primary horizontal, dimisalkan ada himpunan predikat yang diakses oleh aplikasi yang berbeda. Satu aplikasi memperoleh informasi pegawai dengan posisi DBAdmin, sementara aplikasi lainnya memperoleh informasi pegawai dengan gaji lebih besar dari Rp 15 juta. Predikat sederhana dapat dinyatakan dalam himpunan sbb: . Selanjutnya, predikat-predikat dapat dinyatakan ke dalam himpunan dari minterm, yaitu . Selanjutnya, predikat-predikat dapat dinyatakan ke dalam himpunan dari minterm, yaitu sebagai berikut :

o m1 = Posisi = ‘DBAdmin’ ^ Gaji > 15000000

o m2 = Posisi ? ‘DBAdmin’ ^ Gaji > 15000000

o m3 = Posisi = ‘DBAdmin’ ^ Gaji = 15000000

o m4 = Posisi ? ‘DBAdmin’ ^ Gaji = 15000000

b.   Dalam fragmentasi derived horizontal, misalkan DEPT dipartisi berdasarkan predikat Lokasi = ‘Bandung’, sehingga ada dua partisi

DEPT1 = sLokasi = ‘Bandung’(DEPT)


DEPT2 = sLokasi ? ‘Bandung’(DEPT)

Sementara, itu PEGAWAI dipartisi berdasarkan partisi DEPT sebagai berikut:

PEGAWAIi PEGAWAI left outer join DEPTi

c.         Dalam fragmentasi vertical, relasi PEGAWAI(NoPeg, NamaPeg, Posisi, Gaji,

NoDep) difragmentasi ke dalam fragmen relasi PEGAWAI1(NoPeg, NamaPeg, Gaji) dan PEGAWAI2(NoPeg, Posisi, NoDep).


Fragmentasi dikatakan tepat apabila memenuhi syarat-syarat berikut:

a.         kelengkapan: dekomposisi relasi R ke dalam fragmen-fragmen R1, …, Rn dikatakan lengkap

jika setiap tupel R dapat ditemukan dalam fragmen Ri mana pun.

b.   rekonstruksi: jika relasi R terdekomposisi ke dalam fragmen-fragmen R1, …, Rn, terdapat operator relasional sedemikian sehingga .

c.       disjoint: jika sebuah relasi R dipartisi, sebuah tupel dalam R, jika ditemukan dalam fragmen Ri, tidak akan ditemukan dalam fragmen Rj dengan i ? j.


3. Alokasi

Dalam basis data terdistribusi, alokasi mengacu kepada distribusi data ke tempat yang optimal. Ada tiga aspek dalam memastikan alokasi menjadi optimal, antara lain.

a.       Biaya minimal, yang mencakup aspek komunikasi, penyimpanan, dan pemrosesan (pembacaan dan update); biaya mengacu pada waktu dan biaya jaringan.

b.          kinerja, yang mencakup waktu respons dan throughput.

c.         konstrain pemrosesan dan penyimpanan per situs (tempat menyimpan data).

4.   Alokasi – Kebutuhan Informasi



Untuk dapat mengalokasikan basis data terdistribusi secara optimal, dibutuhkan informasi-informasi tentang sistem sebagai berikut:

a.         Informasi basis data.

1)        Skema konseptual basis data dan jumlah situs tersedia.

2)        Jumlah, ukuran, dan selektivitas fragmen per relasi global.

b.   Informasi aplikasi.

1)        Jumlah query aplikasi.

2)        Rata-rata jumlah akses baca dariquery ke dalam sebuah fragmen.

3)        Rata-rata jumlah akses update dari query ke dalam sebuah fragmen.

4)        Matriks yang menunjukkan query mana yang meng-update dan/atau membaca fragmen tertentu.

5)        Situs asal tiap-tiap query dijalankan.

c.         Informasi situs.

1)        Unit cost penyimpanan data dalam satu situs.

2)        Unit cost pemrosesan data dalam satu situs.

d.         Informasi jaringan

1)    Komunikasi antara dua situs, mencakup antara lain bandwidth dan tunda (latency).

E.   Replikasi

Sistem basis data terdistribusi dapat menyimpan duplikat dari data yang sama dalam site yang berbeda agar perolehan informasi yang semakin cepat dan toleransi kesalahan. Proses ini disebut replikasi. Replikasi pada relasi bersifat redundan pada dua atau lebih situs.

Replikasi pada relasi disebut replikasi penuh bila relasi tersebut disimpan pada semua situs. Basis data disebut redundan penuh jika tiap-tiap site mengandung duplikat dari keseluruhan basis data.


Replikasi dilakukan karena memiliki kelebihan sebagai berikut:

1.      Jika situs asli yang menyimpan relasi R mengalami kegagalan, relasi R tetap dapat diakses melalui replikanya.

2.        Query pada relasi R dapat berjalan secara paralel di simpul (situs) yang berbeda

3.      Lebih sedikit transfer data, yaitu tidak perlu lagi mengambil data suatu relasi melalui jaringan karena sudah ada replika dalam situs lokal.

Namun, proses replikasi juga memiliki kelemahan, antara lain:

1.        Proses update yang lebih rumit karena setiap replika relasi R harus di-update.

2.      Kendali atas konkurensi yang lebih rumit karena update terhadap replika secara konkuren dapat menyebabkan basis data menjadi tidak konsisten sehingga diperlukan mekanisme khusus dalam penanganan konkurensi.


1.      Sinkron: sebelum seluruh proses transaksi update dinyatakan selesai, data yang telah dimodifikasi disinkronkan ke setiap duplikatnya; proses ini harus menunggu hingga data di tempat penyimpanan duplikat selesai ditulis sebelum dilakukan perubahan lainnya sehingga menjadi lebih kompleks.

2.      Asinkron: copy data diperbaharui secara periodik berdasarkan data utama yang diperbaharui; proses penulisan data selesai tanpa perlu menunggu penulisan data di tempat penyimpanan duplikat selesai; proses ini memang meningkatkan kinerja sistem namun risikonya, inkonsistensi data bisa terjadi.


BAB IV

PENUTUP

A.  Kesimpulan

Basis Data Terdistribusi adalah kumpulan data logic yang saling berhubungan secara fisik terdistribusi dalam jaringan komputer, yang tidak tergantung dari program aplikasi sekarang maupun masa yang akan datang.

Fragmentasi adalah sebuah fenomena di ruang penyimpanan yang digunakan secara tidak efisien, mengurangi kapasitas penyimpanan. Istilah ini juga digunakan untuk menunjukkan tempat yang gersang itu sendiri.

Replikasi adalah adalah suatu teknik untuk melakukan copy dan pendistribusian data dan objek-objek database dari satu database ke database lain dan melaksanakan sinkronisasi antara database sehingga konsistensi data dapat terjamin.

B.   Saran

Dengan keterbatasan kemampuan dan waktu yang tersedia Saya menyadari bahwa masih banyak terdapat kekurangan dalam makalah ini. Saran, perlu ada nya pembahasan mengenai Basis Data Terdistribusi secara langsung




close