Panduan Disaster Recovery Plan ( DRP )

Penulis Artikel : Nathan Gusti Ryan

Berikut ini Tutorial dalam membangun atau menyiapkan Disaster Recovery Planning. Tutorial ini merupakan implementasi penulis dalam menjalankan tugas sehari-hari sebagai IT System Administrator yang berkewajiban menjaga Stabilitas Server System sehingga kita bisa mendapatkan ZERO DOWNTIME Server System.

Disaster Recovery Plan adalah tahapan-tahapan proteksi Server System kita yang harus dipersiapkan agar jika terjadi musibah maka proses Recovery dapat dilakukan dengan cepat. DRP sangat hubungannya dengan ZERO DOWNTIME Server System dimana tujuan utama dari suatu Server System atau DATA CENTER memberikan layanan tanpa henti kepada Client maupun kepada Customer.
Jika suatu Server System atau DATA CENTER tidak didesain dengan sempurna maka server akan mengalami DOWN atau bahkan mengalami kerusakan dan membutuhkan waktu sekian menit bahkan berjam-jam. Dan dapat kita bayangkan, misalkan puluhan hingga ratusan nasabah bank akan mengantri di depan mesin ATM atau bahkan nasabah menjadi tidak percaya pada bank dan menarik uang deposit / tabungan-nya.

Tahapan Disaster Recovery Plan adalah sebagai berikut :

1. REDUNDANT atau Dual Input POWER SOURCE
Siapkan power source yang memadai dan siap pakai serta bisa juga kita terapkan pada DUAL Input power ke UPS kita. Jika tidak ada Genset, kita juga bisa memanfaatkan Input sumber daya yang lain seperti tenaga Surya, dll.
a. Input Power dari PLN.
b. Input Power dari GENSET.
c. Input Power dari Power Source lain.

2. DUAL UPS atau Redundant UPS to PSU
a. UPS A
b. UPS B
Kita gunakan 2 UPS dengan Input Power Source yang berbeda untuk men-supply sebuah server yang memiliki dual Power Supply Unit. Tentunya ini berlaku untuk server yang punya 2 buah Power Supply Unit ( PSU ). Tujuannya adalah jika terjadi problem di salah satu Power Source maka Server juga masih bisa hidup dari Power Supply yang lain atau Power Source yang lain.

3. DUAL POWER SUPPLY UNIT ( per server )
a. PSU A dengan power input dari UPS A
b. PSU B dengan power input dari UPS B
Tidak semua Server memiliki fasilitas Dual Power Supply ini, jadi jika server kita memiliki dual Power Supply maka sebaiknya kita manfaatkan se-optimal mungkin.

4. LOCAL STORAGE RAID System untuk OS
RAID System ( Redundant Array of Inexpensive Disks ) adalah sekelompok harddisk yang berfungsi saling mengantikan / redundant untuk menjaga fungsional harddisk.

Tujuannya adalah jika salah satu atau beberapa harddisk dari suatu kelompok harddisk mengalami kerusakan, maka sekelompok harddisk tersebut secara fungsi tidak mengalami problem sehingga kita tidak sampai mengalami kehilangan data. Pada RAID System ini dianjurkan mengunakan harddisk HotPlug atau harddisk HotSwap, sehingga dengan harddisk ini kita tidak perlu mematikan server untuk proses pengantian harddisk yang rusak tersebut.

System RAID yang dapat kita gunakan adalah :
a. RAID 1+0 / Mirror ( minimal ), lebih bagus lagi pake RAID5 atau RAID6 .
b. RAID5 => ( N=N-1 ), 1 buah harddisk yang dialokasikan untuk Fault Tolerance.
c. RAID6 / RAID ADG ( Advanced Data Guard ) => ( N=N-2 ), 2 buah harddisk yang dialokasikan untuk Fault Tolerance

5. DUAL / REDUNDANT Connection LAN per server
Mengunakan 2 LAN Card atau lebih tentu akan menjamin Availability server dalam jaringan jika terjadi kerusakan pada LAN Card Server. Sehingga jika salah satu koneksi LAN putus maka koneksi LAN yang lain dapat mengambil alih koneksi atau otomatis Take Over.

Redundant Connection ini dapat berupa :
a. NIC / LAN Card untuk Redundant Connection & Load Balancing
b. FO untuk Redundant Connection (Server ke SAN / NAS & FO antar Switch)

6. REDUNDANT Connection EXTERNAL STORAGE Protection untuk OS, Database & Fileserver
External Storage berupa SAN ( Storage Area Network ) ataupun NAS ( Network Attach Storage ) saat ini sudah menjadi suatu kebutuhan pokok dalam Server System. Redundant Connection dari Server ke External Storage ini sangat penting karena sangat membantu dalam menigkatkan proteksi storage sesuai sehingga fungsional Data Storage dapat befungsi sebagaimana mestinya.

Koneksi dari Server ke External Storage berupa Fiber Optic ( FO ) atau Ethernet Connection ( iSCSI ) dan proteksi ke storage kita berupa :
a. System RAID (RAID 1+0, RAID5 atau RAID6)
b. ASM & OMF ( khusus untuk Database Oracle )

7. TAPE BACKUP, Tape Library atau Vitual Tape Library ( VTL )
Tape Backup adalah Proteksi Data lebih lanjut baik ke External Catriedge maupun Virtual Tape Library yang selanjutnya Tape Catriedge di simpan ke suatu tempat khusus agar jika terjadi disaster ( musibah ) dapat digunakan untuk recovery data dengan cepat.

a. Tape Backup Convensional dengan Catriedge yang memadai
b. FO untuk Redundant Connection (dari Server ke Library atau VTL / Virtual Tape library)

8. SERVER REPLICATION TECHNOLOGY
Technology yang di implementasikan pada Server kita sangat berperan penting, misalnya pada Single Server jika terjadi problem ringan seperti RESTART Server, Update Patch, dll butuh waktu untuk Downtime 5 menit hingga 15 menit untuk proses Running Up Server. Apalagi problem fatal maka butuh waktu sekitar 1 jam lebih untuk Re-Building Server yang sama seperti semula. Maka dengan Technology Server Replication maka Downtime Server tersebut bisa di minimalkan bahkan bisa di tekan hingga hingga ZERO Downtime.

Ada 2 macam teknik dalam Server Replication, yaitu :
a. MIRRORED SERVER
b. CLUSTERED SERVER

Pada Mirrored server dibutuhkan Intervensi IT Administrator untuk melakukan Switching atau TakeOver Server termasuk menjalankan Script agar Server Pasif dapat mengambil alih Server Aktif yang sedang Down. Sedangkan pada Clustered Server tidak lagi dibutuhkan intervensi IT Administrator karena Clustered Server bisa melakukan TakeOver secara otomatis. Pada server penulis, proses TakeOver Clustered Server dari NODE1 ke NODE2 di Windows Server 2003 hanya berjalan dalam hitungan sekitar 5 detik.

Clustered System adalah Teknik mengabungkan kemampuan atau kekuatan beberapa buah Server menjadi sebuah Server System yang Powerfull. Secara phisical, Clustered Server ini terdiri atas 2 buah Server atau lebih bahkan hingga ratusan Server. Namun secara System dikenali sebagai 1 buah Server System. Jadi Clustered Server merupakan manifestasi atau miniatur daripada Server Mainframe yang harganya sangat mahal, sehingga dengan menjadi Clustered Server biaya pembelian Server Mainframe dapat di gantikan dengan membangun Clustered Server.

9. SERVER CO-LOCATION
Server Colocation adalah Server production kita gunakan operasional sehari-hari yang di Replikasi-kan pada Server kita yang berada diluar Site Server kita. Misalnya di luar kota, di luar pulau bahkan di luar negeri. Implementasi ini sangat bergantung pada kecepatan bandwith koneksi yang kita miliki atau kita sewa dari ISP.

Ada 3 macam teknik dalam Server Co-Location, yaitu :
a. MIRRORED SERVER Co-Location
b. CLUSTERED SERVER Co-Location
c. BACKUP Storage to Co-Location Storage ( umumnya mengunakan NAS dengan iSCSI )

Ada beberapa hal lagi yang perlu diperhatikan dalam Proteksi Tambahan dalam membangun suatu data Center. Yaitu :
A. Cooling System yang sesuai & memadai ( AC Presisi & redundant ).
B. Fire Protection & Fire alarm ( Fire Suppresson, Gas FM-200, dll ).
C. Security Access yang memadai ( finger print, access card, CCTV, Operator, Satpam, dan lainnya)

Artikel “TIPS Membangun Disaster Recovery Plan Server System” ini memang cocok untuk Proteksi Server System untuk Medium & Enterprise Company. Pasalnya, biaya yang dikeluarkan juga besar sesuai kebutuhan perusahaan serta sesuai budget yang disediakan. Semakin tinggi “High Availability Server System? yang diinginkan maka semakin banyak Point Proteksi yang harus dilakukan berarti juga semakin besar biaya yang harus dikeluarkan”.

http://techno.okezone.com/read/2009/09/10/92/256246/92/tips-membangun-disaster-recovery-plan-server-system

Salam,

 

Nathan Gusti Ryan

Leave a Reply

Fill in your details below or click an icon to log in:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out / Change )

Twitter picture

You are commenting using your Twitter account. Log Out / Change )

Facebook photo

You are commenting using your Facebook account. Log Out / Change )

Google+ photo

You are commenting using your Google+ account. Log Out / Change )

Connecting to %s