Skip to content

Berkunjung ke Dunia Fantasi

23 January 2016
Advertisements

Speleologi Tourism

23 January 2016

 

ST

by: B.A.T

Berkunjung ke Candi Sewu

23 January 2016

candi-sewu

Sepatu Kecil Aisyah

23 January 2016
tags:

Sepatu Aisyah

Menambahkan Online HDD Dalam RAID Group (Studi Kasus Server HP)

22 April 2014
tags: , , ,

Bayangkan suatu kondisi server dimana empat unit HDD yang identik kita setting dalam satu RAID group menggunakan RAID-5.

a

Gambar-1 (Ilustrasi Fisik HDD, warna Hijau mengilustrasikan Logical Volume RAID)

Salah satu HDD dari RAID group tersebut tiba-tiba mengalami kerusakan!, sistem monitoring memberitahukan bahwa ada failure diserver tersebut, tetapi anda cuek tidak menanggapinya dan malah asik mengecek email, karena anda yakin walaupun salah satu HDD mengalami kerusakan, server masih dapat berjalan dengan baik menggunakan tiga unit HDD tersisa, tetapi lamunan anda buyar tatkala bos anda segera memberitahukan bahwa server tersebut tidak bisa diakses sama sekali. Server tidak bisa booting dan Corrupt, selidik punya selidik, Group RAID-5 HDD server anda tidak hanya mengalami satu HDD failure akan tetapi mengalami kerusakan HDD yang lain.

Gambar-1 (Ilustrasi 2 unit HDD rusak)

Gambar-1 (Ilustrasi 2 unit HDD rusak)

Gambar-3 (Contoh log dalam keadaan nyata, dua HDD rusak)

Gambar-3 (Contoh log dalam keadaan nyata, dua HDD rusak)

Kejadian ini sering kita sebut dengan ungkapan “Sh*t Happens”, kejadian yang hanya dapat terjadi dalam skala 1:100 tapi tetap mungkin terjadi!. “Mencegah lebih baik daripada mengobati” mungkin pepatah ini bisa kita implementasikan juga didunia IT, kali ini pepatah tersebut kita akan coba diserver khususnya dalam kinerja RAID Hardisk.

Gambar-4 (Ilustrasi Penambahan Online HDD)

Gambar-4 (Ilustrasi Penambahan Online HDD)

Setelah kejadian ini tim infrastruktur segera menggelar rapat untuk menyingkapi permasalahan tersebut. Dari rapat didapatkan suatu rencana perbaikan dengan menambahkan satu HDD sebagai online HDD atau sering kita dengar dengan sebutan HDD spare, Online HDD ini akan menggantikan HDD yang failure sampai dengan HDD yang rusak tersebut diganti dengan yang baru. Proses usulan perbaikan ini tidak boleh merestart atau menshutdown server dilingkungan production.

Kali ini kita akan belajar untuk menambahkan satu HDD sebagai online spare tatkala server mengalami kejadian satu HDD failure. Dari pengalaman penulis, semua principal HW server memiliki kemampuan untuk menambahkan HDD secara “on the fly” untuk dijadikan online HDD. Kebetulan server yang dijadikan referensinya adalah HP. Kita akan menambahkan online HDD dengan bantuan tools “HP Array Configuration Utility CLI”. Langkah-langkahnya adalah sebagai berikut :

  • Ketikan hpacucli pada console
Gambar-5 (Pengecekan meggunakan perintah hpacucli)

Gambar-5 (Pengecekan meggunakan perintah hpacucli)

  • Ketikan ctrl all show config, dengan perintah ini kita dapat mengetahui bahwa konfigurasi dasar logical drive server kita menggunakan RAID-5.
Gambar-6 (informasi dasar konfigurasi RAID)

Gambar-6 (informasi dasar konfigurasi RAID)

  • Tambahkan HDD baru pada server , sehingga jika kita ketikan ctrl all show config, akan muncul device baru yang belum dialokasikan, terlihat pada gambar 7
3.add new hdd

Gambar-7 (Penambahan HDD baru)

  • Dengan perintah ctrl slot=0 array A add spares=2I:1:5, kita menambahkan HDD yang baru , terletak pada port 2I box 1 dan bay 6 kedalam raid controller slot 0  array A (ilustrasi gambar-8)
Gambar-8 (Perintah pengalokasian HDD baru menjadi Online HDD)

Gambar-8 (Perintah pengalokasian HDD baru menjadi Online HDD)

  • Jika perintah yang dimasukkan benar, maka ketika kita ketikan perintah ctrl all show config, maka HDD yang baru telah dialokasikan menjadi online HDD atau spare, seperti terlihat pada gambar-9
5. spare sudah terpasang

Gambar-9 (HDD yang baru telah dialokasikan menjadi online HDD atau spare)

  • Langkah selanjutnya adalah opsional, hanya untuk memastikan bahwa online HDD yang kita alokasikan bekerja sesuai dengan harapan, pada kasus ini saya mencabut salah satu HDD pada port 1I, box 1 di bay 4, terlihat di gambar 10 HDD yang saya cabut statusnya berubah menjadi Failed, dan online HDD berubah statusnya menjadi Active spare dengan status Rebuilding.
Gambar-10 (Pengujian)

Gambar-10 (Pengujian)

  • Pada gambar 11 terlihat ilustrasi penggantian HDD rusak dengan yang baru, jika konfigurasi benar HDD yang baru akan melakukan proses Rebuilding menggantikan online HDD.
8. rebuilding kedua

Gambar-11 (Ilustrasi penggantian HDD rusak)

  • Setelah HDD baru selesai melakukan Rebuild, Online HDD akan kembali kedalam status awalnya
5. spare sudah terpasang

Gambar-12(HDD baru telah telah selesai melakukan rebuild dan onlie HDD kembali ke status awal)

Tapi perlu dipertimbangkan bahwa usulan penambahan online HDD berikut tidak serta merta merupakan solusi yang paling baik, anda juga perlu mempertimbangan dari sudut pandang yang lain (Silahkan mengacu pada referensi 3 sebagai bahan acuan),dan pilihan ada ditangan anda. Sekian pengalaman dari saya mudah-mudahan tulisan ini dapat bermanfaat.

 
Ref:
1. http://www.hp.com
2. http://en.wikipedia.org/wiki/RAID
3. http://blog.open-e.com/why-a-hot-spare-hard-disk-is-a-bad-idea/

Belajar Mengimplementasikan Eventlog Analyzer

16 March 2014

Suatu ketika Bos meminta staf IT-nya untuk membangun suatu infrastruktur server dan aplikasi yang dapat mengumpulkan semua log dari server-server produksi yang beroperasi diperusahaannya. Dia juga menginginkan jikalau ada log dari server produksi yang termasuk pada gangguan ataupun event yang dianggap “Severity High” maka server dengan aplikasinya tersebut akan mengirimkan pesan singkat (SMS) ke nomer-nomer tertentu. Kira-kira gambaran umum topology dari perusahaan tersebut adalah sebagai berikut:

(Gambar-1 Topologi)

(Gambar-1 Topologi)

Kondisi lainnya adalah:

  1. Server-server yang ada diambil lognya beroperating system Linux dan berjumlah << 100 unit dan berada di area closed/private network(tidak ada koneksi internet).
  2. Server pengumpul event/log ini beroperating system Windows.
  3. Untuk keperluan audit, server event/log ini harus mampu menampung data selama satu tahun.
  4. Aplikasi event/log ini harus user friendly.
  5. Diserver-server yang akan diambil event/log tidak diperbolehkan untuk diinstall agent.
  6. Pada kasus terjadi event/log level severity high pada server produksi maka aplikasi akan mengirimkan pesan singkat ke nomer tertentu, contoh event/log tersebut adalah :

-.Power Problem
-.Link Failure
-.HDD Failure
-.Login Failure
-.System Reboot
-.System Shutdown

      7. Infrastruktur dan aplikasi pengumpul event/log tersebut harus pahe alias paket hemat karena anggaran terbatas.

Sesudah mengetahui user requirement dari si Bos, maka staff IT langsung mencari produk yang sesuai dengan keinginan si Bosnya tersebut. Setelah googling diyahoo, akhirnya pilihan aplikasi jatuh ke produk bernaman “Eventlog  Analyzer” (http://www.manageengine.com/products/eventlog/). Produk tersebut bisa didownload versi trial untuk kita uji dilingkungan development, atau kita juga bisa merasakan “live demo” dari aplikasi tersebut dihalaman web yang mereka sediakan: “http://demo.eventloganalyzer.com/event/index3.do”. Aplikasi sudah kita dapatkan sekarang kita tinggal konsentrasi ke infrastruktur HW untuk server Eventlog Analyzer, tapi saya lebih fokus ke media penyimpanan server tersebut, untuk menghitung besarnya kapasitas dari storage server kita menggunakan acuan dari referensi berikut:

(Gambar-2)

(Gambar-2)

Untuk proses instalasi aplikasi event log analyzer diwindows seperti biasa hanya perlu keahlian tangan untuk mengklik next, sedangkan untuk server target/client kita harus menambahkan satu baris perintah (untuk settingan basic) di /etc/syslog.conf, kita tambahkan diujung baris seperti berikut :

syslogconf

(Gambar-3 syslog.conf)

Pastikan diserver client/target service syslog sedang berjalan.

(Gambar-4 services syslog)

(Gambar-4 services syslog)

Tunggu beberapa saat jika settingan benar maka diserver eventlog analyzer akan muncul dashboard seperti berikut :

(Gambar-5 Dashboard)

(Gambar-5 Dashboard)

Tambahkan server-server yang akan diambil oleh server Eventlog analyzer ini:

(Gambar-6 Host Server-Server)

(Gambar-6 Host Server-Server)

Contoh dari Event/Log yang diambil adalah sebagai berikut:

(Gambar-6 Contoh Event/log yang terekam)

(Gambar-6 Contoh Event/log yang terekam)

2

Gambar-7 (Contoh Event/log “error” yang terekam)

Aplikasi pada kondisi tersebut sudah dapat dinyatakan sukses untuk diimplementasikan, sekarang kita ingin agar aplikasi tersebut dapat mengirimkan pesan singkat jika server target/client terdapat log yang berindikasi “severity high”, untuk dapat mengirimkan sms, tentu kita memerlukan sms-gateway contoh dari perangkat tersebut adalah sebagai berikut:

Gambar-7 (Modem SMS Gateway)

Gambar-7 (Modem SMS Gateway)

Selain perangkat sms-gateway kita juga diharuskan mengetahui event apa yang terjadi tatkala server client/target sedang mengalami kejadian yang dianggap “saverity high” event tersebut diambil dari “/var/log/messages”. Jika sudah mengetahuinya kita bisa jadikan profile alert diserver eventlog analyzer.

(Gambar 8 Alert Setting)

(Gambar 8 Alert Setting)

Langkah selanjutnya adalah pengujian (Disarankan agar pengujian tersebut dilakukan didevelopment terlebih dahulu). Skenarionya adalah jika diserver terjadi event-event seperti Power Problem, Link Failure, HDD Failure, Login Failure, System Reboot dan System Shutdown, server eventlog analyzer tersebut akan mengirimkan notifikasi pesan singkat ke nomer tertentu.

(Gambar-9 contoh notifikasi pesan singkat)

(Gambar-9 contoh notifikasi pesan singkat)

(Gambar-10 contoh notifikasi pesan singkat)

(Gambar-10 contoh notifikasi pesan singkat)

Sepertinya percobaan kita berhasil, sekian pengalaman dari saya mudah-mudahan dapat bermanfaat.

Pro:  Mudah diimplementasikan.

Cons: menggunakan UDP sehingga tidak ada jaminan bahwa data terkirim dengan benar dan data tidak ada engkripsi ketika proses pengiriman.

Ref: http://www.manageengine.com/products/eventlog/, (Diakses maret 2014).

Belajar Mengkonfigurasi Software RAID Menggunakan Tools Linux “mdadm”

10 March 2014
View this document on Scribd