Skip to content

Belajar Melepas Storage External (SAN) Yang Sudah Tidak Dipergunakan (Studi Kasus OS RHEL)

19 July 2014
tags: , , , ,
View this document on Scribd
Advertisements

Menambahkan Online HDD Dalam RAID Group (Studi Kasus Server HP)

22 April 2014
tags: , , ,

Bayangkan suatu kondisi server dimana empat unit HDD yang identik kita setting dalam satu RAID group menggunakan RAID-5.

a

Gambar-1 (Ilustrasi Fisik HDD, warna Hijau mengilustrasikan Logical Volume RAID)

Salah satu HDD dari RAID group tersebut tiba-tiba mengalami kerusakan!, sistem monitoring memberitahukan bahwa ada failure diserver tersebut, tetapi anda cuek tidak menanggapinya dan malah asik mengecek email, karena anda yakin walaupun salah satu HDD mengalami kerusakan, server masih dapat berjalan dengan baik menggunakan tiga unit HDD tersisa, tetapi lamunan anda buyar tatkala bos anda segera memberitahukan bahwa server tersebut tidak bisa diakses sama sekali. Server tidak bisa booting dan Corrupt, selidik punya selidik, Group RAID-5 HDD server anda tidak hanya mengalami satu HDD failure akan tetapi mengalami kerusakan HDD yang lain.

Gambar-1 (Ilustrasi 2 unit HDD rusak)

Gambar-1 (Ilustrasi 2 unit HDD rusak)

Gambar-3 (Contoh log dalam keadaan nyata, dua HDD rusak)

Gambar-3 (Contoh log dalam keadaan nyata, dua HDD rusak)

Kejadian ini sering kita sebut dengan ungkapan “Sh*t Happens”, kejadian yang hanya dapat terjadi dalam skala 1:100 tapi tetap mungkin terjadi!. “Mencegah lebih baik daripada mengobati” mungkin pepatah ini bisa kita implementasikan juga didunia IT, kali ini pepatah tersebut kita akan coba diserver khususnya dalam kinerja RAID Hardisk.

Gambar-4 (Ilustrasi Penambahan Online HDD)

Gambar-4 (Ilustrasi Penambahan Online HDD)

Setelah kejadian ini tim infrastruktur segera menggelar rapat untuk menyingkapi permasalahan tersebut. Dari rapat didapatkan suatu rencana perbaikan dengan menambahkan satu HDD sebagai online HDD atau sering kita dengar dengan sebutan HDD spare, Online HDD ini akan menggantikan HDD yang failure sampai dengan HDD yang rusak tersebut diganti dengan yang baru. Proses usulan perbaikan ini tidak boleh merestart atau menshutdown server dilingkungan production.

Kali ini kita akan belajar untuk menambahkan satu HDD sebagai online spare tatkala server mengalami kejadian satu HDD failure. Dari pengalaman penulis, semua principal HW server memiliki kemampuan untuk menambahkan HDD secara “on the fly” untuk dijadikan online HDD. Kebetulan server yang dijadikan referensinya adalah HP. Kita akan menambahkan online HDD dengan bantuan tools “HP Array Configuration Utility CLI”. Langkah-langkahnya adalah sebagai berikut :

  • Ketikan hpacucli pada console
Gambar-5 (Pengecekan meggunakan perintah hpacucli)

Gambar-5 (Pengecekan meggunakan perintah hpacucli)

  • Ketikan ctrl all show config, dengan perintah ini kita dapat mengetahui bahwa konfigurasi dasar logical drive server kita menggunakan RAID-5.
Gambar-6 (informasi dasar konfigurasi RAID)

Gambar-6 (informasi dasar konfigurasi RAID)

  • Tambahkan HDD baru pada server , sehingga jika kita ketikan ctrl all show config, akan muncul device baru yang belum dialokasikan, terlihat pada gambar 7
3.add new hdd

Gambar-7 (Penambahan HDD baru)

  • Dengan perintah ctrl slot=0 array A add spares=2I:1:5, kita menambahkan HDD yang baru , terletak pada port 2I box 1 dan bay 6 kedalam raid controller slot 0  array A (ilustrasi gambar-8)
Gambar-8 (Perintah pengalokasian HDD baru menjadi Online HDD)

Gambar-8 (Perintah pengalokasian HDD baru menjadi Online HDD)

  • Jika perintah yang dimasukkan benar, maka ketika kita ketikan perintah ctrl all show config, maka HDD yang baru telah dialokasikan menjadi online HDD atau spare, seperti terlihat pada gambar-9
5. spare sudah terpasang

Gambar-9 (HDD yang baru telah dialokasikan menjadi online HDD atau spare)

  • Langkah selanjutnya adalah opsional, hanya untuk memastikan bahwa online HDD yang kita alokasikan bekerja sesuai dengan harapan, pada kasus ini saya mencabut salah satu HDD pada port 1I, box 1 di bay 4, terlihat di gambar 10 HDD yang saya cabut statusnya berubah menjadi Failed, dan online HDD berubah statusnya menjadi Active spare dengan status Rebuilding.
Gambar-10 (Pengujian)

Gambar-10 (Pengujian)

  • Pada gambar 11 terlihat ilustrasi penggantian HDD rusak dengan yang baru, jika konfigurasi benar HDD yang baru akan melakukan proses Rebuilding menggantikan online HDD.
8. rebuilding kedua

Gambar-11 (Ilustrasi penggantian HDD rusak)

  • Setelah HDD baru selesai melakukan Rebuild, Online HDD akan kembali kedalam status awalnya
5. spare sudah terpasang

Gambar-12(HDD baru telah telah selesai melakukan rebuild dan onlie HDD kembali ke status awal)

Tapi perlu dipertimbangkan bahwa usulan penambahan online HDD berikut tidak serta merta merupakan solusi yang paling baik, anda juga perlu mempertimbangan dari sudut pandang yang lain (Silahkan mengacu pada referensi 3 sebagai bahan acuan),dan pilihan ada ditangan anda. Sekian pengalaman dari saya mudah-mudahan tulisan ini dapat bermanfaat.

 
Ref:
1. http://www.hp.com
2. http://en.wikipedia.org/wiki/RAID
3. http://blog.open-e.com/why-a-hot-spare-hard-disk-is-a-bad-idea/

Belajar Mengimplementasikan Eventlog Analyzer

16 March 2014

Suatu ketika Bos meminta staf IT-nya untuk membangun suatu infrastruktur server dan aplikasi yang dapat mengumpulkan semua log dari server-server produksi yang beroperasi diperusahaannya. Dia juga menginginkan jikalau ada log dari server produksi yang termasuk pada gangguan ataupun event yang dianggap “Severity High” maka server dengan aplikasinya tersebut akan mengirimkan pesan singkat (SMS) ke nomer-nomer tertentu. Kira-kira gambaran umum topology dari perusahaan tersebut adalah sebagai berikut:

(Gambar-1 Topologi)

(Gambar-1 Topologi)

Kondisi lainnya adalah:

  1. Server-server yang ada diambil lognya beroperating system Linux dan berjumlah << 100 unit dan berada di area closed/private network(tidak ada koneksi internet).
  2. Server pengumpul event/log ini beroperating system Windows.
  3. Untuk keperluan audit, server event/log ini harus mampu menampung data selama satu tahun.
  4. Aplikasi event/log ini harus user friendly.
  5. Diserver-server yang akan diambil event/log tidak diperbolehkan untuk diinstall agent.
  6. Pada kasus terjadi event/log level severity high pada server produksi maka aplikasi akan mengirimkan pesan singkat ke nomer tertentu, contoh event/log tersebut adalah :

-.Power Problem
-.Link Failure
-.HDD Failure
-.Login Failure
-.System Reboot
-.System Shutdown

      7. Infrastruktur dan aplikasi pengumpul event/log tersebut harus pahe alias paket hemat karena anggaran terbatas.

Sesudah mengetahui user requirement dari si Bos, maka staff IT langsung mencari produk yang sesuai dengan keinginan si Bosnya tersebut. Setelah googling diyahoo, akhirnya pilihan aplikasi jatuh ke produk bernaman “Eventlog  Analyzer” (http://www.manageengine.com/products/eventlog/). Produk tersebut bisa didownload versi trial untuk kita uji dilingkungan development, atau kita juga bisa merasakan “live demo” dari aplikasi tersebut dihalaman web yang mereka sediakan: “http://demo.eventloganalyzer.com/event/index3.do”. Aplikasi sudah kita dapatkan sekarang kita tinggal konsentrasi ke infrastruktur HW untuk server Eventlog Analyzer, tapi saya lebih fokus ke media penyimpanan server tersebut, untuk menghitung besarnya kapasitas dari storage server kita menggunakan acuan dari referensi berikut:

(Gambar-2)

(Gambar-2)

Untuk proses instalasi aplikasi event log analyzer diwindows seperti biasa hanya perlu keahlian tangan untuk mengklik next, sedangkan untuk server target/client kita harus menambahkan satu baris perintah (untuk settingan basic) di /etc/syslog.conf, kita tambahkan diujung baris seperti berikut :

syslogconf

(Gambar-3 syslog.conf)

Pastikan diserver client/target service syslog sedang berjalan.

(Gambar-4 services syslog)

(Gambar-4 services syslog)

Tunggu beberapa saat jika settingan benar maka diserver eventlog analyzer akan muncul dashboard seperti berikut :

(Gambar-5 Dashboard)

(Gambar-5 Dashboard)

Tambahkan server-server yang akan diambil oleh server Eventlog analyzer ini:

(Gambar-6 Host Server-Server)

(Gambar-6 Host Server-Server)

Contoh dari Event/Log yang diambil adalah sebagai berikut:

(Gambar-6 Contoh Event/log yang terekam)

(Gambar-6 Contoh Event/log yang terekam)

2

Gambar-7 (Contoh Event/log “error” yang terekam)

Aplikasi pada kondisi tersebut sudah dapat dinyatakan sukses untuk diimplementasikan, sekarang kita ingin agar aplikasi tersebut dapat mengirimkan pesan singkat jika server target/client terdapat log yang berindikasi “severity high”, untuk dapat mengirimkan sms, tentu kita memerlukan sms-gateway contoh dari perangkat tersebut adalah sebagai berikut:

Gambar-7 (Modem SMS Gateway)

Gambar-7 (Modem SMS Gateway)

Selain perangkat sms-gateway kita juga diharuskan mengetahui event apa yang terjadi tatkala server client/target sedang mengalami kejadian yang dianggap “saverity high” event tersebut diambil dari “/var/log/messages”. Jika sudah mengetahuinya kita bisa jadikan profile alert diserver eventlog analyzer.

(Gambar 8 Alert Setting)

(Gambar 8 Alert Setting)

Langkah selanjutnya adalah pengujian (Disarankan agar pengujian tersebut dilakukan didevelopment terlebih dahulu). Skenarionya adalah jika diserver terjadi event-event seperti Power Problem, Link Failure, HDD Failure, Login Failure, System Reboot dan System Shutdown, server eventlog analyzer tersebut akan mengirimkan notifikasi pesan singkat ke nomer tertentu.

(Gambar-9 contoh notifikasi pesan singkat)

(Gambar-9 contoh notifikasi pesan singkat)

(Gambar-10 contoh notifikasi pesan singkat)

(Gambar-10 contoh notifikasi pesan singkat)

Sepertinya percobaan kita berhasil, sekian pengalaman dari saya mudah-mudahan dapat bermanfaat.

Pro:  Mudah diimplementasikan.

Cons: menggunakan UDP sehingga tidak ada jaminan bahwa data terkirim dengan benar dan data tidak ada engkripsi ketika proses pengiriman.

Ref: http://www.manageengine.com/products/eventlog/, (Diakses maret 2014).

Belajar Mengkonfigurasi Software RAID Menggunakan Tools Linux “mdadm”

10 March 2014
View this document on Scribd

hda: INVALID GEOMETRY: 64 PHYSICAL HEADS? Buffer I/O error on device hda, logical block 0 [solved]

1 January 2014
tags: , , ,

Suatu ketika server mengalami hang tiba-tiba ketika direstart tidak mau boot secara normal dan mengeluarkan error seperti berikut ini:

1

Berhubung server ini bukan merupakan server critical maka bisa diotak-atik untuk dicari akar permasalahannya, akan tetapi sialnya aplikasi server mau dipakai untuk pelatihan diesok harinya, dengan berat hati server harus disolved malam hari ini juga. Karena kondisi kalut dan deadline yang mengharuskan server dapat kembali beroperasi diesok hari maka saya memutuskan untuk mengambil langkah yang saya anggap perlu:

1. Melihat log melalui ILO (Tidak ditemukan log yang aneh)
2. Reboot server, masuk mode single mode lalu force untuk melakukan fsck

2

Alhamdullilah server dapat masuk ke single mode dan dapat saya force untuk melakukan fsck, kemudian saya restart ulang server tersebut.
3. Booting dengan beberapa error yang muncul

3
4. Healthy check tidak bisa dilakukan, cd/dvd-room not found. Tadinya saya mau coba menggunakan software bawaan h/w server untuk mengecek kondisi server, tapi anehnya cd/dvd room tidak mau dieject dan mengeluarkan pesan error cd/dvd-room not found. Saya berpikiran bahwa error hda berhubungan dengan Hardisk maka saya lanjut ke langkah selanjutnya.
5. Berhubung server menggunakan RAID-1, saya cabut salah satu HDD existing Slot 1 ganti dengan HDD backup A, tunggu sampai synchronized,  reboot dan force melakukan repair disk (fsck command)
6. Setelah server direstart dan “Buffer I/O on device hda, logical block 0” error masih terjadi

4
7. Cabut salah satu HDD existing Slot 2 ganti dengan HDD backup B, tunggu sampai synchronized, reboot dan force melakukan repair disk (fsck command)
8. Setelah Server direstart “Buffer I/O on device hda, logical block 0” error masih terjadi
9.  Nah setelah langkah pada point 8 dilakukan “Buffer I/O on device hda, logical block 0” error masih terjadi, mengapa masih terjadi error? padahal kedua HDD sudah menggunakan HDD yang baru!
10. Kemudian HDD Slot 1 dan Slot 2 dari server lama saya masukkan ke server lain untuk keperluan testing.
11. server booting dengan normal, “Buffer I/O on device hda, logical block 0” tidak terjadi …

5

13. Kesimpulan sementara bahwa HDD yang dibawa dari server lama tidak ada masalah sama sekali
14. Setelah dilanda kebingungan sesaat maka dirasa saatnya perlu bertanya kepada paman google dan setelah beberapa page tidak ditemukan jawaban yang dapat membantu, akhirnya didapat suatu link yang mengalami kasus yang sama dengan yang saya alami. Percaya atau tidak, dilink tersebut dinyatakan permasalahan timbul dari H/W cd/dvd room yang bermasalah. Kemudian saya coba untuk mengganti cd/dvd-room dan viola server booting dengan normal …

6

7

Akhirnya saya dapat meninggalkan ruang server dengan wajah tersenyum.

Menikmati Pemandangan Singapore dengan Singapore Flyer

2 December 2013

The Singapore Flyer is a giant Ferris wheel in Singapore that was constructed between 2005 and 2008.
Ref                : Wikipedia
Address       : 30 Raffles Ave, Singapore 039803
Height         : 541′ (165 m)
Opened       : March 1, 2008
Hours          : 8:30 am – 10:30 pm
Phone          : +65 6333 3311
Architect     : Kisho Kurokawa

1

44

43

41

42

marina dua

marina

Frontal view of the boarding and alighting platform

Frontal view of the boarding and alighting platform

4

2

3

10

36

37

12

13

16

17

18

19

20

23

best view

View of Marina Bay from one of the capsules

26

29

33

Another view from one of the capsules

34

Selamat mencoba ….”30 Menit yang luar biasa” …

Belajar Mengecek Dan Menguji Multipath Di RHEL

28 September 2013
View this document on Scribd