My Articles‎ > ‎

Event Management – Service Operation-

posted Sep 4, 2015, 3:49 AM by husniteja sukmana

Organisasi yang belum menerapkan layanan IT baik, biasanya akan berhadapan dengan banyak kendala. Pertama yang  biasa dihadapi, terutama bagi Ketua bidang IT adalah sangat bergantungnya users kepada Ketua IT. Karena belum menerapkan Single Point of Contact, Ketua IT selalu menjadi orang pertama yang akan dihubungi jika terjadi masalah dengan layanan IT. Mulai dari direktur sampai ke staff akan menghubungi Ketua IT tersebut untuk mendapatkan pelayanan yang “ katanya” bisa lebih cepat. Padahal dengan cara seperti itu, dijamin semua masalah, request dan sebagainya menjadi tidak tercatat, dan mengakibatkan waktu untuk penyelesaian akan menjadi lebih lama.

Bayangkan seandainya Ketua IT sedang rapat, atau sedang tidak berada di lokasi, atau yang lebih exsterm lagi, Ketua IT nya sedang cuti. Sudah pasti eskalasi akan menjadi lebih lambat dan mungkin saja akan baru terlaksana kalau sang Ketua sudah balik ke kantor. Akibatnya pasti akan berdampak pada bisnis dari sebuah perusahaan.

Penyelesaian dari contoh diatas pada best practice ITILv3, bisa dijembatani dengan menggunakan Service Desk dan Single Point of Contact (SPoC). Pembahasan mengenai Service desk dan Single Point of Contact bisa dilihat dibahasa tersendiri.

Yang menjadi pertanyaan selanjutnya adalah apakah permasalahan yang dimunculkan oleh users hanya satu-satunya input bagi proses incident dan problem management? Kalau organisasi IT hanya mengandalkan laporan dari users kemudian bergerak untuk menyelesaikan masalah yang ada, maka kami akan katakan bahwa cara ini adalah cari paling konvensional.

Organisasi IT harus “beyond” dari sisi informasi akan adanya masalah, jangan sampai organisasi IT hanya tahu masalah hanya karena ada laporan dari user. Untuk itu dibutuhkan cara lain yang bisa digunakan oleh organisasi IT untuk dapat mengetahui akan terjadinya masalah lebih cepat dibandingkan user. Cara lain tersebut dengan monitoring IT Infrastructure.  Dari hasil monitoring tersebut, dapat dibuat batasan (threshold) tertentu. Jika sudah mendekati atau melebihi threshold maka, akan memberitahu kepada service desk secara otomatis bahwa ada sesuatu masalah. Service desk kemudian bisa mencoba menangani dan juga bisa mengeskalasi masalah yang ada.

Dalam ITILv3, proses monitoring seluruh event yang mungkin bisa berdampak bagi layanan IT adalah bagian dari proses event management. Event management memiliki beberapa objektif diantaranya:

·         Mendeteksi perubahan-perubahan yang ada pada IT Infrastructure, IT Application  yang dapat mengakibatkan adanya efek bagi organisasi

·         Menentukan aksi yang harus dilakukan apabila ada perubahan pada kondisi dan melakukan komunikasi kepada proses lain (incident management, problem management, dll)

·         Menentukan batasan-batasan threshold perubahan-perubahan yang ada  dan memberitahu kalau perubahan tersebut sudah menyentuh nilai threshold yang sudah ditetapkan kepada Service Desk agar kemudian bisa dieskalasi ke fungsi atau struktural yang tepat

Event management dalam menentukan perubahan-perubahan yang ada sebaiknya memperhatikan Configuration Item (CI), kondisi lingkungan (environment condition), software / aplikasi, security dan lain-lain. Melihat kondisi seperti ini, maka sudah seharusnya pada saat pemilihan tools ITSM, penerapan event management ini sudah harus otomatis bisa tersambung ke proses-proses yang lain.

Setelah melihat beberapa literature yang ada, kami coba petakan langkah-langkah yang ada pada event management sebagai berikut:

1.       Tentukan semua aspek yang ingin dikontrol, misalnya dari disisi infrastruktur (server, network devices, PC), aplikasi (service aplikasi), security (firewall, akses), lingkungan (Air conditioning, kelembapan)

2.       Tentukan batasan dari item-item pada point 1 diatas, sebagai contoh:

a.       Infrastruktur

                                                               i.      Bandwidth yang melewati router harus kurang dari 10GB

                                                             ii.      Memory pada server tidak boleh lebih dari 80% dalam waktu lebih dari 1 menit

b.      Aplikasi

                                                               i.      Akses terhadap user tertentu

                                                             ii.      Service aplikasi jalan pada semua cluster

                                                            iii.      Masa lisensi dari aplikasi

c.       Lingkungan

                                                               i.      Ditetapkan suhu ruang server harus berada diantara 10-15 derajat Celcius

d.      Security

                                                               i.      Batasan terhadap ekstensi file yang diperbolehkan

                                                             ii.      Akses terhadap situs-situs tertentu

3.       Mendefenisikan level dari batasan-batasan yang sudah ditentukan. Misalnya warning berdasarkan level (hijau, kuning, merah). Kapan dinyatakan level kuning (sebagai contoh bandwidth disebuah router sudah mendekati 10GB, misalnya 9.5GB)

4.       Menentukan proses otomatisasi notifikasi kepada service desk dan juga secara struktural (IT Staff, Level Manager, CIO). Proses ini bisa menggunakan tools monitoring yang terhubung dengan CI sehingga lansung tercatat dan ternotifikasi (email, sms)

Contoh nyata untuk pelaksanaan event management yang baik, sudah diterapkan oleh beberapa Bank di Indonesia, khususnya untuk penanganan ATM. ATM yang baik harus bisa memberikan informasi ke pihak bank atau pihak yang ditunjuk oleh bank untuk menangani masalah ATM (Vendor), apabila ada masalah dengan ATM. Ada mekanisme komunikasi secara terus menerus antara mesin ATM dan sistem monitoring central. Apabila ATM mati, maka komunikasi tersebut menjadi fail (gagal), sehingga akan mentriger sistem sentral untuk memberikan notifikasi ke PIC / Vendor. Otomatis SLA akan terjaga bahwa ATM tidak akan mati lebih dari waktu yang ditentukan.

Bayangkan kalau Bank belum menerapkan proses event management, dan kebetulan ATM yang dipasang berada diluar kota dan agak terpencil. Sudah untung kalau ada users yang memberikan notifikasi via telepon untuk melaporkan ATM tersebut mati, tetapi biasaya users tidak akan melakukan itu. Users lebih senang untuk mencari ATM lain atau bisa jadi menuju ATM bank tetangga karena sudah terhubung dengan jaringan bersama.

 

Serpong – 4 September 2015-

Comments