23 Sep. 2011 - Adaugat de Ionut Lopatan
Orice organizaţie care deţine un data center conştientizează faptul că puzderia de servere şi echipamente pe care le posedă în data center trebuie gestionate. Dacă serverul de sub biroul unui angajat poate fi lăsat în seama acestuia să-l întreţină şi să menţină în viaţă cu tot cu aplicaţia pe care o rulează, în cazul unui data center lucrurile se schimbă fundamental, în principal datorită dimensiunii la care rulează un data center, cu sute/mii de servere, componente de reţea, echipamente de stocare ş.a.m.d.:
- Necesitatea unei disponibilităţi deosebite a data center-ului, de multe ori scrise cu mulţi de 9 (99,99% înseamnă că aplicaţiile nu au voie să “stea” mai mult de o oră într-un an – incluzând opriri datorate defectelor sau opriri intenţionate pentru mentenanţa periodică obligatorie).
- Echipamentele trebuie să poată fi gestionate de la distanţă chiar în lipsa unui sistem de operare – management “bare-metal” (instalarea unui sistem de operare să se poată face de la distanţă pe servere, prin controlul display-ului, al butoanelor de control – power on, CD-ului şi dischetei etc.).
- Echipamentele trebuie să aibă un grad cât mai mare de standardizare (imaginaţi-vă ce ar însemna să gestionaţi numai driverele necesare pentru a instala zeci de modele diferite de servere, unele rulând Windows, iar altele Linux – şi aici pot fi iar diverse variante!).
- Standardizarea trebuie să se reflecte şi în software-ul folosit pentru aplicaţii, un număr mai mic de aplicaţii fiind mai uşor de administrat prin aplicarea de patch-uri, standardizarea procedurilor de administrare, utilizarea de script-uri pentru automatizare etc.
- Administrarea trebuie să se facă integrat, prin culegerea de informaţii de la fiecare echipament în parte, agregarea acestor informaţii şi prezentarea sub formă de dashboard-uri vizuale, care să arate interacţiunea dintre servere, echipamente de stocare, software, componente de reţea şi echipamentele utilizatorului.
- Monitorizarea trebuie să se facă individual şi proactiv, astfel încât defectarea unui echipament să fie anunţată în timp foarte scurt sau chiar prevăzută pe cât posibil (defectarea unui serviciu trebuie cunoscută imediat în data center, înainte de a începe să sune telefoanele utilizatorilor/ clienţilor).
- Modificarea configuraţiei existente, implementarea de noi servicii şi echipamente trebuie riguros documentate şi formalizate, astfel încât în orice moment să fie cunoscută configuraţia actuală, reală (nu cea “de pe hârtie”) – un data center este în continuă evoluţie, iar gestiunea acestei schimbări trebuie să facă parte integrantă din administrarea unui data center.
- Dacă pentru echipamentele fizice există noţiunea de “inventar” (acestea putând fi efectiv pipăite), prin utilizarea virtualizării, numărul de servere poate să scape foarte uşor de sub control, iar gestiunea acestora poate deveni un adevărat coşmar (maşinile virtuale putând fi localizate mai greu pe un anumit server sau echipament de stocare).
Gestiunea problemelor de genul celor semnalate mai sus reprezintă partea cea mai importantă a administrării unui data center. În trecut, conştiente de aceste probleme, companiile care aveau în dotare data centere importante şi-au dezvoltat propriile metode de administrare, însă spre sfârşitul anilor ’80 s-a produs o standardizare a acestor metode prin elaborarea, de către Office of Government Commerce (OGC) din Marea Britanie, a unui set de principii şi metode care a devenit rapid un standard – ITIL (Information Technology Infrastructure Library).
ITIL este în esenţă un set de documente care descriu principii şi bune practici (“best practices”) de implementare a tehnologiilor informatice. În prima versiune, acest set de documente practic a explodat ca număr, astfel că în anii 2000 – 2001 a apărut versiunea ITIL v2, care organizează activităţile în 8 categorii logice care tratează diferitele aspecte ale implementărilor IT: management, aplicaţii şi servicii. Dintre toate acestea, secţiunea de management al serviciilor (“Service Management”) este cea mai răspândită şi utilizată – aceasta tratează regulile de creare, administrare şi livrare/disponibilitate a serviciilor. Versiunea ITIL v3 a apărut în 2007, sintetizând 26 de procese şi funcţii, grupate în 5 volume centrate pe conceptul de ciclul de viaţă al serviciilor.
ITIL este construit pe baza unui model de administrare şi control al operaţiunilor având la bază o organizare de tip procese; ciclul de viaţă al proceselor este modelat printr-o serie de stări de tipul “plan-do-check-act”, adică o spirală continuă prin care un proces este proiectat, executat, monitorizat şi modificat după necesităţi, închizându-se ciclul cu crearea unei noi versiuni a procesului ş.a.m.d. Aşa cum a fost proiectat, ITIL descrie bine procesele IT dintr-un data center, însă criticile ulterioare au arătat că nu este potrivit şi pentru descrierea proceselor de business pe care le implementează acele operaţiuni şi procese IT în data center (de exemplu, Six Sigma – mai orientat către producţie şi managementul de business).
Dată fiind aria destul de mare pe care o acoperă ITIL în domeniul administrării unui data center, vom enumera în continuare doar câteva dintre conceptele introduse de către ITIL (şi care au fost ulterior implementate în instrumente software pentru suportul, uşurarea implementării şi controlul eficient al implementării acestor concepte):
1. Service desk/service request management (cu denumirile echivalente “call-center” sau “help desk”) – are rolul de a fi o interfaţă unică a unui utilizator pentru semnalarea oricăror aspecte legate de un serviciu, precum şi elementul de comunicare permanentă cu un utilizator pe durata de viaţă a serviciului respectiv (informarea utilizatorului despre stadiul „reclamaţiei” sale). În prezent există nenumărate aplicaţii care implementează acest concept (mai simple sau mai complexe, unele chiar gratuite şi customizabile de către utilizator);
2. Incident management – permite centralizarea tuturor incidentelor într-un singur loc, analiza acestora (inclusiv analize pe termen lung al tendinţelor incidentelor şi analiza cauzelor de bază a incidentelor – „root cause analysis”), precum şi redirecţionarea spre rezolvare către persoana/departamentul cele mai potrivite;
3. Configuration management database (CMDB) – prin folosirea sistemului de “service desk” se creează întotdeauna un incident; acesta este uneori rezolvat la primul nivel, dar de multe ori necesită escaladarea la nivelurile superioare (nivelurile 2 sau 3), iar prin această escaladare se poate iniţia un întreg lanţ de procese (incident management, problem management, change management, release management sau configuration management). Tot acest lanţ de procese este urmărit în CMDB, care funcţionează ca un jurnal al tuturor activităţilor întreprinse;
4. Change management – se ocupă de problemele conexe sau cauzate de modificarea unui serviciu, în scopul reducerii impactului pe care îl poate avea o schimbare asupra activităţii de producţie (de la detalierea modificărilor în documentele “Request for Change” şi până la banalele informări despre o iminentă oprire a unui serviciu, adresată utilizatorilor acestuia);
5. Configuration management – este un întreg set de practici, concepte şi instrumente care au ca scop existenţa unei evidenţe corecte, precise şi la zi, a configuraţiei din data center (servere, storage, echipamente de reţea etc.);.
6. Service-level management – se ocupă de crearea şi apoi cuantificarea unor metrici de operare a unui serviciu (disponibilitatea serviciului, procedurile de asigurare a continuităţii serviciului, existenţa unui catalog de servicii disponibile); în acest capitol de vorbeşte despre SLA (Service Level Agreements) care sunt contracte ce stabilesc toate caracteristicile de disponibilitate ale unui serviciu;
7. Security management - descrie un set de bune practici pentru asigurarea securităţii informaţiilor prelucrate, prin cunoaşterea şi evaluarea riscurilor, precum şi implementarea unui set de reguli legate de autentificare, responsabilitate, non-repudiere (negarea unei fapte devine imposibilă) şi fiabilitate.
Întrucât ITIL a devenit un standard de-facto pentru organizarea administrării unei infrastructuri IT, au apărut şi certificările care să ateste competenţele profesionale în acest domeniu. Pentru ITIL v2 există 3 niveluri de certificare, numite Foundation, Practitioner şi Manager. În ITIL v3 vor exista 4 niveluri denumite mai sugestiv Foundation, Intermediate, Expert and Master.
Implementarea ITIL în cadrul unei organizaţii IT va duce la standardizarea, structurarea şi proceduralizarea activităţilor, eliminarea în mare măsură a erorilor umane şi o mai bună administrare şi automatizare. În acelaşi timp aduce cu sine şi o schimbare a mentalităţilor din organizaţie şi uneori implementarea aceloraşi procese într-un timp mai lung (datorat în principal necesităţii de a documenta fiecare pas şi a respecta procedurile).
Specificaţiile ITILv2 sunt independente de platformele software folosite. Un derivat al ITIL este MOF – Microsoft Operations Framework, dezvoltat de către Microsoft şi care conţine elemente specifice pentru gestiunea infrastructurii Microsoft. MOF face referire la şi se bazează pe produsele specifice Microsoft pentru management şi monitorizare incluse în suita System Center, cum ar fi SCOM (System Center Operations Manager) şi SCCM (System Center Configurations Manager). Datorită ariei de acoperire restrânse numai la produsele Microsoft, MOF este văzut ca un instrument accesibil maselor largi, dar doar o anticameră către un instrument de gestiune de data centere eterogene.
Dr. Ionuţ Lopătan,
Hewlett-Packard România
ionut.lopatan@hp.com
Resurse utile:
ITIL pe înţelesul tuturor
http://en.wikipedia.org/wiki/Information_Technology_Infrastructure_Library
COBIT pe scurt
http://en.wikipedia.org/wiki/COBIT
Six Sigma pe scurt
http://en.wikipedia.org/wiki/Six_Sigma
Microsoft Operations Framework
http://www.microsoft.com/mof
Copyright © 2012 IDG Romania. All rights reserved