Home   Contact  Zoeken

Problem Management

 

Het voorkomen van (nieuwe) incidenten:

Reactief

Organiseren structurele oplossingen voor voorgekomen incidenten.

Proactief

Organiseren acties gebaseerd op analyse infrastructuur.

 

Basisbegrippen

Een problem omschrijft de ongewenste situatie die de nog onbekende oorzaak is van één of meer incidenten.

Een known error is een probleem waarvan de oorzaak is vastgesteld. Voor een known error kan een RFC worden ingediend.

Een work around is een tijdelijke oplossing om het probleem op te lossen wanneer het zich weer voordoet..

Een quick fix is een tijdelijk lapmiddel om het probleem op te lossen.

Problem control omvat de bewaking en oplossing van problems.

Error control omvat de bewaking en correctie van known errors.

 

Proces

Input

Activiteiten

Output

  • Incident gegegevens.
  • Work arounds en quick fixes
  • CMDB
  • Fabrikantgegevens
  • Rapportages capacity en availability management.
  • Problem control
  • Error control
  • Proactief problem management
  • Rapportage & informatie
  • Known Errors
  • RFC’s
  • Problem records
  • Rapportages

Activiteiten

Problem control

  • Problem identificatie en registratie.
    • Het benoemen van een problem aan de hand van
    • Onopgeloste incidenten.
    • Herhalende incidenten (trendanalyse voorkomen, kosten/duur oplossen, getroffen gebruikers).
    • Zwakke plekken in de infrastructuur.
    • Bedreigingen van servicel levels.

    De activiteit kan worden toegekend aan problem coordinatoren, maar ook medewerkers capacity of availability management.

 

  • Classificatie en allocatie. Het classificeren van een problem:
    • Categorie (hardware, software, …)
    • Impact.
    • Urgentie.
    • Prioriteit.
    • Status (Problem, known error, resolved).

    Het vervolgens alloceren van resources voor oplossing.

  • Onderzoek en diagnose.

  • Foutbronnen uit andere omgevingen (dan de beheerde infrastructuur) zoals ontwikkelfouten.

Error control

  • Error identificatie en registratie. Vanaf het moment dat een problem de status known error krijgt valt het onder Error control.

  • Onderzoek naar oplossing rekening houdend met service levels en indien een oplossing bestaat de RFC opstellen.

  • Noodoplossing uitvoeren (work around, quick fix, urgente RFC).

  • Vastleggen van de gekozen oplossing t.b.v. incident management.

  • Post Implementation Review (PIR). Evalatie en bij succes afsluiting van het problem.

Bewaking

  • Het bewaken van de voortgang van problems en known errors in verhouding tot SLA’s.

Rapportage

  • Het informeren van incident management en service level management.

 

Processturing

Prestatie-indicatoren

  • Afname van incidenten.
  • Doorlooptijd oplossing problems.
  • Kosten oplossing problems.

Rapportage

  • Urenverantwoording (totaal/verfijnd).
  • Evaluatie van producten in productie/ontwikkeling (of die aan kwaliteitseisen voldoen).
  • Effectiviteit problem management.
  • Verhouding reactief/pro-actief problem management.
  • Planning lopende problems/known errors.
  • Verbetervoorstellen problem management.

Kritische succesfactoren

  • Effectieve incidentregistratie.
  • S.M.A.R.T. doelstellingen voor problem management.
  • Een goede samenwerking tussen incident- en problem management.

Rollen

  • Problem manager.
  • Ondersteuningsrollen (aan problem manager).

 

Kosten

  • Allocatie van middelen. De allocatie is ad hoc omdat problem niet te prognotiseren zijn. Allocatie is dan ook per problem een kosten/baten-overweging.

 

Knelpunten

  • Beperkte koppeling tussen incident/problem management.
  • Onvoldoende communicatie tussen ontwikkeling problem management m.b.t. bekende bugs, known errors e.d.
  • Gebrek aan commitment.

 

Opmerkingen

  • Problem management is een verbeterprocess voor incident management en geen escalatie voor incident management (zoals het toch te vaak wordt gezien). Een incident met grote impact mag een probleem zijn, maar is dus geen problem.


www.siemons.info
© Copyright William Siemons, Netherlands 2001-2007. 
Counter