مدیریت فرایندهای کسب و کار

مدیریت حوادث (Incident Management) در ITIL چیست؟

این مقاله دارای نسخه PDF انگلیسی است. جهت دسترسی به لینک دانلود نسخه انگلیسی هم‌اکنون عضو شوید.

مدیریت حوادث فناوری اطلاعات (IT incident management) یکی از فرایندهای اساسی در کسب و کار است. در این مقاله، شما با اصول مدیریت حوادث، مولفه‌های آن، نقش‌ها و مسئولیت‌های مربوطه و نحوه کارکرد مدیریت حوادث با سایر مولفه‌های میز خدمات آشنا خواهید شد.

حوادث فناوری اطلاعات چیست؟

حوادث فناوری اطلاعات هرگونه اختلال در خدمات فناوری اطلاعات سازمان است که بر روی هر کاربر یا کل کسب و کار تأثیر می‌گذارد. به طور خلاصه، حادثه هر چیزی است که تداوم کسب و کار را قطع کند.

مدیریت حوادث فناوری اطلاعات چیست؟

مدیریت حوادث، فرآیند مدیریت اختلالات خدمات فناوری اطلاعات و بازیابی خدمات در توافق‌نامه‌های سطح خدمات (SLA) است.

دامنه مدیریت حوادث با گزارش دادن یک مسئله توسط کاربر شروع می‌شود و با حل یک مسئله توسط یکی از اعضای میز خدمات خاتمه می‌یابد.

مراحل مدیریت حوادث

با مدیریت صحیح حوادث، جمع‌آوری اطلاعات در مورد حوادث بصورت ساده و منظم صورت می‌گیرد. تیم‌های میز خدمات می‌توانند فرم‌ها را در پورتال سلف سرویس کاربر منتشر کنند تا اطمینان حاصل شود که تمام اطلاعات مربوطه در زمان درست جمع‌آوری می‌شود.

مرحله بعدی در مدیریت حوادث، طبقه‌بندی و اولویت‌بندی حادثه است. این نه تنها به مرتب‌سازی تیکت‌های ورودی کمک می‌کند بلکه باعث می‌شود آن‌ها به تکنسین‌هایی منتقل شوند که بیشترین صلاحیت را برای کار در این زمینه دارند. طبقه‌بندی حادثه همچنین به سیستم میز خدمات کمک می‌کند تا مناسب‌ترین SLAها را برای حوادث اعمال کند و این اولویت‌ها را به کاربران نهایی اعلام نماید. هنگامی که یک حادثه طبقه‌بندی و اولویت‌بندی شد، تکنسین‌ها می‌توانند آن را تشخیص داده و راه‌حل را به کاربر ارائه دهند.

فرآیند مدیریت حوادث هنگامی که با اتوماسیون مربوطه فعال باشد، به تیم‌های میز خدمات اجازه می‌دهد تا از انطباق با SLA مراقبت کنند و وقتی به تخلف SLA نزدیک می‌شوند، اعلان‌ها را برای تکنسین‌ها ارسال می‌کند. همچنین تکنسین‌ها این گزینه را دارند که با پیکربندی تشدیدهای خودکار متناسب با حادثه، تخلفات SLA را افزایش دهند. پس از تشخیص مسئله، تکنسین به کاربر یک قطعنامه ارائه می‌دهد که کاربر می‌تواند آن را تأیید کند. این فرآیند چند مرحله‌ای اطمینان حاصل می‌کند که هر مسئله فناوری اطلاعات که بر تداوم کسب و کار تأثیر می‌گذارد در اسرع وقت حل و فصل شود.

اگر مدیریت حوادث نداشته باشید چه اتفاقی می‌افتد؟

مدیریت حوادث تمام جنبه‌های یک حادثه را در طول چرخه حیات آن پوشش می‌دهد. این امر، روند حل و فصل را تسریع کرده و مدیریت تیکت‌ها را شفاف می‌کند. بدون مدیریت حوادث، رسیدگی به تیکت‌ها می‌تواند دردسرساز شود. برخی از مشکلات اساسی که می‌توانند بوجود آیند عبارتند از:

  • عدم شفافیت در مورد وضعیت تیکت و جدول زمانی مورد انتظار برای کاربران
  • هیچ ثبت مناسبی از حوادث گذشته وجود نخواهد داشت.
  • عدم توانایی در مستندسازی راه‌حل‌ها برای مسائل مکرر یا آشنا
  • ریسک بیشتر وقفه‌های کسب و کار، به ویژه با حوادث بزرگ
  • عدم توانایی گزارشگری
  • کاهش رضایت مشتری

چرخه حیات مدیریت حوادث

روند مدیریت حوادث را می‌توان به شرح زیر خلاصه کرد:

  • مرحله ۱: ثبت وقایع
  • مرحله ۲: طبقه‌بندی حادثه
  • مرحله ۳: اولویت‌بندی حادثه
  • مرحله ۴: تعیین تکلیف
  • مرحله ۵: ایجاد و مدیریت وظایف
  • مرحله ۶: مدیریت و تشدید SLA
  • مرحله ۷: ارائه راه‌حل برای حادثه
  • مرحله ۸: بستن حادثه

این فرایندها ممکن است بر اساس نوع حادثه ساده یا پیچیده باشند. آن‌ها همچنین ممکن است چندین گردش کار و وظیفه علاوه بر روند اساسی توضیح داده شده در بالا داشته باشند.

ثبت وقایع

حادثه را می‌توان از طریق تماس‌های تلفنی، ایمیل، پیام کوتاه و فرم‌های وب سایت در پورتال سلف سرویس یا از طریق پیام‌های چت زنده ثبت کرد.

طبقه‌بندی حادثه

حوادث را می‌توان بر اساس حوزه فناوری اطلاعات یا کسب و کار و حوزه‌ای که در آن حادثه باعث ایجاد اختلال در شبکه، سخت‌افزار و … می‌شود، دسته‌بندی کرد.

اولویت‌بندی حادثه

اولویت یک حادثه را می‌توان تابعی از تأثیر و فوریت آن با استفاده از یک ماتریس اولویت تعیین کرد. تأثیر حادثه نشان‌دهنده میزان خسارتی است که به کاربر یا کسب و کار وارد خواهد کرد. فوریت یک حادثه نشان‌دهنده زمانی است که باید حادثه حل شود. بر اساس اولویت، حوادث را می‌توان به شکل زیر دسته‌بندی کرد:

  • بحرانی
  • بالا
  • متوسط
  • کم

تعیین تکلیف

هنگامی که حادثه طبقه‌بندی و اولویت‌بندی شد، به طور خودکار به یک تکنسین با تخصص مربوطه هدایت می‌شود.

ایجاد و مدیریت وظایف

حادثه براساس پیچیدگی می‌تواند به فعالیت‌های فرعی یا وظایفی تقسیم شود. وظایف معمولاً زمانی ایجاد می‌شوند که تصحیح حادثه به مشارکت چندین تکنسین از بخش‌های مختلف نیاز داشته باشد.

مدیریت و تشدید SLA

در حالی که حادثه در حال پردازش است، تکنسین باید اطمینان حاصل کند که SLA نقض نشده است. SLA زمان قابل قبولی است که در آن حادثه نیاز به پاسخ دارد. SLAها را می‌توان به حوادث براساس پارامترهای آن‌ها مانند طبقه‌بندی، درخواست‌کننده، تأثیر، فوریت و … اختصاص داد. در مواردی که SLA در حال نقض است یا نقض شده است، می‌توان حادثه را از نظر عملکردی یا سلسله مراتبی افزایش داد تا اطمینان حاصل شود که حل شده است.

ارائه راه‌حل برای حادثه

یک حادثه وقتی حل‌شده تلقی می‌شود که تکنسین با یک راه‌حل موقت یا دائمی برای مسئله روبرو شده باشد.

بستن حادثه

هنگامی که مشکل حل شد و کاربر از راه‌حل راضی بود، می‌توان آن را بست.

بررسی بعد از حادثه

پس از بسته شدن یک حادثه، خوب است که تمام اقدامات اجرایی آن را ثبت کنید. این امر به آماده‌سازی بهتر تیم‌ها برای حوادث آینده کمک کرده و روند کارآمدتری برای مدیریت حوادث ایجاد می‌کند. همانطور که در زیر نشان داده شده است، روند بررسی پس از حادثه می‌‌تواند به جنبه‌های مختلف تقسیم شود که به ویژه برای حوادث بزرگ بسیار مفید است.

ارزیابی داخلی

شناسایی حادثه
  • چه کسی و چگونه این حادثه را کشف کرد؟
  • چه مدت بعد از وقوع، حادثه کشف شد؟
  • آیا حادثه می‌توانست زودتر شناسایی شود؟
  • آیا ابزارها یا فناوری‌هایی می‌توانند در تشخیص سریع یا پیشگیرانه حادثه کمک کنند؟
جریان اطلاعات و ارتباطات
  • سهامداران با چه سرعتی از حادثه مطلع شدند؟
  • برای پخش مجدد اعلان‌ها از چه کانالی استفاده شده است؟
  • آیا کلیه ذی‌نفعان مربوطه بلافاصله از آخرین اطلاعات باخبر شده‌اند؟
  • برقراری ارتباط با کاربر برای جمع‌آوری اطلاعات و آگاهی دادن از وضعیت تیکت چقدر آسان بود؟


مجموعه

ITIL

این پست بخشی از مجموعه ITIL در کار و کسب است. ترتیب زیر را در این حوزه پیشنهاد می‌کنیم.

  1. آموزش ITIL، درس اول | چرا به مدیریت فرایندهای خدمات فناوری اطلاعات نیاز داریم؟
  2. دانلود کتاب اصلی ITIL 4 Foundation + فایل خلاصه کتاب
  3. بررسی تعاریف و تفاوت‌های چارچوب‌های ITSM و ITIL
  4. مدیریت تغییر (Change Management) در ITIL چیست؟
  5. راهنمای اساسی برای مدیریت مشکلات (Problem Management) در ITIL
  6. مدیریت حوادث (Incident Management) در ITIL چیست؟
  7. دانلود موردکاوی پیاده‌سازی ITIL در اسپاتیفای | Spotify: an ITIL Case Study
  8. دانلود کتاب راهنمای آزمون ITIL و تشریح نکات مهم | ITIL 4 Essentials
  9. توافق نامه سطح سرویس خدمات (SLA) چیست و چگونه نوشته می‌شود؟
  10. دانلود نمونه شناسنامه و فرم فرایند ITIL مدیریت تغییر | ITIL Change Management Process Example
  11. دانلود قالب فارسی فرایند مدیریت سطح خدمات (SLA و OLA) مطابق ITIL
  12. دانلود قالب فارسی فرایند مدیریت تغییر، فرم درخواست تغییر و PIR مطابق ITIL

نوشته های مشابه

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

دوره جامع و بلندمدت «تحلیلگر حرفه‌ای کسب‌وکار» با رویکرد کاربردی و اجراییاطلاعات بیشتر و ثبت‌نام
بستن