مدیریت فرایندهای کسب و کار
مدیریت حوادث (Incident Management) در ITIL چیست؟
مدیریت حوادث فناوری اطلاعات (IT incident management) یکی از فرایندهای اساسی در کسب و کار است. در این مقاله، شما با اصول مدیریت حوادث، مولفههای آن، نقشها و مسئولیتهای مربوطه و نحوه کارکرد مدیریت حوادث با سایر مولفههای میز خدمات آشنا خواهید شد.
حوادث فناوری اطلاعات چیست؟
حوادث فناوری اطلاعات هرگونه اختلال در خدمات فناوری اطلاعات سازمان است که بر روی هر کاربر یا کل کسب و کار تأثیر میگذارد. به طور خلاصه، حادثه هر چیزی است که تداوم کسب و کار را قطع کند.
مدیریت حوادث فناوری اطلاعات چیست؟
مدیریت حوادث، فرآیند مدیریت اختلالات خدمات فناوری اطلاعات و بازیابی خدمات در توافقنامههای سطح خدمات (SLA) است.
دامنه مدیریت حوادث با گزارش دادن یک مسئله توسط کاربر شروع میشود و با حل یک مسئله توسط یکی از اعضای میز خدمات خاتمه مییابد.
مراحل مدیریت حوادث
با مدیریت صحیح حوادث، جمعآوری اطلاعات در مورد حوادث بصورت ساده و منظم صورت میگیرد. تیمهای میز خدمات میتوانند فرمها را در پورتال سلف سرویس کاربر منتشر کنند تا اطمینان حاصل شود که تمام اطلاعات مربوطه در زمان درست جمعآوری میشود.
مرحله بعدی در مدیریت حوادث، طبقهبندی و اولویتبندی حادثه است. این نه تنها به مرتبسازی تیکتهای ورودی کمک میکند بلکه باعث میشود آنها به تکنسینهایی منتقل شوند که بیشترین صلاحیت را برای کار در این زمینه دارند. طبقهبندی حادثه همچنین به سیستم میز خدمات کمک میکند تا مناسبترین SLAها را برای حوادث اعمال کند و این اولویتها را به کاربران نهایی اعلام نماید. هنگامی که یک حادثه طبقهبندی و اولویتبندی شد، تکنسینها میتوانند آن را تشخیص داده و راهحل را به کاربر ارائه دهند.
فرآیند مدیریت حوادث هنگامی که با اتوماسیون مربوطه فعال باشد، به تیمهای میز خدمات اجازه میدهد تا از انطباق با SLA مراقبت کنند و وقتی به تخلف SLA نزدیک میشوند، اعلانها را برای تکنسینها ارسال میکند. همچنین تکنسینها این گزینه را دارند که با پیکربندی تشدیدهای خودکار متناسب با حادثه، تخلفات SLA را افزایش دهند. پس از تشخیص مسئله، تکنسین به کاربر یک قطعنامه ارائه میدهد که کاربر میتواند آن را تأیید کند. این فرآیند چند مرحلهای اطمینان حاصل میکند که هر مسئله فناوری اطلاعات که بر تداوم کسب و کار تأثیر میگذارد در اسرع وقت حل و فصل شود.
اگر مدیریت حوادث نداشته باشید چه اتفاقی میافتد؟
مدیریت حوادث تمام جنبههای یک حادثه را در طول چرخه حیات آن پوشش میدهد. این امر، روند حل و فصل را تسریع کرده و مدیریت تیکتها را شفاف میکند. بدون مدیریت حوادث، رسیدگی به تیکتها میتواند دردسرساز شود. برخی از مشکلات اساسی که میتوانند بوجود آیند عبارتند از:
- عدم شفافیت در مورد وضعیت تیکت و جدول زمانی مورد انتظار برای کاربران
- هیچ ثبت مناسبی از حوادث گذشته وجود نخواهد داشت.
- عدم توانایی در مستندسازی راهحلها برای مسائل مکرر یا آشنا
- ریسک بیشتر وقفههای کسب و کار، به ویژه با حوادث بزرگ
- عدم توانایی گزارشگری
- کاهش رضایت مشتری
چرخه حیات مدیریت حوادث
روند مدیریت حوادث را میتوان به شرح زیر خلاصه کرد:
- مرحله ۱: ثبت وقایع
- مرحله ۲: طبقهبندی حادثه
- مرحله ۳: اولویتبندی حادثه
- مرحله ۴: تعیین تکلیف
- مرحله ۵: ایجاد و مدیریت وظایف
- مرحله ۶: مدیریت و تشدید SLA
- مرحله ۷: ارائه راهحل برای حادثه
- مرحله ۸: بستن حادثه
این فرایندها ممکن است بر اساس نوع حادثه ساده یا پیچیده باشند. آنها همچنین ممکن است چندین گردش کار و وظیفه علاوه بر روند اساسی توضیح داده شده در بالا داشته باشند.
ثبت وقایع
حادثه را میتوان از طریق تماسهای تلفنی، ایمیل، پیام کوتاه و فرمهای وب سایت در پورتال سلف سرویس یا از طریق پیامهای چت زنده ثبت کرد.
طبقهبندی حادثه
حوادث را میتوان بر اساس حوزه فناوری اطلاعات یا کسب و کار و حوزهای که در آن حادثه باعث ایجاد اختلال در شبکه، سختافزار و … میشود، دستهبندی کرد.
اولویتبندی حادثه
اولویت یک حادثه را میتوان تابعی از تأثیر و فوریت آن با استفاده از یک ماتریس اولویت تعیین کرد. تأثیر حادثه نشاندهنده میزان خسارتی است که به کاربر یا کسب و کار وارد خواهد کرد. فوریت یک حادثه نشاندهنده زمانی است که باید حادثه حل شود. بر اساس اولویت، حوادث را میتوان به شکل زیر دستهبندی کرد:
- بحرانی
- بالا
- متوسط
- کم
تعیین تکلیف
هنگامی که حادثه طبقهبندی و اولویتبندی شد، به طور خودکار به یک تکنسین با تخصص مربوطه هدایت میشود.
ایجاد و مدیریت وظایف
حادثه براساس پیچیدگی میتواند به فعالیتهای فرعی یا وظایفی تقسیم شود. وظایف معمولاً زمانی ایجاد میشوند که تصحیح حادثه به مشارکت چندین تکنسین از بخشهای مختلف نیاز داشته باشد.
مدیریت و تشدید SLA
در حالی که حادثه در حال پردازش است، تکنسین باید اطمینان حاصل کند که SLA نقض نشده است. SLA زمان قابل قبولی است که در آن حادثه نیاز به پاسخ دارد. SLAها را میتوان به حوادث براساس پارامترهای آنها مانند طبقهبندی، درخواستکننده، تأثیر، فوریت و … اختصاص داد. در مواردی که SLA در حال نقض است یا نقض شده است، میتوان حادثه را از نظر عملکردی یا سلسله مراتبی افزایش داد تا اطمینان حاصل شود که حل شده است.
ارائه راهحل برای حادثه
یک حادثه وقتی حلشده تلقی میشود که تکنسین با یک راهحل موقت یا دائمی برای مسئله روبرو شده باشد.
بستن حادثه
هنگامی که مشکل حل شد و کاربر از راهحل راضی بود، میتوان آن را بست.
بررسی بعد از حادثه
پس از بسته شدن یک حادثه، خوب است که تمام اقدامات اجرایی آن را ثبت کنید. این امر به آمادهسازی بهتر تیمها برای حوادث آینده کمک کرده و روند کارآمدتری برای مدیریت حوادث ایجاد میکند. همانطور که در زیر نشان داده شده است، روند بررسی پس از حادثه میتواند به جنبههای مختلف تقسیم شود که به ویژه برای حوادث بزرگ بسیار مفید است.
ارزیابی داخلی
شناسایی حادثه
- چه کسی و چگونه این حادثه را کشف کرد؟
- چه مدت بعد از وقوع، حادثه کشف شد؟
- آیا حادثه میتوانست زودتر شناسایی شود؟
- آیا ابزارها یا فناوریهایی میتوانند در تشخیص سریع یا پیشگیرانه حادثه کمک کنند؟
جریان اطلاعات و ارتباطات
- سهامداران با چه سرعتی از حادثه مطلع شدند؟
- برای پخش مجدد اعلانها از چه کانالی استفاده شده است؟
- آیا کلیه ذینفعان مربوطه بلافاصله از آخرین اطلاعات باخبر شدهاند؟
- برقراری ارتباط با کاربر برای جمعآوری اطلاعات و آگاهی دادن از وضعیت تیکت چقدر آسان بود؟
مجموعه
ITIL
- آموزش ITIL، درس اول | چرا به مدیریت فرایندهای خدمات فناوری اطلاعات نیاز داریم؟
- دانلود کتاب اصلی ITIL 4 Foundation + فایل خلاصه کتاب
- بررسی تعاریف و تفاوتهای چارچوبهای ITSM و ITIL
- مدیریت تغییر (Change Management) در ITIL چیست؟
- راهنمای اساسی برای مدیریت مشکلات (Problem Management) در ITIL
- مدیریت حوادث (Incident Management) در ITIL چیست؟
- دانلود موردکاوی پیادهسازی ITIL در اسپاتیفای | Spotify: an ITIL Case Study
- دانلود کتاب راهنمای آزمون ITIL و تشریح نکات مهم | ITIL 4 Essentials
- توافق نامه سطح سرویس خدمات (SLA) چیست و چگونه نوشته میشود؟
- دانلود نمونه شناسنامه و فرم فرایند ITIL مدیریت تغییر | ITIL Change Management Process Example
- دانلود قالب فارسی فرایند مدیریت سطح خدمات (SLA و OLA) مطابق ITIL
- دانلود قالب فارسی فرایند مدیریت تغییر، فرم درخواست تغییر و PIR مطابق ITIL