در طرح ریزی و ارایه خدمات، یکی از چالش های جدی این است که چگونه پایداری سرویس – تا حد ممکن – حفظ شود؛ چرا که امروزه استمرار برقراری خدمات، به عنوان یکی از اصلی ترین ابعاد کیفیت سرویس برشمرده می شود؛ تا جایی که موجب ایجاد مزیت رقابتی بارز و ارزشمندی برای سازمان های ارایه دهنده خدمات فناوری اطلاعات می شود. این چالش زمانی بغرنج تر شده و مدیریت آن دشوارتر می شود که اجزای یک سرویس متنوع، ذاتا شکننده و پیچیده بوده و حتی توسط زنجیره ای از پیمانکاران فرعی نیز تامین شود.

 

هیچ سرویس دهنده ای نمی تواند ادعا کند که قادر است خدماتی بدون وقفه را در محدوده ای مشخص از زمان دایر کرده و برقراری آن را به میزان 100درصد حفظ کند و اگر چنین ادعایی مطرح شد، شایسته است که سرویس گیرندگان در انتخاب چنین سازمانی، تردید کنند. یک سرویس، به هر میزان هم که بالغ بوده و فرایندهای راهبری آن به روز باشد، همواره آسیبی درونی یا بیرونی، یا حتی رخدادی از نوع الزام  به توسعه و بهبود، بروز می کند که موجب ایجاد وقفه در ارایه آن می شود.
وقفه در سرویس – که غالبا در صنعت با Outage و در خدمات با Downtime شناخته می شود – به مجموعه لحظاتی اطلاق می شود که سیستم یا سرویس، از روند عادی خود خارج شده و دریافت خروجی های آن برای مخاطبان، دسترس پذیر نباشد. این توقف خدمات به 2 دسته کلی قابل تقسیم هستند: نخست وقفه هایی که ناشی از بروز حوادث (Exception) در اجزای تشکیل دهنده یک خدمت هستند و دیگری قطعی خدماتی که به صورت عمدی اما بنا بر دلایلی (مانند سرویس های ادواری، تعمیرات پیشگیرانه یا PM، توسعه ظرفیت های زیرساخت و منابع و غیره) بروز می کنند. در چنین شرایطی، اقداماتی مشخص و حتی بعضا معینی از سوی سرویس دهنده باید معمول شود. یکی از مهم ترین این اقدامات، اطلاع رسانی به ذینفعان سرویس است؛ که در مورد حوادث پس از وقوع و در خصوص موارد برنامه ریزی شده، مدت زمانی متناسب، پیش از وقوع رخداد، انجام می پذیرد.
یک سرویس دهنده متعهد و هوشیار، برای حالات مختلف بروز حوادث، برنامه بازیافت شرایط (Recovery Plan) و همچنین راهکار موقت (Around Work) پیش بینی می کند که البته همواره ممکن است شرایطی نوظهور نیز رخ دهند که برای آن، راهکار و حتی مسیری موقت تدبیر نشده باشد، اما غنا و تعالی کیفی سرویس های یک سازمان رابطه مستقیم با کم بودن این موارد دارد. می دانیم که به مجموعه زمان های برقراری سرویس، زمان دسترس پذیری (Availability) گفته می شود که عموما با میزان نسبت زمان برقراری سرویس به کل زمان تعهد شده و به صورت درصدی نشان داده می شود؛ اما نکته اینجا است که کوتاه بودن زمان وقفه، تنها پارامتر ارزشمند برای کیفیت سرویس نیست و تواتر نادر رخداد قطعی خدمات نیز ارزشی به نام قابل اعتماد بودن (Reliability) را خلق می کند. به این ترتیب مزیت رقابتی که از آن صحبت شد، زمانی حاصل می شود که سرویس ها کمتر دچار وقفه شوند و زمان وقفه آن نیز کوتاه باشد و البته برای غالب موارد، راهکاری از پیش تعیین شده نیز وجود داشته باشد.