آپتایم (Uptime) چیست؟ + آموزش اندازهگیری آپتایم سرور
آپتایم سرور اندازه گیری uptime، آپتایم سرور چیست و چرا باید برای ما اهمیت داشته باشد؟ در این مقاله میخوانیم که همین مفهوم ساده چه تاثیرات مهمی میتواند بر میزان موفقیت سایت بگذارد.آپتایم از آن مفهومهای چالش برانگیز است که هم میتواند فریبدهنده باشد و هم میتواند تکلیفمان را با زیرساختهای وبسایت روشن کند. حالا این که کدام یک از اینها اتفاق بیفتد بستگی به دانش و شناختمان از این مفهوم و کارکردش دارد. در این مقاله قصد داریم مفهوم آپتایم (uptime) را عمقیتر بررسی کنیم. یعنی بدانیم آپتایم چیست و چه تفاوتی با مفاهیم مشابه دارد. سپس بیاموزیم که نحوهٔ اندازهگیری آپتایم سرور به چه صورت است؛ نگاهی به اثرات فریبکارانهٔ آن بیندازیم و دربارهٔ ابهامات، شفافسازی کنیم.
آپتایم چیست؟
آپتایم معیاری است که به در دسترس بودن سرور اشاره دارد. با این حال این تعریف کاملی نیست و ممکن است با مفهوم Availibility اشتباه گرفته شود. معنی Uptime دقیقاً مدت زمانی است که یک سرور کار میکند و در دسترس است. مقدار آپتایم با درصد نشان داده میشود و درصد بالای آن نشان میدهد که سختافزارها به خوبی کار میکنند و احتمال خرابی آنها پایین است. مثلاً آپتایم ۹۹ درصد یعنی سرورها ۹۹ درست زمان فعالیت خود در دسترس هستند.
Availability چیست؟
از آنجایی که پارامتر Availability هم به فارسی در دسترس بودن ترجمه می شود، گاهی باعث سردرگمی میشود. اما Availability تفاوت بزرگی با آپتایم دارد. در دسترس بودن علاوه بر زمان بالا بودن سرورها جنبههای دیگری را نیز درنظر میگیرد. درصد Availability نشان میدهد که با درنظر گرفتن زمان قطعی سرور، یک سیستم در مجموع چقدر کاربردهای موردنظر کاربران را برآورده میکند. یا به بیان دیگر، یک سیستم چند درصد از اوقات میتواند در موقعیتهای نیاز کاربران عملکرد را به آنها ارائه کند.
تفاوت Uptime و Availability
در حالی که مفهوم آپتایم صرفاً به نسبت در دسترس بودن یک دستگاه سختافزاری (مثل سرور) اشاره دارد، Availability کمی دورتر میرود و در کادر بزرگتری به ماجرا نگاه میکند.
مثلاً اگر آپتایم ضمانت میکند که ۹۹ درصد اوقات یک سال سرورها در دسترس باشند؛ Availability بررسی میکند که حالا با این درصد آپتایم، وضعیت ارائه سرویس به مشتری چگونه است. یعنی مجموعاً توانایی کلاینت، کاربر نهایی و مشتریان برای دسترسی کامل به فرمها، دادههای مشتری، و سایر مطالب در سرورها چه میزان است. درواقع Availability درصدی از زمان که تمام سیستم یا محصول برای کاربر قابل استفاده است را بررسی میکند و میشود گفت که محوریت آن روی تجربهٔ کاربر است نه صرفاً عملکرد سختافزارها. Availability هم مثل آپتایم بر اساس درصد تعیین میشود.
آپتایم مهمتر است یا در دسترس بودن؟
در توافقنامهٔ (SLA) آپتایم بهعنوان زمان تضمینشدۀ بالا بودن سختافزار نسبت به عملکرد گذشتهٔ آن تعیین میشود. یعنی آنچه که در آینده رخ میدهد بهطور قطع تضمین نمیشود. در حالی که Availability خروجی نهایی برای کاربران را در نظر میگیرد. مدت زمان خرابی و تعمیر سرورها در آپتایم نشان داده نمیشوند؛ اما در این مفهوم، زمان کار سیستم و هرگونه خرابی برنامهریزیشده یا برنامهریزینشدهای که بر دسترسی به سیستم تأثیر میگذارد، در نظر گرفته میشود.
اثر هندوانهای و دردسرهای Uptime و SLA!
در استانداردهای بینالمللی، میان شرکتهای خدماتدهنده و مشتریان قراردادی به نام SLA تعریف میشود. سند Service Agreement Level استانداردهای خدماتی که کسب و کار موظف است به مشتری عرضه کند را تعریف میکند.
مثلاً درمورد آپتایم سرور، شرکت تامین کننده در سند SLA تضمین میکند که آپتایم سطح SLA 99.99٪ معادل 52 دقیقه و 36 ثانیه در سال، جای عدم دسترسی دارد.
همه چیز دربارهٔ SLA خوب است تا زمانی که اثر هندوانهای روی آن اتفاق نیفتد. اثر هندوانه در SLA کسبوکارها، پدیدهای است که همه چیز را از بیرون سبز نشان میدهد، اما واقعیت از درون به رنگ خون است. به بیان دیگر، آنچه در سند SLA آمده است، یا کاربرد ندارد یا منسوخ شده است؛ یا اینکه آنچه در سند تعریف شده از سمت کسبوکار خوب بهنظر میرسد اما از نظر مشتری مناسب نیست.
برای مثال اگر شرکت هاستینگی آپتایم ۹۰ درصد را با افتخار بیان میکند، اما مشتریان از ۳۰ روز اختلال در دسترسی ناراضی هستند، اثرهندوانهای رخ داده است.
نحوۀ محاسبه آپتایم سرور چگونه است؟
در یک فرمول ساده میتوان گفت آپتایم سالانه عبارت است از :
تعداد ساعات کارکرد سرویس در سال ÷ ۸۷۶۰ ساعت × ۱۰۰ = درصد آپتایم سالانه
عدد ۸۷۶۰ تعداد کل ساعات یک سال (۲۴ ساعت یک روز * ۳۶۵ روز در سال) را نشان میدهد.
مثال اندازه گیری آپتایم:
اجازه بدهید روش محاسبهٔ ماهیانه را نیز با یک مثال توضیح دهیم. فرض کنید یک سایت را در طول ۲۴ساعت (که به ۸۶۴۰۰ ثانیه ترجمه می شود) مانیتور کردهاید و در این بازه زمانی وب سایت به مدت ۱۰ دقیقه (۶۰۰ ثانیه) از کار افتاده است. برای تعیین درصد زمان کار و خرابی، محاسبه زیر انجام می شود:
- کل زمان از کار افتادن سایت شما: ۶۰۰ ثانیه
- کل زمان مانیتورینگ سایت شما: ۸۶۴۰۰ ثانیه
- درصد داونتایم= ۶۰۰ ثانیه / ۸۶۴۰۰ ثانیه = ۰.۰۰۶۹ = ۰.۶۹٪
- درصد آپتایم = ۱۰۰٪ – ۰.۶۹٪ = ۹۹.۳۱٪\
ماجرای آپتایم ۹۹.۹۹۹ چیست؟
اگر اهل مطالعه به زبان انگلیسی دربارهٔ وب و سرور هستید، احتمالاً اصطلاح Nine Five را شنیدهاید. منظور از این ۵تا نُه درواقع ۹۹.۹۹۹ درصدهای دقیقتر آپتایم است که هریک جزئیات نهفتهای در خود دارند.
با دیدی سطحی ممکن است آپتایم ۹۹.۹ و ۹۹.۹۹ چندان تفاوتی با یکدیگر نداشته باشند، اما اگر کمی عمیقتر شویم میبینیم که اعداد بعد از اعشار تا چه حد حیاتی هستند. یک سرور معمولی با آپتایم ۹۹٪ در واقع ۸۸ ساعت در سال از کار میافتد. اگر این ساعات پیک فروش وبسایتهای فروشگاهی یا رخدادهای مهم وبسایتهای بزرگ باشند، خسارات میتوانند جبرانناپذیر باشند.
میانگین هزینه هر ساعت از کار افتادن سایت کسبوکارها با نرخ جهانی ۱۶۳۶۷۴ دلار است! قابل تخمین است که این عدد با نرخ داخلی کوچکتر است؛ اما با این حال دقایق داونتایم خسارت به دنبال دارند.
با توجه به جدول بالا میبینید که چه حجمی از خسارت با اضافه شدن هریک از این نُهها از روی دوش کسبوکار برداشته میشود.
چه عواملی در پدیدار شدن Five Nine تاثیرگذارند؟
در واقع دو فاکتور اصلی در عملکرد آپتایم تأثیرگذار هستند: نیروی انسانی و توازن بار.
اگر شرکت هاستینگ بتواند از تعداد بیشتری سرور در سرویسهای میزبانی استفاده کند، توازن بار را بهخوبی رعایت کرده است. یعنی بهجای این که تمام دادهها روی یک سرور نگهداری شوند و خرابی آن سرور بتواند منجر به خسارت شود، سرورهای بک آپ بتوانند در صورت بروز خرابی بهصورت جایگزین کار کنند.
فاکتور بعدی تخصص و تجربۀ تیم بازیابی در نگهداری از سرورها است. اگر پرسنل فنی هاستینگ توانمندی بالایی برای مدیریت بحرانها و جایگزینی نداشته باشند، خرابی سرورها میتواند فاجعهبار باشد.
آیا آپتایمِ ۱۰۰ درصد، ممکن است؟
پیشتر بهصورت خلاصه اشاره کردیم که آپتایم، قراردادی براساس عملکرد گذشتهٔ سختافزارها است و هرگز نمیتواند ضامن آینده باشد یا آن را پیشبینی کند. خب اگر خرابی و از دسترس خارج شدن سرور قابل پیشبینی باشد که علاج واقعه پیش از وقوع انجام میشود.