ما دیروز شاهد یک اختلال شش ساعته در فیس بوک، اینستاگرام و واتساپ بودیم و به نظر میرسد که تاثیر این اتفاق بسیار بیشتر از آن چیزی بود که فقط برای کاربران اتفاق افتاد. این اختلال باعث شد تا ارزش سهام فیس بوک بهشدت افت کند و این شرکت مبلغی معادل ۱۰۰ میلیون دلار در بخش تبلیغات از دست بدهد. ارزش شرکت فیس بوک چند ساعت بعد از شروع اختلال به میزان ۶ میلیارد دلار کاهش یافت. ارزش این شرکت در طول یک ماه گذشته با میزان ۱۲.۸۸ درصد کاهش یافته بود و از ۱۴۰ میلیارد دلار به ۱۲۰.۹ میلیارد دلار رسیده بود.
فیس بوک حالا انگشت سرزنش را به سمت خودش گرفته و میگوید که این اختلال زمانی شروع شد که مهندسان این شرکت مشغول انجام کارهای روتین نگهداری سیستمها بودند. سانتوش ژاناردان (Santosh Janardhan) نایب رئیس زیرساخت فیس بوک با انتشار یک پست وبلاگی گفته است که این شرکت تلاش میکند تا از این اتفاق یاد بگیرد و چنین اختلالهایی دیگر هرگز اتفاق نخواهد افتاد.
اختلال دیروز در فیس بوک میلیاردها دلار برای زاکربرگ هزینه داشت
ژاناردان گفته است:
این اختلال توسط سیستمی ایجاد شد که شبکه اصلی جهانی ما را مدیریت میکرد. این سیستم همه تجهیزات محاسباتی ما را به هم وصل میکرد و شامل بیش از دهها هزار کیلومتر کابل فیبر نوری میشد که از سرتاسر جهان عبور کرده و همه دیتاسنترهای ما را به هم مرتبط میکرد.
درباره دیتاسنترهای فیس بوک باید بگوییم که این مراکز، ساختمانهای بزرگی هستد که رایانههای بزرگی را برای ذخیره دادهها و انجام کارای شبکهای در خود جای دادهاند. البته برخی از این مراکز کوچکتر هستند و فقط برای ارسال دادههای مورد درخواست کاربران مورد استفاده قرار میگیرند و توسط شبکه اصلی فیس بوک به دیتاسنترهای بزرگتر وصل میشوند. در همین مراکز کوچکتر است که درخواستهای اپلیکیشنی کاربران مورد بررسی قرا میگیرد و به گوشی آنها ارسال میشود.
مطالب مرتبط:
اتفاقی که دیروز افتاد به این صورت بود که مهندسان فیس بوک برای چند دقیقه بخشی از شبکه اصلی این شرکت را برای بررسی وضعیت نگهداری این سرویس خاموش کردند، اما آنها بهاشتباه کل سیستم و همه ارتباطات شبکه اصلی را خاموش کردند که همین موضوع باعث شد تا ارتباط دیتاسنترهای فیس بوک در سراسر دنیا قطع بشود.
فیس بوک یک سیستم داخلی نیز دارد که برای ارسال دستورات استفاده میشود تا مطمئن شوند اختلالهایی مثل اختلال دیروز اتفاق نمیافتد. اما مشکلی که دیروز پیش آمد این بود که این سیستم هم دچار اختلال شده بود و نمیتوانست دستور متوقف کردن خاموشی شبکه اصلی فیس بوک را بدهد.
فیس بوک میگوید که از اتفاق دیروز یاد خواهد گرفت تا دیگر چنین اتفاقهایی نیفتد
مشکل دیگری که دیروز سرورهای DNS فیس بوک را تحت تاثیر قرار داد این بود که دسترسی به این سرورها حتی با وجود اینکه همچنان کار میکردند امکانپذیر نبود. این موضوع باعث شد تا بقیه اینترنت نتواند این سرورها را پیدا کند. فیس بوک میگوید که همه چیز آنچنان سریع اتفاق افتاد که مهندسان این شرکت نتوانستند دو مشکل به وجود آمده را برطرف کنند. یکی از این دو مشکل خاموش شدن شبکههای شرکت بود که باعث شد دیتاسنترها نتوانند به هم وصل بشوند و مشکل دوم عدم دسترسی به DNS بود که اجازه نمیداد مهندسان این شرکت مشکل را پیدا و برطرف کنند.
به محض اینکه فیس بوک توانست به شبکه اصلی خود دسترسی پیدا کند همه چیز به حال عادی برگشت. اما فیس بوک یک مشکل دیگر نیز داشت و آن این بود که اگر کل سرویسهایش را همزمان بر میگرداند میزان ترافیک ایجادشده در سیستم میتوانست باعث کراش دوباره آن بشود. اما فیس بوک بهلطف مهندسان کارکشته خود توانست بر این مشکل فائق بیاید و پلتفرمهای خود را بتدریج به حالت عادی برگرداند.
فیس بوک میگوید که از این اتفاق درسهای زیادی آموخته و دیگر اجازه نخواهد داد تا چنین اتفاقی دوباره بیفتد. این شرکت در بیانیه خود گفته است:
هر اتفاقی مثل این، فرصتی برای یاد گرفتن است و همه ما از این اتفاق درسهای زیادی یاد گرفتهایم. ما بعد از هر مشکل، آن را بررسی میکنیم تا بدانیم چطور میتوانیم سیستمهای خودمان را امنتر کنیم و این پروسه هماکنون در حال انجام است.
منبع: PhoneAr
نظرات