من حمیدرضا احمدی مدیرعامل و بنیانگذار ایوند هستم. برگزاری و شرکت در رویداد بخش جداییناپذیر زندگی من در ۸ سال گذشته بوده است تا آنجا که سراغ راهاندازی یک پلتفرم برای تسهیل برگزاری رویداد رفتم. من بر اساس تجربه شخصی میدانم که اشکال و اختلال در برگزاری رویداد، چه مشکلات و چه استرسهایی را برای برگزارکنندگان و مهمانان در پی خواهد داشت. متاسفانه پنجشنبه صبح گذشته (۱۶ بهمن ۹۹) ایوند که ماموریت تسهیل و ارزشرسانی به رویدادها را دارد، خود باعث استرس و مشکلاتی برای برگزارکننده و شرکتکنندگان رویداد dmtalk7 شد.
به دلیل حجم زیاد درخواستها شرکتکنندگان آن رویداد، دیتابیسهای سایت ایوند منابع کم آوردند و باعث شد که قطعی و اختلال سایت را تجربه کنیم که برای ما بسیار غیر معمول است. نسخه کوتاه داستان این است که کیفیت سرویسدهی ما خوب نبود و به شما، مشتریانمان و برگزارکنندگان آن رویداد یک عذرخواهی بدهکار هستیم و مطمئناً تلاش خواهیم کرد برای اطمینان از اینکه این اتفاق هرگز تکرار نشود.
داستان طولانیتر این است که ایوند به زمان احتیاج دارد که زیرساختش را با شرایط جدید وفق دهد. پس از شیوع ویروس کرونا و تغییراتی که ایجاد شد ، ما نیز به دنبال تغییر در سرویس خود بوده و هستیم که همچنان به برگزارکنندگان و شرکتکنندگان رویدادها ارزش برسانیم. ولی واقعیت این است که با اینکه محصولمان را تغییر داده و در حال حاضر میزبان وبینارها هستیم و مسئولیت پذیرش شرکتکنندگان وبینارها را نیز به عهده گرفته ایم، زیرساخت سایت همچنان بر اساس رویدادهای حضوری است و تغییرات در زیرساخت طولانی تر از آن شده که انتظارش را داشتیم.
در اواخر ماه آذر، شاهد قطعی در اوایل رویداد یلدای کارآفرینی بودیم که با اینکه مشکل را بعد از ۳۰ دقیقه حل کردیم ، زیرساختمان کاملا تحت شک و تردید قرار گرفت و به این علت تصمیم گرفتیم که پلتفرمها و زیرساخت سروری خود را از نو بررسی کرده و با کمک گرفتن از شرکتهای خبره تر تغییرات اساسی به این بخش از کسبوکار خود بدهیم.
از این هفته تیم دواپس ما جای خود را به تیم جدیدی خواهند داد. در چند روز آینده همکاری جدیدی را با تیم پویا و متخصص «همروش» شروع خواهیم کرد که نیازهای دوآپسی و زیرساختی ما را جوابگو باشند. در ضمن سرورهای ما از بستر فعلی مهاجرت کرده و به بستر ابری کوبرنتیس همروش (Kubernetes) سوار میشوند.
بستر kubernetics برای پشتیبانی از سیستم های بزرگ و توزیع شده طراحی شده است و مانیتورنیگ قوی و عمیقی روی دیتابیس و سرورهای دیگرمان میدهد که کمک خواهد کرد مشکل را قبل از وقوع شناسایی و برطرف کنیم.
در ادامه تصمیم داریم که به صورت دوره ای Load Test (تست بارسنگین) روی سرویسهای خود انجام دهیم تا خیالمان از رویدادهای پربازدید راحت باشد و همچنین مشتریان بتوانند از آن سیستم ها به راحتی استفاده کنند.
در انتها در ضمن معذرتخواهی دوباره، لازم است که خاطرنشان کنم که آپدیتهایی در قبال بهبود و ارتقای زیرساخت در هفتههای آینده با مشتریان و علاقهمندان به اشتراک خواهم گذاشت. مطمئن باشید که میدانیم که ترافیک ۲ تا ۳ هزار نفری نباید باعث اختلال در سرویس شود. همچنین لازم است گفته شود که ما می دانیم که آپتایم سرورهای ایوند در ایجاد ارزش برای شما بسیار حیاتی است و در بهبود زیرساخت سیستم از هر تلاش و هزینه فروگذار نخواهیم کرد.