ایوند
ایوند
خواندن ۳ دقیقه·۴ سال پیش

اختلال برنامه ریزی نشده و معذرت‌خواهی ازبرگزارکننده و شرکت‌کنندگان رویداد dmtalk

من حمیدرضا احمدی مدیرعامل و بنیانگذار ایوند هستم. برگزاری و شرکت در رویداد بخش جدایی‌ناپذیر زندگی من در ۸ سال گذشته بوده است تا آنجا که سراغ راه‌اندازی یک پلتفرم برای تسهیل برگزاری رویداد رفتم. من بر اساس تجربه شخصی میدانم که اشکال و اختلال در برگزاری رویداد، چه مشکلات و چه استرس‌هایی را برای برگزارکنندگان و مهمانان در پی خواهد داشت. متاسفانه پنجشنبه صبح گذشته (۱۶ بهمن ۹۹) ایوند که ماموریت تسهیل و ارزش‌رسانی به رویدادها را دارد، خود باعث استرس و مشکلاتی برای برگزارکننده و شرکت‌کنندگان رویداد dmtalk7 شد.

به دلیل حجم زیاد درخواست‌ها شرکت‌کنندگان آن رویداد، دیتابیس‌های سایت ایوند منابع کم آوردند و باعث شد که قطعی و اختلال سایت را تجربه کنیم که برای ما بسیار غیر معمول است. نسخه کوتاه داستان این است که کیفیت سرویس‌دهی ما خوب نبود و به شما، مشتریانمان و برگزارکنندگان آن رویداد یک عذرخواهی بدهکار هستیم و مطمئناً تلاش خواهیم کرد برای اطمینان از اینکه این اتفاق هرگز تکرار نشود.

داستان طولانی‌تر این است که ایوند به زمان احتیاج دارد که زیرساختش را با شرایط جدید وفق دهد. پس از شیوع ویروس کرونا و تغییراتی که ایجاد شد ، ما نیز به دنبال تغییر در سرویس خود بوده و هستیم که همچنان به برگزارکنندگان و شرکت‌کنندگان رویدادها ارزش برسانیم. ولی واقعیت این است که با اینکه محصولمان را تغییر داده و در حال حاضر میزبان وبینارها هستیم و مسئولیت پذیرش شرکت‌کنندگان وبینارها را نیز به عهده گرفته ایم،‌ زیرساخت سایت همچنان بر اساس رویدادهای حضوری است و تغییرات در زیرساخت طولانی تر از آن شده که انتظارش را داشتیم.

در اواخر ماه آذر، شاهد قطعی در اوایل رویداد یلدای کارآفرینی بودیم که با اینکه مشکل را بعد از ۳۰ دقیقه حل کردیم ، زیرساختمان کاملا تحت شک و تردید قرار گرفت و به این علت تصمیم گرفتیم که پلتفرمها و زیرساخت سروری خود را از نو بررسی کرده و با کمک گرفتن از شرکت‌های خبره تر تغییرات اساسی به این بخش از کسب‌وکار خود بدهیم.

برنامه‌های آتی زیرساختی

از این هفته تیم دواپس ما جای خود را به تیم جدیدی خواهند داد. در چند روز آینده همکاری جدیدی را با تیم پویا و متخصص «هم‌روش» شروع خواهیم کرد که نیازهای دوآپسی و زیرساختی ما را جوابگو باشند. در ضمن سرورهای ما از بستر فعلی مهاجرت کرده و به بستر ابری کوبرنتیس همروش (Kubernetes) سوار می‌شوند.

بستر kubernetics برای پشتیبانی از سیستم های بزرگ و توزیع شده طراحی شده است و مانیتورنیگ قوی و عمیقی روی دیتابیس و سرورهای دیگرمان میدهد که کمک خواهد کرد مشکل را قبل از وقوع شناسایی و برطرف کنیم.

در ادامه تصمیم داریم که به صورت دوره ای Load Test (تست بارسنگین) روی سرویس‌های خود انجام دهیم تا خیالمان از رویداد‌های پربازدید راحت باشد و همچنین مشتریان بتوانند از آن سیستم ها به راحتی استفاده کنند.

کلی کار مانده است

در انتها در ضمن معذرتخواهی دوباره، لازم است که خاطرنشان کنم که آپدیتهایی در قبال بهبود و ارتقای زیرساخت در هفته‌های آینده با مشتریان و علاقه‌مندان به اشتراک خواهم گذاشت. مطمئن باشید که می‌دانیم که ترافیک ۲ تا ۳ هزار نفری نباید باعث اختلال در سرویس شود. همچنین لازم است گفته شود که ما می دانیم که آپتایم سرورهای ایوند در ایجاد ارزش برای شما بسیار حیاتی است و در بهبود زیرساخت سیستم از هر تلاش و هزینه فروگذار نخواهیم کرد.

ایوندرویداد
شاید از این پست‌ها خوشتان بیاید