پلتفرم CLOUDERA، اولین پلتفرم یکپارچه تحلیل بیگ دیتا در سطح سازمانی

سلام دوستان عزیزم. قبل از هر چیزی بگم من این مطلب رو در وب سایت دنیای بیگ دیتا نشر دادم که اونجا هم می تونین راجع به مباحث بیگ دیتا بیشتر مطالعه کنید.

آشنایی با Cloudera

شرکت Cloudera شرکتی مستقر در ایالات متحده که در سال 2008 تاسیس شده است رسالتی مشابه MapR و Hortonworks (که در حال حاضر با هم تلفیق شدند) را ایفا می کند. این شرکت یک پلتفرم مبتنی بر هدوپ ایجاد کرده اند که با محبوب ترین نرم افزارهای آپاچی هدوپ به منظور تحلیل بیگ دیتا یکپارچه شده است. هدوپ تنها یک نرم افزار یا پلتفرم نیست، هدوپ یک اکوسیستم است که قلب تپنده پروژه های مهم تحلیل بیگ دیتا تلقی می شود.


اما چرا سازمان ها از Cloudera استفاده می کنند؟

اساسا ایجاد و کانفیگ یک کلاستر به صورت دستی و نه خوکار کار زمان بری است، بررسی هر نُود در کلاستر به صورت تک به تک وقتی نودها و کلاسترهای زیادی داریم، کانفیگ هر یک از کلاسترها، استقرار سرویس های مدنظرمان و راه اندازی مجدد هر یک از سرویس ها در یک محیط توزیع شده اشکال عمده ای تلقی می شود و نیازمند حجم عظیمی از خودکار سازی فرآیندها به منظور مدیریت سرویس ها است. Cloudera به منظور حل این مشکلات و صرفه جویی در مصرف زمان، هزینه وحتی اعصاب ? توزیع هدوپی اختصاصی را به منظور نصب سرویس های مدنظر و آپدیت کانفیگ کلاسترها ارائه کرده است که تنها با چند کلیک زیرساخت هدفمندی را به منظور تحلیل بیگ دیتا به ارمغان می آورد.

شرکت Cloudera با ارائه اولین پلتفرم یکپارچه برای بیگ دیتا ، انقلابی در مدیریت داده های سازمانی ایجاد می کند. نام محصول مهم این شرکت در عرصه بیگ دیتا، Enterprise Data Hub که به اختصار CDH نامیده می شود می باشد. Cloudera  پلتفرم اختصاصی خود را به منظور ذخیره ، پردازش و تجزیه و تحلیل تمامی داده های خود در اختیار شرکت ها قرار می دهد و این امکان را فراهم می کند تا ارزش سرمایه گذاری های موجود را افزایش دهند و در عین حال راه های جدیدی را برای استخراج ارزش از مجموعه داده های عظیم خود فراهم کنند. درآمد اصلی این شرکت از راه سرویس های حرفه ای است که به منظور سهولت در یکپارچه سازی بیگ دیتا در شرکت ها ارائه می دهند. Cloudera سرویس هایی تحت عنوان Impala و Kudu را توسعه داده است که فرآیند یکپارچه سازی هدوپ و نِرخ پاسخگویی این چارچوب را بهبود بخشیده است. به عنوان جمع بندی می توان گفت مزیت رقابتی این شرکت ارائه یک پلتفرم یکپارچه به منظور تحلیل بیگ دیتا در سطح سازمان است هر چند شرکت های دیگری نظیر Databricks نیز با ارائه پلتفرم یکپارچه تحلیل داده که مبتنی بر Spark بر بستر Cloud می باشند در حال حاضر بسیار فعال هستند. CEO شرکت Databricks آقای دکتر علی قدسی فارغ التحصیل دانشگاه کالیفرنیا در برکلی می باشند. ان شاالله در مقاله ای مجزا به بررسی Databricks و نوآوری های این شرکت می پردازیم.

همانطور که مقاله انتشار نسخه 7 پلتفرم Cloudera بررسی کردیم و در تصویر فوق مشخص است، در لایه Data Consistency, Governance, Security  ابزارهایی نظیر Apache Ranger, Apache Altas و Apache KNOX حضور دارند.