معرفی و بررسی ۳ ابزار کد باز مناسب تحلیل و هوش تجاری

مقدمه (هدف)

از ابزارهای پُراهمیت در مسیر داده‌محور شدن سازمان‌ها، ابزارهای موسوم به تحلیل و هوش تجاری (Analytics and BI Tools) است. انتظارات اولیه از ابزارهای تحلیل و هوش تجاری و قابلیت‌های آن‌ها را می‌توان در قالب موارد زیر دسته‌بندی کرد:

۱. توانایی اتصال به منابع داده‌ای مختلف؛

۲. توانایی تغییر داده‌ها پس از دریافت از منبع داده؛

۳. توانایی بصری‌سازی داده‌ها؛

۴. توانایی ارسال هشدارها و رخدادها؛

۵. امکان مدیریت سطح دسترسی؛

۶. توانمندسازی همۀ اعضای سازمان در تحلیل داده‌ها بدون نیاز به دانش تخصصی.

به تعبیری هدف اصلی به‌کارگیری این ابزارها در سازمان‌ها را می‌توان «توانمندسازی همۀ اعضای سازمان در پاسخ‌گویی به پرسش‌های کسب‌وکاری از طریق داده‌ها و یادگیری از داده‌های سازمان» دانست.

برای انتخاب ابزارهای تحلیل و هوش تجاری، معیارهای مختلفی پیشنهاد شده است که در ادامه و در بخشی مجزا به معیارهای انتخاب ابزارهای تحلیل و هوش تجاری می‌پردازیم.

چرا ابزارهای کد باز؟

یکی از تصمیم‌های اساسی در زمینۀ انتخاب ابزار مناسب، تصمیم دربارۀ کد باز بودن یا اختصاصی‌بودن نرم‌افزار است. در هر دو حوزه نیز نرم‌افزارهای شناخته‌شده‌ای به‌عنوان گزینه‌های درخور توجه وجود دارد.

از جمله ابزارهای اختصاصی تحلیل و هوش تجاری که در قالب مدل نرم‌افزار به‌عنوان خدمت (SaaS) ارائه می‌شود، می‌توان به نمونه‌های زیر اشاره کرد:

  • Microsoft Power BI
  • Tableau Cloud
  • Qlik Sense Cloud
  • IBM Watson Analytics
  • TIBCO Spotfire
  • Domo.com

برای انتخاب از بین ابزارهای اختصاصی، معمولاً گزارش‌های تجاری نظیر گزارش Magic Quadrant گارتنر به‌عنوان راهنمایی اولیه و مناسب، در دسترس است و می‌توان برای انتخاب ابزار باتوجه‌به معیارهای مدنظر، از این گزارش‌ها استفاده کرد.

از جمله ابزارهای کد باز تحلیل و هوش تجاری که به‌صورت رایگان ارائه می‌شود، می‌توان به نمونه‌های زیر اشاره کرد:

  • Metabase
  • Redash
  • Apache Superset (formerly was Caravel)
  • Grafana
  • Kibana

این مستند با این فرض نگاشته شده که سیاست ما، استفاده از ابزارهای کد باز تحلیل و هوش تجاری است و سه نمونه از ابزارهای کد باز بررسی و مقایسه شده است.

از جمله مزایای استفاده از ابزارهای کد باز، امکان تخصیص تیم مستقل درون سازمان برای توسعۀ ابزار و شخصی‌سازی آن باتوجه‌به نیازهای کسب‌وکاری خاص سازمان است. همچنین هزینۀ تعبیۀ این ابزارها در نرم‌افزارهای بومی سازمان و شخصی‌سازی آن‌ها به‌نسبت نرم‌افزارهای اختصاصی کمتر است.

گزینه‌های شناسایی‌شده

مهم‌ترین نرم‌افزارهای تحلیل و هوش تجاری کد باز شناسایی‌شده شامل نمونه‌های زیر است:

  • Metabase
  • Redash
  • Apache Superset (formerly was Caravel)
  • Grafana
  • Kibana

گزینه‌های انتخاب‌شده

انتخاب گزینه‌های اولیه برای بررسی بیشتر می‌تواند باتوجه‌به نیازهای سازمان، قابلیت‌های ابزار، تجربۀ قبلی در زمینۀ استفاده از این ابزارها در سازمان، میزان بلوغ و چشم‌انداز توسعۀ آتی ابزارها انجام شود. بر این اساس، در مرحلۀ اول، ابزارهای Metabase، Redash، Apache SuperSetو Grafana به‌عنوان گزینه‌های بررسی بیشتر انتخاب شد.

معیارهای ارزیابی

معیارهای کلی که در این بررسی برای تصمیم‌گیری دربارۀ انتخاب ابزار، برگزیده شده، عبارت‌اند از:

۱. سهولت نصب، راه‌اندازی و نگهداری؛

۲. مشتریان استفاده‌کننده از ابزار با توجه ویژه به صنعت و اندازۀ کسب‌وکار آن‌ها؛

۳. چشم‌انداز توسعه و میزان فعال‌بودن جامعۀ توسعه‌دهندۀ ابزار؛

۴. پشتیبانی (در دسترس بودن مستندات و میزان فعال‌بودن جامعه در پاسخ‌گویی به اشکال‌های احتمالی)؛

۵. طرح‌های رایگان و پولی استفاده از ابزار و قابلیت‌های هریک از طرح‌ها؛

۶. میزان دانش فنی ضروری برای کار با ابزار و یادگیری از داده‌ها؛

۷. تنوع امکان ارتباط با سایر زیرساخت‌ها و سیستم‌های سازمان؛

۸. تنوع نمودارها و قابلیت‌های بصری‌سازی؛

۹. امکان به‌کارگیری خروجی گزارش‌ها در ابزارهای بومی سازمان.

همچنین برای همۀ ابزارها، نکته‌های زیر نیز حائز اهمیت است که با توجه به زمینه سازمانی می‌تواند مدنظر قرار بگیرد.

۱. چه کسانی در سازمان از ابزار استفاده می‌کنند؟

۲. اقلامی که تحویل داده می‌شوند، چه چیزهایی هستند؟

۳. اندازۀ داده‌ها و مقیاس‌پذیری آن چیست؟

۴. آیا این ابزار در یک فرایند موجود قرار می‌گیرد یا جزو اصلی فرایند جدیدی است؟

در ادامه ابزارها را بررسی می‌کنیم و در نهایت، آن‌ها را بر اساس نُه معیار اول معرفی‌شده در این بخش مقایسه می‌کنیم.

متابیس

«متابیس» ابزار کد باز تحلیل و هوش تجاری است که رسالت اصلی خود را توانمندسازی همۀ افراد شرکت برای یادگیری از داده‌ها معرفی می‌کند.

نصب ابزار از طریق داکر و یا فایل جاوا ممکن است و به‌راحتی انجام می‌شود.

ابزار را در کمتر از پنج دقیقه به‌راحتی و با حداقل دانش فنی می‌توان نصب و راه‌اندازی کرد.

متابیس به‌راحتی به منابع دادۀ متنوعی متصل می‌شود. البته تنوع منابع داده‌ای آن نسبت به «ری‌دش» و «سوپرست» محدود است.

منابع داده‌ای متابیس
منابع داده‌ای متابیس

مهم‌ترین تمایز این برنامه را می‌توان در سهولت راه‌اندازی و نگهداری، عدم نیاز به داشتن دانش فنی برای یادگیری از داده‌ها و تجربۀ کاربری مناسب آن دانست؛ ذکر این نکته ضروری است که به‌رغم زیبایی و سهولت و تجربۀ کاربری مناسب، تنوع نمودارها زیاد نیست.

مستندات متابیس کاربران را در زمینۀ مراحل مختلف راه‌اندازی و ساخت داشبورد با استفاده از ابزار، به‌خوبی راهنمایی می‌کند. همچنین فعالیت در سایت‌های راهنما برای پاسخ‌گویی به اشکال‌های کاربران شایان توجه است.

چشم‌انداز توسعۀ آتی متابیس، در سایت گیت‌هاب و در یکی از ارائه‌های این شرکت به‌صورت نکته‌های زیر ذکر شده است:

  • امکان جوین بین جدول‌های مختلف؛
  • استفاده از چندین سری در سازندۀ کوئری؛
  • ایجاد بهبودهایی در ابعاد؛
  • ماژولار کردن ارائه‌دهندگان SSO؛
  • قابلیت ایجاد اسنیپت‌های SQL؛
  • قابلیت کش‌کردن پیش‌بینانه؛
  • پشتیبانی بیشتر از جوین‌ها و کار روی سازندۀ کوئری جدید.
  • Instance Serialization؛
  • Reduced Memory Footprint؛

اطلاعات مربوط به فعال‌بودن توسعۀ متابیس روی گیت‌هاب در شکل زیر نمایش داده شده است.

متابیس در دو حالت ابری و نصب روی سرور اختصاصی ارائه شده سرویس ابری آن در سه طرح مختلف و سرویس نصب اختصاصی آن در دو طرح مختلف ارائه شده است که می‌توان این طرح‌ها را در دو شکل زیر مشاهده کرد:

طرح های ابری متابیس
طرح های ابری متابیس
طرح های نصب روی سرور اختصاصی متابیس
طرح های نصب روی سرور اختصاصی متابیس

در طرح‌های پولی، امکانات پشتیبانی مناسبی از جمله تخصیص کارشناس پشتیبانی اختصاصی و پاسخ‌گویی در زمان کوتاه ارائه می‌شود.

از تمایزهای این محصول که کمتر در محصولات مشابه وجود دارد، قابلیتی به نام X-Ray است که داده‌های بازنمایی‌شده در داشبوردها را از مناظر جدیدی بررسی می‌کند و امکان یادگیری را روی داده‌های بازنمایی‌شده که نسبت به روند نرمال متمایز هستند، ایجاد می‌کند.

متابیس امکان بازنمایی داده‌های مربوط به چند منبع دادۀ مختلف (در پایگاه داده‌های مختلف) در قالب تنها یک داشبورد را فراهم می‌کند.

منطق ساخت گزارش‌ها ساده است و کاربران به‌راحتی می‌توانند گزارش‌های خود را در قالب سؤال‌هایی ایجاد کنند، در قالب مجموعه‌ها ذخیره نمایند و از طریق داشبوردها بازنمایی کنند. همچنین، می‌توان سطوح دسترسی را در سطح مجموعه‌ها مدیریت کرد.

کاربران حرفه‌ای می‌توانند از طریق سازندۀ کوئری سؤال‌های مدنظر خود را ایجاد کنند یا سؤال‌های ایجادشده از طریق رابط کاربری را ویرایش کنند.

ری‌دش

«ری‌دش» یکی دیگر از ابزارهای شناخته‌شده و معتبر کد باز تحلیل و هوش تجاری است. رسالت ری‌دش کمک به کاربران برای درک بهتر داده‌هایشان است.

باتوجه‌به اینکه راه‌اندازی ابزار ری‌دش وابستگی‌هایی به Redis، Node js، PostgreSQL و NginX دارد، صرفاً دریافت فایل داکر آماده از داکر هاب برای استفاده از ابزار کفایت نمی‌کند. برای این منظور، راهنمای نصب و راه‌اندازی ابزار در دو سطح برای توسعه‌دهندگان در دسترس قرار گرفته است. اطلاعات کامل راهنمای نصب و راه‌اندازی ری‌دش را می‌توانید در مسیر https://redash.io/help/open-source/dev-guide مشاهده کنید.

برای راه‌اندازی ری‌دش از دستورالعمل‌های ارائه‌شده در سایت استفاده شد که مطابق راهنمای سایت راه‌اندازی موفق انجام نشد و اطلاعات موجود در سایت صحیح نبود. راهنماهای موجود در اینترنت نیز برای رفع مشکل کافی نیست و به‌نظر می‌رسد که راه‌اندازی و نگهداری (به‌ویژه در مراحل به‌روزرسانی) نیازمند تخصص و زمان بیشتری نسبت به ابزار متابیس است.

ری‌دش به‌راحتی به منابع داده متنوعی متصل می‌شود. تنوع منابع داده‌ای آن نسبت به متابیس بسیار بیشتر و درخور توجه است؛ از جمله اتصال‌های شایان توجه ری‌دش که در متابیس موجود نیست،‌ امکان اتصال به کاساندرا، گرین پلام و هایوْ است. همچنین امکان یکپارچه‌سازی با Google Spreadsheets، JIRA،‌JSON و Python از جمله قابلیت‌های درخور توجهی است که در متابیس موجود نیست.

برای کار با ری‌دش و ساخت داشبوردها، لازم است تا کاربر دانش کوئری‌نویسی مناسبی داشته باشد و از این منظر شاید نتوان آن را در زمرۀ ابزارهای Self Service BI ایده‌آل برای کاربران عادی سازمان به‌حساب آورد.

مهم‌ترین نقطۀ تمایز این برنامه را می‌توان در تنوع اتصالات و تنوع نمودارها دانست. برای مثال امکان رسم نمودار Cohort برای بررسی نگهداشت کاربران از قابلیت‌های شایان توجه ابزار ری‌دش است.

همچنین قابلیت‌های در دسترس کاربر برای نمودارهای موجود روی داشبورد نیز بیشتر از متابیس است.

یکی از قابلیت‌های کاربردی دیگر این ابزار، امکان دسترسی به گزارش‌های ایجادشده از طریق api است.

در مقایسه با متابیس، سهولت راه‌اندازی و نگهداری ری‌دش کمتر است و برای راه‌اندازی و توسعۀ داشبوردها روی ابزار،‌ دانش فنی لازم است. ذکر این نکته لازم است که در زمینۀ زیبایی و تجربۀ کاربری متابیس کاربرپسندتر از ری‌دش است.

مستندات ری‌دش در زمینۀ مراحل مختلف راه‌اندازی و ساخت داشبورد با استفاده از ابزار، موجود است؛ اما به‌نظر می‌رسد که سازنده سرمایه‌گذاری مناسبی در این حوزه انجام نداده است. مستندات و راهنماهای کاربری متابیس در این زمینه برتر از ری‌دش به‌نظر می‌رسد.

اطلاعات چشم‌انداز توسعۀ آتی ری‌دش، در سایت سازنده و در گیت‌هاب در دسترس نیست.

اطلاعات مربوط به فعال‌بودن توسعۀ ری‌دش روی گیت‌هاب در شکل زیر نمایش داده شده است.

باتوجه‌به بررسی میزان فعالیت یک‌ماهه روی سایت گیت‌هاب و همچنین مقایسۀ سایت https://stackshare.io/stackups/superset-vs-redash-vs-metabase از سه محصول مدنظر، میزان فعالیت و جامعۀ کاربران فعال متابیس بیشتر از ری‌دش و سوپرست است.

ری‌دش در سه سطح آغازگر، حرفه‌ای و کسب‌وکار قیمت‌گذاری و ارائه می‌شود.

قیمت‌گذاری طرح‌های مختلف ری‌دش
قیمت‌گذاری طرح‌های مختلف ری‌دش

در طرح کسب‌وکار قابلیت‌ها مشابه قابلیت‌های طرح نصب اختصاصی بنگاهی متابیس است. از نظر مالی به‌نظر می‌رسد که طرح کسب‌وکار ری‌دش هزینۀ کمتری در یک سال ایجاد می‌کند.

ری‌دش امکان بازنمایی داده‌های مربوط به چند منبع داده مختلف (در پایگاه داده‌های مختلف) در قالب تنها یک داشبورد را فراهم می‌کند.

منطق ساخت گزارش‌ها به‌نسبت ساده است و کاربران به‌راحتی می‌توانند گزارش‌های خود را در قالب کوئری‌هایی ایجاد کرده، آن‌ها را روی داشبوردها نمایش دهند.

سوپرست

«سوپرست» از دیگر ابزارهای شناخته‌شده و معتبر کد باز تحلیل و هوش تجاری است. این ابزار ابتدا با نام Panoramix و سپس Caravel به‌عنوان پلتفرم اکتشاف داده (data exploration) توسعه داده شده است و در حال حاضر به‌عنوان نوعی ابزار تحت وب هوش تجاری مدرن و در سطح بنگاه (enterprise-ready) توسط کمپانی Apache پشتیبانی می‌شود. در حال حاضر Apache Superset به‌عنوان یکی از پروژه‌های تحت شتاب‌دهی بنیاد آپاچی است و در صورت تأیید برخی پارامترها، به‌عنوان یکی از پروژه‌های بنیاد نرم‌افزاری آپاچی (ASF) پذیرفته می‌شود.

رسالت سوپرست از ابتدا کمک به کاربران برای درک بهتر داده‌هایشان و اکتشاف داده‌ها بوده است. در ابتدا Caravel به‌عنوان پلتفرم اکتشاف داده‌ها و ساخت داشبوردها درون airbnb توسعه داده شده است و پس از آن کد آن به‌صورت باز منتشر شده است.

راه‌اندازی ابزار سوپرست وابستگی‌هایی به PostgreSQL و Redis دارد. برای نصب و راه‌اندازی سوپرست به دانش تخصصی حداقلی کار با لینوکس نیاز دارید. اطلاعات کامل راهنمای نصب و راه‌اندازی سوپرست را می‌توانید در مسیر https://superset.incubator.apache.org/installation.html مشاهده کنید.

سوپرست به‌راحتی به منابع داده متنوعی متصل می‌شود. تنوع منابع داده‌ای آن نسبت به متابیس بیشتر و درخور توجه است. سوپرست به‌صورت پیش‌فرض، به‌جز اتصال به Sqlite که بخشی از کتابخانۀ استاندارد پایتون است،‌ قابلیت اتصال به سایر پایگاه‌های داده‌ای را در خود ندارد؛ برای این منظور لازم است تا پکیج‌های ضروری مدنظر نصب شود. امکان اتصال به پایگاه‌های داده‌ای مختلفی که SQL Alchemy را پشتیبانی می‌کنند، وجود دارد.

برای کار با سوپرست و ساخت داشبوردها، لازم است تا کاربر دانش نسبی کوئری‌نویسی داشته باشد و از این منظر شاید نتوان آن را در زمرۀ ابزارهای Self Service BI ایده‌آل برای کاربران عادی سازمان به‌حساب آورد.

از ویژگی‌های کلیدی و بسیار مهم سوپرست انجام تنظیمات مربوط به کش برای بارگذاری داشبوردهاست.

از دیگر تمایزهای مهم این ابزار می‌توان تنوع اتصالات و تنوع نمودارها را ذکر کرد. برای مثال امکان رسم نمودارهای Sankey و Sunburst از قابلیت‌های متمایز ابزار سوپرست است.

همچنین قابلیت‌های در دسترس کاربر برای نمودارهای موجود روی داشبورد نیز بیشتر از متابیس است.

یکی از قابلیت‌های کاربردی این ابزار، امکان خروجی گرفتن از نمودارها در قالب‌های json و csv است.

در مقایسه با متابیس سهولت راه‌اندازی و نگهداری سوپرست اندکی کمتر است و برای راه‌اندازی و توسعۀ داشبوردها روی ابزار،‌ دانش فنی نسبی لازم است.

برای برخی از نیازها، نیازمند شخصی‌سازی و سفارشی‌سازی سوپرست خواهید بود که با زبان پایتون انجام می‌شود.

مستندات سوپرست در زمینۀ مراحل مختلف راه‌اندازی و ساخت داشبورد با استفاده از ابزار، موجود است. از نقاط قوت بالقوۀ سوپرست، سرمایه‌گذاری بنیاد نرم‌افزاری آپاچی روی ابزار است؛ به‌گونه‌ای که در حال حاضر کتابی با موضوع معرفی سوپرست در سایت انتشارات PacktPub در دسترس است که بخش‌هایی از آن را می‌توان به‌رایگان مطالعه کرد.

اطلاعات چشم‌انداز توسعۀ آتی سوپرست، در سایت سازنده در دسترس نیست.

اطلاعات مربوط به فعال‌بودن توسعۀ سوپرست روی گیت‌هاب در شکل زیر نمایش داده شده است.

سوپرست امکان بازنمایی داده‌های مربوط به چند منبع دادۀ مختلف (در پایگاه داده‌های مختلف) در قالب تنها یک داشبورد را فراهم می‌کند.

منطق ساخت گزارش‌ها ساده است و کاربران به‌راحتی می‌توانند گزارش‌های خود را در قالب کوئری‌هایی ایجاد کنند و آن‌ها را روی داشبوردها نمایش دهند.

مقایسه

مقایسۀ متابیس، ری‌دش و سوپرست باتوجه‌به معیارهای معرفی‌شده در بخش معیارهای ارزیابی، در قالب جدول زیر ارائه می‌شود.

مقایسه ابزارهای متابیس، ری‌دش و سوپرست
مقایسه ابزارهای متابیس، ری‌دش و سوپرست

نتیجه‌گیری

تصمیم‌گیری دربارۀ انتخاب ابزار باتوجه‌به اطلاعات ارائه‌شده نیازمند بحث باتوجه‌به نیازهای ویژه، منابع و محدودیت‌های سازمان است.