معرفی و بررسی ۳ ابزار کد باز مناسب تحلیل و هوش تجاری
مقدمه (هدف)
از ابزارهای پُراهمیت در مسیر دادهمحور شدن سازمانها، ابزارهای موسوم به تحلیل و هوش تجاری (Analytics and BI Tools) است. انتظارات اولیه از ابزارهای تحلیل و هوش تجاری و قابلیتهای آنها را میتوان در قالب موارد زیر دستهبندی کرد:
۱. توانایی اتصال به منابع دادهای مختلف؛
۲. توانایی تغییر دادهها پس از دریافت از منبع داده؛
۳. توانایی بصریسازی دادهها؛
۴. توانایی ارسال هشدارها و رخدادها؛
۵. امکان مدیریت سطح دسترسی؛
۶. توانمندسازی همۀ اعضای سازمان در تحلیل دادهها بدون نیاز به دانش تخصصی.
به تعبیری هدف اصلی بهکارگیری این ابزارها در سازمانها را میتوان «توانمندسازی همۀ اعضای سازمان در پاسخگویی به پرسشهای کسبوکاری از طریق دادهها و یادگیری از دادههای سازمان» دانست.
برای انتخاب ابزارهای تحلیل و هوش تجاری، معیارهای مختلفی پیشنهاد شده است که در ادامه و در بخشی مجزا به معیارهای انتخاب ابزارهای تحلیل و هوش تجاری میپردازیم.
چرا ابزارهای کد باز؟
یکی از تصمیمهای اساسی در زمینۀ انتخاب ابزار مناسب، تصمیم دربارۀ کد باز بودن یا اختصاصیبودن نرمافزار است. در هر دو حوزه نیز نرمافزارهای شناختهشدهای بهعنوان گزینههای درخور توجه وجود دارد.
از جمله ابزارهای اختصاصی تحلیل و هوش تجاری که در قالب مدل نرمافزار بهعنوان خدمت (SaaS) ارائه میشود، میتوان به نمونههای زیر اشاره کرد:
- Microsoft Power BI
- Tableau Cloud
- Qlik Sense Cloud
- IBM Watson Analytics
- TIBCO Spotfire
- Domo.com
برای انتخاب از بین ابزارهای اختصاصی، معمولاً گزارشهای تجاری نظیر گزارش Magic Quadrant گارتنر بهعنوان راهنمایی اولیه و مناسب، در دسترس است و میتوان برای انتخاب ابزار باتوجهبه معیارهای مدنظر، از این گزارشها استفاده کرد.
از جمله ابزارهای کد باز تحلیل و هوش تجاری که بهصورت رایگان ارائه میشود، میتوان به نمونههای زیر اشاره کرد:
- Metabase
- Redash
- Apache Superset (formerly was Caravel)
- Grafana
- Kibana
این مستند با این فرض نگاشته شده که سیاست ما، استفاده از ابزارهای کد باز تحلیل و هوش تجاری است و سه نمونه از ابزارهای کد باز بررسی و مقایسه شده است.
از جمله مزایای استفاده از ابزارهای کد باز، امکان تخصیص تیم مستقل درون سازمان برای توسعۀ ابزار و شخصیسازی آن باتوجهبه نیازهای کسبوکاری خاص سازمان است. همچنین هزینۀ تعبیۀ این ابزارها در نرمافزارهای بومی سازمان و شخصیسازی آنها بهنسبت نرمافزارهای اختصاصی کمتر است.
گزینههای شناساییشده
مهمترین نرمافزارهای تحلیل و هوش تجاری کد باز شناساییشده شامل نمونههای زیر است:
- Metabase
- Redash
- Apache Superset (formerly was Caravel)
- Grafana
- Kibana
گزینههای انتخابشده
انتخاب گزینههای اولیه برای بررسی بیشتر میتواند باتوجهبه نیازهای سازمان، قابلیتهای ابزار، تجربۀ قبلی در زمینۀ استفاده از این ابزارها در سازمان، میزان بلوغ و چشمانداز توسعۀ آتی ابزارها انجام شود. بر این اساس، در مرحلۀ اول، ابزارهای Metabase، Redash، Apache SuperSetو Grafana بهعنوان گزینههای بررسی بیشتر انتخاب شد.
معیارهای ارزیابی
معیارهای کلی که در این بررسی برای تصمیمگیری دربارۀ انتخاب ابزار، برگزیده شده، عبارتاند از:
۱. سهولت نصب، راهاندازی و نگهداری؛
۲. مشتریان استفادهکننده از ابزار با توجه ویژه به صنعت و اندازۀ کسبوکار آنها؛
۳. چشمانداز توسعه و میزان فعالبودن جامعۀ توسعهدهندۀ ابزار؛
۴. پشتیبانی (در دسترس بودن مستندات و میزان فعالبودن جامعه در پاسخگویی به اشکالهای احتمالی)؛
۵. طرحهای رایگان و پولی استفاده از ابزار و قابلیتهای هریک از طرحها؛
۶. میزان دانش فنی ضروری برای کار با ابزار و یادگیری از دادهها؛
۷. تنوع امکان ارتباط با سایر زیرساختها و سیستمهای سازمان؛
۸. تنوع نمودارها و قابلیتهای بصریسازی؛
۹. امکان بهکارگیری خروجی گزارشها در ابزارهای بومی سازمان.
همچنین برای همۀ ابزارها، نکتههای زیر نیز حائز اهمیت است که با توجه به زمینه سازمانی میتواند مدنظر قرار بگیرد.
۱. چه کسانی در سازمان از ابزار استفاده میکنند؟
۲. اقلامی که تحویل داده میشوند، چه چیزهایی هستند؟
۳. اندازۀ دادهها و مقیاسپذیری آن چیست؟
۴. آیا این ابزار در یک فرایند موجود قرار میگیرد یا جزو اصلی فرایند جدیدی است؟
در ادامه ابزارها را بررسی میکنیم و در نهایت، آنها را بر اساس نُه معیار اول معرفیشده در این بخش مقایسه میکنیم.
متابیس
«متابیس» ابزار کد باز تحلیل و هوش تجاری است که رسالت اصلی خود را توانمندسازی همۀ افراد شرکت برای یادگیری از دادهها معرفی میکند.
نصب ابزار از طریق داکر و یا فایل جاوا ممکن است و بهراحتی انجام میشود.
ابزار را در کمتر از پنج دقیقه بهراحتی و با حداقل دانش فنی میتوان نصب و راهاندازی کرد.
متابیس بهراحتی به منابع دادۀ متنوعی متصل میشود. البته تنوع منابع دادهای آن نسبت به «ریدش» و «سوپرست» محدود است.
مهمترین تمایز این برنامه را میتوان در سهولت راهاندازی و نگهداری، عدم نیاز به داشتن دانش فنی برای یادگیری از دادهها و تجربۀ کاربری مناسب آن دانست؛ ذکر این نکته ضروری است که بهرغم زیبایی و سهولت و تجربۀ کاربری مناسب، تنوع نمودارها زیاد نیست.
مستندات متابیس کاربران را در زمینۀ مراحل مختلف راهاندازی و ساخت داشبورد با استفاده از ابزار، بهخوبی راهنمایی میکند. همچنین فعالیت در سایتهای راهنما برای پاسخگویی به اشکالهای کاربران شایان توجه است.
چشمانداز توسعۀ آتی متابیس، در سایت گیتهاب و در یکی از ارائههای این شرکت بهصورت نکتههای زیر ذکر شده است:
- امکان جوین بین جدولهای مختلف؛
- استفاده از چندین سری در سازندۀ کوئری؛
- ایجاد بهبودهایی در ابعاد؛
- ماژولار کردن ارائهدهندگان SSO؛
- قابلیت ایجاد اسنیپتهای SQL؛
- قابلیت کشکردن پیشبینانه؛
- پشتیبانی بیشتر از جوینها و کار روی سازندۀ کوئری جدید.
- Instance Serialization؛
- Reduced Memory Footprint؛
اطلاعات مربوط به فعالبودن توسعۀ متابیس روی گیتهاب در شکل زیر نمایش داده شده است.
متابیس در دو حالت ابری و نصب روی سرور اختصاصی ارائه شده سرویس ابری آن در سه طرح مختلف و سرویس نصب اختصاصی آن در دو طرح مختلف ارائه شده است که میتوان این طرحها را در دو شکل زیر مشاهده کرد:
در طرحهای پولی، امکانات پشتیبانی مناسبی از جمله تخصیص کارشناس پشتیبانی اختصاصی و پاسخگویی در زمان کوتاه ارائه میشود.
از تمایزهای این محصول که کمتر در محصولات مشابه وجود دارد، قابلیتی به نام X-Ray است که دادههای بازنماییشده در داشبوردها را از مناظر جدیدی بررسی میکند و امکان یادگیری را روی دادههای بازنماییشده که نسبت به روند نرمال متمایز هستند، ایجاد میکند.
متابیس امکان بازنمایی دادههای مربوط به چند منبع دادۀ مختلف (در پایگاه دادههای مختلف) در قالب تنها یک داشبورد را فراهم میکند.
منطق ساخت گزارشها ساده است و کاربران بهراحتی میتوانند گزارشهای خود را در قالب سؤالهایی ایجاد کنند، در قالب مجموعهها ذخیره نمایند و از طریق داشبوردها بازنمایی کنند. همچنین، میتوان سطوح دسترسی را در سطح مجموعهها مدیریت کرد.
کاربران حرفهای میتوانند از طریق سازندۀ کوئری سؤالهای مدنظر خود را ایجاد کنند یا سؤالهای ایجادشده از طریق رابط کاربری را ویرایش کنند.
ریدش
«ریدش» یکی دیگر از ابزارهای شناختهشده و معتبر کد باز تحلیل و هوش تجاری است. رسالت ریدش کمک به کاربران برای درک بهتر دادههایشان است.
باتوجهبه اینکه راهاندازی ابزار ریدش وابستگیهایی به Redis، Node js، PostgreSQL و NginX دارد، صرفاً دریافت فایل داکر آماده از داکر هاب برای استفاده از ابزار کفایت نمیکند. برای این منظور، راهنمای نصب و راهاندازی ابزار در دو سطح برای توسعهدهندگان در دسترس قرار گرفته است. اطلاعات کامل راهنمای نصب و راهاندازی ریدش را میتوانید در مسیر https://redash.io/help/open-source/dev-guide مشاهده کنید.
برای راهاندازی ریدش از دستورالعملهای ارائهشده در سایت استفاده شد که مطابق راهنمای سایت راهاندازی موفق انجام نشد و اطلاعات موجود در سایت صحیح نبود. راهنماهای موجود در اینترنت نیز برای رفع مشکل کافی نیست و بهنظر میرسد که راهاندازی و نگهداری (بهویژه در مراحل بهروزرسانی) نیازمند تخصص و زمان بیشتری نسبت به ابزار متابیس است.
ریدش بهراحتی به منابع داده متنوعی متصل میشود. تنوع منابع دادهای آن نسبت به متابیس بسیار بیشتر و درخور توجه است؛ از جمله اتصالهای شایان توجه ریدش که در متابیس موجود نیست، امکان اتصال به کاساندرا، گرین پلام و هایوْ است. همچنین امکان یکپارچهسازی با Google Spreadsheets، JIRA،JSON و Python از جمله قابلیتهای درخور توجهی است که در متابیس موجود نیست.
برای کار با ریدش و ساخت داشبوردها، لازم است تا کاربر دانش کوئرینویسی مناسبی داشته باشد و از این منظر شاید نتوان آن را در زمرۀ ابزارهای Self Service BI ایدهآل برای کاربران عادی سازمان بهحساب آورد.
مهمترین نقطۀ تمایز این برنامه را میتوان در تنوع اتصالات و تنوع نمودارها دانست. برای مثال امکان رسم نمودار Cohort برای بررسی نگهداشت کاربران از قابلیتهای شایان توجه ابزار ریدش است.
همچنین قابلیتهای در دسترس کاربر برای نمودارهای موجود روی داشبورد نیز بیشتر از متابیس است.
یکی از قابلیتهای کاربردی دیگر این ابزار، امکان دسترسی به گزارشهای ایجادشده از طریق api است.
در مقایسه با متابیس، سهولت راهاندازی و نگهداری ریدش کمتر است و برای راهاندازی و توسعۀ داشبوردها روی ابزار، دانش فنی لازم است. ذکر این نکته لازم است که در زمینۀ زیبایی و تجربۀ کاربری متابیس کاربرپسندتر از ریدش است.
مستندات ریدش در زمینۀ مراحل مختلف راهاندازی و ساخت داشبورد با استفاده از ابزار، موجود است؛ اما بهنظر میرسد که سازنده سرمایهگذاری مناسبی در این حوزه انجام نداده است. مستندات و راهنماهای کاربری متابیس در این زمینه برتر از ریدش بهنظر میرسد.
اطلاعات چشمانداز توسعۀ آتی ریدش، در سایت سازنده و در گیتهاب در دسترس نیست.
اطلاعات مربوط به فعالبودن توسعۀ ریدش روی گیتهاب در شکل زیر نمایش داده شده است.
باتوجهبه بررسی میزان فعالیت یکماهه روی سایت گیتهاب و همچنین مقایسۀ سایت https://stackshare.io/stackups/superset-vs-redash-vs-metabase از سه محصول مدنظر، میزان فعالیت و جامعۀ کاربران فعال متابیس بیشتر از ریدش و سوپرست است.
ریدش در سه سطح آغازگر، حرفهای و کسبوکار قیمتگذاری و ارائه میشود.
در طرح کسبوکار قابلیتها مشابه قابلیتهای طرح نصب اختصاصی بنگاهی متابیس است. از نظر مالی بهنظر میرسد که طرح کسبوکار ریدش هزینۀ کمتری در یک سال ایجاد میکند.
ریدش امکان بازنمایی دادههای مربوط به چند منبع داده مختلف (در پایگاه دادههای مختلف) در قالب تنها یک داشبورد را فراهم میکند.
منطق ساخت گزارشها بهنسبت ساده است و کاربران بهراحتی میتوانند گزارشهای خود را در قالب کوئریهایی ایجاد کرده، آنها را روی داشبوردها نمایش دهند.
سوپرست
«سوپرست» از دیگر ابزارهای شناختهشده و معتبر کد باز تحلیل و هوش تجاری است. این ابزار ابتدا با نام Panoramix و سپس Caravel بهعنوان پلتفرم اکتشاف داده (data exploration) توسعه داده شده است و در حال حاضر بهعنوان نوعی ابزار تحت وب هوش تجاری مدرن و در سطح بنگاه (enterprise-ready) توسط کمپانی Apache پشتیبانی میشود. در حال حاضر Apache Superset بهعنوان یکی از پروژههای تحت شتابدهی بنیاد آپاچی است و در صورت تأیید برخی پارامترها، بهعنوان یکی از پروژههای بنیاد نرمافزاری آپاچی (ASF) پذیرفته میشود.
رسالت سوپرست از ابتدا کمک به کاربران برای درک بهتر دادههایشان و اکتشاف دادهها بوده است. در ابتدا Caravel بهعنوان پلتفرم اکتشاف دادهها و ساخت داشبوردها درون airbnb توسعه داده شده است و پس از آن کد آن بهصورت باز منتشر شده است.
راهاندازی ابزار سوپرست وابستگیهایی به PostgreSQL و Redis دارد. برای نصب و راهاندازی سوپرست به دانش تخصصی حداقلی کار با لینوکس نیاز دارید. اطلاعات کامل راهنمای نصب و راهاندازی سوپرست را میتوانید در مسیر https://superset.incubator.apache.org/installation.html مشاهده کنید.
سوپرست بهراحتی به منابع داده متنوعی متصل میشود. تنوع منابع دادهای آن نسبت به متابیس بیشتر و درخور توجه است. سوپرست بهصورت پیشفرض، بهجز اتصال به Sqlite که بخشی از کتابخانۀ استاندارد پایتون است، قابلیت اتصال به سایر پایگاههای دادهای را در خود ندارد؛ برای این منظور لازم است تا پکیجهای ضروری مدنظر نصب شود. امکان اتصال به پایگاههای دادهای مختلفی که SQL Alchemy را پشتیبانی میکنند، وجود دارد.
برای کار با سوپرست و ساخت داشبوردها، لازم است تا کاربر دانش نسبی کوئرینویسی داشته باشد و از این منظر شاید نتوان آن را در زمرۀ ابزارهای Self Service BI ایدهآل برای کاربران عادی سازمان بهحساب آورد.
از ویژگیهای کلیدی و بسیار مهم سوپرست انجام تنظیمات مربوط به کش برای بارگذاری داشبوردهاست.
از دیگر تمایزهای مهم این ابزار میتوان تنوع اتصالات و تنوع نمودارها را ذکر کرد. برای مثال امکان رسم نمودارهای Sankey و Sunburst از قابلیتهای متمایز ابزار سوپرست است.
همچنین قابلیتهای در دسترس کاربر برای نمودارهای موجود روی داشبورد نیز بیشتر از متابیس است.
یکی از قابلیتهای کاربردی این ابزار، امکان خروجی گرفتن از نمودارها در قالبهای json و csv است.
در مقایسه با متابیس سهولت راهاندازی و نگهداری سوپرست اندکی کمتر است و برای راهاندازی و توسعۀ داشبوردها روی ابزار، دانش فنی نسبی لازم است.
برای برخی از نیازها، نیازمند شخصیسازی و سفارشیسازی سوپرست خواهید بود که با زبان پایتون انجام میشود.
مستندات سوپرست در زمینۀ مراحل مختلف راهاندازی و ساخت داشبورد با استفاده از ابزار، موجود است. از نقاط قوت بالقوۀ سوپرست، سرمایهگذاری بنیاد نرمافزاری آپاچی روی ابزار است؛ بهگونهای که در حال حاضر کتابی با موضوع معرفی سوپرست در سایت انتشارات PacktPub در دسترس است که بخشهایی از آن را میتوان بهرایگان مطالعه کرد.
اطلاعات چشمانداز توسعۀ آتی سوپرست، در سایت سازنده در دسترس نیست.
اطلاعات مربوط به فعالبودن توسعۀ سوپرست روی گیتهاب در شکل زیر نمایش داده شده است.
سوپرست امکان بازنمایی دادههای مربوط به چند منبع دادۀ مختلف (در پایگاه دادههای مختلف) در قالب تنها یک داشبورد را فراهم میکند.
منطق ساخت گزارشها ساده است و کاربران بهراحتی میتوانند گزارشهای خود را در قالب کوئریهایی ایجاد کنند و آنها را روی داشبوردها نمایش دهند.
مقایسه
مقایسۀ متابیس، ریدش و سوپرست باتوجهبه معیارهای معرفیشده در بخش معیارهای ارزیابی، در قالب جدول زیر ارائه میشود.
نتیجهگیری
تصمیمگیری دربارۀ انتخاب ابزار باتوجهبه اطلاعات ارائهشده نیازمند بحث باتوجهبه نیازهای ویژه، منابع و محدودیتهای سازمان است.
مطلبی دیگر از این انتشارات
چهار تا نکته ساده و جالب توی برنامه نویسی
مطلبی دیگر از این انتشارات
عزیزم کجایی؟
مطلبی دیگر از این انتشارات
جلسه پستمرتم چیست؟