مهندس یادگیری ماشین
هوش تجاری و کاربرد آن در استارتاپها
این نوشته برگفته از گفتگوی بنده با رضا غیابی، فرصت آفرین، میباشد و خلاصهای است از قسمت پنجم فصل اول ایده کست با موضوع هوش تجاری به زبان اول شخص. ویدیو گفتگو در آخر صفحه موجود است.
هوش تجاری به طور خیلی ساده، روشها، نرمافزارها و یا هر سیستمی است که دادههای خام را به اطلاعات قابل فهم تبدیل میکند. کسب و کارها میتوانند از این اطلاعات استفاده کنند برای پیشرفت در بخشهایی مانند مارکتنیگ و طراحی محصول. امروز با حجم انبوه اطلاعات تولید شده به صورت روزانه توسط کاربران، استفاده از هوش تجاری برای تضمین موفقیت یک کسب و کار لازم میباشد. تاثیری که جدی گرفتن دادهها و استفاده از آنها در قالب هوش تجاری میتواند بر روی کسبوکارها بگذارد را نباید دسته کم گرفت.
تاریخچهای کوتاه از هوش تجاری
هوش تجاری اولین بار در سال ۱۹۵۰ میلادی با توسعه پروژه آرپانت (ARPANet) مطرح شد. شبکه آرپانت با پروژههای تکمیلی ازجمله پروتکل (TCP\IP) تبدیل به مهمترین بستر فضای مجازی یعنی اینترنت شد. در طول این سالها استفاده بهینه از اطلاعات تهیه شده در این شبکه مورد بحث قرار گرفت که زمینهساز شکل گیری هوش تجاری شد.
طبق پیشبینیهای صورت گرفته تا سال ۲۰۱۸، حدود ۲۰ بیلیون دلار در این حوزه سرمایهگذاری صورت گرفته است.
استفاده از دادههای Unstructured در هوش تجاری
٪۸۰ از دادههایی که بصورت روزانه در اینترنت تولید میشوند غیرقابل دستهبندی هستند. به چه معنا؟به این معنا که ما به جزییات دادههایی مثل عکس و ویدیو دسترسی نداریم و دستهبندی آن ها حتی با وجود روشهایی مثل image recognition سخت میباشد.
با وجود حجم انبوهی از این دادههای غیرقابل دستهبندی ما چطور میتوانیم از هوش تجاری استفاده نماییم؟
اول به جملهی معروفی رجوع میکنیم که ما در عین حالی که در انبوه اطلاعات غرق شدیم، دچار فقر دادهای میباشیم. یعنی در صورتی که حجم انبوهی از اطلاعات دورمان را گرفته است، ما در استفاده بهینه از آنها عاجز هستیم. به عنوان مثال، شاید از نظر یک شیرینیفروش ذخیرهی دادهی اینکه چند نفر با لباس آستینکوتاه وارد فروشگاه میشوند مهم نباشد، در حالیکه شاید خرید یک نوع مخصوص از شیرینی مرتبط باشد با نوع لباسی که شخص میپوشد. شاید آن سبک از شیرینی فقط توسط افرادی تهیه شود که لایفاستایل خاص داشته باشند، پس این مهم است. پس ذخیره سازی این سبک اطلاعات و در آوردن روندهایی از میان آن میتواند در موفقیت هر کسبوکاری تاثیرگذار باشد.
معرفی سطوح مختلف دانش
برای درک بهتر این موضوع سطوح مختلف دانش را بررسی خواهیم کرد. دانش ۴ سطح دارد:
اولین سطح داده، همان داده (Data) به معنای کلمه میباشد. داده معمولا یک مختصات دارد. به طور مثال یک x و y، و یا اینکه ساعت چند یک تراکنش انجام داده شده یک رکورد از دادهها میباشد.
در سطح دوم، با قرار دادن این دادهها در کنار هم در یک جدول و یا یک نمودار و پیدا کردن یک ارتباط خطی میان این دادهها، اطلاعات بوجود میآید که یک لایهی عمیقتر از دانش میباشد.
به عنوان مثال، ما تنها میتوانیم بفهمیم که تراکنشی توسط فرد x در ساعت y و در روز z انجام شده، بلکه میتوانیم در این سطح بفهمیم که این فرد یک تراکنش همچنینی هر یکشنبه انجام میدهد. یا به عنوان مثال مشاورین املاک میدانند که قیمت ملک در پاییز و بهار با تغییر مواجه میشود. یا قیمت کولر در تابستان و بخاری در زمستان گران میشود. چنین روندهایی را میتوان با استفاده از این نوع اطلاعات کسب نمود. چنین تحلیلهایی، امروزه، توسط مردم عادی نیز برای مواردی مثل قیمت طلا و ارز انجام میشوند.
در سطح سوم، ما با دانش (Knowledge) مواجه هستیم. دانش توسط یک فرد خبره انجام میپذیرد و صرفا با داشتن اطلاعات نمیتوان به نتیجهای رسید. این کار فردی است که سالها در یک حوزه مانند بورس یا بانک فعالیت کرده و با دانشی که در طی این سالها کسب کرده میتواند با قرار دادن نمودارهای اطلاعات در کنار هم به یک نتیجهگیری و تحلیل درست برسد. به عنوان مثال، پیشبینی میشود که ریاست جمهوری ترامپ، چه تاثیری میتواند بر قیمت نفت بگذارد و این چیزی نیست که اکنون ماشینها بتوانند انجام دهند و نیازمند دانش فرد خبره میباشد. کار BI اکنون این است که داده را تبدیل به اطلاعات کند و این اطلاعات توسط دانش یک فرد تحلیل و نتایج آن اعلام شود.
لایهی آخری که در دانش وجود دارد، خرد (Wisdom) است.
خرد چیزی است که آن متخصص در طول سالهای طولانی، مثل ۳۰ سال یا ۴۰ سال، کسب میکند. به عنوان مثال، اگر از کسی که متخصص بورس است و سابقه ۵۰ ساله در این کار دارد بپرسیم «بورس ایران را چگونه ارزیابی می کنید؟»، آنگاه این فرد میتواند یک جمله «خرد» تولید کند. میگویند هر فدر در طول عمر خود ۳ جمله «خرد» تولید میکند. یک چیز نایاب که مخصوص آن فرد است و آن فرد با رجوع به تجربیات سالانه خود این جملات را تولید میکند.
«هوش تجاری» و دانش
حال بررسی میکنیم که BI چگونه از دانش استفاده میکند.ارتباط BI با دانش وظیفه آن را میتوان در یک جمله خلاصه کرد:
هوش تجاری به ما کمک میکند که دادهها را جمع کنیم، از دادهها اطلاعات تولید کنیم، از اطلاعات دانش بسازیم و از دانش خرد تولید کنیم.
این موضوع باعث میشود که ما پدیدههای اطرافمان را بهتر درک کنیم. این موارد با نرمافزارهای پیجیده قابل اجرا است اما حالت ساده آن با استفاده از نرمافزارهای سادهتر مثل Excel نیز قابل پیادهسازی است. شما میتوانید دادهها را در اکسل وارد کنید و سپس شروع به نوشتن گزارشها و پیدا کردن روندهای جالب از میان آنها کنید. میتوان مثال شیرینیفروشی در تهران را زد که با استفاده از BI به نتیجهای رسیده که با استفاده از آن میزان تولید پایه کیکهای خود را در روزهای هفته به صورت بهینه تعیین میکند تا چیزی اضافه نماند.
مثال دیگری که در این زمینه وجود دارد دکهها میباشند، که میتوانند با بررسیهای ساده به این پی ببرند که کدام تیترها برای مردم جذابیت بیشتری دارند. با استفاده از یک Data Sensor ساده مثل دوربین مداربسته میتوان رفتار مردم و تفاوت تراکم آنها در کنار تیترها را بررسی کرد. با تحلیل این بررسیها، به عنوان مثال، دکهها میتوانند چینش روزنامههای مختلف را در طول روز با توجه به تیتر آنها تغییر دهند.
«هوش تجاری» و استارتاپها
در حوزه IT و مخصوصا استارتاپهای این حوزه، استفاده از «هوش تجاری» یک امر اجتنابناپذیر میباشد. با توجه به حجم اطلاعات تولید شده توسط استارتاپها و همچنین مواردی مانند لاگ تولید شده توسط سیستم میتوان هوش تجاری را پیادهسازی کرد.
استارتاپها از راههای زیر برای شروع BI در استارتاپ خود میتوانند استفاده کنند:
- راه حل های BI مبتنی بر cloud مقرون به صرفه میباشند زیرا شما را قادر می سازد در هزینه های زیرساختی، سخت افزاری و فناوری اطلاعات صرفه جویی کنید. به طور کلی ، آنها بر روی مدل های اشتراکی کار می کنند، به این معنی که نیازی به سرمایه گذاری مبلغ هنگفت برای خرید مجوزها نیست.
- بسیاری از محصولات منبع باز BI نیز موجود است. استفاده کردن از آنها آسان نیست و برای راه اندازی آن به domain expert ها نیاز دارید.
- انعطاف پذیر و مقیاس پذیر - بسیاری از ابزازهای BI شما را مجبور به ساخت انبار دادهها میکنند که خود یک فعالیت بسیار زمانبر (و گران) است. علاوه بر این، ایجاد گزارش با استفاده از برخی سیستم ها به دلیل پیچیده بودن نرم افزار میتواند هفتهها طول بکشد. محصولی را انتخاب کنید که انعطاف پذیر باشد - این می تواند هزینه های نگهداری شما را کاهش دهد.
تجزیه و تحلیل Big Data
تعریف: آنالیز کلان دادهها با هدف پیدا کردن یک الگو و pattern مشخص.
مشکلی که در صنعت بخصوص IT گاها بوجود میآید، وجود یکسری اطلاعات حجیم و بزرگ میباشد که نمیدانم آن را چکار باید کنیم. به طور مثال، یک رویداد ۸ ساعته را در نظر بگیرید که با ۱۱ عدد دوربین فیلمبرداری میشود. پس حجم ویدیوهای خام تولید شده ۸۸ ساعت خواهد بود که برای یک انسان عادی مشاهده و تجزیه این تعداد ساعت فیلم میسر نیست. مثالهای دیگر حجم لاگهای تولید شده به صورت روزانه توسط بانکها میباشد که بسیار حجم دادهی زیادی میباشد.
در همین راستا علم تجزیه و تحلیل (مدیریت) Big Data ایجاد شده تا بتوان کار تحلیل این حجم عظیم دادهها به کمک کامپیوتر انجام شود و دخالت انسانی در آن کمتر باشد. در همین راستا کارهای زیر در روند آنالیز Big Data انجام میشود:
- انبارسازی (Warehousing)
- تمیزسازی (Cleansing): به عنوان مثال، حذف شمارههای ۸ رقمی از لیست شمارههای موبایل.
پس از انجام مراحل بالا، به کمک الگوریتمهای مناسب، ترند و نتیجه تحلیل این دادهها بدست میآید.
تجزیه و تحلیل کسبوکار (Business Analytics)
تعریف: برداشتی است که بشر در لایهی دانش (Knowledge) از دادههای BI میگیرد.
ما اکنون در سازمانها شاهد حذف Junior Analyst ها از لایهی آنالیز سازمانها هستیم، چون اکنون کامپیوترها قادر هستند تحلیلهای کسبوکاری انجام دهند. البته در آخر این به ما بستگی دارد که چه سبک گزارشهایی از دستگاه نیاز داریم.
شاخص کلیدی عملکرد (KPI)
هر مجموعه و سازمانی، با توجه به ماموریت و چشمانداز خود، باید KPIهایی با توجه به استراتژی سازمانی خود مشخص کند.
به عنوان مثال، ما میخواهیم در نقطهای از خیابان که در آن با ماشین خود پارک کردیم به انتهای خیابان برسیم. KPI ما در این صورت این خواهد بود که آیا به وسط کوچه رسیدیم؟، سرعتمان چند کیلومتر بر ساعت است؟ و یا آیا پشت سرمان ماشین دیگری وجود دارد یا خیر؟. این KPI ها در هر کسبوکار صورت مخصوص به خود را میگیرد. باید دید که آیا، به عنوان مثال، نسبت فروش به هزینهای که برای آن میکنیم KPI مناسبی برای کسبوکار ما میباشد یا خیر؟ نحوه اندازهگیری آن نیز برای هر KPI متفاوت میباشد و باید نسبتها را دقیق بررسی کرد و اندازه گرفت. مثلا برای مثال نسبت فروش هر چقدر این نسبت بیشتر باشد پس ما در فروش خود موفقتر بودیم.
در پایان…
به عنوان جمعبندی، ما در ایران دادههای زیادی داریم که متاسفانه آنها را ذخیره و ثبت نمیکنیم. این بمانند یک جریان آب میماند که در حال هدر رفتن است. در همین راستا میتوانیم این حرکت را از خودمان شروع کنیم و با باز کردن یک فایل اکسل، در طول روز، دادههایی که فکر میکنیم برایمان مهم است ثبت کنیم. مهم بودن این اطلاعات را میتوان از اینکه چه چیزهایی میخواهیم بر کسبوکارمان اندازه گیری کنیم، بفهمیم. در مدیریت گفته میشود: «چیزی که نتوان اندازه گرفت، همچنین نمیتوان مدیریت کرد.» پس چیزهایی که میخواهیم ذخیره کنیم به عنوان عامل در نظر گرفته و بررسی میکنیم و عوامل بسته به آنها را نیز بررسی کرده و به این نتیجه میرسیم که آیا این KPI ما هست یا خیر. ما اکنون در ایران در لایهی ذخیرهسازی دادهها در حال پیشرفت هستیم اما در پردازش این اطلاعات همچنان ناکامیم.
مطلبی دیگر از این انتشارات
به جای شغل جدید، بازار بسازیم
مطلبی دیگر از این انتشارات
فضاهای کار اشتراکی در ایران که باید به آن سر بزنید
مطلبی دیگر از این انتشارات
قیچی اصلاح بر ژنتیکهای معیوب