فرصت‌هایی که در پایگاه‌های داده مشترک وجود دارد

یک سوپرمارکت زنجیره‌ای در استرالیا با یک شرکت بیمه خودرو یک برنامه مدیریت وفاداری مشتریان مشترک ایجاد می‌کند. اطلاعات ترکیبی به‌دست‌آمده از کارت‌های عضویت مشتریان همبستگی‌های جالبی را مشخص کردند. داده‌ها نشان داد که آن‌هایی که گوشت قرمز و شیر بیشتری می‌خرند، با احتمال بیشتری دچار تصادف می‌شوند و از بیمه خود استفاده می‌کنند. در مقابل آن‌هایی که پاستا و یک نوشیدنی خاص را می‌خرند و شب‌ها بنزین می‌زنند، ریسک کمتری برای شرکت بیمه دارند. شرکت بیمه از این جمع‌بندی چگونه می‌تواند استفاده کند؟

یکی از کاربردهای مهم دانستن همبستگی بین متغیرها، استفاده در پیش‌بینی است. اگر ما بدانیم بین الف و ب همبستگی وجود دارد و بدانیم الف رخ خواهد داد، آنگاه می‌توان پیش‌بینی کرد که ب نیز رخ خواهد داد. اما بین همبستگی و رابطه علّی تفاوت وجود دارد. در مثال بالا نمی‌توان این‌گونه نتیجه گرفت که خوردن گوشت یا شیر باعث افزایش احتمال تصادف می‌شود.

پرسش اصلی در مسائلی مانند مثال بالا این است که آیا می‌توان بر اساس همبستگی دیده‌شده بین دو متغیر تصمیم به اقداماتی گرفت یا خیر؟

آیا همین‌که بدانیم دو رخداد باهم اتفاق می‌افتند می‌تواند کافی باشد یا حتماً لازم است بدانیم چرا این دو رخداد اتفاق می‌افتند؟ چه زمانی می‌توانیم بر مبنای همبستگی عمل کنیم؟

پاسخ در دو نکته نهفته است:

✅نکته اول، تا چه حد اطمینان داریم که همبستگی در آینده هم رخ خواهد داد. هرچه اطمینان بیشتری داشته باشیم که همبستگی در آینده هم رخ خواهد داد، منطقی‌تر آن است که اقدام کنیم. این مسئله دو جنبه دارد. یکی آنکه بر اساس داده‌های تاریخی بررسی کنیم این رابطه با چه فرکانسی تکرار شده است. هرچه این همبستگی بیشتر تکرار شده باشد، احتمال آنکه دو متغیر به هم مربوط باشند بیشتر است. مسئله بعد این است که چه توضیحاتی برای وجود این همبستگی داریم. اگر فرضیه‌هایی که برای توضیح این همبستگی داریم کمتر باشد و به آن‌ها اطمینان بالاتری داشته باشیم، احتمال بیشتری وجود دارد که دو متغیر به هم مربوط باشند.

✅نکته دوم، سبک‌سنگین کردن بین ریسک و پاداش اقدام است. اگر اقدام منجر به‌اشتباه شود و ما در معرض ریسک بالایی قرار بگیریم، آنگاه ممکن است اقدام بر اساس یک همبستگی خیلی قوی هم درست نباشد.

بر همین اساس گروه مشاوران بوستون (BCG) چارچوبی را مطرح کرده که در مقاله ای که لینک آن در زیر آمده است، توضیح دادم. سپس کاربرد این چارچوب را برای مثالی که در ابتدا ذکر کردم، شرح دادم.

فرصت های زیادی برای شرکت‌های ایرانی وجود دارد تا با شرکت‌هایی که محصولات یا خدمات مکمل دارند برنامه‌های مشترک ایجاد کنند. یکی از کاربردهای مهم این برنامه های مشترک بهره گیری از پایگاههای داده تلفیقی است که می تواند ابعاد دقیق تر و بهتری را از رفتار خرید مشتریان به دست دهد و برای طرفین ارزش خلق کند. امیدوارم این نگرش در بین شرکت‌های ایرانی گسترش پیدا کند.

در صنعت شما چه فرصت‌هایی برای همکاری‌های مشترک و بهره‌گیری از داده های آن وجود دارد؟

https://analica.ir/when-to-act-on-correlation/