پس از مبتلا شدن به کرونا و گذراندن دوران قرنطینه خانگی، از روی اجبار به اندازه 10 سال اخیر برنامههای تلویزیون را مشاهده کردم. با توجه به حوزهی کار فعلیم که مربوط به تحلیل موضوعات کسب و کار در حوزهی فروش و بازاریابی است، جالبترین بخش برنامهها برای من آگهیهای بازرگانی بود. آگهیهایی که با بیسلیقهگی تمام و در زمان نامناسب برای مخاطب نامناسب پخش میشوند. به خاطر همین تصمیم گرفتم که در این پست به صورت مختصر چگونگی تحلیل یک کمپین تبلیغاتی که بر پایهی تبلیغات در مدیاهای تلویزیون، رادیو و نشریات عمومی با هدف افزایش فروش انجام میشوند را به صورت مختصر بیان کنم.
در زمان اجرای یک کمپین تبلیغاتی بسیار مهم است که به طور پیوسته شرایط موجود را تحلیل کرده تا بهترین وجه ممکن اهداف کمپین برآورده شوند. مسئولین اجرای کمپینهای تبلیغاتی باید همواره دنبال پاسخهای موجه برای دو سوال ذیل باشند:
دیتاست مورد استفاده برای کمپین بازاریابی از این لینک قابل دسترسی است. در این دیتاست میزان فروش مقداری به ازای هزینههای صرف شده در هر یک از مدیاهای تبلیغاتی بیان شده است.
برای جواب به سوالات فوق، از زبان برنامهنویسی پایتون و دو کتابخانه Pandas و Statsmodels استفاده خواهیم کرد. بدین منظور کتابخانههای فوق را در Jupyter Notebook فراخوانی مینماییم.
import pandas as pd
import statsmodels.formula.api as smf
ابتدا دیتاست را با قطعه کد ذیل فراخوانی مینماییم.
advertising = pd.read_csv('Advertising.csv', usecols=[1,2,3,4])
برای پاسخ سوال1، میتوان یک رگرسیون چندگانه بر روی متغییرهای مستقل تلویزیون، رادیو، روزنامه و متغییر وابسته میزان فروش برازش نمود و فرض آماری H0: BTV = BRadio = BNewspaper= 0 را تست نمود. بدین منظور آمارهی F برای پذیرش یا رد فرض صفر در مقابل فرض یک استفاده میگردد. به منظور انجام رگرسیون قطعه کد ذیل را در پایتون اجرا مینماییم:
est = sm.ols('sales ~ TV + radio + newspaper', advertising).fit()
est.summary()
در جدول ذیل نتایج اجرای رگرسیون چندگانه فوق بر دیتاست نشان داده شده است.
تفسیر نتایج این جدول به شرح ذیل میباشد:
مقدار آمارهی F در رگرسیون چندگانه برازش شده برابر با 570 است. با توجه به اختلاف زیاد آن با عدد 1، می توان با قاطعیت ادعا کرد که ضریب حداقل یکی از متغیرهای تلویزیون، رادیو و روزنامه نزدیک به صفر میباشد و حداقل یک متغیر تاثیر قابل ملاحظهای بر متغییر وابسته(میزان فروش) ندارد.
ضریبهای تخمین شده معادلهی رگرسیونی برای روزنامه در مدل رگرسونی تقریباٌ برابر صفر است و همجنین p-value آن در حدود 0.86 میباشد که با توجه به فرض صفر در نظر گرفته شده، این منغیر اثر معناداری در میزان افزایش فروش ندارد و با توجه به ضرایب تلویزیون و رادیو در معادله رگرسیون و مقادییر p-value آنها میتوان نتیجه گرفت که این دو متغییر تاثیر معناداری در میزان فروش دارند.
به منظور تحلیل دقیقتر این موضوع، با اجرای کد ذیل ماتریس ضریب همبستگی را برای سه متغییر مستقل و متغیر وابسته فروش ترسیم مینماییم:
advertising.corr()
ماتریس ضریب همبستگی در شکل ذیل نشان داده شده است:
تبلیغات تلویزیون و رادیویی ضریب همبستگی بالایی با میزان فروش دارند و روزنامه ضریب همبستگی پایینتری با میزان فروش دارند که تصدیقکنندهی نتایج رگرسیون میباشد.
اکنون میتوان بررسی نمود نتایج مدل تا چه میزان قابل اعتماد می باشد؟
شاخص Adjusted R-Squared برابر با 0.896 محاسبه شده است. این شاخص بیانگر میزان واریانسی است که توسط متغیرهای مستقل (رادیو، تلویزیون، روزنامه) در تعیین میزان متغییر وابسته(میزان فروش) در مدل رگرسیونی برآورد شده است. در دیتاست مورد بررسی، متغیرهای مستقل توانستهاند تا 90 درصد واریانس فروش را کاور کنند و تنها 10 درصد وابسته به متغیرهای مستقلی است که در مدل رگرسیونی در نظر گرفته نشدهاند. لذا میتوان به تحلیلهای صورت گرفته اعتماد نمود.
برای پاسخ به سوال دوم و تعیین این که به میزان یک واحد تخصیص بودجه در هر یک از مدیاهای تلویزیون و رادیو، میزان فروش چه مقدار خواهد بود، معادله رگرسیونی را با متغییرهای مستقل تاثیرگذار بر میزان فروش محاسبه مینماییم و قطعه کد ذیل را اجرا مینماییم:
est = smf.ols('sales ~ TV + radio', advertising).fit()
est.summary()
با اجرای کد، نتایج ذیل حاصل میگردد:
با توجه به نتایج جدول ذیل و ضرایب متغییرها خواهیم داشت:
sales = 2.9211 + 0.0458 * 1 + 0.188 * 1 = 3.1549
در واقع به میزان یک واحد هزینه برای تبلیغات تلویزیونی و رادیویی 3.15 واحد فروش خواهیم داشت.
اکنون با توجه به اطلاعات مرتبط با بهای تمام شده و سود حاصل از فروش می توان در رابطه با اثربخش بودن یا غیر اثربخش بودن تبلغات تصمیمگیری کرد.