بیگ کوئری (BigQuery) یک پایگاه داده (data warehouse) متعلق به گوگل هست که به شما اجازه میده داده ها رو مدیریت کنید. بیگ کوئری میتواند دیتای شما را از منابع مختلف (آنالیتیکس، ادز و …) جمع آوری و پردازش کند. بیگ کوئری جزوی از Google Cloud Platform است و با داشتن اکانت گوگل کلاد، می توان به گوگل این ابزار هم دسترسی داشت.
جلوگیری از حذف دیتای یوزر
جلوگیری از محدودیت های نمایش دیتا مثل data sampling و data threshold
بکاپ گرفتن از آنالیتیکس یونیورسال
تغییر و پردازش آسانتر دیتا
امکان فیلتر کردن داده های اشتباه
رایگان بودن
برای ساخت پروژه در Google Cloud ابتدا وارد آدرس https://console.cloud.google.com شوید. می توانید google cloud را در مرورگر خود سرچ کرده و از لینک google cloud وارد صفحه اصلی شوید و از بالا سمت راست دکمه console را انتخاب کرده و وارد صفحه کنسول شوید. از صفحه کنسول دکمه select a project را مطابق شکل زیر انتخاب کنید.
در صفحه باز شده New Project را انتخاب کرده تا پروژه جدید بسازید. اگر از قبل پروژه ساخته اید می توانید همان را انتخاب کنید.
در صفحه زیر اسم پروژه را به دلخواه نوشته و Create کنید.
پروژه شما ساخته شد. در قسمت بالا سمت چپ باید اسم پروژه نمایش داده شود. اگر این اسم را در اینجا مشاهده نمی کنید، از همین قسمت پروژه خود را انتخاب کنید.
در این بخش نیاز است API بیگ کوئری را برای استفاده آنالیتیکس و دیگر دیتاسورس ها قابل دسترسی کنیم.
ایپیآی (API) یا Application Programming Interface مکانیزمی برای ارتباط دو نرم افزار است.
بعد از انتخاب پروژه ای که ساختیم، از منوی همبرگری سمت چپ وارد بخش APIs and Interfaces می شویم و قسمت Enable APIs and Services را انتخاب کنید.
در صفحه باز شده، دکمه ENABLE APIS AND SERVICES + را بزنید.
در قسمت سرچ، BigQuery API را بنویسید و دقیقا گزینه زیر را انتخاب کنید.
در این قسمت گزینه enable را فعال کنید.
برای اتصال بیگ کوئری به آنالیتیکس از بخش Admin آنالیتیکس وارد شوید.
از قسمت Product Links گزینه BigQuery Links را انتخاب کنید.
در این قسمت دکمه Links را بزنید.
در اینجا Choose a BigQuery Project را انتخاب کنید.
پروژه ای که در گوگل کلاد ساختید را انتخاب کنید.
نکته: ممکن است با خطای BigQuery API isn't enabled for the selected Google Cloud project مواجه شوید. این خطا به این دلیل است که API بیگ کوئری در گوگل کلاد enable نشده است. (بخش قبلی)
در مرحله بعد با انتخاب Configure data streams and events دیتا استریم هایی که می خواهید به بیگ کوئری وصل شوند را انتخاب کنید. می توانید تمام دیتا استریمها را انتخاب کنید. به دلیل اینکه روزانه تا ۱ میلیون ایونت مجاز است که به بیگ کوئری فرستاده شود، می توانید دیتا استریمهایی که احتیاجی ندارید را انتخاب نکنید.
همچنین در این قسمت از شما میپرسد چه ایونت هایی را نمی خواهید به بیگ کوئری ارسال کنید. میتوانید ایونت های غیر مهم را در این بخش اضافه کنید. البته این اتفاق فقط برای سایتهای با تعداد ایونت بسیار بالا رخ میدهد. (بنابراین احتیاجی به اضافه کردن ایونتها در این بخش نیست.)
انتخاب data location اهمیتی ندارد و میتوانید روی همان united states باقی بگذارید. دکمه next را بزنید.
در منوی Export Data دو روش Daily و Streaming برای ارسال دیتا به بیگ کوئری وجود دارد. البته در اکانت رایگان بیگ کوئری امکان استفاده از روش Streaming وجود ندارد. در ارسال اطلاعات به روش Daily، دیتای روزانه از آنالیتیکس در پایان روز در جدولی با نامی شبیه به events_intraday_YYYYMMDD به بیگ کوئری ارسال می شود و در روش Streaming دیتا در طول روز با جدول هایی با نام شبیه events_YYYYMMDD به بیگ کوئری ارسال می شود و در پایان روز این فایل ها پاک شده و فایل events_intraday_YYYYMMD باقی میماند.
دکمه next را زده و سپس submit کنید. آنالیتیکس به BigQuery لینک میشود.
در بخش آخر باید به گوگل اکانت در آنالیتیکس دسترسی Administer بدهید تا اجازه داشته باشد دیتای شما را از آنالیتیکس خروجی بگیرد.
برای این کار در صفحه console.cloud.google.com از منوی همبرگری بالا سمت چپ، I AM Admin را انتخاب کنید.
نیاز است که ابتدا یک service account بسازیم. از منوی دست چپ صفحه I AM Admin، گزینه Service Accounts را انتخاب کنید.
در صفحه باز شده دکمه Create Service Account را بزنید.
در صفحه باز شده نام اکانت را بنویسید. (مثلا my-website) در اینجا خود به خود Service Account ID ساخته میشود. نیاز است که email address ساخته شده را کپی کنید تا بعدا در آنالیتیکس به این ایمیل دسترسی بدهید.
در صفحه بعد در قسمت select a role رول owner را انتخاب کنید.
سپس done را بزنید.
اگر از قسمت ساخت اکانت ایمیل را کپی نکردید، در صفحه باز شده، میتوانید از این قسمت کپی کنید. ایمیل ساخته شده را انتخاب کنید و سپس آن را کپی کنید. همچنین میتوانید با انتخاب ایمیل، صفحه key را انتخاب کرده و از دکمه Add Key و سپس Create new key، کلید ورود به این سرویس اکانت را دانلود کرده و ذخیره کنید. این فایل، کلید ورود شما به سرویس اکانت است.
در این بخش میخواهیم به ایمیلی که در قسمت قبل کپی کردیم دسترسی Administer بدهید. از قسمت Admin آنالیتیکس وارد بخش Account و سپس Account access management بشوید.
از دکمه + ایمیلی که کپی کردید را وارد کنید. دقت داشته باشید که به این ایمیل دسترسی Administer بدهید.
بعد از ۲۴ ساعت بیگ کوئری به آنالیتیکس وصل میشود و ۲۴ ساعت نیز طول میکشد تا دیتا از آنالیتیکس به بیگ کوئری ارسال شود. بنابراین بعد از ۴۸ ساعت میتوانید اولین دیتا را در بیگ کوئری ببینید.
برای مشاهده دیتای آنالیتیکس در صفحه console.cloud.google.com از منوی همبرگری در بالا سمت چپ، BigQuery را انتخاب میکنیم و وارد فضای بیگ کوئری شوید.
از قسمت explorer آنالیتیکس را انتخاب کنید.
در اینجا میتوانید دیتای آنالیتیکس را به صورت جدول یا فایل JSON مشاهده کنید.
دیتای آنالیتیکس به شکل جدول، شامل ستون (column) و سطر (row) به بیگ کوئری در جدولی با نام events_YYYYMMDD به بیگ کوئری ارسال میشود.
ستونها (column) شامل لیست زیر میشود که اطلاعاتی نظیر سورس، مدیوم، اطلاعات جغرافیایی و … را در خود ذخیره دارد.
سطرها (row) شامل لیست زیر میشود که اطلاعاتی نظیر event_date event_name و … را در خود ذخیره دارد.
در این حالت شما به محیط sandbox فضای ابری گوگل یعنی پلن رایگان دسترسی دارید. ایراد sandbox این است که بعد از ۶۰ روز دیتای شما پاک میشود و حتما نیاز است که اکانت گوگل خود را به یک کردیت کارت وصل کنید تا دیتا در BigQuery باقی بماند. (فقط نیاز است که به کردیت کارت وصل کنید، نیاز به پرداخت هزینه نیست.) در غیر این صورت میتوانید قبل از پاک شدن دیتا پروژهی دیگهای بسازید و آن را به آنالیتیکس وصل کنید.
این اطلاعات را در این لینک از توضیحات گوگل میتوانید بخوانید.