کگل(Kaggle) چیست(قسمت دوم )


توصیم اینکه اگه پست اول کگل چیست رو از اینجا نخوندید بهتره اونو اول بخونید (کلا ۴ دقیقه طول میکشه) که با فلسفه سایت کگل اشنا شید بعد این متن رو بخونید

مارک منسون (Mark Manson) نویسنده اثر معروف The Subtle Art of Not Giving a Fu*k یا همون هنز ظریف بی خیالی (اینجا میتونید از متمم راجبش بخونید) یه جایی تو کتاب میگه سوال کلیشه ای که وجود داره اینکه از هر کی بپرسی از زندگی چی میخای قطعا میگه که خونه،ماشین، خانواده خوب و ... .ولی اینا رو که همه میخان
سوالی که مطرح میکنه و واقعا زندگی رو دچار تغییر میکنه اینکه حاضری برا چی درد بکشی؟ عایا حاضری برای رسیدن به هدفت ساعتها پشت میز باشی و کار کنی و کد بزنی؟ حاضری برا یه ارتباط خوب جوابهای رد زیادی بشنوی؟ حاضری .... تا ...... این لیست واقعا ته نداره
مارک منسون از اون وبلاگ نویسهای بقول خودش از نظر بقیه احمق هستش ولی واقعا ادمیه که پای صحبتاش و کتاباش (here) بشینی یه تکون واقعیت بهت میده که زندگیتو متحول میکنه
به شخصه کتاب بالا رو دوبار فارسی و انگلیسشو خوندم برا منی که کلی کتاب نصفه نیمه هست که ولشون کردم بخاطر اینکه حال نکردم با متن یا نویسنده!
خب اگه میگین اینا چه ربطی داره به کگل باید بگم نکتش همینه که عایا حاضری برای پیشرفتت درد بکشی؟ حاضری با افرادی رقابت کنی که واقعا بقول مهدی علیپور در دکتر استارتاپ مثل موتور گازی هستی در لاین سرعت چون وقتی میای میبینی برادرای و بعضا خواهرای هندی و پاکستانی اینجا رو ترکوندن! صرفا خواستم بگم واقعیت اینه ولی دلیل نمیشه که تلاش نکنیم (اینم بگم گرند مستر ایرانی هم داریم اینم یه نمونش) یعنی شدنیه
خب بریم سر اصل مطلب راجب کگل،اول از بخشاش بگم و بعد برم سر جزییات هر بخش
تقریبا همه کارهای مرتبط با دیتاساینس رو میتونید تو سایت ببینید از مسابقه گرفته تا مشاغل فعال و آموزش ولی بخش مهمش همون مسابقه هستش.


توی بخش مسابقه میتونید مسابقات مختلف رو ببینید و اونیکه دوست دارید رو شرکت کنید کافیه که دکمه join رو بزنید و اراجیف ترمزاندکاندیشن رو تایید کنید

حتما میپرسید مسابقات جایزه هم داره؟ آره عاقا خوبم دارن! فک کن اگه اول بشی تو یه مسابقه بالای ۱۰ هزار دلار گیرت میاد که الانی که من این متنو مینویسم میشه تقریبا 230 میلیون تومن!! البته تا شما بخونی متنو ممکنه شده باشه ۵۰۰ میلیون یا شایدم ۶۰۰ خدا میدونه یعنی پول چند سال کارمندی! ولی اینطوریام نیست همونیکه گفتم رقابت شدیده.
تبهای زیر عکس که مشخصه برا چی هستن ولی بخش مهمش notebook و discussion هستش که فلسفه اصلی یادگیری اینجاس چون یه عده برا اینکه رتبه بیارن میان کدهاشونو شییر میکنن و با امتیاز گرفتن رتبشون ارتقا پیدا میکنه( کلا بحث اینستیو هستش که کامیونیتی ها رو میچرخونه اگه نه ملت بیکار نیستن که وقت صرف کنن ولی خب اینستیو هر فرد فرق میکنه یکی رتبه هستش یکی پول یکی فقط نشون داده شدن).

یه نمونه مثال بزنم خودم یه بار یه دیتایی رو لود کردم و روش مدل زدم ولی مموری ارور گرفتم حتی رو خود کرنل کگل(کگل یه سری امکانات سروری بهت میده که لازم نیست دیتارو دانلود کنی و مستقیم میتونی مثل کولب کداتو ران کنی GPU & TPUهم میتونی استفاده کنی اما باید بری فعال کنی ولی محدودیت هفتگی داره) خلاصه با یکم سرچ توی نوتبوکها یه فانکشن یه بنده خدایی گذاشته بود که حجم دیتارو کم میکرد و منم زحمت کپی پیست رو کشیدم! و کارمو راه انداخت. اینجاست که اون کامیونیتیه بدرد میخوره.


بخش دیسکاسشن هم معمولا اگه سوالی از اون سازمانی که دیتارو گذاشته (مثلا در عکس بالا lyft) و یا با بقیه گفتگو کنی هستش و میتونی هم تیمی پیدا کنی که یافتن یه ادم که باهات مچ باشه سخته ولی ارزش تست داره من خودم با خیلیا از دیار کفر تیم تشکیل دادم از هند و چین و امریکا بگیر تا اوکراین ولی پیگیر نبودن بجز یکی دو مورد که واقعا وقت میزاشتن.

بعد اینکه به مسابقه جوین شدین میتونید یه کرنل یا همون نوتبوک جدید برا خودتون بسازید و کداتون رو بسته به زبانی که میخاین کار کنید(R & Python) انتخاب کنید و بسم الله شروع کنید به کد زدن. وقتی هم کارتون تموم شد بخاین ببینید چقدر مدلی که زدین با توجه به متریکی که توی مسابقه گفته شده (قسمت overview میتونین پیداش کنین) خوبه و نسبت به سایرین چه رتبه ای دارین میتونید مراحل زیر رو برید و خروجی مدلتون رو سابمیت کنید (مراحلش توی عکسای زیر هست)

بعد دکمه آبی بالا سمت راست رو بزنید و مثل عکس زیر دکمه save &Run .... رو انتخاب و save رو بزنید

یکم صبر کنید تا done رو ببینید پایین سمت چپ و بعد عدد کنار دکمه ورژن رو انتخاب کنید تا به صفحه ورژن های مختلف هدایت شید بعد دکمه go to viewer بازم بالا سمت راست رو بزنید و به صفحه جدیدی که وارد میشید برید قسمت output و از اونجا میتونید دکمه submit رو بزنید و نهایتا میتونید رتبتون رو ببینید

در اخر راجب سطوح مختلف یوزرها بگم که بدونید بد نیست

بخام ساده شده براتون بگم سیستم امتیاز بندی کگل بر اساس سطح و حوزه فعالیت(مسابقه/دیتاست/فعالیت در کامیونیتی کگل شامل نوتبوک و دیسکاسشن) مثل شکل زیره

مثلا این یوزر لوول مستر داره توی مسابقه ولی فعالیت آنچنانی در کامیونیتی کگل نداشته یا بقول معروف همون بچه سرتقی که تو فوتبال دوست داشته فقط خودش گل بزنه(اینم گفتم که بدونید بجز شنا توی پست اول، فوتبال هم بلدم!)