علم داده فقط مخصوص یک زمینه نیست. چه شما مهندس باشی، چه دکتر، چه پلیس، بالاخره روزی میاد که چهارتا دختر و پسر با عینک و هودی بهتون نزدیک می شند و میگن که بهتر از شما می تونند بیماری هارو تشخیص بدن، فروش محصولات رو پیش بینی کنند یا حتی جنایت کارهارو شناسایی کنند.
من در اینجا خلاصه ویدئو این هفته رو مینویسم تا همه از زبان شیرین فارسی هم لذت ببریم:)
اول از همه باید بگم که من اینجا تجربیات خودم و هرچیز مفیدی که از اینترنت پیدا کردم رو براتون خلاصه می کنم. ازونجایی که پایتون و آر از بقیه معروف ترهستن، من تصمیم گرفتم یک مقایسه روی این دو بزنم. این به این معنی نیست که اگر از متلب یا برنامه دیگه ای استفاده می کنین، اونها به هیچ دردی نمی خورند:)
از اونجایی که این علم روز به روز داره معروف و معروف تر میشه، آدم های بیشتری دارن وارد این حوزه میشند. خیلی ازین آدم ها پیشینه یا مدرک کامپیوتری ندارند. به همین دلیل خیلی از ما اول که می خواییم شروع به یادگیری کنیم مغزمون بین چندین گزینه برای یادگیری مهمترین ابزار این مسیر، یعنی زبان برنامه نویسی مناسب، گیج میشه.
بیشتر از یک سال پیش شروع به یادگیری علم داده و کار در این زمینه کردم. اولین روز ها خیلی ازین زمینه سر درنمیاوردم ولی چون رشته خودم مهندسی صنایع بود و عاشقش نبودم، می خواستم یک زمینه ی مربوط به کامپیوتر رو امتحان کنم و چه فرصتی بهتر از دوره کارآموزی. همونطور که میدونین بازار کار ایران برای افراد کم تجربه خیلی باز نیست و من هم بابای کله گنده و با ارتباطات فوق العاده در شرکت های کله گنده نداشتم :)
خب ولی چون میدونستم که رشته خودم برام جذاب نیست گفتم عاقا من شروع می کنم به درخواست کارآموزی دادن تا یکجا بالاخره من بی تجربه رو قبول کنه :)
از ما درخواست و از اونها انکار :)
خلاصه بعد از این همه، یکی تونستم با یکی از شرکت ها برای تحلیل داده شروع به کار کنم. دو ماه کارآموزی یا شاید بیشتر خودآموزی و تلاش باعث شد بتونم همکاریم رو به عنوان کارمند باهاشون ادامه بدم. تو این دوران من با پایتون و تبلو کار می کردم و یکی از کارفرما ها یا بهتره بگم مشاورین اون شرکت، با R کار می کرد.
ما برای حل مسائل مختلف با هر دو زبان کار می کردیم و خیلی وقت ها هم برای نمایش داده به سراغ تبلو میرفتیم. اینجا من
1. ویژگی های هر دو زبان
2. معیار TIOBE
3. چیزی که الان در بین کاربران علم داده معروف هست
رو می نویسم تا باشد که دیگر فرزندان نوپای عالم داده رستگار شوند.
هر دو Python و R حدود 3 دهه هست که درست شدند. Python از روز های اولیه با هدف برنامه نویسی به راحتترین و بهینه ترین شکل نوشته شده. در صورتی که R رو محققان آماری نوشتند. همونطور هم که انتظار میره افرادی که از پیشینه آماری میان راحتتر می تونند در این محیط تحقیق و آنالیز دیتا انجام بدند اما افرادی که پیشینه کامپیوتری دارند با پایتون راحتترن.
پایتون زبان Robust هست. به این معنا که خوندن و دیباگ کردن توی اون خیلی راحتتر و ساده تر از آر میشه. حتی شما برای نوشتن توابع و یادگیری اونها مخصوصا در زمینه های یادگیری ماشین و هوش مصنوعی راحتتر می تونید با این زبان کار کنید و دستورات رو بهش بگید چون دستورات پایتون خیلی شبیه به زبان معمولی انگلیسی هست.
اما خب در پایتون شما خیلی ابزار ها و توابع آر رو ندارین و متاسفانه خیلی وقت ها نتایج به زیبایی نتایج آر درنمیاد.
این معیار محبوبیت یک زبان برنامه نویسی رو مشخص میکنه و همونطور که میبینید پایتون در مقایسه با آر خیلی خیلی محبوب تر هست. ولی خب این یک معیار جالب برای ما نیست چون داره یک جامعه بزرگ رو میبینه نه تنها دیتا کار هارو. ولی از این می تونیم بفهمیم که اگر شما پایتون بلد باشید و بخوایید در تیمی کار کنید که نرم افزار درست می کنند و از شما بخوان ماشین لرنینگ رو برای تحلیل بخش های مختلف یا حتی ارائه خدمات استفاده کنین، شما بهتر با تیمتون و همچنین بخش های مختلف کار می تونید تبادل اطلاعات و داده کنید.
توضیح نمودار: در یک همه پرسی در سال های اخیر از بین تمام افرادی که در کگل بودند، بیشتر از همه استفاده از پایتون رو به افراد تازه کار پیشنهاد میدند.
توضیح نمودار: از بین تمام گروه های مختلف فقط بین محققان علم داده از R بیشتر از Python استفاده می کنند.
توضیح (نمودارشو نمیذارم دیگه خسته شدم. بله:)) ): تمام افراد این حوزه با رنج های مختلف تجربه همه بیشتر از پایتون تا هر زبان برنامه نویسی دیگه استفاده می کنند.
امیدوارم این مقاله یک دید کلی برای تصمیم گیری بین این دوزبان بهتون داده باشه و از دیدن نمودار ها چیزی رو که میخواستید پیدا کرده باشید.
حتما در قسمت نظرها در اینجا یا یوتیوب، دیدگاهتون رو درمورد هر دو زبان یا حتی زبان های کاربردی دیگه برای علم داده به اشتراک بذارین :)