علم داده چیست و چه کاربردی دارد

انسان همواره با تجزیه و تحلیل داده ها و اطلاعات بدنبال بهبود عملکرد ها و فرایند های اطراف خود بوده است و به همین دلیل داده ها همواره نقش مهمی در زندگی ما داشته اند اما امروز با ظهور شبکه ها و دنیای مجازی و همچین کسب و کار ها وعلوم گوناگون نقش آنها بسیار پر رنگ تر شده است بطوری که عصر کنونی را عصر داده ها می دانند.روزانه بیش از ۲.۵ میلیون ترابایت داده در اینترنت تولید می شود که حدود ۷۵ درصد آنها ساختار نیافته هستند.این داده ها زمانی ارزشمند خواهند بود که بتوان آنها را تحلیل کرده و از دل انها آمار و ارقامی بدست آوریم که با استفاده از انها بتوان به شناخت بیشتر و بهتر بازار،رفتار های کاربران و علایق انها و چیزهایی اینچنین دست یابیم.
علم داده (data science ) یک علم میان رشته ای پیرامون استخراج دانش و آگاهی از مجموعه ای داده و اطلاعات است و به جمع آوری،آماده سازی،تحلیل ،بصری سازی ،مدریت و نگاه داشت اطلاعت در حجم بالا می پردازد و با علوم مختلفی همچون ریاضیات ،امار،یاد گیری ماشین ، یاد گیری عمیق(deep learning )و ... در ارتباط است.به عبارت دیگر علم داده مطالعه محلی که داده ها از ان می آيند،نشانگر چه چیزی هستندو چگونه مبدل ساختن آن ها به منبعی ارزشمند برای کسب و کار و استراتژی های فناوری اطلاعات سازمان است.
در ضمن دیتا ساینتیست ها متفاوت از متخصصین امار هستند.با اینکه آنها اهداف و مهارت های مشترکی دارند و هر دو از داده های حجیم استفاده می کنند اما متفاوت هستند.دانش داده(data science ) حوزه جدیدی است که عمیقا بر استفاده از کامپیوتر و فناوری متکی است.
برای مثال برای کاربرد دانش داده دپارتمان‌های فروش و بازاریابی می‌توانند داده‌های مشتریان را برای بهبود نرخ جذب مشتری و ساخت کمپین‌های فرد به فرد کاوش کنند. موسسات بانکی، داده‌های خود را جهت ارتقا وظیفه شناسایی کلاهبرداری کاوش می‌کنند. سرویس‌های استریم مثل «نتفلیکس» (Netflix) داده‌ها را برای شناسایی آنچه کاربران به آن علاقمند هستند و استفاده از آن‌ها برای دانستن اینکه تولید چه فیلم‌ها یا برنامه‌های تلویزیونی بهتر است کاوش می‌کنند.همچنین، در نتفلیکس از الگوریتم‌های مبتنی بر پایگاه داده به‌منظور ساخت توصیه‌های شخصی‌سازی شده متناسب با عقاید کاربران استفاده شده است. شرکت‌های حمل‌و‌نقل مانند FedEx ،DHL و UPS از علم داده برای کشف بهترین مسیرها، زمان‌ها و نوع حمل‌و‌نقل کالا استفاده می‌کنند. با وجود کاربردهای متعدد علم داده، این زمینه در کسب‌و‌کار هنوز نوظهور است، زیرا شناسایی و تحلیل حجم انبوهی از داده‌های ساختار نیافته می‌تواند برای شرکت‌ها بسیار پیچیده، گران قیمت و زمان‌بر باشد.