مرجع تخصصی آمار ایران
مسیرهای شغلی در علم داده
علم داده (Data Science) را میتوان به عنوان ترکیبی از تحلیل آماری و مهارتهای برنامه نویسی برای آنالیز دیتاستهایی با حجم بالا و ارائه پیشبینیها و نتایج معنیدار خلاصه کرد. این امر به اجرای بسیاری از مهارتها مانند آمار، داده کاوی، رگرسیون، طبقه بندی، مدل سازی و تجسم دادهها و غیره نیاز دارد.
جمع آوری دادهها آغاز این راه است؛ زیرا بیشتر دادههای خام بدون فیلتر صحیح، مرتب سازی و تمیز کردن (cleaning) بیفایده هستند. دادههای خام برای اینکه بتوانند به طور مناسب مدل سازی شوند و مورد تجزیه و تحلیل قرار گیرند باید توسط محققان داده ترکیب و یا حذف گردند.
امروزه علم داده و کلان دادهها (big data) نقش بسیار پررنگی در جهت ایجاد استراتژیهای موفق در تصمیم گیری یا روابط تجاری کمپانیهای بزرگ ایفا میکنند. این نیاز روزافزون به مهندسی کلان داده و علوم کاربردی، بسیاری از صنایع را به استخدام محققان داده به عنوان جادوگران امروزی برای پیش بینی نتایج و ارائه تفسیرهای معنیدار سوق داده است.
در حال حاضر محققان داده با پیش زمینههای مختلفی از جمله زیست شناسی، مالی، اقتصاد، محیط زیست، کامپیوتر، آمار و غیره وجود دارند. این تنوع و کاربردها در علوم مختلف باعث ایجاد یک بینش خلاقانه و افزایش مهارت حل مشکلات مختلف در آنها میگردد. اگرچه این مقاله سعی در پوشش کلیه مشاغل مرتبط با علم داده را ندارد؛ اما سعی خواهد کرد متقاضیان یادگیری و متقاضیان شغل را با مسیرهای مختلف علم داده همانطور که در شکل زیر مشاهده می شود آشنا کند.
امور عمومی (Public Affair)
یک محقق داده در این مسیر شغلی از آمار و مهارتهای علوم کامپیوتر استفاده میکند تا سیاستهای کلی مؤثری را در جهت رفع مشکلات اجتماعی ایجاد کند. این کار از طریق پرسشنامههای سیاسی، زیرساختها/ شهرهای هوشمند/ مدیریت حمل و نقل، تشخیص کلاهبرداری دولت (به عنوان مثال فرار مالیاتی)، مدیریت سیستمهای آموزش، بهداشت عمومی/ مسکن/ تحلیل دادههای اجرای قانون و غیره انجام میشود.
آنالیز تجاری (Business Analytics)
آنالیزهای تجاری اساساً از علم داده برای تعیین تصمیمات تجاری، شناسایی نقاط ضعف و اعمال تغییرات عملی درون یک سازمان برای بهبود شاخصهای کلیدی عملکرد یا سایر اقدامات استفاده میکنند. اگرچه تحلیل دادهها و تحلیلهای تجاری اهداف مشترک یکسانی دارند؛ اما تصمیم گیری، انجام تغییرات و ارتباطات بیشتر در مورد دوم (تحلیلهای تجاری) وجود دارد.
سرمایه گذاری و امور مالی (finance)
تحلیل داده هسته اصلی خدمات مالی است. پیش بینی قیمت، استفاده از مدلهای آماری برای پیش بینی بورس، شناسایی تغییرات، تخمین طول عمر مصرف کننده و تشخیص کلاهبرداری از جمله مزایایی است که یک محقق داده میتواند به ارائه دهندگان خدمات مالی ارائه دهد. در واقع استفاده از علم داده در امور مالی منجر به تصمیم گیری در زمان صحیح و ایجاد الگوریتمهای معاملاتی میشود که فرصتهای بازار را پیش بینی کرده و نحوه ایجاد روابط با مشتری را بر اساس دادههای قبلی و هوش مصنوعی معین میسازد.
علم کامپیوتر (Computer Science)
علم داده میتواند به عنوان یک شاخه در حال توسعه از علم و به عنوان زیر مجموعهای از علم کامپیوتر به اضافه بخش آمار در نظر گرفته شود. با این حال به دلیل مباحث مشترک در علم داده و علم کامپیوتر، یک محقق داده میتواند از نقطه تلاقی این تکنیکها نیز استفاده کرده و ریاضیات و مهارتهای رمزگذاری را در بسیاری از زمینههای علم کامپیوتر مانند مدیریت دیتابیس (database)، محاسبات علمی و داده کاوی به کار گیرد. محقق داده در مباحثی از قبیل هوش مصنوعی و پردازش زبان طبیعی (natural language processing) نیاز دارد تا از پیش زمینه رمزگذاری بیشتری برخوردار باشد.
امنیت سایبری (Cybersecurity)
علم داده در بسیاری از سیستمهای امنیت سایبری استفاده میشود. بر اساس مدلهای تحلیلی و هوش مصنوعی، پاسخ به مخاطرات قدیمی و جدید به طور خودکار انجام میگردد. از طریق تکنیکهای علم داده، یک سازمان میتواند دادهها را از نزدیک مورد بررسی قرار داده و یک سیستم تشخیصی عالی را برای جلوگیری از کلاهبرداری و محافظت از اطلاعات ارزشمند پیاده سازی کند.
علم محیط زیست (Environmental Science)
در سالهای اخیر گرم شدن کره زمین به دلیل آلودگیهای صنعتی به یک موضوع مورد بحث تبدیل شده است. یک محقق داده با دانش زیست محیطی میتواند تکنیکهای مدل سازی و پیش بینی را در مجموعههای مختلف داده مانند سطح آلایندهها، افزایش سطح آب و میزان نمک، مقادیر جوی و دادههای مکانی از اکوسیستمهای مختلف زمین شناسی اعمال کند. نتایج را میتوان در سیستمهای اطلاعات جغرافیایی، اقلیمشناسی، سنجش از دور برای پروژههای نظارتی بر محیط زیست و تغییرات جهانی آب و هوا استفاده کرد.
روابط اقتصادی بین المللی (International Economic Relations)
علم داده همچنین میتواند برای فراهم آوردن درک عمیق از اقتصاد سیاسی بین المللی، اقتصاد محیط زیست، فرایند جهانی سازی و جهانی شدن (globalization process) و روابط تجاری و مالی مورد استفاده قرار گیرد.
اقتصاد خرد (Microeconomics)
یک محقق داده میتواند مهارتهای خود را در زمینههایی مانند اقتصاد و تحلیل اقتصادی، اقتصاد عمومی و کار، آزمایشهای اقتصادی و ارزیابی تأثیر به کار گیرد.
بیوتکنولوژی (Biotechnology)
بیوتکنولوژی را میتوان علم استفاده از روشهای تکنیکی برای تحلیل ارگانیسم زنده، سیستمهای بیولوژیکی یا به طور کلی سیستم مراقبتهای بهداشتی تعریف کرد. بسیاری از شرکتهای بیوتکنولوژی (زیست فناوری) نیاز به استخدام محققان داده دارند. آنالیز ژنوم و تعیین توالی نسل بعدی به بیوتکنولوژیستها با دانش آماری و برنامه نویسی نیاز دارد تا حجم وسیعی از دادهها را برای یک تحقیق خاص آنالیز کنند. علاوه بر این، اکتشافات دارویی مانند واکسن، آنالیز عوارض جانبی و طبقه بندی میکروارگانیسمها یا بیماریها میتوانند از طریق علم داده انجام شوند.
هر چه مشاغل بیشتری به علم داده اعتماد میکنند، نیاز به متخصصانی که میتوانند دادهها را جمع آوری، سازماندهی و تفسیر کنند افزایش مییابد. در سالهای آینده نیاز به تحلیلگران و محققان داده بسیار زیاد خواهد بود و مشاغل مختلف موجود در این زمینه تکنیکهای منحصر به فرد در جهت رفع مشکلات مربوط به دادهها را ایجاد خواهند کرد.
منبع: TOWARDSDATASCIENCE
مطلبی دیگر از این انتشارات
حجم نمونه آماری چقدر است؟
مطلبی دیگر از این انتشارات
چگونه در سال آینده محقق داده (data scientist) بزرگی بشویم؟
مطلبی دیگر از این انتشارات
هر آنچه که باید درباره پی-مقدار یا p-value در علم آمار بدانید