سؤالات مصاحبه استخدامی متخصص علم‌داده

یکی از مهم‌ترین‌ گام‌های ارزیابی یک متخصص علم‌داده علاوه بر بررسی کردن رزومه کاری، مصاحبه استخدامی و پرسیدن برخی از سؤالات تخصصی از وی ‌می‌باشد. لذا اگر در شرکت خود قصد استخدام دانشمند علم‌داده دارید می‌توانید از سؤالات ذیل جهت بررسی هر چه بیشتر دانش تخصصی وی استفاده نمایید.

متخصصین و دانشمندان علم‌داده هم با پاسخ به سؤالات زیر می‌توانند دانش خود را محک بزنند!

1- چرخه انجام یک پروژه علم‌داده چیست؟

2- روش Cross Validation چیست و چه مزایایی دارد؟

3- مراحل پیاده‌سازی یک محصول تجاری داده محور چگونه می‌باشد؟

4- بیشترین حجم دادگان مورداستفاده در پروژه‌های قبلی چه میزان بوده است؟ جهت مدیریت این حجم از چه پلتفرم و ابزارهایی استفاده کرده‌اید؟

5- مهم‌ترین گام در چرخه متدولوژی CRISP-DM چیست و چرا؟

6- پاک‌سازی اطلاعات چیست و چگونه انجام می‌گردد؟

7- چگونه دادگان غیر ساخت‌یافته به اطلاعات ساخت‌یافته تبدیل می‌گردند؟

8- در پیاده‌سازی یک مدل مبتنی بر یادگیری ماشین، پایدار بودن(robust) اهمیت بیشتری دارد یا میزان صحت(Accurate)؟

9- گام‌های بهینه‌سازی یک الگوریتم ازلحاظ سرعت و کیفیت چیست؟

10- تفاوت الگوریتم‌ها و روش‌های با نظارت با روش‌های بدون نظارت چیست؟

11- تفاوت Overfitting و Underfitting چیست و چه زمانی اتفاق می‌افتند؟

12- تفاوت معیارهای ارزیابی precision و recall چیست؟ کدام‌یک کارآمدتر هست؟

13- از چه راهکارهایی جهت مدیریت دادگان غیرمتوازن(Unbalance Data) استفاده خواهید کرد؟

14- چه معیارهای جهت انتخاب یک الگوریتم یادگیری ماشین جهت پاسخ به یک مسئله وجود دارد؟

15- تفاوت پایگاه داده، انبار داده و Data Mart چیست؟

16- چه زمانی از الگوریتم‌هایی مانند SVM یا Random Forset استفاده می‌کنید و چرا؟

17- تحلیل مؤلفه‌های اصلی (Principal component analysis) چیست و چه مزایا و معایبی دارد؟

18- نسل‌های معماری‌های پردازشی کلان داده چیست و Map Redcue چه تفاوتی با موتور پردازشی Spark دارد؟

19- پایگاه داده‌های غیر رابطه‌ای به چند دسته تقسیم می‌شوند و در چه مسائلی می‌توانند مورداستفاده قرار بگیرند؟

20- روش‌های مبتنی بر شبکه‌های عصبی پیشرفته(یادگیری عمیق) چه مزایا و معایبی نسبت به سایر الگوریتم‌ها و روش‌ها دارد؟


ارادتمند

محمدرضا محتاط

https://t.me/dataanalysis