hyperparameters
hyperparameters
خواندن ۶ دقیقه·۳ سال پیش

چگونه خواندن مقالات به شما کمک می کند دانشمند داده موثرتری باشید

چرا به جای بررسی دستی داده هایمان، کاری را که لینکدین انجام داد را امتحان نکنیم؟ این به آنها کمک کرد تا 95 درصد دقت و 80 درصد به خاطر بیاورند.

سپس هم تیمی من نحوه استفاده لینکدین از نزدیکترین همسایگان برای شناسایی برچسب های متناقض (در عنوان شغل) را به اشتراک گذاشت. سپس، لینکدین یک ماشین بردار پشتیبانی (SVM) را بر روی برچسب‌های ثابت آموزش داد. سپس SVM برای به روز رسانی برچسب های ناسازگار استفاده شد. این به آنها کمک کرد تا به دقت 95 درصدی در طبقه بندی عنوان شغلی خود دست یابند.

این پیشنهاد در بحث ما مفیدترین بود. پیگیری آن منجر به دقت نهایی طبقه‌بندی محصول ما به 95٪ شد. من پرسیدم که چگونه او توانست در این بینش انتقادی مشارکت کند. او پاسخ داد: "اوه، من فقط هر از چند گاهی مقاله می خواندم." به طور خاص، او سعی می کند هر هفته 1 تا 2 مقاله بخواند، معمولاً در مورد موضوعاتی که تیم روی آنها کار می کرد.

با خواندن مقالات، ما توانستیم یاد بگیریم که دیگران (به عنوان مثال، لینکدین) چه چیزهایی را مفید (و نه کارآمد) یافته اند. سپس می‌توانیم رویکرد آنها را تطبیق دهیم و مجبور نباشیم موشک را دوباره اختراع کنیم. این به ما کمک می کند تا یک راه حل کارآمد را با زمان و تلاش کمتر ارائه دهیم.


مقاله ها حاوی دانش مقطر در مورد آنچه که دیگران کار می کنند و کار نمی کنند هستند. با خواندن آنها، به فضای مشکل سرعت می‌دهیم و رویکرد آنها را تقویت می‌کنیم. این ما را از اختراع مجدد چرخ و در نتیجه ایجاد یک راه حل کار با زمان و تلاش کمتر باز می دارد.

خواندن مقالات نیز دیدگاه ما را گسترش می دهد. اگرچه ممکن است در بخش‌های محدودی از علم داده کار کنیم، پیشرفت‌ها در تحقیقات اغلب مفید هستند. به عنوان مثال، ایده جاسازی کلمات و نمودارها در سیستم های توصیه گر مفید بوده است. به طور مشابه، ایده هایی از بینایی کامپیوتر - مانند یادگیری انتقال و data augmentation - برای پردازش زبان طبیعی (NLP) مفید بوده است.

خواندن مقالات نیز ما را به روز نگه می دارد. حوزه NLP در دهه گذشته پیشرفت های زیادی داشته است. با این وجود، با خواندن 10 یا بیشتر مهم ترین مقاله، می توانیم به سرعت به نتیجه برسیم. آگاهی از پیشرفت های اخیر به ما امکان می دهد آنها را در محل کار به کار ببریم و اثربخشی خود را افزایش دهیم.

اگر من بیشتر از دیگران دیده‌ام، با ایستادن بر شانه‌های غول‌ها است. - اسحاق نیوتن

در نتیجه کار زمان و تلاش کمتری می گیرد و زمان بیشتری برای مطالعه و یادگیری داریم. این یک چرخه با فضیلت است!

چگونه انتخاب کنیم چه مقالاتی را بخوانیم؟

اگر شروع به خواندن مقاله می کنید، فقط هر آنچه را که به آن علاقه دارید بخوانید - بیشتر مقالات چیزی برای آموزش دارند. خواندن در مورد موضوعاتی که به آنها علاقه دارید نیز ایجاد این عادت را آسان تر می کند.

شما همچنین می توانید مقالات را بر اساس عملی بودن انتخاب کنید. به عنوان مثال، ممکن است لازم باشد به سرعت دامنه یک پروژه را درک کنید. قبل از شروع یک پروژه، تقریباً همیشه زمانی را برای مرور مقاله اختصاص می‌دهم. صرف چند روز غواصی در کاغذها می تواند هفته ها، اگر نگوییم ماه ها، از بن بست ها و پیچ و خم ها نجات می دهد.

دریافت توصیه از همتایان نیز راهی مفید برای شناسایی مقالات مفید برای خواندن است. من تمرین‌کنندگان یادگیری ماشین را در شبکه های اجتماعی دنبال می‌کنم و وقتی چند نفر از آنها مقاله مشابهی را ذکر می‌کنند، متوجه می‌شوم. از طرف دیگر، مشترک خبرنامه های انتخابی شوید که نسبت اطلاعات به نویز بالایی دارند.

چه مقالاتی را بخوانم؟ از جهت عملی، بیشتر مقالات مرتبط با کار را مطالعه می کردم. این به من این امکان را می دهد که فوراً مطالبی را که خوانده ام اعمال کنم و در نتیجه یادگیری خود را تقویت کنم. خارج از محل کار، من به sequences ها علاقه دارم و تمایل به خواندن در مورد NLP و یادگیری تقویتی دارم. من به خصوص به مقالاتی علاقه دارم که به اشتراک بگذارند چه چیزی مؤثر بوده و چه چیزی مفید نیست،این شامل مقالات Word2vec، BERT و T5 است.


چگونه مقالات را بخوانیم؟

جستجوی گوگل برای "چگونه مقالات را بخوانیم" نتایج مفید بی شماری را به دست می دهد. اما اگر آن را طاقت‌فرسا می‌دانید، در اینجا دو موردی وجود دارد که برای من مفید بود:

  • رویکرد کلاسیک سه پاس یا https://web.stanford.edu/class/ee384m/Handouts/HowtoReadPaper.pdf
  • (و نسخه ویدیویی سه دقیقه ای)

https://www.youtube.com/watch?v=SKxm2HF_-k0

  • نحوه خواندن یک مقاله دانشگاهی: توصیه های یک پروفسور بزرگ

http://omscs6460.gatech.edu/research-guide/how-to-read-an-academic-paper/

مصاحبه با دانشمندان دیگر که رویکرد خود را به اشتراک می گذارند

https://www.sciencemag.org/careers/2016/03/how-seriously-read-scientific-paper

رویکردی برای مقالات مهندسی-پژوهشی

اطمینان خاطر که ما تنها کسانی نیستیم که این کار را سخت می بینیم

روش من شبیه روش سه پاس است. در مثال زیر، نحوه خواندن چندین مقاله recsys را به اشتراک خواهم گذاشت تا در مورد معیارهای تازگی، تنوع، سرندیپیتی بیاموزم. و غیره.

در اولین پاس، چکیده را اسکن می‌کنم تا بفهمم آیا مقاله آنچه را که من نیاز دارم را دارد یا خیر. اگر اینطور باشد، سرفصل ها را مرور می کنم تا بیانیه مشکل، روش ها و نتایج را شناسایی کنم. در این مثال، من به طور خاص به دنبال فرمولی در مورد نحوه محاسبه معیارهای مختلف هستم. من به تمام مقالات موجود در لیستم یک پاس اول می دهم (و تا زمانی که لیست را کامل نکنم از شروع با پاس دوم مقاومت می کنم). در این مثال، حدود نیمی از اوراق به پاس دوم رسیدند.

در پاس دوم، دوباره هر مقاله را مرور می کنم و بخش های مربوطه را برجسته می کنم. این به من کمک می کند وقتی بعداً به مقاله مراجعه می کنم، به سرعت بخش های مهم را تشخیص دهم. سپس، برای هر مقاله یادداشت برداری می کنم. در این مثال، یادداشت‌ها بیشتر حول معیارها (یعنی روش‌ها، فرمول) بودند. اگر بررسی ادبیات یک برنامه کاربردی باشد (مانند recsys، طبقه‌بندی محصول، تشخیص تقلب)، یادداشت‌ها بر روی روش‌ها، طراحی سیستم و نتایج تمرکز می‌کنند.

برای اکثر مقالات، پاس دوم کافی است. من اطلاعات کلیدی را گرفته ام و در صورت نیاز می توانم در آینده به آن مراجعه کنم. با این وجود، اگر در حال مطالعه مقالات به عنوان بخشی از مرور ادبیات هستم، یا اگر بخواهم دانش خود را تقویت کنم، گاهی اوقات پاس سوم را انجام می دهم.


در گذر سوم، مفاهیم رایج در کاغذها را در یادداشت های خود ترکیب می کنم. مقاله‌های مختلف روش‌های خاص خود را برای اندازه‌گیری تازگی، تنوع، سرزنده بودن، و غیره دارند. در حین انجام این کار، اغلب شکاف هایی در یادداشت ها و دانش خود پیدا می کنم و مجبور می شوم دوباره مقاله اصلی را مرور کنم.

در نهایت، اگر فکر می‌کنم برای دیگران مفید است، درباره آموخته‌هایم می‌نویسم و آن را به صورت آنلاین منتشر می‌کنم. نسبت به شروع از صفر، داشتن یادداشت های من به عنوان مرجع نوشتن را بسیار آسان تر می کند. این پست از نمونه است.

خواندن ذهن را فقط با مواد معرفتی تجهیز می کند. این تفکر است که آنچه را که می خوانیم مال ما می کند. - جان لاک


خودتان آن را امتحان کنید

قبل از اینکه وارد پروژه بعدی خود شوید، یک یا دو روز را صرف بررسی چند مقاله مرتبط کنید. من مطمئن هستم که در میان مدت و بلند مدت در زمان و تلاش شما صرفه جویی می کند. مطمئن نیستم از کجا شروع کنم؟ در اینجا چند منبع مفید برای شروع آورده شده است:

  • مقالات با کد: ML تحقیق با کد برای پیاده سازی آن

https://paperswithcode.com/

  • https://github.com/eugeneyan/applied-ml
  • https://github.com/eugeneyan/ml-surveys
  • https://scholar.google.com/intl/en/scholar/help.html#alerts
  • https://42papers.com/
هوش مصنوعیپردازش زبان طبیعیمقاله
شاید از این پست‌ها خوشتان بیاید