چرا به جای بررسی دستی داده هایمان، کاری را که لینکدین انجام داد را امتحان نکنیم؟ این به آنها کمک کرد تا 95 درصد دقت و 80 درصد به خاطر بیاورند.
سپس هم تیمی من نحوه استفاده لینکدین از نزدیکترین همسایگان برای شناسایی برچسب های متناقض (در عنوان شغل) را به اشتراک گذاشت. سپس، لینکدین یک ماشین بردار پشتیبانی (SVM) را بر روی برچسبهای ثابت آموزش داد. سپس SVM برای به روز رسانی برچسب های ناسازگار استفاده شد. این به آنها کمک کرد تا به دقت 95 درصدی در طبقه بندی عنوان شغلی خود دست یابند.
این پیشنهاد در بحث ما مفیدترین بود. پیگیری آن منجر به دقت نهایی طبقهبندی محصول ما به 95٪ شد. من پرسیدم که چگونه او توانست در این بینش انتقادی مشارکت کند. او پاسخ داد: "اوه، من فقط هر از چند گاهی مقاله می خواندم." به طور خاص، او سعی می کند هر هفته 1 تا 2 مقاله بخواند، معمولاً در مورد موضوعاتی که تیم روی آنها کار می کرد.
با خواندن مقالات، ما توانستیم یاد بگیریم که دیگران (به عنوان مثال، لینکدین) چه چیزهایی را مفید (و نه کارآمد) یافته اند. سپس میتوانیم رویکرد آنها را تطبیق دهیم و مجبور نباشیم موشک را دوباره اختراع کنیم. این به ما کمک می کند تا یک راه حل کارآمد را با زمان و تلاش کمتر ارائه دهیم.
مقاله ها حاوی دانش مقطر در مورد آنچه که دیگران کار می کنند و کار نمی کنند هستند. با خواندن آنها، به فضای مشکل سرعت میدهیم و رویکرد آنها را تقویت میکنیم. این ما را از اختراع مجدد چرخ و در نتیجه ایجاد یک راه حل کار با زمان و تلاش کمتر باز می دارد.
خواندن مقالات نیز دیدگاه ما را گسترش می دهد. اگرچه ممکن است در بخشهای محدودی از علم داده کار کنیم، پیشرفتها در تحقیقات اغلب مفید هستند. به عنوان مثال، ایده جاسازی کلمات و نمودارها در سیستم های توصیه گر مفید بوده است. به طور مشابه، ایده هایی از بینایی کامپیوتر - مانند یادگیری انتقال و data augmentation - برای پردازش زبان طبیعی (NLP) مفید بوده است.
خواندن مقالات نیز ما را به روز نگه می دارد. حوزه NLP در دهه گذشته پیشرفت های زیادی داشته است. با این وجود، با خواندن 10 یا بیشتر مهم ترین مقاله، می توانیم به سرعت به نتیجه برسیم. آگاهی از پیشرفت های اخیر به ما امکان می دهد آنها را در محل کار به کار ببریم و اثربخشی خود را افزایش دهیم.
اگر من بیشتر از دیگران دیدهام، با ایستادن بر شانههای غولها است. - اسحاق نیوتن
در نتیجه کار زمان و تلاش کمتری می گیرد و زمان بیشتری برای مطالعه و یادگیری داریم. این یک چرخه با فضیلت است!
چگونه انتخاب کنیم چه مقالاتی را بخوانیم؟
اگر شروع به خواندن مقاله می کنید، فقط هر آنچه را که به آن علاقه دارید بخوانید - بیشتر مقالات چیزی برای آموزش دارند. خواندن در مورد موضوعاتی که به آنها علاقه دارید نیز ایجاد این عادت را آسان تر می کند.
شما همچنین می توانید مقالات را بر اساس عملی بودن انتخاب کنید. به عنوان مثال، ممکن است لازم باشد به سرعت دامنه یک پروژه را درک کنید. قبل از شروع یک پروژه، تقریباً همیشه زمانی را برای مرور مقاله اختصاص میدهم. صرف چند روز غواصی در کاغذها می تواند هفته ها، اگر نگوییم ماه ها، از بن بست ها و پیچ و خم ها نجات می دهد.
دریافت توصیه از همتایان نیز راهی مفید برای شناسایی مقالات مفید برای خواندن است. من تمرینکنندگان یادگیری ماشین را در شبکه های اجتماعی دنبال میکنم و وقتی چند نفر از آنها مقاله مشابهی را ذکر میکنند، متوجه میشوم. از طرف دیگر، مشترک خبرنامه های انتخابی شوید که نسبت اطلاعات به نویز بالایی دارند.
چه مقالاتی را بخوانم؟ از جهت عملی، بیشتر مقالات مرتبط با کار را مطالعه می کردم. این به من این امکان را می دهد که فوراً مطالبی را که خوانده ام اعمال کنم و در نتیجه یادگیری خود را تقویت کنم. خارج از محل کار، من به sequences ها علاقه دارم و تمایل به خواندن در مورد NLP و یادگیری تقویتی دارم. من به خصوص به مقالاتی علاقه دارم که به اشتراک بگذارند چه چیزی مؤثر بوده و چه چیزی مفید نیست،این شامل مقالات Word2vec، BERT و T5 است.
چگونه مقالات را بخوانیم؟
جستجوی گوگل برای "چگونه مقالات را بخوانیم" نتایج مفید بی شماری را به دست می دهد. اما اگر آن را طاقتفرسا میدانید، در اینجا دو موردی وجود دارد که برای من مفید بود:
https://www.youtube.com/watch?v=SKxm2HF_-k0
http://omscs6460.gatech.edu/research-guide/how-to-read-an-academic-paper/
مصاحبه با دانشمندان دیگر که رویکرد خود را به اشتراک می گذارند
https://www.sciencemag.org/careers/2016/03/how-seriously-read-scientific-paper
رویکردی برای مقالات مهندسی-پژوهشی
اطمینان خاطر که ما تنها کسانی نیستیم که این کار را سخت می بینیم
روش من شبیه روش سه پاس است. در مثال زیر، نحوه خواندن چندین مقاله recsys را به اشتراک خواهم گذاشت تا در مورد معیارهای تازگی، تنوع، سرندیپیتی بیاموزم. و غیره.
در اولین پاس، چکیده را اسکن میکنم تا بفهمم آیا مقاله آنچه را که من نیاز دارم را دارد یا خیر. اگر اینطور باشد، سرفصل ها را مرور می کنم تا بیانیه مشکل، روش ها و نتایج را شناسایی کنم. در این مثال، من به طور خاص به دنبال فرمولی در مورد نحوه محاسبه معیارهای مختلف هستم. من به تمام مقالات موجود در لیستم یک پاس اول می دهم (و تا زمانی که لیست را کامل نکنم از شروع با پاس دوم مقاومت می کنم). در این مثال، حدود نیمی از اوراق به پاس دوم رسیدند.
در پاس دوم، دوباره هر مقاله را مرور می کنم و بخش های مربوطه را برجسته می کنم. این به من کمک می کند وقتی بعداً به مقاله مراجعه می کنم، به سرعت بخش های مهم را تشخیص دهم. سپس، برای هر مقاله یادداشت برداری می کنم. در این مثال، یادداشتها بیشتر حول معیارها (یعنی روشها، فرمول) بودند. اگر بررسی ادبیات یک برنامه کاربردی باشد (مانند recsys، طبقهبندی محصول، تشخیص تقلب)، یادداشتها بر روی روشها، طراحی سیستم و نتایج تمرکز میکنند.
برای اکثر مقالات، پاس دوم کافی است. من اطلاعات کلیدی را گرفته ام و در صورت نیاز می توانم در آینده به آن مراجعه کنم. با این وجود، اگر در حال مطالعه مقالات به عنوان بخشی از مرور ادبیات هستم، یا اگر بخواهم دانش خود را تقویت کنم، گاهی اوقات پاس سوم را انجام می دهم.
در گذر سوم، مفاهیم رایج در کاغذها را در یادداشت های خود ترکیب می کنم. مقالههای مختلف روشهای خاص خود را برای اندازهگیری تازگی، تنوع، سرزنده بودن، و غیره دارند. در حین انجام این کار، اغلب شکاف هایی در یادداشت ها و دانش خود پیدا می کنم و مجبور می شوم دوباره مقاله اصلی را مرور کنم.
در نهایت، اگر فکر میکنم برای دیگران مفید است، درباره آموختههایم مینویسم و آن را به صورت آنلاین منتشر میکنم. نسبت به شروع از صفر، داشتن یادداشت های من به عنوان مرجع نوشتن را بسیار آسان تر می کند. این پست از نمونه است.
خواندن ذهن را فقط با مواد معرفتی تجهیز می کند. این تفکر است که آنچه را که می خوانیم مال ما می کند. - جان لاک
خودتان آن را امتحان کنید
قبل از اینکه وارد پروژه بعدی خود شوید، یک یا دو روز را صرف بررسی چند مقاله مرتبط کنید. من مطمئن هستم که در میان مدت و بلند مدت در زمان و تلاش شما صرفه جویی می کند. مطمئن نیستم از کجا شروع کنم؟ در اینجا چند منبع مفید برای شروع آورده شده است:
https://paperswithcode.com/