من ربات ترجمیار هستم و خلاصه مقالات علمی رو به صورت خودکار ترجمه میکنم. متن کامل مقالات رو میتونین به صورت ترجمه شده از لینکی که در پایین پست قرار میگیره بخونین
۱۰ منبع آزاد برای یادگیری پردازش زبان طبیعی
منتشرشده در: : towardsdatascience به تاریخ ۲۵ آوریل ۲۰۲۱
لینک منبع: 10 Free Resources for Learning Natural Language Processing
پردازش زبان طبیعی، یا NLP زمینههای زبانشناسی، علوم کامپیوتر و هوش مصنوعی را با هم ترکیب میکند تا ماشینها را قادر به استخراج معنی، بینش و پیشبینی از دادههای متن کند.
اکثر سازمانهای مدرن مقادیر زیادی از اطلاعات متنی را از مشتریان و عملیات تجاری خود به شکل ایمیل، چت، تماس تلفنی و بسیاری از تعاملات دیگر جمعآوری میکنند. این داده میتواند در توسعه درک عمیقتر از مشکلاتی که مشتریان با آن مواجه هستند بسیار ارزشمند باشد و بینش از این داده میتواند به حل برخی از این مشکلات و همچنین خودکار و بهینهسازی مشتری مواجه با فرآیندهای کسبوکار کمک کند.
بنابراین برای دانشمندان داده ضروری است که زمینه پردازش زبان طبیعی را درک کنند. از آنجا که این یک زمینه بسیار تخصصی است و به مجموعه مختلفی از تکنیکها برای دیگر اشکال هوش مصنوعی نیاز دارد، چیزی است که همیشه توسط دورههای علمی داده عمومی پوشش داده نمیشود.
در این مقاله من میخواهم منابع آنلاین مورد علاقه خود را برای یادگیری پردازش زبان طبیعی به اشتراک بگذارم.
ممکن است به مطالعه مقاله ۱۲ کتابخانه برتر پایتون برای علم داده در سال ۲۰۲۱ علاقمند باشید.
۱. مقدمهای بر پردازش زبان طبیعی
این دوره کوتاه از Shivam Bansal مقدمه خوبی برای این زمینه است. این روش مبتنی بر پایتون است و عبارات منظم، پردازش متن و طبقهبندی متن را در یک سری از سخنرانیها و تمرینهای ویدئویی پوشش میدهد. در پایان دوره، یک راهنما برای ساخت اولین مدل یادگیری ماشینی متن محور ساده شما وجود دارد. همچنین زمانی که دوره را به پایان رساندید، میتوانید امتحان کوتاهی بدهید تا گواهی تکمیل آن را دریافت کنید.
۲. راهنمای مطالعه از دانشگاه لندن
این راهنمای مطالعه ۱۰۰ صفحهای از دانشگاه لندن مقدمه خوبی برای نظریه پردازش دادههای خام با ماشین و استخراج بینش و تحلیل از این دادههای متنی است. مناطق اصلی زیر را پوشش میدهد:
- دسترسی به پیکره متنی و منابع واژگانی.
- پردازش متن خام.
- دستهبندی و برچسب زدن.
- استخراج اطلاعات از متن.
- تجزیه و تحلیل ساختار جمله.
۳. مخزن Awesome NLP
در حقیقت Awesome NLP یک مخزن Github است که شامل لیست عظیمی از منابع از زمینه پردازش زبان طبیعی است. طیف گستردهای از منابع مختلف در اینجا وجود دارد از جمله برنامههای آموزشی، کتابخانهها، مجموعه دادهها، مقالات تحقیقاتی و کتابها.
۴. سخنرانیهای استنفورد درباره پردازش زبان طبیعی با یادگیری عمیق
این فهرست پخش یوتیوب شامل کل مجموعه سخنرانیها برای دوره زمستانی ۲۰۱۹ دانشگاه استنفورد در زمینه پردازش زبان طبیعی با یادگیری عمیق است. این یک مقدمه واقعا خوب برای استفاده از مدلهای شبکه عصبی برای وظایف NLP است.
همه اسلایدها، ویدئوها، یادداشتهای سخنرانی و تکالیف برای این درس را میتوان در این کتاب یافت.
۵. آموزش NLP با پایتورچ
پایتورچ یک چارچوب یادگیری عمیق است که به طور ایدهآل برای توسعه مدلهای مبتنی بر NLP مناسب است. این مخزن، همراه با کتاب Natural Language Processing with PyTorch: Build Intelligent Language Applications Using Deep Learning از دلیپ رائو و برایان مک ماهان و شامل دفترچههای نمونه، مجموعه دادهها و یادداشتها است.
این شاخه مقدمهای بر پایتورچ، شبکههای عصبی، تعبیه کلمه و مدلسازی ترتیب برای NLP را پوشش میدهد. این یک منبع عالی برای درک یادگیری عمیق برای پردازش زبان طبیعی است.
۶. پردازش گفتار و زبان
این منبع برای خواندن نسخه کتاب پردازش زبان و گفتار نوشته دن جورافسکی و جیمز اچ مارتین رایگان است. این یک مقدمه خوب برای پردازش زبان طبیعی به طور کلی است و همه چیز را از پردازش پایه دادههای متنی گرفته تا ساختارهای یادگیری عمیق و ترجمه ماشینی پوشش میدهد.
شاید مطالعه مقاله توسعه مبتنی بر ترانک (Trunk) چیست؟ برای شما مفید باشد.
۷. تجزیه و تحلیل متن با جعبهابزار زبان طبیعی
در اصل NLTK، کتابخانه پایتون معروف به جعبهابزار زبان طبیعی است. این یکی از پلتفرمهای پیشرو برای کار با دادههای متنی است و شامل واسطهای ساده برای طبقهبندی متن، tokenization، ناشی شدن و استدلال معنایی است. این کتاب نه تنها یک راهنمای بسیار دقیق برای استفاده از NLTK است بلکه یک منبع خوب برای یادگیری NLP به طور کلی با تعداد زیادی مثال عملی است.
۸. دوره پردازش زبان طبیعی کاگل
این درس بسیار کوتاه از کاگل یک شروع سریع عالی است اگر شما کاملا در زمینه NLP تازهکار هستید و فقط میخواهید به برخی آموزشهای ساده و کوتاه دسترسی داشته باشید. اگر چه به طور خلاصه، این اصول اساسی شامل پردازش متن، طبقهبندی متن و تعبیه کلمه را پوشش میدهد.
۹. دستور العملهایNLP مایکروسافت
هدف این مخزن، که توسط مایکروسافت توسعه و نگهداری میشود، مستندسازی و استانداردسازی بهترین روشها برای توسعه سیستمهایی است که از پردازش زبان طبیعی استفاده میکنند.
آن شامل مجموعهای از مثالها به شکل نوتبوکهای Jupyter و توابع مفید برای استفاده توسط هر کسی که پردازش زبان طبیعی را انجام میدهد، میباشد. این یک راهنمای مرجع واقعا مفید برای درک بهترین تجارب برای مبتدیان و دست اندرکاران باتجربهتر در این زمینه است.
۱۰. منبعSpark NLP
ابزار SPark NLP موکدا یک منبع یادگیری نیست، با این حال به عنوان یک کتابخانه برای پردازش زبان طبیعی ساختهشده در بالای Apache SPark، ابزاری عالی برای توسعهدهندگان SPark برای استفاده از قدرت پردازش زبان طبیعی در مقیاس است.
پردازش زبان طبیعی یک زمینه مهم برای همه دانشمندان داده برای یادگیری است. توانایی به دست آوردن بینش و پیشبینی از منابع داده بدون ساختار مانند متن تا حد زیادی امکانات برای کاربردهای علوم داده در سازمانها را افزایش میدهد.
در این مقاله، من یک مقدمه کوتاه به ده منبع آنلاین مورد علاقهام برای به دست آوردن درک این زمینه ارائه کردهام. این موارد همه چیز را از پردازش متن تا یادگیری عمیق برای NLP تا بهترین روشها برای استفاده از این تکنیکها پوشش میدهد. منابعی که در این مقاله پوشش داده شدهاند باید هر چیزی که نیاز دارید را به شما بدهند تا با برنامههای ساختوساز با پردازش زبان طبیعی شروع کنید.
این متن با استفاده از ربات ترجمه مقالات علوم داده ترجمه شده و به صورت محدود مورد بازبینی انسانی قرار گرفته است.در نتیجه میتواند دارای برخی اشکالات ترجمه باشد.
مقالات لینکشده در این متن میتوانند به صورت رایگان با استفاده از مقالهخوان ترجمیار به فارسی مطالعه شوند.
مطلبی دیگر از این انتشارات
هوش مصنوعی دروغگویان در رابطه با مصرف الکل را گیر میاندازد!
مطلبی دیگر از این انتشارات
۵ روش غیرمعمول برای مقابله با استرس با تکیهبر علم
مطلبی دیگر از این انتشارات
گامی به سوی محافظت از بیماران در برابر اشتباهات دارویی