کتابخانه های مورد نیاز برای NLP

به نام خدا

سلام

خوبی؟

امروز میخوام بهت چند تا کتابخانه رو برای فعالیت توی حوزه ی NLP معرفی کنم.

راستی میدونی کتابخانه چیه؟

کتابخانه یا Library
کتابخانه یا Library

اگر نمیدونی این تعریفی رو که این زیر برات مینویسم رو بخون:

اگر با ++C کار کرده باشی بهتر این رو میفهمی.

کتابخانه یا library کد های از قبل نوشته شده هستند که شما میتونید کد نویسیتون رو باهاش راحت تر کنید

مثلا وقتی شما اول برنامه کتابخانه تون رو ایمپورت میکنید تا انتهای برنامه ازش میتونید استفاده کنید.

بیشتر کتابخانه ها با C ساخته میشن

تقریبا هم میشه گفت کتابخانه ها تماما از نوشتن تابع ها به وجود اومدن

آموزش ساخت کتابخانه رو توی اون یکی وبلاگم یعنی "جایی برای غرق شدن در برنامه نویسی" قرار میدم.



حالا میرسیم به بخشی که میخوام کتابخانه هایی رو که توی NLP استفاده میشن رو به شما معرفی کنم.

1_natural language toolkit(NLTK)

این کتابخانه میشه گفت بهترین کتابخانه ای هست که میتونید ازش توی nlp استفاده کنید

با این کتابخانه تقریبا تمام کار هایی که میشه توی NLP انجام داد رو میتونید انجام بدید ، مثل دسته بندی ، ریشه یابی، برچسب گذاری ، تجزیه و استدلال معنایی

این لینک سایتشه.



2_TextBlob

text blob برای کسانی مناسبه که تازه وارد این حوزه شدن ، به خاطر این برای یکی از بهترین کتابخانه هاست
اما نمیشه گفت که همه ی کار ها رو میشه باهاش انجام داد.

کار هایی که میتونید با این کتابخانه انجام دهید: تجزیه و تحلیل احساسات ، دسته بندی ، استخراج عبارات.

از اینجا هم میتونید وارد سایتش بشید.



3_CoreNLP

این کتابخونه توی دانشگاه استنفورد با زبان جاوا نوشته شده ، و اینکه خیلی ها از این کتابخانه استفاده میکنن.

میدونید مزیت این کتابخانه نسبت به کتابخانه های دیگه چیه؟؟

این کتابخانه خیییییلی سریعه و میشه باهاش خیلی سریع تمام کار ها رو انجام داد.

پیشنهاد میکنم از این کتابخانه هم حداقل یک بار استفاده کنید.

از اینجا هم میتونید به سایتش یه نگاه بندازید.



4_spaCy

این کتابخانه حتی از CoreNLP هم سریع تره، میدونی به خاطر چی؟

به خاطر اینکه با Cython نوشته شده و مفسرش سریع تره.

با این کتابخانه میتونید کار های جذابی انجام بدید ، منظورم اینه که میتونید مثلا متن ها رو خلاصه کنید، دسته بندی کنید، شباهت دو تا جمله رو به دست بیارید و خلاصه کلی کار های جذاب دیگه که همه ی این ها رو از پست بعدی شروع میکنم.

این هم لینکشه : spacy.io



5_Gensim

Gensim کتابخانه ای هست که برای متن های طولانی استفاده میشه

منظورم اینه که برای کار های پر قدرت نیازش داریم.

این کتابخانه همینطوری برای خودش کار نمیکنه و مثلا باید از Numpy هم کمک بگیریم برای هندل کردن این کتابخانه.

لینک سایت



نتیجه گیری:

من خودم بیشتر از NLTK و spaCy استفاده میکنم و سعی میکنم بیشتر برنامه هام رو با spaCy بنویسم تا برای شما راحت تر باشه.

از این پست به بعد پروژه های عملی رو کار میکنیم.




به انتهای این مطلب رسیدیم، امیدوارم از این اموزش خوشت اومده باشه.

تا جلسه بعدی خدانگهدار?