تو این مقاله سعی کردم با توجه به جمع آوری اطلاعات از منابع مختلفی، مفهوم NLP رو تا جای ممکن برای سئوکارها توضیح بدم و در نهایت با هم میریم که ببینیم چطوری میشه به صورت کاربردی از این مفهوم استفاده کنیم.
دیگه واقعا نمیخوام مقاله رو با NLP چیست شروع کنم، خودتون برید بخونید ? ولی NLP یعنی پردازش زبان طبیعی، تا همین جا میدونم.
سیستم های پردازش زبان طبیعی رو میخوام فقط اون هایی رو که مربوط به سئو هستند رو معرفیشون کنم و از بقیه فاکتور میگیرم.
یکی از مرسوم ترین ابزارها خود word مثلا که اگر مثلا خطایی بنویسیم میاد زیرش قرمز میکنه متن رو یا ابزارهای مختلف دیگه مثل grammarly، Word Ai و... و حتی اصلا خود گوگل. وقتی اشتباه مینویسیم بهمون Sugg میده منظورت این بوده؟
واسه فارسی هم ویراستیار و پاک نویس رو من دیدم.
این ابزارها میان متنی رو که ما نوشتیم با توجه به یه سری مدل و الگوریتم دسته بندی میکنن. کاربردش چیه؟
مثلا ما یه محتوایی رو آپلود میکنیم، بعد این سیستم های میتونن ببرنش تو دسته بندی مشخص، و اسش تگ هم بزنن و ... و عملا زمان خوبی رو واسه ما سیو میکنه.
گوگل هم از این سیستم میبینیم که به خوبی داره استفاده میکنه و با توجه به دیتاهایی که داره از Structure Data های سایت های مختلف جمع آوری میکنه و همچنین مدل Entity Base، میتونه تشخیص بده که محتوای ما میتونه در چه دسته بندی ای قرار بگیره.
حالا به ما چه ربطی داره و چه کمکی به ما میکنه؟
اسپم ایمیل رو دیدید؟ خب این از همین مدل استفاده میکنه اما چطوری؟ علاوه بر دیتاهایی که خودش جمع آوری میکنه، از رفتار کاربران هم خیلی کمک میگیره.
پس ما میتونیم چه کاری کنیم؟ فرض کنیم کیورد بیت کوین:
یه پست لینکدین خیلی خوبی پیام مختارنیا زد درباره همین که میتونستیم همین بیت کوین رو به عنوان یک Entity در نظر بگیریم و با یک ابزار، مفاهیم مرتبط باهاش رو استفاده کنیم.
حالا بیت کوین یه مثال خیلی عالیه، اما خیلی نمیشه بسطش داد پس حالا چیکار کینم؟
یه وبینار میلاد شولی داره که مثل همیشه عالی بود (لعنتی edge of tech هستش ?) و درباره پتنت های گوگل صحبت میکرد و میگفت که اهمیت کیورد ریسرچ برای ما به شدت زیاد هستش با توجه به این پتنت ها.
حالا من این جا دسته بندی میکنم و یه سری موارد رو هم بهش اضافه میکنم:
برای طراحی و فهم درست Pillar Cluster میتونید از آقای بابک بنیادی سلطان پیلار کلاستر (و هویج) استفاده کنید و تو دوره خوبشون شرکت کنید. چیزی که من تو کلی مصاحبه با کسایی که میخواستن استخدام بشن داشتم، مفهوم پیلار کلاستر رو صرفا در حد مفاهیمی که تو سایتای hubspot/semrush و اینا گفته بودن میدونستن که اونا واقعا هیچی نگفتن.
اینم که سیستم های بازیابی اطلاعات هست که موتورهای جستجو ازش استفاده میکنن. ما کوئری سرچ میکنیم و search engine میاد مفاهیم مرتبط با اون کوئری رو برمیگردونه.
سیستم های خلاصه سازی هم گوگل که فعلا من ندیدم چیزی خاصی ازش که تو این بخش موفقیت خاصی داشته باشه.
شاید بگید متا دسکریپشن رو میاد برمیگردونه که بالاخره اون رو داره از یه جایی در صفحه میخونه خودش نمیاد خلاصه سازی انجام بده.
اما یه سری استراکچر دیتا رو واسه همین خلاصه سازی و بهینه سازی زمان برای کاربران ساخته.
مثلا how to /recipe و keypoint های ویدئو (اگر اسمشو درست گفته باشم البته دقیق یادم نیست) و چندتای دیگه اینا همشون در جهت همین خلاصه سازی و دسترسی سریع و دقیق تر به محتوای مورد نظر است. اما هنوز من دیتایی مبتنی بر خلاصه سازی یک محتوا بدون داشتن استراکچردیتایی که ما بهش داده باشیم ندیدم.
پس کاربرد این هم داریم میبینیم که خیلی از ما روزانه از این structure data ها داریم استفاده میکنیم.
اینجا هم گوگل سعی میکنه با توجه به این سیستم بیاد و مفاهیم یک محتوا رو بررسی کنه که این هم بخوایم کاربردی بگیم، برمیگرده به همون 2 پارامتر کیورد ریسرچ و پیلار کلاستر (بک لینک رو فاکتور بگیریم اون هم طبیعتا میتونه اهمیت خیلی زیادی داشته باشه)
این با بالایی تفاوتش اینه که این یکی میاد کیوردهای خاص و مهم یه متن رو بررسی میکنه. حالا خب شاید بگیم که چی به درد ما میخوره خب؟
من حدود 2 سال پیش (دقیقشو یادم نیست) که تو دوره سئو وبسیما شرکت کردم امین اسماعیلی اومد یه حرفی زد که خیلی جذاب بود.
https://websima.academy/seo-online-course/
گفت که برنده اسکار ایرانی از دیدگاه گوگل میشه همون اصغر فرهادی. پس شما نیاز نیست اگر یه مقاله درباره اصغر فرهادی نوشتین هی نیان بگین اصغر فرهادی، بیان بعضی جاها بگید برنده اسکار ایرانی، کارگردان جدایی نادر از سیمین و ...
حالا یه مثال دیگه:
who is the founder of amazon?
اینجا با توجه به NLP گوگل میاد اینکار رو میکنه که کلمات who/is/the/of رو نادیده میگیره. فقط دوتا کلمه واسش خاص هست founder/amazon.
در سیستم entity base، این دو کلمه در کنار هم فقط به یه نفر اشاره میکنه اونم Jeff Bezos ?. خیلی جالب شد نه؟
البته این کار توسط دوتا از تکنیک های nlp یعنی POS Tagging و Named Entity Recognition استفاده میکنه که در ادامه دربارشون صحبت میکنم.
این سیستم واسه تحلیل نظرات استفاده میشه. اینم یه خبرایی از جاهایی شنیده بودم که گوگل رو این بخش هم داره خودشو تقویت میکنه (یادم نیست کجا خوندم).
مثلا یک محصولی وجود داره و مردم همه زیر اومدن نوشتن که خیلی آشغال بود، مزخرف بود و ... خب تحلیل نظرات اینجا به کمک میاد.
حالا باز کاربردش چیه؟ اینجا مشخص میشه اگر واقعا نظرات منفی باشه و محصول ما کیفیت مناسب رو نداشته باشه خب دیگه با بک لینک هم شاید نشه کاریش کرد (البته شاید!) ولی این داستان کامنت و نظرات راه دور زدن زیاد داره (مسئولیت هر گونه سوء استفاده با خودتون هستش). ولی مثلا تو سوشال این تحلیل خیلی بهتر میتونه انجام بشه، چون اونجا نظرات رو کسی accept نمیکنه.
هنوز هم یکسری از افراد اعتقاد دارند که گوگل نمیتونه مفاهیم درون یک عکس رو خیلی خوب تشخیص بده!! چرا مقاومت میکنن نمیدونم!!
پس این سیستم ها هم امروزه دیگه خیلی پیشرفته شدن و کارشون تبدیل عکس به متن هستش. این نشون میده اهمیت داشتن نوشته مرتبط، لوگو، آدرس سایت و ... چقدر میتونه به اعتبار و برداشت مناسب از یک عکس به کمک ما بیاد.
این سیستم هم وظیفش پیشنهاد عبارت بعدی به کلاینت هستش. گوگل دقیقا همین کار رو میکنه دیگه ما وقتی یه چیزی رو سرچ میکنیم، گوگل میاد یه سری پیشنهاد میده.
سیستم های بیشتری از NLP وجود دارن ولی سعی کردم اونایی که میشه کاربردی ازشون استفاده کرد رو بگم.
خب حالا یه سری دیتای خیلی جالب هم ما تو بخش تکنیک های پردازش زبان طبیعی داریم که میتونه دید بسیار بسیار جالب و خوبی به ما بدن.
تکنیک Part Of Speech Tagging وظیفش تجزیه و تحلیل کلمات داخل یک جمله است.
مثال:
I Saw The Man On The Roof
i =[pron] saw[verb] the[det] man [noun] on[preposition] the [det] roof[noun]
حالا شما بیان واسه همون مثال
who is the founder of amazon
این حرکت رو بزنید.
حالا کاربردش چیه؟
یه جمله خیلی جالب آقای بابک بنیادی تو دورهش گفت که اینجا میفهمیم دقیقا چطوری عمل میکنه، اونجا گفتش که:
سعی کنید pkw / skw / akw رو به صورت نهادی در عبارات استفاده کنید.
بابک بنیادی
پس میبینیم که اع چقدر جالب و خفن میشه یه محتوا رو سئو کرد.
این تکنیک به جای تمرکز روی کیوردها، میاد کل یک عبارت رو تجزیه و تحلیل میکنه همین.
این تکنیک خیلی جالبه چون کارش پیدا کردن اسامی خاصی درون یک جمله است.
مثلا در یک جمله ما jeff bezos / amazon داریم:
خب jeff bezos میشه یک person از اون ور amazon هم میشه یک organization.
حالا نکته قشنگش همین بحث entity هستش ?? وقتی شما میای از اون دو عبارت استفاده میکنی در یک جمله، خود اینها entity هستن و میتونی برای غنی کردن محتوا از مفاهیم مرتبط به این entity ها استفاده کنی، که روشش رو همون بالاتر گفتم دیگه!!
خیلی جالبه این تکنیک هم تو دوره وبسیما گفته شده بود که گوگل تشخیص میشه وقتی شما مینویسی که:
سرعت شیر، تاریخ انقضای شیر و.. این دو "شیر" در این دو عبارت کاملا معنا و مفهوم متفاوتی دارند.
پس این تکنیک کارش اینه که تشخیص بده یک کلمه در یک عبارت دقیقا چه معنایی میده.
شاید باورش براتون سخت باشه اما این هم جزو بدیهیات نویسندگی است که شما باید از متراف و هم معنای کلمات و عبارات استفاده کنید.
مثلا سیاه = مشکی است. پس حتما، حتما و حتما در محتواهاتون برای جلوگیری از stuffing از مترادف کلمات استفاده کنید.
اما وقتی جالب تر میشه که بدونین این واسه جملات هم کاربرد داره.
مثال:
when will my book arrive? = when will i receive my book?
حالا نکته اینجاست که خب همین الان کلی ابزار هستن که میان اینکار رو انجام میدن که و خیلی ها نتیجه میگیرن از این کار. خب اینجا دیگه من نه میگم استفاده کنید و نه میگم نکنید (به من چه اصلا!) من میگم فقط این مطلب در حوزه AI هستش.
این تکنیک کارش درک و پردازش مفاهیم معنایی است. یعنی مثلا:
"گریل کردن، نیاز به ماده غذایی داره، شخص داره، ابزار داره و ...."
کاربردش اینجا مشخص میشه که ما نمیتونیم از مفهومی مثل گریل کردن نام ببریم و مواردی که بهش وابسته هستن برای تکمیل معناش رو به کار نبریم. یا در واقع انقدر خوب از مفاهیم مرتبطش استفاده کنیم که محتوای غنی تری داشته باشیم.
خب به پایان محتوا رسیدیم و جمع بندی ای که باید کرد اینه که سعی کنید به 3 فاکتوری در بخش text categorization گفتم شدیدا عمل کنید. شاید مهم ترین بخش این محتوا همون باشه. من مشکلی که توی آموزش ها میدیدم و خودم خیلی رو اعصابم بود این بود که یه سری مفاهیم خیلی جذاب و خفن بیان میشه ولی در نهایت ما نمیدونیم که چطوری میشه به صورت عملیاتی از اینا استفاده کرد. تمام سعی خودمو کردم که کاملا عملیاتی مباحث رو بررسی کنم. اگر خوبی بدی، غلط املایی، نگارشی و.. دیدید حلال کنید خلاصه. سعی میکنم محتوا رو آپدیت کنم و بهبودش بدم تا جایی که میتونم.
منابع مورد استفاده: