توسن روزه شطرنج چپ

به سختی این چند کلمه را تونستم پیدا کنم که هیچ سایتی همزمان آنها را نداشته باشد (چه برسد برای اینکه صفحه برای آن داشته باشند و حتی سخت ترش، پاراگرافی که این چهار کلمه در آن آمده باشد) تا با آن نشان بدهم که گوگل بدون توجه به اینکه هیچ سایتی ارتباط معنایی با این چهار کلمه برقرار نمی کند، از ان نتیجه بر می گرداند.

و این یعنی گوگل دیگر مبتنی بر سیمانتک نیست، نه اینکه سیمانتک نیست، اولویتش دیگر سیمانتک نیست و اولویت را بر چگالی قرار داده که این به دلیل تغییرات معماری آن است که در این مطلب به ان می پردازم.

اما چرا؟، یکی از شعارهای بزرگ گوگل همیشه این بوده که می تواند مرتبط ترین نتایج جستجو را نسبت به عبارت جستجو شده کاربران نمایش دهد.

اما از 2021 گوگل در این روندی که پیش گرفته بود دچار پس رفت شد تا جاییکه الان نتایج بسیاری برای چهار کلمه ای «توسن روزه شطرنج چپ» که واقعا هیچ رابطه ای بین انها متصور نیست می آورد.

این اتفاق برای منطقه ایران نه از 2021 که از یکی دو ماه قبل افتاده است. (من دقیقم یادم است که در جلسه ای که برای موتورهای جستجو داشتیم این را مزیت گوگل می دانستم که با این اوصاف دیگر این مزیت را ندارد.) و همیشه ما شاهد این تاخیر اجرای سیاستهای گوگل در منطقه خودمان بوده ایم و وقتی در ایران هم پروژه گوگل اجرایی شد یعنی دیگر همه جا اجرا شده است و پایان روال تدریج ان است.

اما چرا گوگل از خیر سیمانتک گذشت؟

شاید در نگاه اول با خودتان می گویید، اینکه گوگل برای چهار عبارت بی ارتباط به هم،درکنار هم نتیجه برمی گرداند حتما ناشی از تغییر سیاست مالی اش بوده و تصمیم گرفته برای کلمات تجاری هم درآمد سازی کند و تو این فهرست چهار کلمه ای شاید شطرنج برای گوگل ارزش بالایی دارد (اگر این جستجو را انجام داده باشید می بینید که تمام نتایج حول شطرنج است.)

ولی اشتباه می کنید، بیایید این چهار کلمه را هم امتحان کنید: «مست روزه لگد چپ»

می بینید که بازم گوگل روی یک کلمه متمرکز شد که «لگد زدن جنین» بود.

این لگد زدن که دیگه جنبه بیزینس برای گوگل نداره؟

اما یک چیزی از این دو مثال عایدمون شد، گوگل کلمه ای که بیشترین چگالی را در وب داشته ملاک کاربر قرار داده است.

این خوبه یا بد؟

مشخصا بد است و به این معناست که گوگل در درک رابطه معانی بین کلمات عاجز شده است.

و برعکس گذشته، سیستم جدید گوگل مبتنی بر چگالی شده تا اتکا بر سیمانتک و این به معنای تنزل رتبه سیمانتک نسبت به چگالی است (سئوکاران ایرانی با درک این مطلب من می توانند به پول کلانی برسند، چرا که گوگل پیش از این چگالی را در اولویت 8 از 10 خود قرار داه بود و الان آن را به بالاترین سطح خود ارتقاء داده است.)حتما می گویید خوب برایش فرقی هم نمی کند؟

من همین جستجو را تو یکی از بهترین جستجوگرهای ایرانی یعنی «ترب» انجام دادم، تا ببینید فرقی دارد یا نه.

چون مشکل ترب هم مشابه گوگلِ بعد از 2021 است، با این تفاوت که ترب هرگز رابطه سیمانتک ر ا در دستور کار خود نداشته است. یعنی نمی تواند رابطه معنایی بین کلمات را پیدا کند(چون الگوریتم نسبتا پیچیده ای نیاز دارد و برای همین به هوش مصنوعی که هزینه بالایی برای ترب دارد باید پناه ببرد).

بیایید «تز تدایی روانکاویی سادیسم در جامعه» را در گوگل جستجو کنید.

کاری به این نداریم که عبارت درست شما را به غلط تعبیر می کند:

جستجو غلط‌گیری شد: از تایی روان کاوی سادیسم در جامعه

ایا نتیجه زیر برای شما قابل قبول است؟

جستجو برای «تز تدایی روانکاویی سادیسم در جامعه» در ترب
جستجو برای «تز تدایی روانکاویی سادیسم در جامعه» در ترب

«تز تدایی روانکاویی سادیسم در جامعه» چه ارتباطی به «کتاب جامعه شناسی جامع کنکور مهروماه» دارد؟

پاسخ واضح است، از نظر ترب پاسخ پیدا شده است چون هر کدام از نتایج حداقل یک کلمه از عبارت مورد جستجو را دارد (و تنها نمی تواند تشخیص دهد که این نتایج ارتباط لازم با عبارت مورد جستجو را ندارند. این شمایید که می توانید تشخیص دهید رابطه لازم بین نتایج و عبارت جستجو شده وجود ندارد).

الان گوگل که استاد در پیدا کردن ارتباطات معنایی بود با تغییر معماری، خودش هم به همین درد مبتلا شده اما در سطح وسیع تر و بدتر و فاجعه آمیز که دور از تصور کاربران ایرانی عاشق و دلسوحته گوگل است.

این رنج بزرگی برای کاربران ایرانی است که دیگر گوگل در تحقیقات دانشگاهی که اکثرا نیاز به یافتن رابطه معنایی نوع 2 را دارند به آنها کمکی نخواهد کرد

من نتیجه حاصله توسط گوگل را در ارشیو ذخیره کردم تا در صورت اصلاح توسط هوش مصنوعی به روش سعی و خطا و نه سیمانتک مستندات داشته باشم اینجا: جستجو برای «تز تدایی روانکاویی سادیسم در جامعه».

می بینیم که به دلیل از دست دادن سیمانتک نوع 2) ارتباط سه جانبه(حالت پیچیده ای از سیمانتک)

نتوانست آنرا پیدا کند

در شرایطی که ما سایت تخصصی برای روانکاوی تداعی با سرفصل سادیسم داریم گوگل از یافتن آن عاجز شده است
در شرایطی که ما سایت تخصصی برای روانکاوی تداعی با سرفصل سادیسم داریم گوگل از یافتن آن عاجز شده است

سیستم IR گوگل که معجزه ای بیش نبود، بر اساس یک ناممکن نوشته شده است و آن «پیدا کردن سوزن در انبار کاه است.» کاری که گوگل با IR به بهترین وجه آن را انجام داد.

اما با کنار رفتن سیمانتک نوع 2 از نتایج جستجوی گوگل، وقتی رابطه سیمانتک از این نوع که اتفاقا مهمترین ان است، برقرار نباشد در کنار سوزن، سوزن ته گرد، میخ، پیچ و حتی سنجاق هم از این انبار کاه پیدا می شود.

البته بزرگی مشکل گوگل خودش را در عبارات روز و جدید نمایش می دهد (چون برای عبارات قدیمی و پرتکرار به تجاربی رسیده که به گوگل کمک می کند مثلا اگر در گوگل سالها قبل به کرار «How to run PHP code» جستجو نشده بود الان نتایج گوگل برای این جستحو تو ذوق کاربرانش می زد.

متوجه شدید چی شده؟

کلان داده عظیم گوگل و حجم بالای Dl و ML پشت آن باعث شده که خلا سیمانتک را کامل حس نکنیم، شاید همین خود گوگل را هم به اشتباه انداخته، یا به پذیرش اشتباه. که در هر صورت مخاطره امیز است.

بگذارید مثالی ملموس بزنم، اگر گوگل کماکان روی معماری GFS بود و شما جستجو می کردید: جنگ دوجین روز

با اینکه عبارت بی معنایی است گوگل شما را به جنگهای 12 روزه ایران و اسرائیل هدایت می کرد(از نظر قواعد ارتباط معنایی نوع 2 ) بین دوجین و 12 تفاوتی نیست، این یعنی مثل این می باشد که وقتی شما جنگ دوجین روز جستجو کردید مثل این بود که برای: جنگ 12 روز جستجو کرده اید.

بله مشکل جدید گوگل نشات گرفته از همین عدم انتقال کامل سیستم IR از معماری GFS به Colossus است. از IR ای می گوییم که زمانی وجه تمایزش با دیگران بود ، کل بنیان گوگل بر روی سیستم IR اش سوار شده است ، حتی محبوبیتش برای سازمان سیاه (که درآمد ده درصدی برای گوگل دارد). اما برای سرعت دادن به با فدا کردن سیمانتک نوع 2، معماری جادویی جدید گوگل شکل گرفت که در پذیرش درخواستهای چند میلیارد در ثانیه موفق هست،از معماری Colossus گوگل که 40 تا 50 درصد موفقیتش به دلیل این معماری منحصر به فرد و محرمانه است سخن می رانم.

اما گوگل طی 5 سالی که بر روی طراحی این معماری متمرکز شده بود تا آن را جایگزین GFS کند فقط به کلان داده ها یا bigdata و سرعت دسترسی به آن فکر کرد و ارتباط معنایی یا جستجوی معنایی ارتجاعی(~=مبتنی بر ر ابطه) semantic search elasticsearch را در ان لحاظ نکرد(جورهایی گوگل خودش بنیانگذارش بود،چون اولین موتور بود که تئوری ارتباط معنایی را به واقعیت تبدیل کرد)

نمی دونم از سر فراموشی این خطای راهبردی را مرتکب شده یا هیبت غول بی شاخ و دم بودن را با رسیدنن به سرعت سرسام آور به ان ترجیح داده.

اما این را به یادگاری از من داشته باشید، اگر روزی گوگل در رقابت از رقبا شکست خود برای همین تغییر معماری از GFS به Colossus بوده.

تغییر معماری از GFS (Google File System) به Colossus به‌صورت یک جهش ناگهانی نبود، بلکه تدریجی و چند مرحله‌ای بین حدود ۲۰۰۹ تا ۲۰۱۲ انجام شد.(هرچند در عمل چیزی که ما دیدیم در 2021 این معماری نهایی شد و نه 2012).
در سال ۲۰۲۱، یک نقطه عطف مهم در معماری Colossus اتفاق افتاد یعنی با پایان یافتن ساختار معماری Colossus، گوگل تصمیم گرفت اطلاعات بیشتری را درباره ساختار و نحوه عملکرد این سیستم فایل توزیع‌شده با عموم به اشتراک بگذارد. این نخستین بار بود که جزئیات فنی گسترده‌ای منتشر شد، کاری که پیش از آن محرمانه باقی مانده بود.

اما تغییرات مهم گفته شده در این پست نیز از 2021 با همه گیر شدن Colossus شروع شد.

و اولین گزارش شکایت مرتبط با بحث ما نیز از درج شکایتی در فروم پشتیبانی گوگل در سپتامبر 2021 شروع شد:

جستجوی گوگل دیگر نتایج مفیدی را نشان نمی‌دهد

و بهترین پاسخ منتخب به آن این بود:

من فکر می‌کنم اتفاقی که افتاده این است که اندازه اینترنت و حجم محتوایی که روزانه منتشر می‌شود، آنقدر افزایش یافته که برای حفظ سرعت بازیابی جستجوها، باید میانبرهایی ایجاد شود تا تعداد نتایج به تعداد قابل مدیریت‌تری کاهش یابد.

اما این پاسخ درست نبوده، پاسخ درست در تغییر معماری از GFS به Colossus برای رسیدن به سرعت 30 گیگابایت iops است.(گوگل هرگز به ان اعتراف نخواهد کرد، چون با این نقص خلایی را برای رقابت ایجاد کرده است)

همینقدر بدانید که همین الانش هم اگر تو پول غرق بزنید بالاترین میزان IOPS قابل دسترسی برایتان 2 مگابایت است و شرکتهایی مثل بینگ با هزینه های سرسام اور توانسته اند از ر.ش نودهای شبکه ای ان را به سختی به 3 گیگابایت برسانند و گوگل براحتی 10 برابر آن را دارد و این در ازای فدا کردن ارتباط نتایج جستجو بوده است.

انشاله در مستندات اوجو چگونه فدا شدن ان نیز مستند خواهد شد.

و گوگل در اینده از همین ناحیه ضربه خواهد خور