خواندن ۳ دقیقه·۳ ماه پیش

ساده بگم: هوش مصنوعی چطوری کار میکنه!

تا حالا به این فکر کردی وقتی از هوش مصنوعی یه سؤال می‌پرسی، واقعاً جواب رو از کجا پیدا می‌کنه؟ چطور ممکنه تو چند ثانیه بین یه عالمه اطلاعات بگرده و چیزی رو بیاره که به سؤال تو می‌خوره؟ ماجرا از یه جای جالب شروع میشه… با یه داستان ساده من همه چیو بهت میگم. بعد این متن تو متخصص هوش مصنوعی نمیشی، ولی قلقلک میشی بیشتر بدونی یا با فضای کار اون آشنا میشی. پس بریم ببینیم داستان چیه...

کامپیوتر معنی رو نمی‌فهمه!

ما اگه این دو تا جمله رو بشنویم:

«مدت گارانتی این محصول چقدره؟»
«این دستگاه چند ماه ضمانت داره؟»

سریع می‌فهمیم منظور یکیه.

ولی برای یه سیستم معمولی، اینا فقط دو تا رشته متفاوت از حروفن. هیچ حسی از «معنی یکی بودن» نداره. سیستم‌های قدیمی فقط دنبال کلمه‌های مشترک می‌گشتن. یعنی اگه دقیقاً همون کلمه تکرار نمی‌شد، ممکن بود نتیجه رو پیدا نکنن. اینجاست که داستان جذاب میشه.

تبدیل معنی به عدد!

کامپیوتر با عدد حال می‌کنه 😄 نه با کلمه. ببین منظورم صفر و یک نیست. مثلا یه جمله را تصور کن که تبدیل بشه به یه آرایه ای از اعداد. و به طور خلاصه، عددهایی که به هم نزدیکترن، معنی نزدیکتری دارند. به همین سادگی. حالا اینجا به این تبدیل جمله به اعداد میگن:

Embedding

یعنی تبدیل متن به یه نمایش عددی از معنی.

خروجیش یه چیزیه شبیه این که بهش میگن بردار:

[0.21, -0.78, 1.02, 0.44, ...]

بعدش چی میشه؟

فرض کن داخل سیستم ذخیره شده:

«این دستگاه ۷ ماه ضمانت دارد.»

حالا کاربر می‌پرسه:

«گارانتی این محصول چقدره؟»

سیستم سؤال رو هم تبدیل می‌کنه به عدد. بعد با یه محاسبه ریاضی به اسم Cosine Similarity بررسی می‌کنه کدوم جمله از نظر عددی نزدیک‌تره.

اگه فاصله کم باشه → یعنی معنی نزدیکه.

دیگه مهم نیست کلمه‌ها یکی باشن. مهم اینه که «حس معنایی» شبیه هم باشه.

اینجاست که Vector Database وارد بازی میشه

حالا فکر کن هزاران یا میلیون‌ها جمله تبدیل شدن به بردار. اینا داخل یه دیتابیس (خونه ی داده ها خخخ) داخل یه چیزی به اسم Vector Database ذخیره میشن. کارش علاوه بر ذخیره، فقط یه چیزه: پیدا کردن نزدیک‌ترین معنی بین کلی داده.

یعنی برخلاف دیتابیسهای قبلی دیگه خبری از جدول نیست. البته اگه نمیدونی دیتابیس چیه باید برات بگم که اینش مهم نیست، مهم اینه که یه سری عدد فک کن ذخیره شدن که هر چی به هم نزدیکتر باشند، از لحاظ معنی نزدیکترن.

RAG یعنی چی که اینقدر اسمش رو می‌شنویم؟

وقتی این جستجوی معنایی با یه مدل تولید متن ترکیب بشه، بهش میگن:

RAG

یعنی اول برو اطلاعات مرتبط رو پیدا کن، بعد باهاش جواب بساز. به همین خاطره که بعضی جواب‌های هوش مصنوعی دقیق‌تر میشن. چون قبلش واقعاً رفته دنبال اطلاعات.

خلاصه‌ی پشت صحنه

وقتی سؤال می‌پرسی:

سؤالت تبدیل میشه به عدد
نزدیک‌ترین معنی پیدا میشه
مدل بر اساس اون جواب می‌سازه

همین.

خب این وسط Zvec کجای داستانه؟

تا اینجا فهمیدیم:

جمله تبدیل میشه به عدد (Embedding)
عددها با هم مقایسه میشن (Cosine Similarity)
نزدیک‌ترین معنی پیدا میشه
بعد مدل جواب می‌سازه (RAG)

اما یه سؤال مهم:

این همه بردار کجا نگه‌داری میشن؟
و کی اینقدر سریع نزدیک‌ترینش رو پیدا می‌کنه؟

اینجاست که چیزی مثل Zvec وارد بازی میشه.

Zvec یه Vector Database توکار (Embedded) ـه.
یعنی لازم نیست یه سرور جدا بالا بیاری، لازم نیست سیستم پیچیده راه بندازی، داخل خود برنامه‌ات اجرا میشه. اگه SQLite رو برای جدول‌ها بشناسیم، Zvec رو میشه گفت همون ایده، ولی برای «معنی». تو بهش بردار میدی، اون برات نگهشون می‌داره، و وقتی یه سؤال جدید بیاد، سریع میگه: «داداش این از همه شبیه‌تره 😄»

کی به درد می‌خوره؟

Zvec بیشتر به درد این جور پروژه‌ها می‌خوره:

اپلیکیشن‌های لوکال
پروژه‌های سبک
داده‌های محرمانه که نمی‌خوای بفرستی سرور بیرون
وقتی می‌خوای سریع یه سیستم RAG بسازی بدون دردسر زیرساخت

یعنی اگه بخوای یه چت‌بات داخلی برای شرکتت بسازی که فقط روی فایل‌های خودتون جواب بده، این مدل ابزار دقیقاً همون چیزیه که لازم داری.

حالا تصویر کامل رو ببین

وقتی از هوش مصنوعی سؤال می‌پرسی:

سؤالت تبدیل میشه به یه بردار عددی
Zvec نزدیک‌ترین بردار رو پیدا می‌کنه
مدل زبانی با کمک اون اطلاعات جواب می‌سازه

و کل این اتفاق… تو چند میلی‌ثانیه میفته.

آخرش چی شد؟

نه تو الان متخصص هوش مصنوعی شدی، نه قراره فردا بری الگوریتم ANN پیاده‌سازی کنی. ولی حداقل وقتی از AI سؤال می‌پرسی، می‌دونی یه چیزی فراتر از «جادو» پشتشه. یه سری عدد. یه سری فاصله. یه عالمه ریاضی. و یه دیتابیس که معنی رو نگه می‌داره.

https://github.com/alibaba/zvec

هوش مصنوعیدیتابیسهوشریاضیکامپیوتر

دیر و زود

سریال زندگی من...

شاید از این پست‌ها خوشتان بیاید

دیر و زود

خواندن ۳ دقیقه·۳ ماه پیش

ساده بگم: هوش مصنوعی چطوری کار میکنه!

کامپیوتر معنی رو نمی‌فهمه!

ما اگه این دو تا جمله رو بشنویم:

«مدت گارانتی این محصول چقدره؟»
«این دستگاه چند ماه ضمانت داره؟»

سریع می‌فهمیم منظور یکیه.

تبدیل معنی به عدد!

Embedding

یعنی تبدیل متن به یه نمایش عددی از معنی.

خروجیش یه چیزیه شبیه این که بهش میگن بردار:

[0.21, -0.78, 1.02, 0.44, ...]

بعدش چی میشه؟

فرض کن داخل سیستم ذخیره شده:

«این دستگاه ۷ ماه ضمانت دارد.»

حالا کاربر می‌پرسه:

«گارانتی این محصول چقدره؟»

اگه فاصله کم باشه → یعنی معنی نزدیکه.

دیگه مهم نیست کلمه‌ها یکی باشن. مهم اینه که «حس معنایی» شبیه هم باشه.

اینجاست که Vector Database وارد بازی میشه

RAG یعنی چی که اینقدر اسمش رو می‌شنویم؟

وقتی این جستجوی معنایی با یه مدل تولید متن ترکیب بشه، بهش میگن:

RAG

خلاصه‌ی پشت صحنه

وقتی سؤال می‌پرسی:

سؤالت تبدیل میشه به عدد
نزدیک‌ترین معنی پیدا میشه
مدل بر اساس اون جواب می‌سازه

همین.

خب این وسط Zvec کجای داستانه؟

تا اینجا فهمیدیم:

جمله تبدیل میشه به عدد (Embedding)
عددها با هم مقایسه میشن (Cosine Similarity)
نزدیک‌ترین معنی پیدا میشه
بعد مدل جواب می‌سازه (RAG)

اما یه سؤال مهم:

این همه بردار کجا نگه‌داری میشن؟
و کی اینقدر سریع نزدیک‌ترینش رو پیدا می‌کنه؟

اینجاست که چیزی مثل Zvec وارد بازی میشه.

کی به درد می‌خوره؟

Zvec بیشتر به درد این جور پروژه‌ها می‌خوره:

اپلیکیشن‌های لوکال
پروژه‌های سبک
داده‌های محرمانه که نمی‌خوای بفرستی سرور بیرون
وقتی می‌خوای سریع یه سیستم RAG بسازی بدون دردسر زیرساخت

حالا تصویر کامل رو ببین

وقتی از هوش مصنوعی سؤال می‌پرسی:

سؤالت تبدیل میشه به یه بردار عددی
Zvec نزدیک‌ترین بردار رو پیدا می‌کنه
مدل زبانی با کمک اون اطلاعات جواب می‌سازه

و کل این اتفاق… تو چند میلی‌ثانیه میفته.

آخرش چی شد؟

https://github.com/alibaba/zvec

هوش مصنوعیدیتابیسهوشریاضیکامپیوتر

دیر و زود

سریال زندگی من...

شاید از این پست‌ها خوشتان بیاید