خواندن ۲ دقیقه·۲ سال پیش

فردوسی، پردازش زبان طبیعی و قند پارسی!

به نظر من، کاری که متخصص‌‌های پردازش زبان طبیعی مرکز تحقیقات هوش مصنوعی پارت انجام دادن، شاید چیزی کمتر از کار فردوسی و نجات زبان فارسی نباشه! اون هم توی قرن ۲۱ !

حتما می‌دونید که وقتی زبان فارسی داشت کم‌کم می‌رفت که به دست فراموشی سپرده بشه و هجوم زبان‌های بیگانه داشت حضور این زبان شیرین رو کمرنگ می‌کرد، «فردوسی» این زنگ خطر رو احساس کرد و دست به کار شد و تمام ثروت و انرژی و وقتش رو گذاشت تا شاهنامه رو به نظم فارسی دربیاره و ۳۰ سال این تلاش رو ادامه داد.
اینجوری شد که فارسی نجات پیدا کرد و ما الان توی قرن ۲۱ میتونیم به همون زبانی صحبت کنیم که هزار سال پیش مردم باهاش صحبت میکردن و شعرهای سعدی و حافظ رو بفهمیم.

حالا متخصص‌های پردازش زبان طبیعی پارت چیکار کردن؟ توی این برهه پرهیاهو که همه کشورها دارن روی هوش مصنوعی ملی شون کار میکنن و برای زبان های خودشون مدل زبانی بومی توسعه دادن، جای خالی زبان فارسی رو توی ابزارهای هوشمند حس کردن و اومدن یک گروه مدل زبانی بزرگ رو با کلان‌داده های زبان فارسی توسعه دادن تا از این به بعد، هوش مصنوعی فارسی زبان هم پا به دنیای هوش مصنوعی بذاره. چیزی شبیه چت‌جی‌پی‌تی با کیفیت پاسخگویی بهتر و متناسب با زمینه‌های فرهنگی و زبانی خودمون.

مدل های زبانی یکسری سیستم های هوشمندی هستن که با حجم زیادی از داده های یک زبان (مثلا فارسی) آموزش داده میشن و مثل یه مغز متفکر، توی هسته چت بات ها و دستیار های صوتی هوشمند قرار میگیرن. جوری که وقتی با یه چت بات صحبت میکنی، متوجه روبات بودنش نمیشی و انگار داری با یه شخصیت آموزش دیده و پاسخگو صحبت میکنی که خیلی دقیقه.. اما یک ذهن مصنوعی داره!
درنای ۸ میلیارد پارامتری دقیقا اون مدل زبانیه ست که میتونه توی دستیارهای صوتی و چت بات های فارسی زبان به عنوان مغز متفکر بشینه و به سوالها پاسخ بده.
هر سوالی!

اینم بگم که «درنا» یک گروه از مدل‌های زبانیه که بر اساس حجم کلان داده هایی که باهاش آموزش داده شدن، از هم تفکیک میشن. پارت تونسته تا امروز درناهای ۳، ۷ ،۸ و ۱۳ میلیارد پارامتری رو توسعه بده و الان مدل ۸ میلیاردی رو منبع باز کرده. این ینی یه انقلاب توی پیشرفت هوش مصنوعی فارسی!
تبریک به مجموعه پارت و تیم فوق العاده ش.

از این لینک میتونید تستش کنید:

لینک دسترسی به LLM درنا ۸ میلیارد پارامتری&amp;amp;amp;lt;br/&amp;amp;amp;gt;