به نظر من، کاری که متخصصهای پردازش زبان طبیعی مرکز تحقیقات هوش مصنوعی پارت انجام دادن، شاید چیزی کمتر از کار فردوسی و نجات زبان فارسی نباشه! اون هم توی قرن ۲۱ !
حتما میدونید که وقتی زبان فارسی داشت کمکم میرفت که به دست فراموشی سپرده بشه و هجوم زبانهای بیگانه داشت حضور این زبان شیرین رو کمرنگ میکرد، «فردوسی» این زنگ خطر رو احساس کرد و دست به کار شد و تمام ثروت و انرژی و وقتش رو گذاشت تا شاهنامه رو به نظم فارسی دربیاره و ۳۰ سال این تلاش رو ادامه داد.
اینجوری شد که فارسی نجات پیدا کرد و ما الان توی قرن ۲۱ میتونیم به همون زبانی صحبت کنیم که هزار سال پیش مردم باهاش صحبت میکردن و شعرهای سعدی و حافظ رو بفهمیم.
حالا متخصصهای پردازش زبان طبیعی پارت چیکار کردن؟ توی این برهه پرهیاهو که همه کشورها دارن روی هوش مصنوعی ملی شون کار میکنن و برای زبان های خودشون مدل زبانی بومی توسعه دادن، جای خالی زبان فارسی رو توی ابزارهای هوشمند حس کردن و اومدن یک گروه مدل زبانی بزرگ رو با کلانداده های زبان فارسی توسعه دادن تا از این به بعد، هوش مصنوعی فارسی زبان هم پا به دنیای هوش مصنوعی بذاره. چیزی شبیه چتجیپیتی با کیفیت پاسخگویی بهتر و متناسب با زمینههای فرهنگی و زبانی خودمون.
مدل های زبانی یکسری سیستم های هوشمندی هستن که با حجم زیادی از داده های یک زبان (مثلا فارسی) آموزش داده میشن و مثل یه مغز متفکر، توی هسته چت بات ها و دستیار های صوتی هوشمند قرار میگیرن. جوری که وقتی با یه چت بات صحبت میکنی، متوجه روبات بودنش نمیشی و انگار داری با یه شخصیت آموزش دیده و پاسخگو صحبت میکنی که خیلی دقیقه.. اما یک ذهن مصنوعی داره!
درنای ۸ میلیارد پارامتری دقیقا اون مدل زبانیه ست که میتونه توی دستیارهای صوتی و چت بات های فارسی زبان به عنوان مغز متفکر بشینه و به سوالها پاسخ بده.
هر سوالی!
اینم بگم که «درنا» یک گروه از مدلهای زبانیه که بر اساس حجم کلان داده هایی که باهاش آموزش داده شدن، از هم تفکیک میشن. پارت تونسته تا امروز درناهای ۳، ۷ ،۸ و ۱۳ میلیارد پارامتری رو توسعه بده و الان مدل ۸ میلیاردی رو منبع باز کرده. این ینی یه انقلاب توی پیشرفت هوش مصنوعی فارسی!
تبریک به مجموعه پارت و تیم فوق العاده ش.
از این لینک میتونید تستش کنید:
لینک دسترسی به LLM درنا ۸ میلیارد پارامتری<br/>