محمود محمودی نیک·۲ ماه پیشRetrieval-Augmented Generation یا به اختصار RAG چیست؟بطور خلاصه در مورد فرایند بهینه سازی خروجی مدل های زبانی بزرگ صحبت کردم.
سعید حسنی·۳ ماه پیشدرباره Transformer: مدلی که همه چیز رو تغییر داد | 2یاد میگیریم که سه مرحله Encoder چطوری کمک میکنن تا ماشین نه تنها معنی کلمات رو بفهمه، بلکه بدونه هر کلمه توی چه جایگاهی از جمله قرار داره.
سعید حسنی·۳ ماه پیشدرباره Transformer: مدلی که همه چیز رو تغییر داد | 1مدل زبانی بزرگ، اساس و پایه اش چجوری عمل میکنه؟ با زبون ساده و گام به گام قراره باهم یاد بگیریم.
طاها اکبری·۳ ماه پیشMulti-Query attention و Group-Query attentionیک معماری که توی LLM های اخیر مورد توجه قرار گرفته معماری Group Query attention (GQA) هستش. جریان اینه که در زمان آموزش با توجه به این که ه…
طاها اکبری·۳ ماه پیشیادگیری با استفاده از نمونه های کم با استفاده از SetFitگاهی اوقات در حل مسائل دستهبندی تعداد کمی داده از هر کدام از دستهها داریم. (به طور مثال ۸ داده از هر دسته داریم). SetFit روشی برای دسته…
MegaChatدرMegaChat | مگاچت·۴ ماه پیشالگوهای طراحی عاملی با LLMها + پیاده سازی (پایتون)در این متن میخواهیم به کمی کدنویسی در رابطه با این الگوهای طراحی بپردازیم.
آیتیکل | Aiticleدرآیتیکل | اخبار هوش مصنوعی·۵ ماه پیشOpenAI نگاهی به داخل ساختار ChatGPT ارائه میدهدOpenAI یک مقاله تحقیقاتی درباره روش مهندسی معکوس عملکرد مدلهای هوش مصنوعی منتشر کرد.
آیتیکل | Aiticleدرآیتیکل | اخبار هوش مصنوعی·۶ ماه پیشآیا RAG میتواند مشکل توهم هوشمصنوعی را حل کند؟این چارچوب از منابع خارجی برای افزایش دقت استفاده میکند. آیا میتواند انتظارات را برآورده کند؟
آیتیکل | Aiticleدرآیتیکل | اخبار هوش مصنوعی·۶ ماه پیشیونیفای به توسعهدهندگان کمک میکند بهترین LLM را برای کارشان پیدا کنندیکی از مشکلات عمده توسعه دهندگانی که از LLMها استفاده میکنند، انتخاب مدل زبانی مناسب برای کار مورد نظر است، حالا یک استارتاپ به نام Unify .…
آیتیکل | Aiticleدرآیتیکل | اخبار هوش مصنوعی·۶ ماه پیشاستفاده از ایده های نظریه بازی ها برای بهبود قابلیت اطمینان مدل های زبانی"بازی اجماع" محققان MIT یک رویکرد نظری بازی برای رمزگشایی مدل زبان است. الگوریتم رتبهبندی تعادل، پرس و جوی مولد و افتراقی را هماهنگ میکند