سعید حسنی·۳ ماه پیشدرباره Transformer: مدلی که همه چیز رو تغییر داد | 2یاد میگیریم که سه مرحله Encoder چطوری کمک میکنن تا ماشین نه تنها معنی کلمات رو بفهمه، بلکه بدونه هر کلمه توی چه جایگاهی از جمله قرار داره.
سعید حسنی·۳ ماه پیشدرباره Transformer: مدلی که همه چیز رو تغییر داد | 1مدل زبانی بزرگ، اساس و پایه اش چجوری عمل میکنه؟ با زبون ساده و گام به گام قراره باهم یاد بگیریم.
طاها اکبری·۳ ماه پیشMulti-Query attention و Group-Query attentionیک معماری که توی LLM های اخیر مورد توجه قرار گرفته معماری Group Query attention (GQA) هستش. جریان اینه که در زمان آموزش با توجه به این که ه…
Nima Momeni·۱ سال پیشمدل های زبان بزرگ - بخش دومدر پست قبلی، ما شبکه های عصبی را معرفی کردیم و نشان دادیم که چگونه می توانیم از آنها برای تقریب هر تابعی استفاده کنیم...
مهدی رحمانی·۱ سال پیشDETR در برابرYOLOتشخیص شیء یک مشکل مهم در بینایی رایانهای است. دو روش برجسته برای تشخیص شیء، YOLO و DETR هستند.
علیرضا مدنی·۱ سال پیششبکه عصبی ترانسفورمرترانسفورمر به عنوان یکی از معماریهای اصلی در زمینه پردازش زبان طبیعی و بینایی ماشین محسوب میشود و در مسائل مختلفی از ترجمه ماشینی گرفته ت…
علیرضا مدنی·۲ سال پیشخلاصهای از توکنسازها در پردازش زبان طبیعیتقسیم متن به بخش کوچکتر در پردازش زبان طبیعی و بررسی راههای متعددی برای انجام آن. Summary of the tokenizers
Mehrdad Pajuhaan·۲ سال پیشمقدمه کامل شبکه های عصبی : در دنیای ترنسفورمرها چه می گذرد!؟ + ویدئو به زبان فارسیبحث در مورد ChatGPT بسیار داغ هست اما دقیقا موضوعی که در موردش خواهید دید فراتر از داستان ها سطحی خواهد بود.
مجموعه دانشبنیان شناسا·۳ سال پیشمکانیزم توجه و مدلهای تبدیلکننده (Transformers)مدلهای تبدیلکننده یا Transformers تاثیر زیادی بر دنیای هوش مصنوعی گذاشتند. در این پست درباره معماری این مدل و مکانیزم توجه صحبت میکنیم.
مرکز تحقیقات هوش مصنوعی پارت·۳ سال پیش۱۰ چیزی که درباره مدل BERT و معماری Transformer نمیدانید!در این مقاله میخواهیم به مواردی درباره مدل BERT و معماری Transformer که احتمالا نمیدانید اشاره کنیم. در حال حاضر، پردازش زبان طبیعی از مح…