علی اکبر بدری

۲۹ فروردین ۱۴۰۱·۶ پست

داستان ترنسفورمرها

محمدمهدی آقاجانیدرoverfit.ir·

۴ سال پیش

داستان ترنسفورمرها (۶): داستان XLNet

اگر علاقه‌مند هستید که درباره XLNet و علل برتری‌ش بر BERT بیشتر بدونید، این پست رو از دست ندید.

داستان ترنسفورمرها (۶): داستان XLNet

محمدمهدی سمیعیدرoverfit.ir·

۴ سال پیش

داستان ترنسفورمرها (۵): سریع و سبک، گلاب‌گیری از برت با دیستیل‌برت

در این پست میخوایم تکنیک distillation رو که برای فشرده سازی مدل های عصبی بزرگ به کار میره رو بررسی کنیم و بعد هم با مدل distilbert آشنا بشی…

داستان ترنسفورمرها (۵): سریع و سبک، گلاب‌گیری از برت با دیستیل‌برت

محمدمهدی سمیعیدرoverfit.ir·

۴ سال پیش

داستان ترنسفورمرها (۴): داستان برت

اگر در کار پردازش زبان هستید قطعا اسم برت به گوشتون خورده. در این پست قصد داریم تا با شیوه نیکو و روان و جامعی داستان برت رو توضیح بدیم.

داستان ترنسفورمرها (۴): داستان برت

محمدمهدی سمیعیدرoverfit.ir·

۵ سال پیش

داستان ترنسفورمرها (۳): توجه و دیگر هیچ!

در سومین پست از رشته پست «داستان ترنسفورمرها» سعی کردیم مدل ترنسفورمر رو به نحو نیکویی بررسی کنیم!

داستان ترنسفورمرها (۳): توجه و دیگر هیچ!

علی اکبر بدریدرoverfit.ir·

۶ سال پیش

داستان ترنسفورمرها (۲): attention برمی‌خیزد!

در دومین پست از رشته‌پست «داستان ترنسفورمرها» انواع مدل‌های مکانیزم توجه و کاربردهایش را بررسی مختصری کردیم!

داستان ترنسفورمرها (۲): attention برمی‌خیزد!

علی اکبر بدریدرoverfit.ir·

۶ سال پیش

داستان ترنسفورمرها (۱): ناکارآمدی بازگشتی‌ها

مکانیزم توجه انقلابی در هوش مصنوعی و پردازش زبان طبیعی ایجاد کرد و باعث شروع سلطه‌ی ترنسفورمرها شد؛ در رشته پستی این معماری را توضیح دادیم.

داستان ترنسفورمرها (۱): ناکارآمدی بازگشتی‌ها