محمدمهدی سمیعیدرoverfit.ir·۳ سال پیشداستان ترنسفورمرها (۵): سریع و سبک، گلابگیری از برت با دیستیلبرتدر این پست میخوایم تکنیک distillation رو که برای فشرده سازی مدل های عصبی بزرگ به کار میره رو بررسی کنیم و بعد هم با مدل distilbert آشنا بشی…