محمدمهدی آقاجانی در overfit.ir ۲ سال پیش - خواندن ۷ دقیقه اندر حکایت GPT-4 و چالهچولههای آن! در این پست به نقاط ضعف مدلهایی مثل GPT-4 و ChatGPT پرداختیم ...
محمدمهدی آقاجانی در overfit.ir ۲ سال پیش - خواندن ۷ دقیقه هوش مصنوعی با فیدبکهای واقعی! در این نوشته قصد داریم قلب چت جی پی تی یعنی روش آموزش اون رو توضیح بدی...
محمدمهدی سمیعی در overfit.ir ۲ سال پیش - خواندن ۱۳ دقیقه آلفاگو، یادگیری ماشین برای چیرگی بر یک بازی کهن وقتی برای اولین بار یک کامپیوتر، قهرمان انسانها توی بازی گو رو شکست م...
محمدمهدی آقاجانی در overfit.ir ۳ سال پیش - خواندن ۴ دقیقه تیپیکال سمپلینگ، تکه گمشده پازل تولید متن توسط رباتها در این پست میخواهیم به بهانه یه مقاله جدید در حوزه تولید متن، ببینیم...
محمدمهدی آقاجانی در overfit.ir ۳ سال پیش - خواندن ۴ دقیقه داستان ترنسفورمرها (۶): داستان XLNet اگر علاقهمند هستید که درباره XLNet و علل برتریش بر BERT بیشتر بدونید...
علیاکبر بدری در overfit.ir ۳ سال پیش - خواندن ۶ دقیقه مدل WebGPT؛ به GPT-3 اینترنت و مرورگر دادند! مدل GPT-3 یاد گرفت برای پاسخ به سوالها در اینترنت جستجو کند و جواب ر...
محمدمهدی سمیعی در overfit.ir ۳ سال پیش - خواندن ۷ دقیقه داستان ترنسفورمرها (۵): سریع و سبک، گلابگیری از برت با دیستیلبرت در این پست میخوایم تکنیک distillation رو که برای فشرده سازی مدل های عص...
محمدمهدی سمیعی در overfit.ir ۳ سال پیش - خواندن ۱۲ دقیقه داستان ترنسفورمرها (۴): داستان برت اگر در کار پردازش زبان هستید قطعا اسم برت به گوشتون خورده. در این پست...
محمدمهدی سمیعی در overfit.ir ۳ سال پیش - خواندن ۴ دقیقه مدل MEND؛ ادیت سریع، فوری و انقلابی مدلهای زبانی چطور به GPT3 بفهمونیم که دیگه ترامپ رییس جمهور آمریکا نیست؟
محمدمهدی سمیعی در overfit.ir ۳ سال پیش - خواندن ۶ دقیقه متد gather در pytorch با gather آشنا شویم تا کمتر از for قبیح وقت گیر در پایتورچ استفاده کنی...