ورود ثبت نام

Erfan Zinvandi

پست‌ها لیست‌ها انتشارات‌

در حال دریافت اطلاعات...

Erfan ZinvandiدرMCINext·

۱ سال پیش

MIZAN: A Persian LLM Leaderboard

مقدمهمدل‌های زبانی بزرگ(LLMs) با استفاده از بنچمارک‌ها یا آزمون‌های استاندارد به‌منظور سنجش توانایی‌ها و کارایی در وظایف گوناگون زبان‌شناخت…

MIZAN: A Persian LLM Leaderboard

فیلم و سینماخواندن ۹ دقیقه

۲

Erfan ZinvandiدرMCINext·

۱ سال پیش

Persian MT-Bench

دیتاست Persian MT-Bench نسخه‌ی بومی‌سازی‌شده‌ی مجموعه‌ی MT-Bench به زبان فارسی است که با تغییرات محتوایی و ساختاری همراه بوده است. MT-Bench…

Persian MT-Bench

خواندن ۱ دقیقه

۰

Erfan ZinvandiدرMCINext·

۱ سال پیش

PerCoR

PersCoR مخفف "Persian CommonSense Reasoning" است و اولین بنچمارک بزرگ‌مقیاس فارسی برای ارزیابی توانایی مدل‌ها در استدلال دانش عمومی به صورت…

PerCoR

خواندن ۱ دقیقه

۰

Erfan ZinvandiدرMCINext·

۱ سال پیش

PerMMLU

MMLU چیست؟MMLU (اختصار Massive Multitask Language Understanding) یک بنچ‌مارک جامع برای سنجش درک زبانی مدل‌های زبانی بزرگ (LLMs) است که توسط…

PerMMLU

خواندن ۵ دقیقه

۰