
مدلهای هوش مصنوعی هر چند ماه قدرتمندتر میشوند، اما همیشه «قویترین مدل» به معنای «بهترین انتخاب» نیست. من فرصت کار با Fable 5 شرکت انتروپیک را درست پیش از محدود شدن دسترسی عمومی آن داشتم و در این مطلب میخواهم تجربهام را بدون اغراق و بیواسطه بنویسم؛ از سانسور سنگین و محدودیت توکن گرفته تا کیفیت استدلال، و اینکه چرا در نهایت برای کار جدی به مدل دیگری برگشتم.
نکتهای که اغلب دربارهی این مدل نادیده گرفته میشود این است: Fable 5 در واقع نسخهی محدودشده و ایمنسازیشدهی مدل Mythos انتروپیک است. هستهی این دو یکسان است، اما Fable لایههای safeguard بسیار سنگینتری دارد تا بتوان آن را بهصورت عمومی عرضه کرد. به بیان ساده، Fable 5 همان قدرت Mythos را دارد، اما با دیوارههای ایمنی بهمراتب بلندتر.
در تاریخ نگارش این مطلب، دولت آمریکا با استناد به اختیارات امنیت ملی، دستور کنترل صادراتی صادر کرده که دسترسی هر تبعهی خارجی — چه داخل و چه خارج از آمریکا — به Fable 5 و Mythos 5 را ممنوع میکند. نتیجهی عملی این است که این مدل اکنون تنها برای کاربران آمریکایی مجاز است و انتروپیک برای اطمینان از انطباق، دسترسی را برای کاربران دیگر غیرفعال کرده است. دسترسی به سایر مدلهای انتروپیک تحت تأثیر این دستور قرار نگرفته است.
به همین دلیل، تجربهای که در ادامه میخوانید مربوط به بازهی کوتاهی است که این مدل هنوز در دسترس بود.
محدودیتهای Fable 5 در عمل کاملاً محسوس بودند:
سانسور بسیار شدید. برای آزمایش، آن را در یک امتحان مجازی به کار گرفتم و به هیچ روشی نتوانستم پاسخ تقلب برای امتحان دانشگاه از آن بگیرم. نه با تغییر صورت سؤال، نه با عوض کردن فریم پرسش، نه هیچ ترفند دیگری. مدل حتی کوچکترین فضای دور زدن را باقی نمیگذارد. این رفتار برای کاربری که بهدنبال میانبر است آزاردهنده است، اما از منظر طراحی ایمن کاملاً عامدانه است.
محدودیت توکن. پسزمینهی کل تجربه همین بود. مدل توکنسوز است و سقف مصرف بهسرعت پر میشود؛ موضوعی که در کارهای طولانی و پروژهمحور خودش را زود نشان میدهد.
کیفیت استدلال بالا. در مقابلِ این محدودیتها، Fable 5 بهعنوان یک مدل reasoning واقعاً قوی است و خروجی استدلالیاش از انتظار من فراتر بود.
نتیجهای که برای من از این تجربه مهمتر از کیفیت خود مدل بود، این است:
جدیدترین و قدرتمندترین مدل، لزوماً بهترین انتخاب نیست — بهویژه وقتی هزینهها و شرایط اقتصادی فعلی ما در ایران را در نظر بگیریم. حتی اگر Fable 5 همچنان برای ما در دسترس بود، استفادهی دائم از آن از نظر هزینه توجیه نداشت.
برای کار واقعی، کاملترین تجربهی کدنویسی من تا امروز با Opus 4.8 بوده است. با این مدل میتوان پروژههای در مقیاس بزرگ (large-scale) را بهشکل واقعی مدیریت کرد و نسبت هزینه به خروجی آن برای کار جدی منطقی است.
انتخاب درست یعنی مدلی که با مسئله و محدودیتهای واقعی شما همخوانی داشته باشد، نه گرانترین یا تازهترین گزینهی روی میز.
Fable 5 یک مدل استدلالی قدرتمند با ایمنسازی بسیار سنگین و محدودیت توکن بالاست؛ مدلی که بیش از آنکه ابزار کار روزمره باشد، نمونهای از مرزهای جدید قدرت و ایمنی در مدلهای هوش مصنوعی است. اما در عمل، انتخاب مدل باید بر اساس مسئله، هزینه و شرایط واقعی باشد، نه صرفاً تازگی یا قدرت خام. در شرایط فعلی، مدلی مثل Opus 4.8 برای پروژههای جدی انتخاب متعادلتری است.
اگه دوست دارید راجب مدل های هوش مصنوعی انتروپیک و سایر مدل های هوش مصنوعی بیشتر پست بذارم حمایت کنید و نظرتونو بهم بگین.
این مطلب را ماهان زندی نوشته است؛ توسعهدهندهی وب و اپلیکیشن با تمرکز بر ساخت رباتهای تلگرام و اتوماسیون. اگر دربارهی موضوع این مطلب نظری دارید یا دوست دارید تجربهی خودتان از کار با این مدلها را در میان بگذارید، خوشحال میشوم گفتوگو کنیم: +98 939 552 6996