
با سه تا حرکت میتونید معجزه ای در مصرف توکن هاتون داشته باشید.
وقتی Claude Code یک کدبیس را بررسی میکند، عاملهای Explore را راهاندازی میکند که با ابزارهای grep، glob و Read فایلها را اسکن میکنند — و در هر فراخوانی ابزار، توکن مصرف میکنند. CodeGraph به این عاملها یک گراف دانش از پیش ایندکسشده میدهد — شامل روابط نمادها، گرافهای فراخوانی، و ساختار کد. عاملها به جای اسکن فایلها، بهصورت آنی گراف را جستجو میکنند.
نتیجه :

نحوه نصب : ریپو گیت هاب
حرکت دوم صرفه جویی در توکن های ورودی هست کلاد وقتی یک کامند اجرا میکند خروجی اون کامند میتونی خیلی زیاد باشه و بلند باشه ( این خروجی در اصل همون ورودی ایجنت ما میشه اونو میخونه با بفهمه چه خبره )
ابزار rtk میاد و این خروجی فشرده میکنه و فقط در حدی که لازمه به ایجنت میده اینجوری صرجویی زیادی در مصرف توکن ورودی میشه
rtk خروجی دستورات را قبل از اینکه به context مدل زبانی شما برسند، فیلتر و فشردهسازی میکند. یک باینری تکی نوشتهشده با Rust، پشتیبانی از ۱۰۰+ دستور، و سربار کمتر از ۱۰ میلیثانیه.
نتیجه :

نحوه نصب : ریپو گیت هاب
مرحله سوم بهینه کردن توکن خروجی هست
Caveman
یک اسکیل/پلاگین برای Claude Code (و همچنین Codex، Gemini، Cursor، Windsurf، Cline، Copilot و بیش از ۳۰ ابزار دیگر) که باعث میشود عامل هوش مصنوعی مثل انسان غارنشین حرف بزند — خروجی را کوتاه و فشرده میکند، اما هیچچیزی از دقت فنی کم نمیشود.
به جای اینکه مدل جوابهای طولانی و پر از توضیحات اضافه بدهد، فقط چیزی میگوید که واقعاً مهم است. حدود ۷۵٪ از توکنهای خروجی کاهش پیدا میکنند — یعنی هزینه کمتر، سرعت بیشتر، و context window بازتر. مغز همچنان بزرگ است. فقط دهان کوچکتر شده.
مثال :

نتیجه

نحوه نصب : ریپو گیت هاب