خواندن ۷ دقیقه·۶ ماه پیش

اصول مهندسی نرم‌افزار برای ساخت سیستم‌های LLM قابل اعتماد

فراتر از سقف کیفیت ۸۰ درصدی

چالش اصلی در توسعه عامل‌ها، تجربه مشترک رسیدن به سقف کیفیت ۷۰ تا ۸۰ درصدی است؛ نقطه‌ای که نمونه‌های اولیه در مقیاس‌پذیری به سیستم‌های تولیدی قابل اعتماد شکست می‌خورند. متدولوژی «عامل ۱۲ عاملی» (12-Factor Agent) به عنوان یک فلسفه منضبط و مبتنی بر مهندسی نرم‌افزار برای غلبه بر این مانع معرفی می‌شود. این متدولوژی عمداً مشابه «اپلیکیشن ۱۲ عاملی» (12-Factor App) اصلی طراحی شده و همان رویکرد طراحی اصولی را در حوزه سیستم‌های عاملی به کار می‌گیرد. این اصول نه به معنای رد کردن تمام ابزارها و فریم‌ورک‌ها، بلکه به منزله‌ی یک «لیست نیازها» است برای آنچه که فریم‌ورک‌های با قابلیت اطمینان بالا باید به توسعه‌دهندگان امکان کنترل آن را بدهند.

تغییر بنیادین: از انتزاع عاملی به انضباط مهندسی

پیش از پرداختن به الگوهای خاص، یک تغییر بنیادین در مدل ذهنی ضروری است. مسیر رسیدن به قابلیت اطمینان، با فاصله گرفتن از نگرش به عامل‌ها به عنوان موجوداتی جادویی و خودمختار آغاز می‌شود و در عوض، باید آن‌ها را به عنوان اجزای نرم‌افزاری پیشرفته‌ای در نظر گرفت که ملزم به رعایت اصول اثبات‌شده مهندسی هستند.

این سفر فکری برای بسیاری از توسعه دهندگان آشناست. هیجان اولیه استفاده از فریم‌ورک‌های سطح بالا برای ساخت سریع یک عامل، به سرعت جای خود را به کابوس دیباگ کردن می‌دهد؛ جایی که خود را «هفت لایه در اعماق یک پشته فراخوانی» می‌یابید و تلاش می‌کنید بفهمید یک پرامپت چگونه ساخته شده یا ابزارها چگونه در سیستم استفاده می‌شوند. همین مشکلات است که توسعه‌دهندگان را وادار به زیر سؤال بردن این انتزاع‌ها می‌کند. این ناامیدی در داستان ساخت یک عامل DevOps به خوبی نمایان می‌شود: تلاشی که با هدف اجرای دستورات make آغاز شد، به جایی رسید که توسعه‌دهنده مجبور شد تمام جزئیات و ترتیب دقیق مراحل را در پرامپت دیکته کند. در آن نقطه، آشکار شد که یک اسکریپت ساده و قطعی (deterministic) می‌توانست همین کار را با سرعت و قابلیت اطمینان بسیار بیشتری انجام دهد. این روایت علت و معلولی نشان می‌دهد که چگونه اتکای بیش از حد به انتزاع، به راه‌حل‌های ناکارآمد منجر می‌شود و اهمیت حیاتی تفکیک مسائل مناسب برای عامل‌ها از مسائلی که با کد استاندارد بهتر حل می‌شوند را برجسته می‌کند. این تغییر فلسفی ما را به اولین پیامد عملی می‌رساند: به دست گرفتن مالکیت منطق اصلی سیستم.

اصل اساسی: مالکیت جریان کنترل و وضعیت

در هر سیستم نرم‌افزاری قدرتمند، مدیریت وضعیت قابل پیش‌بینی، غیرقابل مذاکره است. سیستم‌های عاملی نیز از این قاعده مستثنی نیستند و به همین دلیل، مالکیت حلقه اجرایی، حیاتی‌ترین تصمیم معماری است. این رویکرد در تضاد کامل با ماهیت «جعبه سیاه» واگذاری کنترل به یک فریم‌ورک قرار دارد. یک حلقه عامل «ساده‌انگارانه» معمولاً از این چرخه پیروی می‌کند: رویداد -> پرامپت -> فراخوانی API -> به‌روزرسانی context -> تکرار. حالت اصلی شکست این حلقه، کاهش عملکرد و قابلیت اطمینان به دلیل پنجره‌های زمینه (context windows) طولانی و مدیریت‌نشده است.

یک حلقه کنترل تحت مالکیت (owned control loop) از چهار جزء اصلی تشکیل شده است:

پرامپت (The Prompt): دستورالعمل‌هایی برای انتخاب گام بعدی.
عبارت سوئیچ (The Switch Statement): کد قطعی که بر اساس خروجی ساختاریافته مدل، اقدامات را اجرا می‌کند.
سازنده زمینه (The Context Builder): منطقی برای گردآوری اطلاعات برای LLM.
شرط حلقه (The Loop Condition): منطقی که تعیین می‌کند چه زمانی و چرا باید از حلقه خارج شد.

از آنجا که عامل‌ها صرفاً نرم‌افزار هستند، وضعیت آن‌ها نیز باید با همان دقت مدیریت شود. مالکیت این حلقه، توانایی پیاده‌سازی الگوهای مدیریت وضعیت پیشرفته را فراهم می‌کند و به ما اجازه می‌دهد تا وضعیت اجرایی (مانند تعداد تلاش های مجدد ) و وضعیت کسب‌وکار (مانند پیام های کاربر یا داده ها برای UI) را یکپارچه کنیم. قدرت این معماری تحت مالکیت، هنگام مدیریت عملیات ناهمزمان (asynchronous) — که یک نقطه شکست رایج برای فریم‌ورک‌های انتزاعی است — به وضوح نمایان می‌شود:

یک رویداد، حلقه عامل را فعال می‌کند.
عامل، دستوری برای یک ابزار خروجی می‌دهد.
گردش کار متوقف شده و کل پنجره Context در یک پایگاه داده با کلید ID وضعیت ذخیره (serialize) می‌شود.
ابزار به صورت ناهمزمان اجرا می‌شود.
پس از اتمام، ابزار با ID وضعیت و نتیجه callback می‌کند.
سیستم، وضعیت را از پایگاه داده بارگیری کرده، نتیجه را به آن اضافه می‌کند و حلقه عامل را به طور یکپارچه از سر می‌گیرد.

این کنترل دقیق بر جریان، زمینه را برای مهندسی اطلاعاتی که در این حلقه جریان می‌یابد، فراهم می‌کند.

تسلط بر رابط: اولویت Context engineering

از آنجایی که LLMها توابع قطعی و بدون حالت (stateless) هستند («توکن ورودی، توکن خروجی»)، مهندسی زمینه (context engineering) — یعنی کنترل دقیق هر توکنی که به مدل ارسال می‌شود — محرک اصلی کیفیت و قابلیت اطمینان عامل است.

مالکیت پرامپت‌ها: در حالی که انتزاع‌های پرامپت برای شروع کار مفید هستند، عبور از آستانه کیفی تولید نیازمند نوشتن پرامپت‌ها «توکن به توکن و به صورت دستی» است. از آنجا که تنها عامل تعیین‌کننده کیفیت خروجی، کیفیت ورودی است، کنترل کامل بر پرامپت‌ها به شما امکان می‌دهد تا بهینه‌سازی‌های دقیقی را برای رسیدن به قابلیت اطمینان بالا اعمال کنید.
مالکیت ساخت context : زمینه چیزی فراتر از تاریخچه چت است؛ این شامل پرامپت‌ها، حافظه، نتایج RAG و داده‌های تاریخی می‌شود. به جای استفاده از فرمت‌های استاندارد (مانند پیام‌های OpenAI)، می‌توان تمام وضعیت رویداد را به صورت یک رشته در یک پیام کاربری واحد قرار داد. هدف، بهینه‌سازی تراکم و وضوح اطلاعاتی است که به LLM منتقل می‌شود.
ترمیم با context : افزودن کورکورانه خطاهای ابزار به پنجره زمینه یک الگوی مضر است که می‌تواند منجر به حلقه‌های خطای غیرقابل کنترل شود. رویکرد مهندسی منضبط، نیازمند دریافت خطاها، خلاصه‌سازی آن‌ها و قرار دادن آن اطلاعات در پنجره context است (یا پاک کردن کامل آن‌ها پس از یک فراخوانی موفق). این امر از انحراف عامل جلوگیری کرده و آن را در مسیر صحیح نگه می‌دارد.

تسلط بر نحوه ساخت ورودی LLM، به طور طبیعی ما را به سمت تحلیل و هدایت خروجی آن سوق می‌دهد.

الگوی معماری برای تولید: عامل‌های خرد و همکاری انسانی

اصول مالکیت و مهندسی context به بهترین شکل در یک الگوی معماری خاص و قدرتمند پیاده‌سازی می‌شوند: معماری micro-agents. این‌ها حلقه‌های عاملی کوچک و تخصصی هستند که در گردش‌های کاری بزرگ‌تر، قابل پیش‌بینی و قطعی تعبیه شده‌اند.

بازنگری در استفاده از ابزار : بنیادی‌ترین و قابل اعتمادترین قابلیت LLM تبدیل زبان طبیعی به JSON ساختاریافته است. «استفاده از ابزار» چیزی جز اجرای قطعی کد (مثلاً از طریق یک عبارت سوئیچ) بر اساس آن JSON تولید شده نیست. این deconstruction حیاتی است، زیرا یک انتزاع مبهم و مستعد خطا («استفاده از ابزار») را با دو جزء مجزا، قدرتمند و قابل دیباگ مستقل جایگزین می‌کند: یک مرحله تولید داده ساختاریافته (نقطه قوت اصلی LLM) و یک مرحله اجرای قطعی (کد استاندارد و قابل اعتماد).
ادغام انسان در حلقه : «تماس با انسان» باید به عنوان یک نوع اقدام درجه یک در نظر گرفته شود، نه صرفاً یک راهکار جایگزین. با وادار کردن مدل به انتخاب اولیه بین تولید یک فراخوانی ابزار و تولید یک پاسخ به زبان طبیعی (مانند «کار من تمام شد» یا «نیاز به توضیح دارم»)، سیستم یک لایه حیاتی برای اعتبارسنجی نیت به دست می‌آورد. این کار، استدلال مدل در مورد وضعیت خود را از اجرای یک وظیفه جدا می‌کند و کل فرآیند را قابل مشاهده‌تر و مشارکتی‌تر می‌سازد.
الگوی «عامل‌های کوچک و متمرکز» را می‌توان با مطالعه موردی ربات استقرار اتوماتیک با همکاری انسان به خوبی درک کرد:
- یک خط لوله CI/CD قطعی تا رسیدن به یک نقطه تصمیم‌گیری (ادغام PR، عبور تست‌ها) اجرا می‌شود.
- کنترل به یک «عامل استقرار» کوچک برای تعیین گام بعدی واگذار می‌شود.
- عامل یک اقدام را پیشنهاد می‌دهد (مثلاً «استقرار فرانت‌اند») و آن را از طریق Slack برای تأیید به انسان ارائه می‌دهد.
- انسان بازخورد زبان طبیعی ارائه می‌دهد (مثلاً «نه، اول بک‌اند را انجام بده»)، که عامل آن را به یک اقدام جدید مبتنی بر JSON ترجمه می‌کند.
- پس از تکمیل و تأیید تمام مراحل عاملی، کنترل به خط لوله قطعی برای اجرای تست‌های end-to-end بازگردانده می‌شود.

مزایای این معماری شامل پنجره‌های زمینه قابل مدیریت، مسئولیت‌های روشن برای هر عامل و قابلیت پیش‌بینی کلی سیستم است.

نتیجه‌گیری: یک مسیر اصولی

ساخت عامل‌های قابل اعتماد یک چالش مهندسی نرم‌افزار است، نه یک مسئله انتزاعی هوش مصنوعی. با کنار گذاشتن دیدگاه عامل‌ها به عنوان موجودات خودمختار و در نظر گرفتن اصول اثبات‌شده مهندسی نرم افزار، می‌توانیم از سقف کیفیت ۸۰ درصدی عبور کرده و سیستم‌هایی بسازیم که واقعاً در محیط عملیاتی کار می‌کنند.

نکات کلیدی این رویکرد عبارتند از:

با عامل‌ها مانند نرم‌افزار رفتار کنید: اصول اثبات‌شده مدیریت وضعیت، جریان کنترل و ماژولار بودن را به کار بگیرید.
مالک منطق اصلی خود باشید: اگر به قابلیت اطمینان بالا نیاز دارید، کنترل پرامپت‌ها، زمینه و حلقه اجرایی خود را به انتزاع‌ها واگذار نکنید.
معماری micro-agents را بپذیرید: عامل‌های کوچک و متمرکز که در گردش‌های کاری قطعی تعبیه شده‌اند را به عامل‌های یکپارچه و خودمختار ترجیح دهید.
برای همکاری انسانی طراحی کنید: سیستم‌هایی بسازید که در آن‌ها انسان‌ها یک بخش طبیعی و جدایی‌ناپذیر از حلقه هستند، نه صرفاً یک کنترل‌کننده استثنا.

مهندسی نرم‌افزارهوش مصنوعیمعماری نرم افزار

علی محمدی

توسعه دهنده نرم افزار

شاید از این پست‌ها خوشتان بیاید

علی محمدی

خواندن ۷ دقیقه·۶ ماه پیش

اصول مهندسی نرم‌افزار برای ساخت سیستم‌های LLM قابل اعتماد

فراتر از سقف کیفیت ۸۰ درصدی

تغییر بنیادین: از انتزاع عاملی به انضباط مهندسی

اصل اساسی: مالکیت جریان کنترل و وضعیت

یک حلقه کنترل تحت مالکیت (owned control loop) از چهار جزء اصلی تشکیل شده است:

پرامپت (The Prompt): دستورالعمل‌هایی برای انتخاب گام بعدی.
عبارت سوئیچ (The Switch Statement): کد قطعی که بر اساس خروجی ساختاریافته مدل، اقدامات را اجرا می‌کند.
سازنده زمینه (The Context Builder): منطقی برای گردآوری اطلاعات برای LLM.
شرط حلقه (The Loop Condition): منطقی که تعیین می‌کند چه زمانی و چرا باید از حلقه خارج شد.

یک رویداد، حلقه عامل را فعال می‌کند.
عامل، دستوری برای یک ابزار خروجی می‌دهد.
گردش کار متوقف شده و کل پنجره Context در یک پایگاه داده با کلید ID وضعیت ذخیره (serialize) می‌شود.
ابزار به صورت ناهمزمان اجرا می‌شود.
پس از اتمام، ابزار با ID وضعیت و نتیجه callback می‌کند.
سیستم، وضعیت را از پایگاه داده بارگیری کرده، نتیجه را به آن اضافه می‌کند و حلقه عامل را به طور یکپارچه از سر می‌گیرد.

این کنترل دقیق بر جریان، زمینه را برای مهندسی اطلاعاتی که در این حلقه جریان می‌یابد، فراهم می‌کند.

تسلط بر رابط: اولویت Context engineering

مالکیت پرامپت‌ها: در حالی که انتزاع‌های پرامپت برای شروع کار مفید هستند، عبور از آستانه کیفی تولید نیازمند نوشتن پرامپت‌ها «توکن به توکن و به صورت دستی» است. از آنجا که تنها عامل تعیین‌کننده کیفیت خروجی، کیفیت ورودی است، کنترل کامل بر پرامپت‌ها به شما امکان می‌دهد تا بهینه‌سازی‌های دقیقی را برای رسیدن به قابلیت اطمینان بالا اعمال کنید.
مالکیت ساخت context : زمینه چیزی فراتر از تاریخچه چت است؛ این شامل پرامپت‌ها، حافظه، نتایج RAG و داده‌های تاریخی می‌شود. به جای استفاده از فرمت‌های استاندارد (مانند پیام‌های OpenAI)، می‌توان تمام وضعیت رویداد را به صورت یک رشته در یک پیام کاربری واحد قرار داد. هدف، بهینه‌سازی تراکم و وضوح اطلاعاتی است که به LLM منتقل می‌شود.
ترمیم با context : افزودن کورکورانه خطاهای ابزار به پنجره زمینه یک الگوی مضر است که می‌تواند منجر به حلقه‌های خطای غیرقابل کنترل شود. رویکرد مهندسی منضبط، نیازمند دریافت خطاها، خلاصه‌سازی آن‌ها و قرار دادن آن اطلاعات در پنجره context است (یا پاک کردن کامل آن‌ها پس از یک فراخوانی موفق). این امر از انحراف عامل جلوگیری کرده و آن را در مسیر صحیح نگه می‌دارد.

تسلط بر نحوه ساخت ورودی LLM، به طور طبیعی ما را به سمت تحلیل و هدایت خروجی آن سوق می‌دهد.

الگوی معماری برای تولید: عامل‌های خرد و همکاری انسانی

بازنگری در استفاده از ابزار : بنیادی‌ترین و قابل اعتمادترین قابلیت LLM تبدیل زبان طبیعی به JSON ساختاریافته است. «استفاده از ابزار» چیزی جز اجرای قطعی کد (مثلاً از طریق یک عبارت سوئیچ) بر اساس آن JSON تولید شده نیست. این deconstruction حیاتی است، زیرا یک انتزاع مبهم و مستعد خطا («استفاده از ابزار») را با دو جزء مجزا، قدرتمند و قابل دیباگ مستقل جایگزین می‌کند: یک مرحله تولید داده ساختاریافته (نقطه قوت اصلی LLM) و یک مرحله اجرای قطعی (کد استاندارد و قابل اعتماد).
ادغام انسان در حلقه : «تماس با انسان» باید به عنوان یک نوع اقدام درجه یک در نظر گرفته شود، نه صرفاً یک راهکار جایگزین. با وادار کردن مدل به انتخاب اولیه بین تولید یک فراخوانی ابزار و تولید یک پاسخ به زبان طبیعی (مانند «کار من تمام شد» یا «نیاز به توضیح دارم»)، سیستم یک لایه حیاتی برای اعتبارسنجی نیت به دست می‌آورد. این کار، استدلال مدل در مورد وضعیت خود را از اجرای یک وظیفه جدا می‌کند و کل فرآیند را قابل مشاهده‌تر و مشارکتی‌تر می‌سازد.
الگوی «عامل‌های کوچک و متمرکز» را می‌توان با مطالعه موردی ربات استقرار اتوماتیک با همکاری انسان به خوبی درک کرد:
- یک خط لوله CI/CD قطعی تا رسیدن به یک نقطه تصمیم‌گیری (ادغام PR، عبور تست‌ها) اجرا می‌شود.
- کنترل به یک «عامل استقرار» کوچک برای تعیین گام بعدی واگذار می‌شود.
- عامل یک اقدام را پیشنهاد می‌دهد (مثلاً «استقرار فرانت‌اند») و آن را از طریق Slack برای تأیید به انسان ارائه می‌دهد.
- انسان بازخورد زبان طبیعی ارائه می‌دهد (مثلاً «نه، اول بک‌اند را انجام بده»)، که عامل آن را به یک اقدام جدید مبتنی بر JSON ترجمه می‌کند.
- پس از تکمیل و تأیید تمام مراحل عاملی، کنترل به خط لوله قطعی برای اجرای تست‌های end-to-end بازگردانده می‌شود.

نتیجه‌گیری: یک مسیر اصولی

نکات کلیدی این رویکرد عبارتند از:

با عامل‌ها مانند نرم‌افزار رفتار کنید: اصول اثبات‌شده مدیریت وضعیت، جریان کنترل و ماژولار بودن را به کار بگیرید.
مالک منطق اصلی خود باشید: اگر به قابلیت اطمینان بالا نیاز دارید، کنترل پرامپت‌ها، زمینه و حلقه اجرایی خود را به انتزاع‌ها واگذار نکنید.
معماری micro-agents را بپذیرید: عامل‌های کوچک و متمرکز که در گردش‌های کاری قطعی تعبیه شده‌اند را به عامل‌های یکپارچه و خودمختار ترجیح دهید.
برای همکاری انسانی طراحی کنید: سیستم‌هایی بسازید که در آن‌ها انسان‌ها یک بخش طبیعی و جدایی‌ناپذیر از حلقه هستند، نه صرفاً یک کنترل‌کننده استثنا.

مهندسی نرم‌افزارهوش مصنوعیمعماری نرم افزار

علی محمدی

توسعه دهنده نرم افزار

شاید از این پست‌ها خوشتان بیاید