مهندسی پرامپت

امروزه در شبکه های اجتماعی مانند لینکدین ، موقعیت های شغلی فراوانی برای مهندسی پرامپت به چشم می خورد ، در این بخش میخواهیم نگاهی عمیق به این مهندسی داشته باشیم ، اما قبل از آن بیایید مدل های زبان بزرگ (LLM) را بررسی کنیم .

همه‌ی افراد با چت بات ها آشنا هستند و مدام از آنها استفاده می‌کنند . از این ابزار ها برای خلاصه نویسی و یا بازیابی اطلاعات استفاده می‌شود ، میخواهیم بدانیم که LLM چگونه در مهندسی پرامپت ( طراحی دستورات هوش مصنوعی) اعمال می‌شود .

مهندسی پرامپت در بحث ارتباط موثر با LLM ها بسیار مهم و حیاتی است، این بدان معناست که با پرسیدن سوالات مناسب ودقیق می توانیم به پاسخ مطلوبی که از LLM میخواهیم برسیم ( مثلا مثل سوال پرسیدن از Chat GPT ) . با این کار از پاسخ های نادرست یا ساختگی که با نام Hallucination شناخته می‌شوند جلوگیری می‌کنیم .

مدل های زبانی بزرگ بیشتر محتوای خود را از اینترنت یاد گرفته اند و این یعنی این مدل ها حقیقت را نمی‌فهمند و ممکن است اطلاعات ضد و نقیضی را در اختیار شما قرار دهند . آنها فقط الگو های آماری را دریافت کرده اند و نمی‌توانند تشخیص دهند کدام اطلاعات درست و کدام نادرست است . ما این موضوع را از چهار روش کلیدی در مهندسی پرامپت مختلف بررسی می‌کنیم .

-        روش اول با حروف اختصاری RAG است . (Retrieval-Augment Generation)که در واقع دو عمل اصلی انجام می‌دهد:

بازیابی اطلاعات :

سیستم ابتدا در منابع معتبر (مثل مقالات علمی، اسناد رسمی) جستجو می‌کند و محتوای دیتا بیس تخصصی شما را استخراج می‌کند .

تولید پاسخ :

سپس با استفاده از مدل زبانی، پاسخ را براساس همان منابع می‌سازد


همانطور که می‌دانید، مدل‌های زبانی بزرگ بر اساس داده‌های اینترنتی آموزش دیده‌اند و اصلاً از محتوای دیتا بیس تخصصی شما اطلاعی ندارند.پس وقتی از مدل‌های زبانی بزرگ پرس‌وجو می‌کنید، باید دیتا بیس خود را به مدل معرفی کنید . منظور از دیتا بیس در اینچا چیزی است که ممکن است مختص صنعت یا شرکت شما باشد و این اطلاعات خاص باید به مدل اعمال شود .

وقتی این دو جزء با هم کار می‌کنند و شما از مدل زبانی بزرگ سوال می‌پرسید، مدل اکنون بر اساس ویژگی‌های حوزه تخصصی محتوای شما پاسخ می‌دهد .

-       روش دوم CoT است . (Chain of Thoughts)

این تکنیک به مدلهای هوش مصنوعی یاد میدهد مانند انسانها فکر کنند و پاسخها را قدم به قدم توضیح دهند .
پاسخها را با توضیح مراحل محاسبه ارائه دهد، که هم دقت را افزایش میدهد و هم باعث درک بهتر فرآیند تصمیمگیری میشود . یعنی مدل شما علاوه بر نمایش نتیجه نهایی ، راه حل مسائل را هم نمایش می‌دهد .

-        روش سوم مورد بحث ، ReAct می‌باشد .

این روش ترکیب هوشمندانه ای از استدلال و عمل است که به مدل های زبانی اجازه می‌دهد که نه تنها فکر کنند ، بلکه بتوانند در صورت نیاز به دنبال اطلاعات بگردند . این روش برخلاف روش RAG محدود به دانش اولیه نیست و مانند یک پژوهشگر عمل می‌کند . در حالیکه RAG فقط از دانش از پیش بارگذاری شده استفاده می‌کند ، ReAct می تواند در لحظه داده هارا جمع آوری کند ( مثلا بصورت آنلاین ) .

-        و در نهایت روش چهارم DSP  است .  (Directional Stimulus Prompting)

تکنیک DSP در مهندسی پرامپت یک تکنیک هوشمندانه برای هدایت مدل های زبانی به سمت تولید پاسخ های دقیق و خاص است . شا به مدل نشانه هایی می ‌دهید تا بجای ارائه اطلاعات عمومی ، بر روی جنبه های خاص مد نظر شما تمرکز کند .

برای مثال وقتی از مدل خود می‌پرسید در مورد شرکت اپل توضیح بده ، با اصلاح درخواست خود و تغییر آن به :  در مورد نوآوری های اخیر شرکت اپل در حوزه هوش مصنوعی توضیح بده ، نقشه را به مدل خود برای ارائه پاسخ های مطلوب و دقیق تر نشان می‌دهید .

ترکیب  این روش ها بصورت زیر برای نتیجه بهتر انجام می‌شود:

شروع با RAG : برای پایه ریزی پاسخ ها بر اساس دانش دامنه .

ترکیب دو روش CoT و ReAct برای استدلال پیچیده و جست و جو درمنابع داخل و خارجی

ترکیب DSP  و RAG  : برای استخراج پاسخ های دقیق و جزئی تر .

پیام آخر : مهندسی پرامپت مانند آموزش دادن به یک ربات باهوش است . هرچه سوالات پرسیده شده هوشمندانه تر باشند ، پاسخ های مدل شما  کاربردی ترخواهند بود.