مهندسی پرامپت
امروزه در شبکه های اجتماعی مانند لینکدین ، موقعیت های شغلی فراوانی برای مهندسی پرامپت به چشم می خورد ، در این بخش میخواهیم نگاهی عمیق به این مهندسی داشته باشیم ، اما قبل از آن بیایید مدل های زبان بزرگ (LLM) را بررسی کنیم .
همهی افراد با چت بات ها آشنا هستند و مدام از آنها استفاده میکنند . از این ابزار ها برای خلاصه نویسی و یا بازیابی اطلاعات استفاده میشود ، میخواهیم بدانیم که LLM چگونه در مهندسی پرامپت ( طراحی دستورات هوش مصنوعی) اعمال میشود .
مهندسی پرامپت در بحث ارتباط موثر با LLM ها بسیار مهم و حیاتی است، این بدان معناست که با پرسیدن سوالات مناسب ودقیق می توانیم به پاسخ مطلوبی که از LLM میخواهیم برسیم ( مثلا مثل سوال پرسیدن از Chat GPT ) . با این کار از پاسخ های نادرست یا ساختگی که با نام Hallucination شناخته میشوند جلوگیری میکنیم .
مدل های زبانی بزرگ بیشتر محتوای خود را از اینترنت یاد گرفته اند و این یعنی این مدل ها حقیقت را نمیفهمند و ممکن است اطلاعات ضد و نقیضی را در اختیار شما قرار دهند . آنها فقط الگو های آماری را دریافت کرده اند و نمیتوانند تشخیص دهند کدام اطلاعات درست و کدام نادرست است . ما این موضوع را از چهار روش کلیدی در مهندسی پرامپت مختلف بررسی میکنیم .
- روش اول با حروف اختصاری RAG است . (Retrieval-Augment Generation)که در واقع دو عمل اصلی انجام میدهد:
بازیابی اطلاعات :
سیستم ابتدا در منابع معتبر (مثل مقالات علمی، اسناد رسمی) جستجو میکند و محتوای دیتا بیس تخصصی شما را استخراج میکند .
تولید پاسخ :
سپس با استفاده از مدل زبانی، پاسخ را براساس همان منابع میسازد
همانطور که میدانید، مدلهای زبانی بزرگ بر اساس دادههای اینترنتی آموزش دیدهاند و اصلاً از محتوای دیتا بیس تخصصی شما اطلاعی ندارند.پس وقتی از مدلهای زبانی بزرگ پرسوجو میکنید، باید دیتا بیس خود را به مدل معرفی کنید . منظور از دیتا بیس در اینچا چیزی است که ممکن است مختص صنعت یا شرکت شما باشد و این اطلاعات خاص باید به مدل اعمال شود .
وقتی این دو جزء با هم کار میکنند و شما از مدل زبانی بزرگ سوال میپرسید، مدل اکنون بر اساس ویژگیهای حوزه تخصصی محتوای شما پاسخ میدهد .
- روش دوم CoT است . (Chain of Thoughts)
این تکنیک به مدلهای هوش مصنوعی یاد میدهد مانند انسانها فکر کنند و پاسخها را قدم به قدم توضیح دهند .
پاسخها را با توضیح مراحل محاسبه ارائه دهد، که هم دقت را افزایش میدهد و هم باعث درک بهتر فرآیند تصمیمگیری میشود . یعنی مدل شما علاوه بر نمایش نتیجه نهایی ، راه حل مسائل را هم نمایش میدهد .
- روش سوم مورد بحث ، ReAct میباشد .
این روش ترکیب هوشمندانه ای از استدلال و عمل است که به مدل های زبانی اجازه میدهد که نه تنها فکر کنند ، بلکه بتوانند در صورت نیاز به دنبال اطلاعات بگردند . این روش برخلاف روش RAG محدود به دانش اولیه نیست و مانند یک پژوهشگر عمل میکند . در حالیکه RAG فقط از دانش از پیش بارگذاری شده استفاده میکند ، ReAct می تواند در لحظه داده هارا جمع آوری کند ( مثلا بصورت آنلاین ) .
- و در نهایت روش چهارم DSP است . (Directional Stimulus Prompting)
تکنیک DSP در مهندسی پرامپت یک تکنیک هوشمندانه برای هدایت مدل های زبانی به سمت تولید پاسخ های دقیق و خاص است . شا به مدل نشانه هایی می دهید تا بجای ارائه اطلاعات عمومی ، بر روی جنبه های خاص مد نظر شما تمرکز کند .
برای مثال وقتی از مدل خود میپرسید در مورد شرکت اپل توضیح بده ، با اصلاح درخواست خود و تغییر آن به : در مورد نوآوری های اخیر شرکت اپل در حوزه هوش مصنوعی توضیح بده ، نقشه را به مدل خود برای ارائه پاسخ های مطلوب و دقیق تر نشان میدهید .
ترکیب این روش ها بصورت زیر برای نتیجه بهتر انجام میشود:
شروع با RAG : برای پایه ریزی پاسخ ها بر اساس دانش دامنه .
ترکیب دو روش CoT و ReAct برای استدلال پیچیده و جست و جو درمنابع داخل و خارجی
ترکیب DSP و RAG : برای استخراج پاسخ های دقیق و جزئی تر .
پیام آخر : مهندسی پرامپت مانند آموزش دادن به یک ربات باهوش است . هرچه سوالات پرسیده شده هوشمندانه تر باشند ، پاسخ های مدل شما کاربردی ترخواهند بود.
مطلبی دیگر از این انتشارات
مهندسی پرامپت
مطلبی دیگر از این انتشارات
برنامه نویس هوشمند گوگل، Jules AI
مطلبی دیگر از این انتشارات
ساختار داخلی مرورگرها و نحوه رندر صفحات وب