مهندسی پرامپت
امروزه در شبکه های اجتماعی مانند لینکدین ، موقعیت های شغلی فراوانی برای مهندسی پرامپت به چشم می خورد ، در این بخش میخواهیم نگاهی عمیق به این مهندسی داشته باشیم ، اما قبل از آن بیایید مدل های زبان بزرگ (LLM) را بررسی کنیم .
همهی افراد با چت بات ها آشنا هستند و مدام از آنها استفاده میکنند . از این ابزار ها برای خلاصه نویسی و یا بازیابی اطلاعات استفاده میشود ، میخواهیم بدانیم که LLM چگونه در مهندسی پرامپت ( طراحی دستورات هوش مصنوعی) اعمال میشود .
مهندسی پرامپت در بحث ارتباط موثر با LLM ها بسیار مهم و حیاتی است، این بدان معناست که با پرسیدن سوالات مناسب ودقیق می توانیم به پاسخ مطلوبی که از LLM میخواهیم برسیم ( مثلا مثل سوال پرسیدن از Chat GPT ) . با این کار از پاسخ های نادرست یا ساختگی که با نام Hallucination شناخته میشوند جلوگیری میکنیم .
مدل های زبانی بزرگ بیشتر محتوای خود را از اینترنت یاد گرفته اند و این یعنی این مدل ها حقیقت را نمیفهمند و ممکن است اطلاعات ضد و نقیضی را در اختیار شما قرار دهند . آنها فقط الگو های آماری را دریافت کرده اند و نمیتوانند تشخیص دهند کدام اطلاعات درست و کدام نادرست است . ما این موضوع را از چهار روش کلیدی در مهندسی پرامپت مختلف بررسی میکنیم .
- روش اول با حروف اختصاری RAG است . (Retrieval-Augment Generation)که در واقع دو عمل اصلی انجام میدهد:
بازیابی اطلاعات :
سیستم ابتدا در منابع معتبر (مثل مقالات علمی، اسناد رسمی) جستجو میکند و محتوای دیتا بیس تخصصی شما را استخراج میکند .
تولید پاسخ :
سپس با استفاده از مدل زبانی، پاسخ را براساس همان منابع میسازد
همانطور که میدانید، مدلهای زبانی بزرگ بر اساس دادههای اینترنتی آموزش دیدهاند و اصلاً از محتوای دیتا بیس تخصصی شما اطلاعی ندارند.پس وقتی از مدلهای زبانی بزرگ پرسوجو میکنید، باید دیتا بیس خود را به مدل معرفی کنید . منظور از دیتا بیس در اینچا چیزی است که ممکن است مختص صنعت یا شرکت شما باشد و این اطلاعات خاص باید به مدل اعمال شود .
وقتی این دو جزء با هم کار میکنند و شما از مدل زبانی بزرگ سوال میپرسید، مدل اکنون بر اساس ویژگیهای حوزه تخصصی محتوای شما پاسخ میدهد .
- روش دوم CoT است . (Chain of Thoughts)
این تکنیک به مدلهای هوش مصنوعی یاد میدهد مانند انسانها فکر کنند و پاسخها را قدم به قدم توضیح دهند .
پاسخها را با توضیح مراحل محاسبه ارائه دهد، که هم دقت را افزایش میدهد و هم باعث درک بهتر فرآیند تصمیمگیری میشود . یعنی مدل شما علاوه بر نمایش نتیجه نهایی ، راه حل مسائل را هم نمایش میدهد .
- روش سوم مورد بحث ، ReAct میباشد .
این روش ترکیب هوشمندانه ای از استدلال و عمل است که به مدل های زبانی اجازه میدهد که نه تنها فکر کنند ، بلکه بتوانند در صورت نیاز به دنبال اطلاعات بگردند . این روش برخلاف روش RAG محدود به دانش اولیه نیست و مانند یک پژوهشگر عمل میکند . در حالیکه RAG فقط از دانش از پیش بارگذاری شده استفاده میکند ، ReAct می تواند در لحظه داده هارا جمع آوری کند ( مثلا بصورت آنلاین ) .
- و در نهایت روش چهارم DSP است . (Directional Stimulus Prompting)
تکنیک DSP در مهندسی پرامپت یک تکنیک هوشمندانه برای هدایت مدل های زبانی به سمت تولید پاسخ های دقیق و خاص است . شا به مدل نشانه هایی می دهید تا بجای ارائه اطلاعات عمومی ، بر روی جنبه های خاص مد نظر شما تمرکز کند .
برای مثال وقتی از مدل خود میپرسید در مورد شرکت اپل توضیح بده ، با اصلاح درخواست خود و تغییر آن به : در مورد نوآوری های اخیر شرکت اپل در حوزه هوش مصنوعی توضیح بده ، نقشه را به مدل خود برای ارائه پاسخ های مطلوب و دقیق تر نشان میدهید .
ترکیب این روش ها بصورت زیر برای نتیجه بهتر انجام میشود:
شروع با RAG : برای پایه ریزی پاسخ ها بر اساس دانش دامنه .
ترکیب دو روش CoT و ReAct برای استدلال پیچیده و جست و جو درمنابع داخل و خارجی
ترکیب DSP و RAG : برای استخراج پاسخ های دقیق و جزئی تر .
پیام آخر : مهندسی پرامپت مانند آموزش دادن به یک ربات باهوش است . هرچه سوالات پرسیده شده هوشمندانه تر باشند ، پاسخ های مدل شما کاربردی ترخواهند بود.
مطلبی دیگر از این انتشارات
پردازش تصویر با OpenCV - مقدماتی برای علاقه مندان به بینایی ماشین
مطلبی دیگر از این انتشارات
برنامه نویس هوشمند گوگل، Jules AI
مطلبی دیگر از این انتشارات
ساختار داخلی مرورگرها و نحوه رندر صفحات وب