متن ذیل ترجمه مقاله Chat-GPT: Applications, Opportunities, and Threats می باشد که در پنل طراحی سیستم ها سمپوزیوم طراحی سیستم ها و مهندسی اطلاعات (دانشگاه ویرجینیا) در تاریخ ۲۸ آپریل ۲۰۲۳ ارائه شد.(لطفا برای دانلود رایگان مقاله اینجا کلیک کنید)
IEEE SIEDS 2023: The Systems and Information Engineering Design Symposium
چکیده:
فناوری Chat GPT یک هوش مصنوعی با استفاده از فن آوری یادگیری ماشین نظارت شده است. در این مقاله به بررسی این هوش مصنوعی با توجه به فرصت ها و تهدید ها در ۱۰ حوزه اصلی تجارت، صنعت، آموزش و مقایسه مدل زبانی ۳.۵ و ۴ و بهبود های حاصل شده در مدل ۴ می پردازیم. نویسندگان این مقاله عمیقا باور دارند که این مدل زبانی با وجود ایجاد پاسخ های مطلوب، نسبتا طبیعی و داری سطحی از ادراک و همدلی، دارای خلاقیت انسانی نمی باشد و نمیتواند به طور کامل جایگزین انسان شود.
مقدمه:
معماری معروف به GPT که در ابتدا توسط Open AI در سال ۲۰۱۸ معرفی شد، به عنوان مبنایی برای Chat GPT عمل می کند. نسخه اول، GPT-1، دارای ۱۱۷ میلیون پارامتر برای کار بود و با استفاده از تکنیک یادگیری عمیق به نام ترانسفورماتور، بر روی حجم وسیعی از داده های متنی به دست آمده از اینترنت آموزش داده شده است.
نسخه GPT-2 که در فوریه ۲۰۱۹ منتشر شد، به طور قابل توجهی بهبود یافت و ۱.۵ میلیارد پارامتر داشت. Open AI تصمیم گرفت نسخه کامل GPT-2 را به دلیل نگرانی هایی که در مورد پتانسیل این مدل برای استفاده نامناسب فقط با 8 درصد از اندازه مدل اصلی در دسترس عموم قرار دهد.
نسخه GPT-3 با ۱۷۵ میلیارد پارامتر در ژوئن ۲۰۲۰ منتشر شد (در نوامبر ۲۰۲۱ حذف شد) که بعد تر به نسخه ۳.۵ ارتقا یافت و در نوامبر ۲۰۲۲ به صورت عمومی عرضه شد. در مارس ۲۰۲۳ ، Open AI نسخه GPT-4 را در دسترس کاربران قرار داد که قابلیت پاسخ به متن و عکس را دارد. دسترسی به این نسخه در ابتدا با پیش ثبت نام و اکنون نسخه ۴ تنها از طریق پرداخت ماهانه ۲۰ دلار امکان پذیر است. GPT-4 به دلیل عملکرد بهبود یافته خود در مقایسه با نسل قبلی خود توجهات را به خود جلب کرده است. دلیل عملکرد برتر آن نسبت به GPT-3.5 این است که دارای یک مدل بزرگتر با پارامترهای بیشتر و آموزش در یک شبکه عصبی بهینه سازی شده است.
تا به امروز (از آپریل ۲۰۲۳)، Open AI هیچ اطلاعاتی در مورد داده ها، منابع محاسباتی، یا تکنیک های آموزشی مورد استفاده برای توسعه مدل زبان ارائه نکرده است. Open AI قصد دارد GPT-5 را در نوامبر ۲۰۲۳ منتشر کند. (با توجه به نگرانی های موجود انتشار نسخه جدید در حاله ای از ابهام قرار دارد).
در توسعه و بهبود فناوری هوش مصنوعی به کار رفته در Chat GPT از مطالعات نظری و تجربی کمک گرفته شده است. در حالی که مطالعات تجربی ممکن است در ادبیات رایجتر باشد، مطالعات نظری نیز نقش مهمی در پیشرفت حوزه پردازش زبان طبیعی و یادگیری عمیق داشتهاند.
جنبه نظری توسعه Chat GPT شامل توسعه مدلهای ریاضی و محاسباتی است که مدل را قادر میسازد تا زبان های انسان مانند را بیاموزد و تولید کند (مدلهای زبان بزرگ متعددی در سالهای اخیر توسعه یافتهاند، مانند Bidirectional Encoder Representations from (BERT)، XLNet، T5، RoBERTa، GPT 3، BLOOM و GPT). با کمک ابزار fine-tuning (یادگیری ماشین) و آموزش، همه این مدلهای مبتنی بر ترانسفورماتور میتوانند انواع وظایف پردازش زبان طبیعی را تکمیل کنند. این پیشرفتها پتانسیل قابل توجهی را در زمینههای پژوهشی و صنعتی ارائه میدهند و انتظار میرود که پیشرفتهای آینده منجر به بهبود قابلیتهای بیشتر شود.
از سوی دیگر، مطالعات تجربی Chat GPT شامل آزمایش عملکرد مدل در وظایف مختلف NLP، مانند تولید متن، پاسخ به سؤال و ترجمه زبان است. گزارش فنی اخیر (مارس ۲۰۲۳) که توسط Open AI در مورد GPT-4 منتشر شد، نشان داد که فرآیند هم ترازی پس از یادگیری (post-training alignment process) یک مدل زبانی مبتنی بر ترانسفورماتور از پیش آموزش دیده، واقعیت و همسویی با رفتار مطلوب را بهبود بخشیده و GPT-4 را قادر می سازد تا در سطح انسانی در معیارهای مختلف حرفه ای و آکادمیک، مانند آزمون وکالت شبیه سازی شده عمل کند.
مقالات زیادی وجود دارند که جنبه های مختلف Chat GPT را مورد مطالعه قرار می دهند و ما در بخش بعدی برخی از آنها را با خلاصه برنامه های اصلی، فرصت ها و تهدیدات Chat GPT بررسی خواهیم کرد. این مطالعه نشان میدهد که چگونه Chat GPT میتواند در حوزههای مختلف برای منافع بیشتر و در عین حال به حداقل رساندن آسیبهای احتمالی استفاده شود، و چگونه جامعه میتواند برای فرصتها و چالشهای ارائهشده توسط این فناوری نوظهور آماده شود.
مقاله های مرتبط:
- هنر Prompt Engineering: مهارت بکارگیری چت جی پی تی یک Prompt دستور یا جمله ای عملی است که برای برقراری ارتباط با مدلهای زبان هوش مصنوعی استفاده میشود تا پاسخی مرتبط، بهینه و دقیق دریافت شود.
- چت جی پی تی: معلم سیلیکونی من در این مقاله، تجربیاتم را در استفاده از Chat GPT و نحوه تعامل با آن در جهت بهبود فرایند یادگیری و برنامه ریزی را مورد بحث قرار میدهم.
- چت جی پی تی: مقدمه ای بر مدل های زبانی بزرگ (LLMs) در این مقاله، به بررسی نحوه استفاده و ایجاد مدلهای زبان بزرگ خواهم پرداخت.
چت جی پی تی: کاربرد ها، فرصتها و مخاطرات
مطالعات اخیر کاربردهای مختلف Chat GPT را در ادبیات علمی مورد بررسی قرار داده است. در این قسمت مهم ترین کارکرد های قابل استفاده توسط Chat GPT را انتخاب کرده و در ۱۰ دامنه مختلف به صورت مختصر دسته بندی می کنیم. این دامنهها طیف وسیعی از موضوعات ممکن را نشان میدهند که Chat GPT میتواند به آنها کمک کند. ما برنامه ها، فرصت ها و تهدیدات را برای هر دامنه ارائه می کنیم و دو حوزه اول را به دلیل اهمیت آن ها مطالعه و توضیحات مفصلی ارائه می دهیم.
الف) صنعت و تجارت
حوزه کسب و کار و صنعت شامل طیف گسترده ای از کاربردها در عملیات و مدیریت، مدیریت زنجیره تامین، تجزیه و تحلیل تجاری، حمل و نقل، منابع انسانی، بازاریابی، تجارت الکترونیک، حسابداری، مالی، خرده فروشی، املاک و مستغلات و بیمه است. فرصتهای اصلی افزایش کارایی و صرفهجویی در هزینه، بهبود تصمیمگیری و کاهش ریسک، دقت پیشبینی بهتر و برنامهریزی بهینه، کاهش حجم کار و کشف تقلب است. به عنوان مثال، برای مدیریت زنجیره تامین، Chat GPT می تواند به وظایف زیر کمک کند:
فرصت های ذکر شده تنها چند نمونه از چگونگی کمک Chat GPT به وظایف مدیریت زنجیره تامین هستند. این توانایی پردازش و تجزیه و تحلیل حجم زیادی از داده ها را دارد که می تواند به کسب و کارها و صنایع کمک کند تا تصمیمات بهتری بگیرند و عملیات خود را بهبود بخشند.
با استفاده از این برنامه ها، آنها می توانند به طیف وسیعی از مزایا دست یابند و در محیط تجاری پرشتاب و رقابتی امروزی، باقی مانده و پیشرفت کنند. توجه به مخاطرات احتمالی مرتبط با هر فرصتی ضروری است. فناوری Chat GPT می تواند در برابر تهدیدات خاصی آسیب پذیر باشد که بر اثربخشی و سودمندی آن تأثیر می گذارد. تهدیدهای اصلی وابستگی به داده هایی با کیفیت بالا، نتایج غیرقابل اعتماد و مغرضانه، توهمات، عدم شفافیت، نگرانی های اخلاقی و حفظ حریم خصوصی داده ها، و خطرات امنیت سایبری هستند.
به عنوان مثال، در مدیریت زنجیره تامین، Chat GPT بعید است که یک تهدید مستقیم باشد اما نگرانیهای بالقوهای وجود دارد که کسبوکارها باید هنگام استفاده از این هوش مصنوعی از آنها آگاه باشند، که به شرح زیر ذکر شدهاند:
بنابراین، برای کاهش تهدیدات ذکر شده، کسب و کارها باید تعادل سالم بین قضاوت انسان و فناوری را حفظ کنند، اقدامات امنیتی سایبری قوی را برای محافظت از داده های خود در برابر حملات احتمالی اعمال کنند، سیاست های حاکمیت داده مناسب داشته باشند، از کارشناسان برای تجزیه و تحلیل نتایج استفاده کنند و به صورت مستمر انصاف و دقت Chat GPT را ارزیابی کنند.
ب) آموزش و پرورش
حوزه آموزش طیف گسترده ای از ابزارهای فناوری و برنامه های کاربردی نرم افزاری را ارائه می دهد که می توانند برای یادگیری آنلاین، یادگیری زبان، تحقیقات آکادمیک و عمومی، کمک آموزشی، نوشتن، ارزیابی امتحان، بازخورد در مورد تکالیف، ایجاد محتوای آموزشی، توسعه حرفه ای و بهبود استفاده شوند.
در تجربیات آموزشی دانش آموزان، فرصتهای اصلی عبارتند از: افزایش دسترسی به آموزش،جایگزینی پشتیبانی مادی برای تدریس و خودآموزی در مطالعه شخصی، تقویت فراگیری بیشتر (با ارائه پشتیبانی زبان، تجربیات یادگیری شخصی، محتوای متنوع و فراگیر، و ویژگیهای دسترسی)، بهبود مشارکت یادگیرنده، پشتیبانی از ارزیابی مانند درجه بندی کارآمدی و بازخورد های سفارشی، بهبود با یادگیری به عنوان مثال در علوم، برنامه نویسی، زبان ها، نوشتن چکیده، مقالات و نامه ها. Chat GPT میتواند ابزار ارزشمندی در تقویت تنوع، برابری، ترویج یادگیری عادلانه، و تسهیل گفتگو و شایستگی فرهنگی باشد. به عنوان مثال، در برنامه های کاربردی تحقیقات آکادمیک و عمومی و کمک آموزشی، Chat GPT می تواند در انجام وظایف زیر کمک کند:
استفاده از Chat GPT در آموزش باید مسئولانه و اخلاقی باشد. تحقیق و مشاهده مداوم ضروری است، زیرا می تواند به طور مستقیم بر تجربه یادگیری تأثیر بگذارد. پیاده سازی هوش مصنوعی در آموزش می تواند به تهدیدات اخلاقی و اجتماعی نیز مختلفی منجر شود. این موارد عبارتند از تداوم تعصب و تبعیض سیستمی، نقض حریم خصوصی دانش آموزان، تشدید نظارت بر دانش آموزان، تضعیف استقلال دانش آموز، و تشدید به حاشیه راندن دانش آموزانی که به طور سنتی کمتر در بحث ها شرکت میکنند. علاوه بر این، معرفی هوش مصنوعی در آموزش می تواند اشکال مختلف بی عدالتی مانند نژادپرستی، جنسیت گرایی و بیگانه هراسی را تقویت کند. تهدیدهای اصلی Chat GPT در آموزش شامل اتکا و وابستگی بیش از حد به فناوری، تله اطلاعات نادرست یا مغرضانه، نگرانی های اخلاقی مانند سرقت ادبی، حفظ حریم خصوصی و سوء استفاده (تولید اخبار جعلی یا انتشار اطلاعات نادرست)، عدم تعامل انسانی و کاهش انگیزه، ناتوانی در انجام برخی وظایف به دلیل عدم درک زمینه، نقص فنی مانند اشکالات و خرابی سرور و خطرات امنیتی است. به عنوان مثال، در کاربردهای تحقیقاتی و کمک آموزشی دانشگاهی و عمومی، تهدیدات به شرح زیر ذکر شده است:
برای کاهش این تهدیدات، مربیان می توانند از استراتژی های مختلفی برای پرداختن به اثرات منفی بالقوه Chat GPT استفاده کنند، مانند تأکید بر اهمیت تفکر انتقادی و تجزیه و تحلیل برای مقابله با کاهش خلاقیت و انگیزه، تکمیل Chat GPT با روش های آموزشی دیگر. همچنین حصول اطمینان از آگاهی دانشآموزان از پتانسیل منفی سوگیری به وسیله اطلاعات نادرست یا مغرضانه، ترویج همکاری و یادگیری از همتایان برای رفع کمبود تعامل انسانی، ایجاد دستورالعملها و خطمشیهای واضح برای استفاده از فناوری هوش مصنوعی برای رسیدگی به نگرانیهای اخلاقی و امنیتی، و داشتن برنامههای پشتیبان هرگونه مشکل فنی که ممکن است ایجاد شود از جمله روش هایی هست که مربیان می توانند برای کاهش مخاطرات استفاده از Chat GPT در بکار بگیرند.
پ) علم و فناوری
حوزه علم و فناوری دارای کاربردهایی در مدل سازی، هوش مصنوعی (مانند یادگیری ماشینی، یادگیری عمیق و پردازش زبان های طبیعی یا NLP)، فناوری اطلاعات (محاسبات، توسعه نرم افزار و تجزیه و تحلیل داده ها)، برنامه نویسی و کدگذاری، اینترنت اشیا (IoT)، رمزنگاری، امنیت سایبری، تولید، خودرو، رباتیک، هوانوردی و انرژی است. Chat GPT فرصت های متعددی را در زمینه های مختلف در حوزه علم و فناوری ارائه می دهد.
کاربردهای آن در هوش مصنوعی شامل ترجمه زبان، تشخیص تصویر، مدل سازی و پیش بینی است. همچنین می تواند به تسهیل تراکنش های امن و غیرمتمرکز در ارزهای دیجیتال کمک کند. در امنیت سایبری، Chat GPT برای شناسایی تلاشهای فیشینگ، شناسایی تهدیدات امنیتی بالقوه و تجزیه و تحلیل رفتار بدافزار مفید است.
توانایی Chat GPT برای پردازش مقادیر زیادی از داده ها نیز در تولید مفید است، جایی که می تواند به بهبود کنترل کیفی محصول و کاهش نرخ خرابی آن کمک کند. هزینه ها، و امکان تعمیر و نگهداری بهتر تجهیزات را فراهم می کند.
سیستمهای پیچیده خودرو، رباتیک، هوانوردی و انرژی نیز میتوانند از قابلیتهای تجزیه و تحلیل مبتنی بر داده و تصمیمگیری Chat GPT بهرهمند شوند. به طور کلی، پردازش زبان پیشرفته و قابلیتهای تحلیلی Chat GPT آن را به ابزاری ارزشمند در طیف گستردهای از کاربردهای علم و فناوری تبدیل میکند. تهدیدهای اصلی نگرانی های اخلاقی، حریم خصوصی و امنیتی هستند. پتانسیل توصیه های مغرضانه؛ و احتمال خطا یا سوء تفاهم وجود دارد.
ت) دولت و سیاست
حوزه دولت و سیاست، سیاست و مدیریت، روابط بینالملل، مدیریت عمومی، امنیت عمومی، مالیات، قانون گذاری و عدالت، قراردادها و مسائل نظامی کاربرد دارد. فرصتهای Chat GPT در این حوزه را میتوان به صورت زیر طبقهبندی کرد:
تهدیدهای مختلفی در رابطه با استفاده از Chat GPT در این حوزه از جمله مسائل مربوط به حریم خصوصی و امنیتی، نگرانی های اخلاقی، احتمال خطا یا سوء تفاهم، و احتمال توصیه های جانبدارانه وجود دارد.
ث) بهداشت و درمان و پزشکی
حوزه مراقبت های بهداشتی و پزشکی در سیستم های مراقبت های بهداشتی، بهداشت عمومی، سلامت روان، زیست شناسی، بیوتکنولوژی، پزشکی از راه دور، معاینه پزشکی، داروسازی و دامپزشکی کاربرد دارد. Chat GPT فرصت های زیادی در این حوزه دارد و مطالعات جالب زیادی برای کاربردها در پزشکی، بهداشت عمومی و سیستم های مراقبت های بهداشتی وجود دارد که ما خوانندگان را به بررسی مطالعات در (در قسمت رفنرس مقاله انگلیسی) ارجاع می دهیم.
در مراقبتهای بهداشتی، به تریاژ کارآمد و بررسی علائم، توصیههای بهداشتی شخصیسازی شده و بهبود نتایج بیمار کمک میکند. در بیوتکنولوژی، داروسازی و دامپزشکی، می تواند کارایی را بهبود بخشد، هزینه ها را کاهش دهد و نتایج بیمار یا روند سلامت حیوانات را بهبود بخشد. استفاده از Chat GPT در تحقیقات علمی نگرانیهای قانونی، مقرراتی، اخلاقی و حریم خصوصی، از جمله مسائل بالقوه حریم خصوصی و امنیتی دادهها، توصیههای مغرضانه و ملاحظات اخلاقی را افزایش میدهد.
ج) زیرساخت
حوزه زیرساخت شامل کاربردهایی در ساخت و ساز، زیرساخت های انرژی و آب، معماری، شهرسازی و طراحی داخلی می شود. فرصت های اصلی در این حوزه شامل بهبود کارایی، کاهش هزینه ها، افزایش ایمنی و افزایش پایداری است. با این حال، تهدیدات احتمالی مربوط به حفظ حریم خصوصی و نگرانی های امنیتی مانند آلودگی منابع، احتمال توصیه های جانبدارانه، و نگرانی های اخلاقی نیز وجود دارد.
چ) محیط زیست و پایداری
حوزه محیط زیست و پایداری طیف وسیعی از کاربردها، از جمله مدیریت زباله، انرژی های تجدیدپذیر، تغییرات آب و هوایی، کشاورزی، سیاست های زیست محیطی، تنوع زیستی، برابری اجتماعی، اکوتوریسم و پایداری مواد غذایی را در بر می گیرد. این حوزه فرصت هایی را برای بهبود کارایی، مدیریت انرژی، پایداری، کاهش هزینه ها و افزایش استفاده از انرژی های تجدیدپذیر ارائه می دهد.
با این حال، آگاهی از تهدیدات احتمالی مانند خطرات امنیت سایبری برای دستگاهها یا سیستمهای متصل، نقض دادهها که حریم خصوصی را به خطر میاندازد، سوء استفاده از دادهها که منجر به تجزیه و تحلیل مغرضانه میشود و پیامدهای زیستمحیطی ناخواسته ابتکارات و پایداری فن آوری بسیار مهم است. با پرداختن فعالانه به این تهدیدات بالقوه، ذینفعان در حوزه محیط زیست و پایداری می توانند در جهت تحقق بخشیدن به مزایای این برنامه ها و در عین حال به حداقل رساندن خطرات تلاش کنند.
ح) ارتباطات
حوزه ارتباطات در رسانه ها و سرگرمی ها، روزنامه نگاری، رسانه های اجتماعی، مخابرات و تبلیغات کاربرد دارد. برخی از فرصت های اصلی در این حوزه شامل توصیه های شخصی برای نمایش های تلویزیونی، فیلم ها و موسیقی است.
بهبود تجربه کاربری؛ تولید محتوای کارآمدتر؛ بهبود فرصت های ارتباطی و شبکه ای؛ افزایش در معرض قرار گرفتن نام تجاری و فروش بیشتر؛ افزایش خلاقیت و نوآوری؛ بهبود دسترسی به اطلاعات دقیق و کشف تقلب.
کاهش هزینه ها استفاده از Chat GPT در این دامنه تهدیدات مختلفی مانند حریم خصوصی داده ها و مسائل امنیتی را به همراه دارد. نگرانی های اخلاقی و قانونی؛ اخبار جعلی و سوگیری رسانه ای؛ آزار و اذیت اینترنتی؛ عدم تایید اصالت و عدم اعتماد؛ امکان توصیه های جانبدارانه و مشکلات حقوقی در کسب درآمد از محتوای ایجاد شده.
خ) فرهنگ و هنر
حوزه فرهنگ و هنر طیف متنوعی از کاربردها را در بر می گیرد، از جمله موسیقی، هنر و طراحی، مد، نویسندگی، بازی، واقعیت مجازی، هنرهای نمایشی، گالری ها، و تأثیر اجتماعی (عدالت اجتماعی، عدالت محیطی، فعالیت، تنوع، برابری، شمول، و کارآفرینی اجتماعی).
فناوری Chat GPT می تواند فرصت های متعددی را برای بهبود فرآیندها و افزایش خلاقیت در این حوزه فراهم کند. به عنوان مثال، می تواند تجزیه و تحلیل موسیقی، فرآیندهای نوشتن، بیان هنری، تجزیه و تحلیل مُد، مدیریت هنری و تجربیات بازی را تسهیل کند.
علاوه بر این، Chat GPT می تواند کارایی در ترکیب و تولید، فرآیندهای طراحی و ایجاد محتوا را بهبود بخشد. در حالی که برخی از مطالعات نشان داده اند که Chat GPT به طور بالقوه می تواند عملکردهای شناختی خاصی را تقویت کند، تحقیقات بیشتری برای درک بهتر این اثرات مورد نیاز است.
علاوه بر نگرانیهای مربوط به حریم خصوصی، اخلاقی و قانونی، یکی دیگر از تهدیدهای خاص در حوزه هنر و فرهنگ، پتانسیل توصیههای جانبدارانه برای تداوم کلیشهها و تقویت و تشدید نابرابریهای موجود است که می تواند بر بازنمایی صداهای متنوع در حوزه هنر و فرهنگ تأثیر منفی بگذارد.
د) سبک زندگی و اوقات فراغت
حوزه سبک زندگی و اوقات فراغت در تناسب اندام و ورزش، سرگرمی، مسافرت و مهمان نوازی و غذا و نوشیدنی کاربرد دارد. فرصت های اصلی در این حوزه شامل بهبود نتایج تناسب اندام، افزایش انگیزه، تجزیه و تحلیل عملکرد بهبود یافته، شرط بندی ورزشی کارآمد، بهبود مشارکت طرفداران، تجربه بهتر مشتری، افزایش فروش، توصیه های شخصی برای ورزش و سفر، بهبود برنامه ریزی سفر، بهبود کیفیت محصول و کاهش می باشد. هزینه ها تهدیدهای احتمالی در این حوزه، نگرانیهای مربوط به حریم خصوصی و پتانسیل توصیههای جانبدارانه است.
ذ) مطالعه تجربی
در این بخش، ما بر حوزه آموزش مورد بحث در بخش دستیار نگارشی تمرکز می کنیم و یک مطالعه تجربی انجام می دهیم. مطالعه موردی ما امتحان میان ترم درس مدل های تصمیم گیری تصادفی (SYS 3060) که دوره ای در سطح پایه در گروه سیستم ها و مهندسی اطلاعات در دانشگاه ویرجینیا به صورت حضوری در مارس 2023 برگزار شد را بررسی می کنیم.
به عنوان ورودی آزمایش خود، به Chat GPT گفته شد که این سوالات مربوط به موضوع درس بود. ما سوالات را به هر دو نسخه GPT-3.5 و GPT-4 دادیم، آزمایش را ۵۰ بار تکرار کردیم (n1 = n2 = ۵۰) و برای جلوگیری از سوگیری های احتمالی، این آزمایش ها را با پروتکل های اینترنتی مختلف (IP) انجام داده و مصحح تمام امتحانات را با امکان افزایش دریافت ۰.۵ نمره به ازای پرسش های ناکامل اما ارزشمند ارزیابی کرد.
ما آزمونهای فرض نرمال بودن را با سطح معنیداری ۰.۰۵ = α برای GPT-3.5 انجام دادیم، و آزمایشهای Shapiro-Wilk و Anderson-Darling به p-value بیشتر از α منجر شد، که نشان میدهد دادهها را میتوان تقریباً نرمال فرض کرد. با این حال، برای GPT-4، داده ها نرمال نیستند، اما دارای انحراف منفی هستند، که نشان می دهد اکثر نمرات به انتهای بالاتر و حداکثر امتیاز نزدیکتر هستند.
از آنجایی که فرض می شود یک مجموعه داده به طور معمول توزیع شده است و دیگری توزیع نشده است، به جای آزمون t، از آزمون Mann-Whitney U (همچنین به عنوان آزمون Wilcoxon rank sum شناخته می شود) استفاده کردیم، که توزیع خاصی از داده ها را در نظر نمی گیرد.
نتیجه آزمون p-value بسیار نزدیک به صفر را نشان داد (p-value = ۲.۲ × ۱۰-۱۶ < ۰.۰۵ = α)، که منجر به رد فرضیه صفر شد، که ادعا می کند میانه های دو نمونه یکسان هستند. شکل زیر هیستوگرام ها و نمودارهای جعبه داده های GPT-3.5 و GPT-4 را نشان می دهد. می توانیم مشاهده کنیم که میانگین امتیاز GPT-4 به طور قابل توجهی بالاتر از GPT-3.5 است، که نشان می دهد GPT-4 از نسخه قبلی بهتر عمل می کند. شایان ذکر است که برخی از سوالات آزمون مربوط به موضوعات مطرح شده در کلاس بود و به همین دلیل است که هیچ یک از نمونه های به دست آمده توسط GPT-4 نتوانستند به حداکثر نمره که ۱۰۰٪ است برسد.
نتیجه گیری
در این مقاله، تکامل Chat GPT را بررسی کردیم و کاربردها، فرصتها و تهدیدهای آن را با تمرکز شدید بر حوزههای تجاری، صنعت و آموزش مطالعه کردیم. ما همچنین آزمایشی را برای ارزیابی اثربخشی Chat GPT-4 در یک محیط آموزشی انجام دادیم.
فناوری Chat GPT انقلابی در پردازش زبان طبیعی ایجاد کرده است و این پتانسیل را دارد که به افراد کمک کند تا با خودکارسازی کارهای معمول در زمان و هزینه خود صرفه جویی کنند. با وجود این، توجه به تهدیدات احتمالی و اتخاذ اقداماتی برای کاهش آنها ضروری است. همانطور که در این مقاله بحث شد، Chat GPT میتواند نتایج و سوگیریهای گمراهکننده ایجاد کند، نگرانیهای اخلاقی را افزایش دهد و مورد سوء استفاده قرار گیرد. به همین دلیل است که برخی کشورها مانند ایتالیا استفاده از این هوش مصنوعی را ممنوع کردهاند (ممنوعیت در حال حاضر رفع شده).
از این رو، می بایست استفاده مسئولانه از Chat GPT در اولویت قرار گیرد تا اطمینان حاصل شود که همه از به کاربردن آن سود میبرند. در حالی که این مدلها قابلیتهای چشمگیری از خود نشان دادهاند، بعید است که بتوانند به طور کامل جایگزین انسانها یا افراد در همه کارها و موقعیتها شوند و مشاغلی که بیشتر تحت تأثیر قرار میگیرند، مشاغلی هستند که به کارهای معمول و تکراری نیاز دارند (مشاغل یقه سفید).
ماشینها ممکن است برای تکرار شهود، احساسات، خلاقیت و هوش انسانی که برای بسیاری از وظایف ضروری هستند، تلاش کنند اما هدف توسعه و بهبود آنها کمک به انسان ها در توسعه ایده ها و بینش های جدید بر اساس داده های موجود و ممکن است تا بتوانند مفاهیم کاملاً جدیدی را ایجاد کنند.