خواندن ۲ دقیقه·۱ سال پیش

هوش‌مصنوعی دیپ‌سیک از آزمایش‌های ایمنی محققان شکست خورد

«دیپ‌سیک R1 نرخ موفقیت حمله 100 درصدی از خود نشان داد؛ به عبارت دیگر، حتی یک درخواست مضر را مسدود نکرد.» – به گفته سیسکو

شرکت چینی هوش مصنوعی DeepSeek به لطف چت‌بات کم‌هزینه و عملکرد بالایش سر و صدا به پا کرده است؛ اما به نظر می‌رسد که این سیستم با مشکل ایمنی در هوش مصنوعی روبرو باشد.

آزمایش‌های ایمنی

تیم تحقیقاتی سیسکو با استفاده از تکنیک‌های کرک الگوریتمی، DeepSeek R1 را در برابر 50 درخواست تصادفی از مجموعه داده HarmBench آزمایش کردند. این درخواست‌ها شامل شش دسته از رفتارهای مضر بودند؛ از جمله جرائم سایبری، اطلاعات نادرست، فعالیت‌های غیرقانونی و آسیب‌های کلی.

نتایج بسیار نگران‌کننده بود:

«دیپ‌سیک ای R1 نرخ موفقیت حمله 100 درصدی را به نمایش گذاشت؛ به عبارت دیگر، حتی یک درخواست مضر نیز مسدود نشد.» – سیسکو بیان می‌کند. این در تضاد کامل با سایر مدل‌های پیشرو قرار دارد که حداقل مقاومت جزئی در برابر حملات داشتند.

به گفته سیسکو، سایر مدل‌های پیشرو مانند مدل o1، اکثر حملات مخرب را به وسیله‌ی حفاظ‌های مدل خود مسدود کرده‌اند. همچنین، همانطور که Wired اشاره کرده، شرکت امنیتی Adversa AI به نتایج مشابهی دست یافته است.

دلایل شکست

محققان سیسکو نسبت به شکست‌های DeepSeek، به بودجه بسیار پایین‌تر آن در مقایسه با رقبا اشاره می‌کنند. آن‌ها معتقدند توسعه ارزان DeepSeek به قیمت «ایمنی و امنیت» تمام شده است.

دیپ‌سیک ادعا می‌کند که توسعه مدل آن تنها با هزینه 6 میلیون دلار انجام شده است؛ در حالی که یک دوره آموزشی شش ماهه برای GPT-5 (مدل بعدی OpenAI که هنوز منتشر نشده) می‌تواند تنها از نظر هزینه‌های محاسباتی حدود نیم میلیارد دلار هزینه داشته باشد، همانطور که The Wall Street Journal گزارش کرده است.

محدودیت‌های محتوا

اگرچه DeepSeek ممکن است با داشتن دانش فنی مناسب، آسان‌تر فریب داده شود، اما نشان داده شده که محدودیت‌های محتوایی قدرتمندی دارد. برای مثال، وقتی موضوعات مرتبط با سیاست چین مطرح می‌شود، این سیستم محدودیت‌های شدیدی اعمال می‌کند.

در آزمایشی که روی موضوعات بحث‌برانگیزی مانند رفتار دولت چین با اویغورها (یک اقلیت مسلمان که سازمان ملل ادعا می‌کند مورد آزار قرار می‌گیرند) انجام شد، DeepSeek پاسخ داد:

«متأسفم، این موضوع فراتر از حوزه فعلی من است. بیایید درباره موضوع دیگری صحبت کنیم.»

همچنین، این چت‌بات از پاسخ دادن به سؤالات مربوط به قتل‌عام میدان تیان‌آنمن (تظاهرات دانشجویی در پکن در سال 1989 که معترضان به ضرب گلوله کشیده شدند) امتناع کرد. اما هنوز مشخص نشده است که آیا مسائل ایمنی هوش مصنوعی یا سانسور تأثیری بر محبوبیت رو به رشد DeepSeek خواهند داشت یا خیر.

منبع: pcmag.com