خواندن ۶ دقیقه·۵ ماه پیش

معرفی هیولای جدید گوگل؛‌ چرا Deep Think خطرناک‌ترین هوش مصنوعی دنیا

آیا چارچوب‌های ایمنی گوگل برای مدل خطرناک Gemini 2.5 Deep Think کافی است؟

گوگل به‌تازگی از پیشرفته‌ترین مدل هوش مصنوعی خود با نام Gemini 2.5 Deep Think رونمایی کرده؛ مدلی که پیش‌تر با کسب مدال طلا در المپیاد جهانی ریاضی (IMO) سر و صدای زیادی به‌پا کرده بود. این مدل اکنون در دسترس قرار گرفته، اما نه برای عموم. استفاده از آن صرفاً برای مشترکین سرویس پرهزینه Google AI Ultra با تعرفه‌ی ماهانه ۲۵۰ دلار امکان‌پذیر است و با محدودیت‌ها و هشدارهای قابل‌توجهی همراه شده است.

مدل متفکر گوگل؛ نگاهی به تکامل استدلال در ماشین‌ها

Gemini 2.5 Deep Think نه‌تنها قدرتمندترین مدل گوگل است، بلکه به مرزهایی نزدیک شده که نگرانی‌هایی جدی را درباره پیامدهای احتمالی‌اش ایجاد کرده است. در تابستان ۲۰۲۴، گوگل در آزمایش‌های داخلی خود تأیید کرد که هرچند این مدل هنوز به «نقطه بحرانی» نرسیده، اما به قابلیت‌هایی نزدیک شده که اگر در دستان نادرست قرار گیرد، می‌تواند بسیار خطرناک باشد.

برای درک اهمیت Deep Think، باید به روند تکاملی تفکر در مدل‌های زبانی نگاه کرد. در آغاز، مدل‌های زبانی بزرگ مانند دانش‌آموزی بی‌حوصله پاسخ‌هایی سریع و کم‌عمق ارائه می‌دادند. با معرفی روش زنجیره تفکر (Chain-of-Thought)، مدل‌ها وادار به طی مراحل استدلال گام‌به‌گام شدند که باعث بهبود چشم‌گیر کیفیت پاسخ‌ها شد. اما این روش یک مشکل اساسی داشت: اگر نخستین گام اشتباه بود، تمام زنجیره نیز نادرست پیش می‌رفت.

برای حل این مشکل، تکنیک درخت تفکر (Tree-of-Thought) معرفی شد. در این رویکرد، مدل به‌جای پیروی از یک مسیر خطی، مسیرهای متعددی را به‌صورت همزمان بررسی و ارزیابی می‌کند. این روش، حل مسئله را از رویکرد خطی به جست‌وجوی اکتشافی تبدیل کرد؛ مشابه آنچه انسان هنگام حل مسائل پیچیده انجام می‌دهد.

Deep Think؛ معماری تفکر با بودجه محاسباتی

قابلیت Deep Think مرحله‌ی بعدی در تکامل این روند است. این قابلیت، یک مدل مستقل نیست بلکه حالتی ویژه در چارچوب Gemini است که با فعال‌سازی آن، مدل به ابزارهایی مانند اجرای کد و جست‌وجوی پیشرفته در گوگل دسترسی می‌یابد. معماری آن بر پایه سه عنصر اساسی طراحی شده: تفکر موازی، تولید فرضیه و خود-نقادی.

اما نوآوری اصلی این مدل در مفهومی با عنوان بودجه تفکر (Thinking Budget) نهفته است. گوگل در اینجا امکان انجام محاسبات بیشتر پیش از پاسخ‌گویی را فراهم کرده؛ به بیان ساده‌تر، کاربران می‌توانند برای مسائل دشوارتر، زمان تفکر بیشتری برای مدل خریداری کنند. این رویکرد، استدلال را از قابلیتی ثابت به منبعی مقیاس‌پذیر و قابل خرید تبدیل کرده است.

از منظر تجاری نیز این یک استراتژی هوشمندانه محسوب می‌شود؛ گوگل با ارائه دو نسخه متفاوت از مدل (Gemini Flash با سرعت بالا و قیمت پایین‌تر و Gemini Pro با قابلیت Deep Think برای نیازهای پیچیده‌تر) به مشتریان اجازه می‌دهد تا براساس نیاز خود، سطح تفکر را انتخاب کنند. این ساختار، بازتولید مدل توسط رقبا را دشوار می‌سازد.

Deep Think در عمل؛ از معماری معابد تا اثبات ریاضی

عملکرد Deep Think در بنچمارک‌های پیشرفته کدنویسی، استدلال و ریاضیات شگفت‌انگیز بوده است. این مدل قادر است تا یک میلیون توکن (معادل یک کتاب بسیار قطور یا ویدیویی سه‌ساعته) را تحلیل کند و ارتباط میان بخش‌های مختلف را درک کند.

در آزمایشی که گوگل منتشر کرده، این مدل توانست طرحی از یک معبد پاگودا با جزئیات فوق‌العاده دقیق، ساختاری سه‌بعدی و عناصر طبیعی واقع‌گرایانه تولید کند که خروجی آن از مدل پایه Pro کاملاً متمایز بود. افزون‌براین، Deep Think موفق به اثبات یکی از حدس‌های ریاضی مهم شده که سال‌ها ذهن ریاضی‌دانان را مشغول کرده بود. برخلاف انسان که تنها چند رویکرد محدود را امتحان می‌کند، این مدل قادر است صدها مسیر مختلف را به‌طور همزمان بررسی کند.

تناقض درخشش و خطا؛ محدودیت‌های پنهان

با وجود این توانایی‌ها، تناقض بزرگی در عملکرد Deep Think دیده می‌شود. پژوهش‌ها نشان می‌دهد که این مدل‌ها هنوز در محاسبات و منطق پایه دچار اشتباهات ساده می‌شوند و قدرت محدودی در شناسایی اشتباهات خود دارند. استدلال‌های پیچیده‌ی مدل‌ها، لزوماً به معنای درستی آن‌ها نیست.

از سوی دیگر، محدودیت عملی مهمی نیز وجود دارد: هر کاربر تنها می‌تواند پنج درخواست (prompt) در روز ارسال کند. این محدودیت جدی، آزمون جامع مدل را بسیار دشوار می‌سازد و هر اشتباه می‌تواند یکی از اعتبارهای روزانه‌ی گران‌بها را هدر دهد.

ایمنی در برابر خطرات؛ چارچوب مهار هوش مصنوعی گوگل

هم‌زمان با افزایش توانایی‌های مدل، نگرانی‌ها درباره‌ی خطرات آن نیز رشد کرده است. گوگل چارچوبی با عنوان Frontier Safety Framework (FSF) طراحی کرده که بر فلسفه‌ی «پیشگیری فعالانه» استوار است.

هسته‌ی این چارچوب، مفهومی به نام سطوح قابلیت بحرانی (Critical Capability Levels – CCLs) است؛ آستانه‌هایی که عبور مدل از آن‌ها می‌تواند ریسک‌های جدی ایجاد کند. این سطوح شامل حوزه‌هایی مانند امنیت سایبری، ساخت سلاح‌های شیمیایی و بیولوژیکی، و هم‌راستایی فریبکارانه (یعنی تظاهر مدل به پیروی از انسان درحالی‌که اهدافی مستقل را دنبال می‌کند) هستند.

برای شناسایی نزدیک شدن به این خطوط قرمز، گوگل سیستمی با عنوان آستانه هشدار (Alert Threshold) طراحی کرده که مانند زنگ خطر، سیگنال‌هایی به تیم‌های ایمنی ارسال می‌کند. طبق گزارش رسمی، مدل Deep Think هنوز به سطوح بحرانی نرسیده اما به «آستانه هشدار» برای امنیت سایبری نزدیک شده و سیم تله‌ای را فعال کرده است. این به معنای ضرورت اقدامات پیشگیرانه فوری است.

رقابت فلسفه‌های ایمنی؛ گوگل در برابر آنتروپیک

گوگل تنها شرکتی نیست که چارچوب ایمنی ارائه داده است. آنتروپیک، دیگر بازیگر کلیدی این حوزه، چارچوبی با عنوان سیاست مقیاس‌پذیری مسئولانه (RSP) دارد که رویکردی محتاطانه‌تر اتخاذ می‌کند. تفاوت فلسفی اصلی در این است که:

گوگل (FSF): نوآوری همراه با مدیریت ریسک
آنتروپیک (RSP): توقف توسعه در صورت نبود اطمینان ایمنی

زنگ خطر از درون؛ هشدار خودِ پژوهشگران گوگل

بزرگ‌ترین نگرانی درباره‌ی Deep Think، از سوی پژوهشگران خود گوگل مطرح شده است. ساموئل آلبانی از تیم DeepMind می‌گوید این مدل تنها اطلاعات را حفظ نمی‌کند، بلکه ایده‌ها را از منابع مختلف به‌شیوه‌ای نوآورانه ترکیب می‌کند. این سطح از استدلال، به‌ویژه در حوزه‌هایی مانند زیست‌شناسی و شیمی، موجب هشدار درباره‌ی ریسک‌های امنیتی شده است.

بر اساس گزارش ایمنی گوگل، عملکرد Deep Think در آزمون‌های زیست‌شناسی و شیمی بسیار بالاتر از مدل‌های پیشین است. این بدان معناست که ممکن است این مدل بتواند به توسعه‌ی دانش مربوط به سلاح‌های بیولوژیکی یا شیمیایی کمک کند. در آوریل ۲۰۲۵، OpenAI نیز هشدار داد که مدل‌های دارای پتانسیل تولید سلاح‌های بیولوژیکی در آستانه ظهور هستند. سم آلتمن، مدیرعامل OpenAI، تصریح کرد: «چراغ‌های خطر چشمک می‌زنند... دنیا ما را جدی نمی‌گیرد.»

شرکت xAI متعلق به ایلان ماسک نیز در گزارش‌های خود بر ریسک‌های زیستی و سایبری تأکید کرده است. بااین‌حال، جامعه علمی اذعان دارد که علم ارزیابی ایمنی هوش مصنوعی هنوز کامل نشده و بسیاری از چارچوب‌های فعلی بر پایه‌هایی در حال رشد بنا شده‌اند.

کلام آخر: شمشیری دولبه

مدل Deep Think هم‌زمان یک ابزار فوق‌العاده خلاق و پژوهشی، و یک فناوری با پتانسیل خطرناک است. فعال‌شدن آستانه هشدار در آزمایشگاه‌های گوگل نشان می‌دهد که در حال ورود به قلمرویی ناشناخته‌ایم و برای هر گام، باید نهایت دقت و احتیاط را به خرج دهیم.

منبع: وبسایت آژانس دیجیتال مارکتینگ اف دیما گروپ