آیا چارچوبهای ایمنی گوگل برای مدل خطرناک Gemini 2.5 Deep Think کافی است؟
گوگل بهتازگی از پیشرفتهترین مدل هوش مصنوعی خود با نام Gemini 2.5 Deep Think رونمایی کرده؛ مدلی که پیشتر با کسب مدال طلا در المپیاد جهانی ریاضی (IMO) سر و صدای زیادی بهپا کرده بود. این مدل اکنون در دسترس قرار گرفته، اما نه برای عموم. استفاده از آن صرفاً برای مشترکین سرویس پرهزینه Google AI Ultra با تعرفهی ماهانه ۲۵۰ دلار امکانپذیر است و با محدودیتها و هشدارهای قابلتوجهی همراه شده است.
مدل متفکر گوگل؛ نگاهی به تکامل استدلال در ماشینها
Gemini 2.5 Deep Think نهتنها قدرتمندترین مدل گوگل است، بلکه به مرزهایی نزدیک شده که نگرانیهایی جدی را درباره پیامدهای احتمالیاش ایجاد کرده است. در تابستان ۲۰۲۴، گوگل در آزمایشهای داخلی خود تأیید کرد که هرچند این مدل هنوز به «نقطه بحرانی» نرسیده، اما به قابلیتهایی نزدیک شده که اگر در دستان نادرست قرار گیرد، میتواند بسیار خطرناک باشد.
برای درک اهمیت Deep Think، باید به روند تکاملی تفکر در مدلهای زبانی نگاه کرد. در آغاز، مدلهای زبانی بزرگ مانند دانشآموزی بیحوصله پاسخهایی سریع و کمعمق ارائه میدادند. با معرفی روش زنجیره تفکر (Chain-of-Thought)، مدلها وادار به طی مراحل استدلال گامبهگام شدند که باعث بهبود چشمگیر کیفیت پاسخها شد. اما این روش یک مشکل اساسی داشت: اگر نخستین گام اشتباه بود، تمام زنجیره نیز نادرست پیش میرفت.
برای حل این مشکل، تکنیک درخت تفکر (Tree-of-Thought) معرفی شد. در این رویکرد، مدل بهجای پیروی از یک مسیر خطی، مسیرهای متعددی را بهصورت همزمان بررسی و ارزیابی میکند. این روش، حل مسئله را از رویکرد خطی به جستوجوی اکتشافی تبدیل کرد؛ مشابه آنچه انسان هنگام حل مسائل پیچیده انجام میدهد.
Deep Think؛ معماری تفکر با بودجه محاسباتی
قابلیت Deep Think مرحلهی بعدی در تکامل این روند است. این قابلیت، یک مدل مستقل نیست بلکه حالتی ویژه در چارچوب Gemini است که با فعالسازی آن، مدل به ابزارهایی مانند اجرای کد و جستوجوی پیشرفته در گوگل دسترسی مییابد. معماری آن بر پایه سه عنصر اساسی طراحی شده: تفکر موازی، تولید فرضیه و خود-نقادی.
اما نوآوری اصلی این مدل در مفهومی با عنوان بودجه تفکر (Thinking Budget) نهفته است. گوگل در اینجا امکان انجام محاسبات بیشتر پیش از پاسخگویی را فراهم کرده؛ به بیان سادهتر، کاربران میتوانند برای مسائل دشوارتر، زمان تفکر بیشتری برای مدل خریداری کنند. این رویکرد، استدلال را از قابلیتی ثابت به منبعی مقیاسپذیر و قابل خرید تبدیل کرده است.
از منظر تجاری نیز این یک استراتژی هوشمندانه محسوب میشود؛ گوگل با ارائه دو نسخه متفاوت از مدل (Gemini Flash با سرعت بالا و قیمت پایینتر و Gemini Pro با قابلیت Deep Think برای نیازهای پیچیدهتر) به مشتریان اجازه میدهد تا براساس نیاز خود، سطح تفکر را انتخاب کنند. این ساختار، بازتولید مدل توسط رقبا را دشوار میسازد.
Deep Think در عمل؛ از معماری معابد تا اثبات ریاضی
عملکرد Deep Think در بنچمارکهای پیشرفته کدنویسی، استدلال و ریاضیات شگفتانگیز بوده است. این مدل قادر است تا یک میلیون توکن (معادل یک کتاب بسیار قطور یا ویدیویی سهساعته) را تحلیل کند و ارتباط میان بخشهای مختلف را درک کند.
در آزمایشی که گوگل منتشر کرده، این مدل توانست طرحی از یک معبد پاگودا با جزئیات فوقالعاده دقیق، ساختاری سهبعدی و عناصر طبیعی واقعگرایانه تولید کند که خروجی آن از مدل پایه Pro کاملاً متمایز بود. افزونبراین، Deep Think موفق به اثبات یکی از حدسهای ریاضی مهم شده که سالها ذهن ریاضیدانان را مشغول کرده بود. برخلاف انسان که تنها چند رویکرد محدود را امتحان میکند، این مدل قادر است صدها مسیر مختلف را بهطور همزمان بررسی کند.
تناقض درخشش و خطا؛ محدودیتهای پنهان
با وجود این تواناییها، تناقض بزرگی در عملکرد Deep Think دیده میشود. پژوهشها نشان میدهد که این مدلها هنوز در محاسبات و منطق پایه دچار اشتباهات ساده میشوند و قدرت محدودی در شناسایی اشتباهات خود دارند. استدلالهای پیچیدهی مدلها، لزوماً به معنای درستی آنها نیست.
از سوی دیگر، محدودیت عملی مهمی نیز وجود دارد: هر کاربر تنها میتواند پنج درخواست (prompt) در روز ارسال کند. این محدودیت جدی، آزمون جامع مدل را بسیار دشوار میسازد و هر اشتباه میتواند یکی از اعتبارهای روزانهی گرانبها را هدر دهد.
ایمنی در برابر خطرات؛ چارچوب مهار هوش مصنوعی گوگل
همزمان با افزایش تواناییهای مدل، نگرانیها دربارهی خطرات آن نیز رشد کرده است. گوگل چارچوبی با عنوان Frontier Safety Framework (FSF) طراحی کرده که بر فلسفهی «پیشگیری فعالانه» استوار است.
هستهی این چارچوب، مفهومی به نام سطوح قابلیت بحرانی (Critical Capability Levels – CCLs) است؛ آستانههایی که عبور مدل از آنها میتواند ریسکهای جدی ایجاد کند. این سطوح شامل حوزههایی مانند امنیت سایبری، ساخت سلاحهای شیمیایی و بیولوژیکی، و همراستایی فریبکارانه (یعنی تظاهر مدل به پیروی از انسان درحالیکه اهدافی مستقل را دنبال میکند) هستند.
برای شناسایی نزدیک شدن به این خطوط قرمز، گوگل سیستمی با عنوان آستانه هشدار (Alert Threshold) طراحی کرده که مانند زنگ خطر، سیگنالهایی به تیمهای ایمنی ارسال میکند. طبق گزارش رسمی، مدل Deep Think هنوز به سطوح بحرانی نرسیده اما به «آستانه هشدار» برای امنیت سایبری نزدیک شده و سیم تلهای را فعال کرده است. این به معنای ضرورت اقدامات پیشگیرانه فوری است.
رقابت فلسفههای ایمنی؛ گوگل در برابر آنتروپیک
گوگل تنها شرکتی نیست که چارچوب ایمنی ارائه داده است. آنتروپیک، دیگر بازیگر کلیدی این حوزه، چارچوبی با عنوان سیاست مقیاسپذیری مسئولانه (RSP) دارد که رویکردی محتاطانهتر اتخاذ میکند. تفاوت فلسفی اصلی در این است که:
گوگل (FSF): نوآوری همراه با مدیریت ریسک
آنتروپیک (RSP): توقف توسعه در صورت نبود اطمینان ایمنی
زنگ خطر از درون؛ هشدار خودِ پژوهشگران گوگل
بزرگترین نگرانی دربارهی Deep Think، از سوی پژوهشگران خود گوگل مطرح شده است. ساموئل آلبانی از تیم DeepMind میگوید این مدل تنها اطلاعات را حفظ نمیکند، بلکه ایدهها را از منابع مختلف بهشیوهای نوآورانه ترکیب میکند. این سطح از استدلال، بهویژه در حوزههایی مانند زیستشناسی و شیمی، موجب هشدار دربارهی ریسکهای امنیتی شده است.
بر اساس گزارش ایمنی گوگل، عملکرد Deep Think در آزمونهای زیستشناسی و شیمی بسیار بالاتر از مدلهای پیشین است. این بدان معناست که ممکن است این مدل بتواند به توسعهی دانش مربوط به سلاحهای بیولوژیکی یا شیمیایی کمک کند. در آوریل ۲۰۲۵، OpenAI نیز هشدار داد که مدلهای دارای پتانسیل تولید سلاحهای بیولوژیکی در آستانه ظهور هستند. سم آلتمن، مدیرعامل OpenAI، تصریح کرد: «چراغهای خطر چشمک میزنند... دنیا ما را جدی نمیگیرد.»
شرکت xAI متعلق به ایلان ماسک نیز در گزارشهای خود بر ریسکهای زیستی و سایبری تأکید کرده است. بااینحال، جامعه علمی اذعان دارد که علم ارزیابی ایمنی هوش مصنوعی هنوز کامل نشده و بسیاری از چارچوبهای فعلی بر پایههایی در حال رشد بنا شدهاند.
کلام آخر: شمشیری دولبه
مدل Deep Think همزمان یک ابزار فوقالعاده خلاق و پژوهشی، و یک فناوری با پتانسیل خطرناک است. فعالشدن آستانه هشدار در آزمایشگاههای گوگل نشان میدهد که در حال ورود به قلمرویی ناشناختهایم و برای هر گام، باید نهایت دقت و احتیاط را به خرج دهیم.
منبع: وبسایت آژانس دیجیتال مارکتینگ اف دیما گروپ