در یکی از بحثبرانگیزترین اتفاقات اخیر دنیای هوش مصنوعی، شرکت Cloudflare اعلام کرد که استارتاپ Perplexity AI—یکی از رقبای جدی ChatGPT و Google Gemini—با جعل هویت مرورگرهای رایج و نقض سیاستهای سایتها، بهصورت غیرمجاز از وبسایتها اطلاعات استخراج کرده است. این افشاگری با طراحی یک تلهی دیجیتال از سوی کلادفلر انجام شد که بهطور خاص برای شناسایی رفتار خزندههای متخلف طراحی شده بود.
چگونه پرپلکسیتی قوانین جمعآوری داده را دور زد؟
پرپلکسیتی بهعنوان یک موتور پاسخگو با قابلیتهای مشابه چتباتهای پیشرفته، برای ارائهی پاسخهای دقیق به کاربران، نیاز به دادههای گسترده و بهروز دارد. اما آنچه موجب نگرانی شده، شیوهی دسترسی این سامانه به محتواهای اینترنتی است. طبق گزارش کلادفلر، این شرکت در ابتدا از خزندهای با نام رسمی (PerplexityBot) استفاده میکرد؛ اما پس از اینکه بسیاری از وبسایتها و زیرساختها مانند کلادفلر دسترسی آن را مسدود کردند، روشی زیرکانهتر را پیش گرفت.
کلادفلر تأیید کرده است که پرپلکسیتی از یوزر ایجنتهای جعلی استفاده کرده تا خود را بهعنوان مرورگرهایی نظیر Google Chrome در سیستمعامل macOS معرفی کند. افزون بر این، پرپلکسیتی با بهرهگیری از آیپیهای مختلف و بدون شناسهی معتبر، توانسته بود محدودیتهای فنی را پشت سر بگذارد و همچنان به وبگردی ادامه دهد.
تلهی دیجیتال چگونه عمل کرد؟
بهمنظور بررسی دقیقتر فعالیت خزندههای مشکوک، کلادفلر اقدام به راهاندازی چند وبسایت خصوصی و نامرئی کرد؛ سایتهایی که در موتورهای جستوجو ثبت نشده، هیچ بکلینکی به آنها وجود نداشت، و فایل robots.txt آنها بهصراحت هرگونه دسترسی خزندهها را ممنوع کرده بود.
اما در کمال تعجب، سرویس Perplexity AI بعدها اطلاعاتی دقیق از همین سایتها در پاسخ به کاربران ارائه داد؛ اتفاقی که تنها در صورتی ممکن است که سیستم پرپلکسیتی بهصورت پنهانی از این صفحات بازدید کرده باشد. این موضوع نشاندهندهی آن است که خزندههای این پلتفرم برخلاف ادعایش، از سیاستهای حریم خصوصی وبسایتها تبعیت نمیکنند.
پیامدهای این افشاگری برای پرپلکسیتی
در پی این افشاگری، کلادفلر اعلام کرد که پرپلکسیتی را از فهرست رباتهای تأییدشده و خوشرفتار خود خارج کرده و مکانیزمهای امنیتی جدیدی را برای جلوگیری از فعالیت خزندههای متخلف این شرکت در سراسر شبکهاش فعال کرده است.
با توجه به اینکه کلادفلر زیرساخت امنیتی و CDN بیش از ۲۰ درصد از کل اینترنت جهانی را مدیریت میکند، این تصمیم میتواند تأثیر چشمگیری بر عملکرد سیستمهای هوش مصنوعی مانند پرپلکسیتی داشته باشد.
رقابت هوش مصنوعی و بحران اخلاق دادهها
در شرایطی که رقابت بر سر توسعهی مدلهای پیشرفتهی هوش مصنوعی شدت گرفته، شرکتهای فعال در این حوزه با چالشهای جدی برای دسترسی به دادههای باکیفیت مواجهاند. جمعآوری داده بدون مجوز، نقض فایل robots.txt، و دور زدن سیاستهای حریم خصوصی وبسایتها، از جمله نگرانیهایی است که از سوی جامعهی توسعهدهندگان، تولیدکنندگان محتوا، و کارشناسان حقوق دیجیتال مطرح شده است.
در حالی که OpenAI، گوگل، و سایر شرکتهای بزرگ تلاش کردهاند با ناشران توافقهایی برای استفاده از محتواهای آنلاین داشته باشند، اقدامات اخیر پرپلکسیتی این سؤال را ایجاد کرده که آیا استارتاپهای کوچکتر نیز باید به همان اصول پایبند باشند یا خیر؟
سخن پایانی
اتفاق اخیر میان پرپلکسیتی و کلادفلر تنها یک هشدار فنی نیست؛ بلکه نمادی از بحران اعتماد و اخلاق در دوران هوش مصنوعی است. با قدرت گرفتن مدلهای زبانی، اهمیت شفافیت در جمعآوری دادهها، احترام به سیاستهای سایتها، و اجتناب از جعل هویت یا رفتارهای پنهانی، بیش از گذشته احساس میشود.
مسلماً در آیندهای نهچندان دور، چارچوبهای قانونی دقیقتری برای فعالیت خزندههای هوش مصنوعی وضع خواهد شد؛ اما تا آن زمان، مسئولیت رفتار منصفانه بر عهدهی توسعهدهندگان است.
منبع: وبسایت آژانس دیجیتال مارکتینگ اف دیما گروپ fdmagroup