توسعه دهندهای در مسیر :)
چالش «عکس 10 سال قبل»؛ در پشت پردهی این خاطرهبازی شیرین چه میگذرد؟
آیا شما هم در چالشی که با نام 10YearsChallenge# شناخته میشود، شرکت کردهاید؟ بسیاری از کاربران تنها با هدف یادآوری خاطرات در این چالش شرکت میکنند و عکس فعلی و 10 سال پیش خود را در کنار هم به اشتراک میگذارند؛ اما آیا شرکتهای فناوری اهداف خاص دیگری را در پشت پردهی این چالش دنبال میکنند؟
اگر شما هم از فعالان شبکههای اجتماعی باشید، احتمالاً این روزها در فیسبوک، اینستاگرام و توییتر با پستهای متعدد افراد از عکسهای پروفایل خود که ظاهر گذشتهی خود – معمولاً از ده سال پیش – را با وضعیت حاضر خود مقایسه میکنند، مواجه شدهاید. اما پیش از پیوستن به این چالش فراگیر به این فکر کردهاید که اشتراک این عکسها و چالشهایی مثل آن، میتوانند از طرف مدیران شبکههای اجتماعی و برای مقاصد دیگری مثل بهبود الگوریتمهای تشخیص چهره و تشخیص سن طراحی شده باشند؟
کیت اُنیل، سخنران و نویسندهی فعال در زمینهی تکنولوژی، از این جهت به موضوع نگاه کرده و در یک توییت وضعیت 10 سال پیش خود را با شرایط حاضر خود به این شکل مقایسه کرده است:
من، 10 سال پیش: احتمالاً در حال خاطرهبازی با گذر سالیان زندگیام در فیسبوک و اینستاگرام بودم.
من، حالا: به این موضوع میاندیشم که این دادهها، میتوانند برای آموزش الگوریتمهای تشخیص چهره روی پیشروی سن و تشخیص سن مورد استفاده قرار گیرند.
این مطلب به طور گستردهای مورد توجه قرار گرفت و در بعضی موارد، واکنشهای نسبتاً شدیدی نیز در قبال آن انجام گرفت. البته هدف او از این مطلب، ایجاد وحشت و نگرانی و بیاعتمادی نسبت به حرکات موجود در شبکههای اجتماعی نیست؛ اما به هر حال روند رو به رشد روشهای نوین مثل همین الگوریتمهای تشخیص چهره و استفاده از دادههای ذخیره شدهی کاربران در شبکههای اجتماعی باعث میشود تفکر و حتی بعضی اوقات، شک در به اشتراک گذاشتن دادههای شخصی در این شبکهها، کار عاقلانه و مناسبی باشد.
در بین افرادی که ایدهی خانم اُنیل را به چالش میکشیدند، بسیاری از آنها این استدلال را مطرح میکردند که این تصاویر، پیش از این چالش هم همه جا موجود بودهاند. بیشترین واکنش، شامل این جمله میشد: «این دادهها در حال حاضر هم در دسترس هستند. فیسبوک همین حالا هم تمامی تصاویر پروفایلها را در اختیار خود دارد».
البته که همین طور است. در نسخههای مختلف این چالش، به افراد آموزش داده میشود که چطور اولین تصویر پروفایل خود یا یک تصویر از 10 سال پیش را در کنار تصویر پروفایل حاضر خود منتشر کنند. بنابراین، بله، این تصاویر پروفایل همین حالا هم موجود هستند، روی همهی آنها یک برچسب زمانی خورده است، افراد زیادی این تصاویر را ذخیره کردهاند و برای بخش اعظم کاربران، این تصاویر به طور عمومی در دسترس هستند. اما بیایید قدری متفاوت به این داستان فکر کنیم.
تصور کنید که قصدِ ارائهی دادهی یادگیری به یک الگوریتم تشخیص چهره روی جنبههای مرتبط با سن، و به طور خاصتر، روی افزایش سن داشته باشید؛ مثلاً این که ظاهر افراد با بالا رفتن سن چه تغییری میکند. در حالت ایدهآل، نیاز به یک مجموعه دادهی بسیار وسیع از تصاویر افراد خواهید داشت. اگر این را هم بدانید که تصاویر در یک فاصله زمانی ثابت و مشخص، مثلاً 10 ساله، گرفته شدهاند، بهتر هم خواهد بود.
در همین رابطه بخوانید:
جمعآوری دادههای حجیم بیش از 70 میلیون کاربر امریکایی فیسبوک که توسط کمبریج آنالیتیکا
مسلماً میتوانید برای به دست آوردن چنین مجموعه دادهای، به کند و کاو در تصاویر پروفایلها در فیسبوک و نگاه کردن به زمان انتشار آنها یا دادههای متای تصویر بپردازید. اما این مجموعهی بزرگ تصاویر پروفایل، میتواند حجم عظیمی از تصاویر غیرمفید و مزاحم را وارد مجموعه دادهی شما کند. هیچ تضمینی وجود ندارد که هر فرد، در انتشار تصاویر خود، ترتیب خاص و درست زمانی را رعایت کرده باشد. این موضوع هم به هیچ وجه عجیب نیست که افرادی، از تصاویر دیگری غیر از تصویر خودشان به عنوان تصویر پروفایل استفاده کنند. همین حالا به لیست دوستان خود در شبکههای اجتماعی نگاه کنید. تصاویر حیوانات خانگی، مناظر طبیعی، تصاویر کارتونی، جملات حکیمانه و بسیاری از تصاویر دیگری از این نوع هم وارد دادههای آموزش الگوریتم شما خواهند شد.
به عبارت دیگر، اگر بتوانید یک مجموعه از تصاویر تمیز، ساده و برچسبگذاری شده با عباراتی مثل «ده سال پیش – امروز» جمعآوری کنید، چندین گام جلوتر خواهید بود.
توجه به مشکلات دیگری مثل اینکه در بسیاری از موارد، تاریخ انتشار یک عکس با تاریخ ثبت آن همخوانی ندارد؛ یا اینکه ممکن است عکس بارگذاری شده، یک تصویر اسکن شده باشد و دادههای EXIF آن نامعتبر باشد، یا برنامههای ادیت عکس که این دادههای زمانی را از بین میبرند و مواردی از این دست، کار را برای جمعآوری این دادهها دشوارتر هم خواهد کرد.
در چالشی که از فیسبوک آغاز شده، کاربران با افزودن برچسبهایی مثل «من در ۲۰۰۸ و من در ۲۰۱۸» به علاوه اطلاعاتی مثل مکان و چگونگی ثبت تصویر از قبیل «۲۰۰۸ در فلان دانشگاه، گرفته شده توسط آقای ایکس؛ ۲۰۱۸ در نیویورک، امسال، مراسم فلان» به جمعآوریکنندهی دادهها کمک میکنند.
به عبارت دیگر، به کمک این چالش، یک مجموعه دادهی تمیز و دقیق از تصاویر کاربران از ۱۰ سال گذشته و حال حاضر آنها جمعآوری شده است. البته تمامی پیامهای دریافتی علیه توییت یاد شده، به در دسترس بودن تصاویر اشاره نمیکنند؛ بعضی نیز معتقدند این دادهها استفادهی خاصی نخواهند داشت. اما محققان بخش داده و دانشمندان، خوب میدانند چطور از آنها استفاده کنند. وقتی هشتگها فراگیر میشوند، به صحت دادههایی که در مراحل اولیهی این روند ایجاد میشوند، بیشتر از دادههای بعدی – زمانی که بعضی کاربران شروع به شوخی کردن با هشتگ یا هایجک کردن آن برای اهداف نامربوط میکنند – میتوان اعتماد کرد.
در مورد تصاویر جعلی نیز، الگوریتمهای شناخت تصویر به اندازهی کافی برای انتخاب چهرهی یک انسان خبره شدهاند. اگر شما به جای حالت عادی این چالش، تصویر یک گربه مربوط به 10 سال پیش و حالا را منتشر کنید، الگوریتم به سادگی میتواند آن را نادیده بگیرد.
فیسبوک در جایگاه خود، هر گونه دست داشتن در چالش #10YearsChallenge را تکذیب کرده است. یکی از اعضای شرکت فیسبوک این گونه پاسخ داده است:
این یک رفتار کاربرمحور است که توانسته همهگیر شود. فیسبوک این جریان را راهاندازی نکرده است و در این چالش، از تصاویری که در فیسبوک موجود است استفاده میشود. از این چالش چیزی به فیسبوک نمیرسد (جز یادآوری اینکه چه چیزهایی در سال 2009 به عنوان مد مطرح بود). به خاطر داشته باشید که کاربران فیسبوک میتوانند در هر زمان، قابلیت تشخیص چهرهی فیسبوک را خاموش کنند.
اما حتی اگر این چالش، یکی از موارد مهندسی اجتماعی نباشد، در سالهای گذشته چندین مثال از بازیهای اجتماعی یا چالشهای اینچنینی برای استخراج و جمعآوری دادهها دیده شده است. تنها کافی است به جمعآوری دادههای حجیم بیش از 70 میلیون کاربر امریکایی فیسبوک که توسط کمبریج آنالیتیکا صورت گرفت فکر کنید.
اما اینکه دیگران از تصاویر فیسبوک شما برای بهبود الگوریتم تشخیص چهره استفاده کنند اتفاق بدی است؟ لزوماً نه. از جهتی، این اتفاق اجتنابناپذیر است. به هر حال ما برای پیشبرد این فناوری نیاز به استفاده از دادههای گسترده داریم تا بتوانیم آن را در مقیاس بزرگ استفاده کنیم. به سه مورد کاربرد برای تشخیص چهره اشاره میکنیم: یک مورد استفادهی قابل احترام، یک مورد معمولی و یک مورد خطرناک.
سناریوی خوب: تکنولوژی تشخیص چهره، به خصوص با توانایی شناخت افزایش سن، میتواند در موارد پیدا کردن کودکان گمشده کمک کند. سال گذشته پلیس در دهلینو گزارش کرد که در چهار سال گذشته، بیش از 3000 کودک گمشده را ردیابی کرده است. اگر کودکان برای مدتی گم شوند، احتمالاً به زودی چهرهشان نسبت به آخرین تصویر ثبت شده تغییر خواهد کرد، بنابراین یک الگوریتم با شناسایی تغییرات سنی میتواند در اینجا بسیار کمککننده باشد.
استفاده عادی و بینابینی: تشخیص سن احتمالاً یکی از مفیدترین راهها برای تبلیغات هدفمند خواهد بود. طراحان تبلیغات میتوانند با استفاده از دوربینها و سنسورهایی که تصاویر کاربر را ثبت میکنند، پیامهای خود را در گروهبندیهای سنی مختلف (و گروهبندیهای دیگری که با تشخیص چهره قابل تفکیک هستند) به کاربر ارائه کنند. این کاربرد آنقدرها هم هیجانانگیز نیست اما میتواند تبلیغات ارائهشده را مرتبطتر با شخص کند. اما ترکیب کردن این قابلیت با موارد دیگری مثل ردیابی مکانی، پاسخها و رفتارهای ما در خرید، همین تبلیغات میتوانند باعث بعضی تعاملاتی شوند که کاربران را به وسواس و حتی وحشت در دنیای مجازی میاندازد.
استفادههایی که میتوانند نادرست باشند: درست مثل سایر فناوریها، امکان فراگیر شدن و ایجاد نتایج دیگر نیز وجود دارد. تشخیص افزایش سن میتواند در آینده در صنعت بهداشت و بیمه نیز اثرگذار باشد. برای مثال اگر به نظر رسد که نسبت به اطرافیان خود، زودتر پیر میشوید میتوان نتیجه گرفت که احتمالاً ریسک بیمهای شما چندان برای شرکت بیمه مناسب نیست و بیمه تصمیم خواهد گرفت که هزینهی بیمه را برای شما بیشتر کرده یا از تحت پوشش قرار دادن شما صرف نظر کند.
پس از این که آمازون سرویس تشخیص چهرهی بلادرنگ خود را در سال 2016 معرفی کرد، از ابتدا توانست این سرویس را به آژانسهای دولتی و مراکز مجری قانون مثل ادارهی پلیس اورلاندو و واشنگتن بفروشد. اما این تکنولوژی باعث افزایش نگرانیهایی در زمینهی حریم خصوصی نیز شد. پلیس میتوانست از این فناوری نه فقط برای رهگیری افراد مشکوک به انجام جرائم، که برای گرفتن رد افراد بیگناه مثل حاضران در راهپیماییها یا افراد دیگری که پلیس آنها را مزاحم میداند، استفاده کند.
اتحادیهی آزادیهای شهروندی امریکا از آمازون توقف فروش این سرویس را درخواست کرد. همین درخواست توسط گروههای دیگری مثل شرکا و کارمندان آمازون نیز انجام شد که باعث شد ارزش و اعتبار شرکت تحت تأثیر قرار گیرد.
صحبت در مورد اثرگذاری فناوری روی مسائل انسانی کار دشواری است. همهی ما میتوانیم تلاش کنیم این تأثیرات را به سمت مثبتی حرکت دهیم، اما برای این کار، باید روشهای استفادهی نادرست از آن را نیز بشناسیم. وقتی با مشکل به خوبی آشنا شویم، بهتر میتوانیم در مورد حل آن تصمیم بگیریم.
خب، حالا این موضوع چقدر مهم است؟ آیا به اشتراک گذاشتن چند عکس در این چالش – که قبلا هم عمومی و در دسترس بودند – باعث رخ دادن اتفاقات بدی خواهد شد؟ آیا آموزش به الگوریتمهای تشخیص چهره برای شناخت سن و پیشروی سن خطرناک است؟ مسلماً نه!
گذشته از بحث خواستگاه یا هدف پشت این چالش، همهی ما باید در مورد دادههایی که ایجاد کرده و به اشتراک میگذاریم، سطحی از دسترسی که به دیگران میدهیم و معنای استفاده از آنها دقیقتر باشیم. اگر موضوع یک بازی بود که صریحاً در آن اعلام شده باشد که جمعآوری این جفت تصاویر قدیمی و جدید، برای استفاده در تحقیقات شناسایی سن استفاده میشود، میتوانستید با توجه به اینکه چه کسی به این تصاویر دسترسی خواهد داشت و هدف آن چه خواهد بود، در شرکت کردن یا نکردن یا انتخاب تصاویر استفاده شده بیشتر دقت کنید.
انسانها رابط بین دنیای فیزیکی و دیجیتال هستند. تعاملات انسانی بخش اعظم جذابیتهای اینترنت اشیاء را شکل میدهند. دادههای ما صنایع را هوشمندتر و سوددهتر میکنند. لذا باید همگی خواستار این باشیم که صنایع با دادههای ما از هر جهت، با احترام رفتار کنند. اما مهمتر از آن، این است که خودمان با اطلاعات و دادههای مربوط به خود، درست رفتار کنیم.
مطلبی دیگر از این انتشارات
مِهداده (کلان داده) چیست؟ (۳)
مطلبی دیگر از این انتشارات
آموزش کتابخانه pandas در پایتون 1
مطلبی دیگر از این انتشارات
10 بخش برتر اینترنت اشیا در سال 2018