خواندن ۱۸ دقیقه·۴ سال پیش

راهنمای استفاده‌ی مسئولانه از APIهای یادگیری ماشین

اصل متن توسط رویا پاکزاد و به زبان انگلیسی نوشته شده است. با تشکر از پ. برای ترجمه.

ماه پیش، دوستی استوری‌ا‌ی در اینستاگرامش منتشر کرد. استوری درباره‌ی تحریم خرید یک محصول روشن‌کننده‌ی پوست در هندوستان بود با اسم تجاری «روشن و دوستداشتنی» (Fair and Lovely). هدف تحریم چی بود؟ اینکه افکار عمومی رو با مساله‌ی مهم‌تری به نام رنگ گرایی (colorism) در هندوستان آشنا کنه.

درسته من هندی نیستم، اما پیام این کمپین برام یادآور خاطرات مشابهی در ایران بود. بین فامیل هم با چنین محصولات «زیبایی»‌ای که ادعا می‌کنه پوست مصرف کننده رو روشن‌تر میکنه روبه‌رو شده بودم. سنم کم بود و فکر نمی‌کردم واقعا چیز مهمی باشه. اما این روزها، مطرح شدن جنبش سیاهان در ایالات متحده (Black Lives Matter) باعث شده همه‌ی کسانی که تو کشور خودشون با نوعی نژادپرستی یا رنگ‌گرایی مواجه شده بودن هم به فکر فرو برن.

ترجمه توییت دکتر لوکر: حذف کلمه‌ی «روشن» از «روشن و دوست‌داشتنی» و تولید دوباره‌ی اون با نام جدید چیزی رو عوض نمیکنه چون در نهایت باز هم این محصول به عنوان روشن کننده و به قیمت تحقیر شدن افراد با رنگ پوستهای متفاوت به فروش میرسه.

وقتی داشتم توییت‌های مربوط به این کمپین رو میخوندم، به این فکر افتادم که شرکت سازنده‌‌‌ی کرم روشن‌کننده‌ی پوست، یعنی ‌‌یونیلور، برداشت و برخوردش با این توییت‌ها چیه؟ آیا از ابزارهای تحلیلگر رسانه‌های مجازی –مبتنی بر تکنولوژی تشخیص احساسات– استفاده میکنه که بتونه درک سریعی از بازخورد مردم داشته باشه؟ چون میدونم جدیدا خیلی مرسومه که شرکت‌ها از ابزارهای تحلیلگر متن استفاده کنن تا با توجه به چیزهایی که در رسانه‌های مجازی مطرح میشه رضایت مشتریان رو تخمین بزنن.

من یک پژوهشگر امور تکنولوژی و حقوق بشر هستم. کار من درک تاثیرات اجتماعی و حقوق بشری تکنولوژی‌های دیجیتاله. به همین دلیل بود که تصمیم گرفتم از قضیه‌ی کمپین «روشن و دوست‌داشتنی» برای بررسی APIهای معمول تحلیلگر احساس استفاده کنم. به خصوص، این موضوع برام سوال بود که مثبت بودن عبارت «روشن و دوستداشتنی» (Fair & Lovely) از نظر احساسی، تا چه حدی ممکنه ابزار تحلیل احساس را گمراه کنه و منجر به اشتباه در دسته‌بندی احساس جمله‌ها بشه، حتی اگه جمله از لحاظ احساسی اصلا بار معنایی مثبتی هم نداشته باشه.

این سوال باعث شد که این پست رو بنویسم، مخصوصا برای توسعه‌دهندگانی که از تکنولوژی‌های یادگیری ماشین به عنوان خدمات (MLaaS) استفاده میکنن و همینطور برای همکارانم که به تاثیرات اجتماعی و حقوق بشری تکنولوژی علاقه‌مندن.

من API تحلیلگر لحن IBM (IBM Tone Analyzer API) و API تحلیلگر احساس متن ParallelDots (ParallelDots Text Analysis Emotion API) رو انتخاب کردم و نتایجشون رو روی توییت‌های مربوط به محصول «Fair & Lovely» شرکت یونیلور امتحان کنم. در ادامه توضیح میدم که ارائه دهندگان این APIها چه سیاست‌های حفظ حریم خصوصی‌ای دارن، شرایط خدمات اون‌ها به چه صورته، چه مستنداتی از مدل‌های یادگیری ماشین‌شون ارایه میدن و در آخر بهتون میگم که برای انتخاب API چه معیارهایی باید داشته باشین.

خب، فرض میکنیم شما یک توسعه‌دهنده یا تحلیلگر رسانه‌های مجازی هستید، و شرکت یونیلور سراغتون اومده تا احساس مشتریاش رو از محتویات رسانه‌های مجازی تحلیل کنید. چیکار می‌کنید؟

فرض می‌کنیم شما مهارت، اطلاعات و داده‌ی لازم برای ساختن مدل یادگیری ماشین مخصوص این موضوع رو ندارید و نمی‌خواید از مدلهای از پیش ساخته شده (pre-trained) هم استفاده کنید. در عوض ساده ترین مسیر رو انتخاب میکنید: استفاده از API تحلیلگر احساس حاضر و آماده که مدل اصلی‌اش توسط یه شرکت دیگه ساخته شده. حالا اگر شما جزو دسته‌ی آخر هستید، برای انتخاب و بکارگیری مسئولانه‌ی این APIها چه معیاری دارید؟

ای-پی-آی ها (API) قانونی دارند -- و قدرتی!

اول از پایه شروع میکنیم. رابط برنامه‌نویسی کاربردی (API) به نرم‌افزارهای مختلف کمک میکنه با هم ارتباط برقرار کنن. API اجازه میده که یک اپلیکیشن درخواستی ارائه بده (درخواست دسترسی به داده یا خدمات) و یک اپلیکیشن دیگه به این درخواست پاسخ بده و اون دسترسی رو میسر کنه. برای مثال، اگه شما یک شرکتی مثل توییتر هستید و از پژوهشگران میخواید که از داده‌های شما برای کار پژوهشی‌شون استفاده کنن، با یک API اجازه‌ی دسترسی به این داده‌ها رو در اختیارشون میذارید یا مثلا اگر بخواید با استفاده از اینترنت اشیا (IoT) وسایل هوشمند خونه‌تون رو به هم متصل کنید تا با هم ارتباط برقرار کنن (مثلا لامپ هوشمند‌تون به رویدادهای سالنامه‌ی گوگل‌تون واکنش نشون بده) باید این خدمات رو از طریق API به هم مرتبط کنید.

اما مثل هر جور تعاملی، باید بین این سرویس‌ها قبل از شروع تعامل قوانینی وجود داشته باشه. این قوانین از طریق سیاستهای API، سیاستهای مرتبط با توسعه‌دهنده‌ها و شرایط خدمات شرکت ارائه دهنده‌ی API وضع میشه. اما این تعاملات و سیاست‌هایی که گاهی شامل دسترسی به اطلاعات شما هم میشه چی هستن؟ اصلا چرا باید مهم باشن؟ این مثال‌‌ها نشون میده که چرا همچین چیزی مهمه.

１) داستان کمبریج آنالتیکا و فیسبوک رو یادتونه؟ (محض یادآوری، اطلاعات ۸۷ میلیون کاربر در اختیار کمبریج آنالتیکا قرار گرفت که با استفاده از اون رفتار و علایق سیاسی کاربران فیسبوک رو تحلیل کنه و در نهایت رو انتخاب‌های سیاسی‌شون تاثیر بذاره). خلاصه اینکه، دلیل اصلی این شکل تجاوز به حریم کاربران و اشتراک داده‌ها، سواستفاده از APIهای دسترسی به داده‌‌های فیسبوک بود. نتیجه این شد که بعد از داستان کمبریج آنالتیکا فیسبوک دسترسی توسعه دهنده‌ها به داده‌ها رو با ایجاد تغییراتی در سیاست‌های APIهاش محدود کرد.

２) موقع استفاده از APIهای یادگیری ماشین به عنوان خدمات تحلیلگر هم نگرانی‌هایی وجود داره. در چنین موردی قضیه برعکس مثال بالاست. توسعه‌دهنده‌ها داده‌هایی در اختیارشون هست و از شرکتهای بزرگ فناوری میخوان که با دادن دسترسی به APIهای یادگیری ماشین، این داده‌ها رو براشون تحلیل کنن (MLaaS). تحقیقات جوی بولاموینی (Joy Buolamwini) و تیمنیت گبرو (Timnit Gebru) روی مطالعات جنسیتی نشون داد که بسیاری از مدل‌‌های یادگیری ماشین تشخیص چهره تبعیض نژادی و جنسیتی قائل میشن. در نتیجه‌ی این مطالعات، شرکتهای بزرگ فناوری خدمات API شون رو برای سازمانهای آمریکایی محدود کردن (اما کسی نمیدونه که هنوز چه روابط تجاری با سایر کشورها دارن... ??‍♀️).

اما مسئولیت توسعه‌دهنده‌هایی که میخوان از این APIهای یادگیری ماشین شرکت‌های فناوری استفاده کنن چیه؟ آیا راهنمایی وجود داره که بهشون کمک کنه APIهای یادگیری ماشین را برای حوزه‌های خاص خودشون یه‌کمی مسئولانه‌تر و بادقت‌تر انتخاب کنن و به کار بگیرن؟

تحلیل احساس: تحلیلگر لحن IBM (IBM Tone Analyzer API) یا تحلیلگر احساس ParallelDots (ParallelDots Text Analysis Emotion API)

خب، برای اینکه از APIهای یادگیری ماشین مبتنی بر فضای ابری که حی و حاضر و به‌ وفور موجوده استفاده کنید، چه‌کار میکنید؟ یک حساب کاربری میسازید و دسترسی به API به شما داده میشه. داده‌های ورودی رو وارد میکنید، خدمات‌دهنده‌ی ابری «جادو»ش رو روی اون‌ها اجرا میکنه، و نتایج به عنوان داده خروجی در اختیار شما قرار میگیره. خیلی راحت!‌ حتی لازم نیست دانشی از علوم داده و یادگیری ماشین داشته باشید تا بتونید این API رو با محصولتون تلفیق کنید. یا حداقل میشه گفت این ادعاییه که شرکتها میکنن تا خدماتشون رو در بازار ارائه کنن، مثل تصویر زیر:

ولی از شوخی گذشته، به‌ عنوان یک توسعه‌دهنده شما یک سری معیار برای انتخاب یک سرویس دارید: معیارهایی مثل دقت، هزینه، و سرعت. اما اگه بخواید بر اساس معیارهای دیگه‌ای مثل حریم خصوصی، امنیت، عادلانه بودن، و شفافیت یه سرویس یادگیری ماشینی رو انتخاب کنید چطور؟ چه روندی رو طی میکنید؟ چه چیزهایی رو چک میکنید؟

بیاید برگردیم به توییت‌های «Fair & Lovely». من با فرض اینکه خودم یک توسعه‌دهنده باشم، چند صدتا توییت درباره‌ی «Fair & Lovely» به زبان انگلیسی رو به کمک Twint جمع‌آوری کردم. بعد رفتم سراغ RapidAPI که پلتفرمیه که به توسعه‌دهنده‌ها کمک میکنه APIهای مختلف رو مقایسه و انتخاب کنن، و تحلیل‌گر لحن IBM (IBM Tone Analyzer API) و تحلیل‌گر متن ParallelDots (ParallelDots Text Analysis Emotion API) رو به عنوان بهترین گزینه‌ها انتخاب کردم. هر دو سرویس تعهد میدن که احساساتی مثل ترس، عصبانیت، لذت، شادی و غیره رو از توییت‌ها برداشت کنن.

بعد توی هر دو سرویس ثبت‌نام کردم و اعتبار لازم برای حساب کاربر توسعه دهنده رو دریافت کردم. حساب کاربری رایگان IBM آی-بی-ام ۲۵۰۰ درخواست API در ماه رو میپذیره، و ParallelDots برای ۱۰۰۰ درخواست در روز رایگانه.

در نهایت، آزمایش زیر رو اجرا کردم. نتایج زیر از نوشته‌های توییت‌های «روشن و دوستداشتنی» به عنوان داده ورودی و جمع‌آوری خروجی API ها بدست اومده. که میتونید توی این spreadsheet هم ببینیدش.

لطفا به تفاوت چشمگیر نتایج بین دو سرویس توجه کنین.

همچنین عبارت «Fair & Lovely» را به عبارتهای خنثی‌تری مثل «your product» و «this product» تغییر دادم. نتیجه‌ی خروجی تغییر کرد! هر چند که بر مبنای تحلیل آدمی‌زادی عملا این جمله‌ها و احساس ‌پشتشون یکی ‌هستن.

اگر من جای توسعه‌دهنده‌ی فرضی‌ داستانمون بودم با این نتایج غلط و غلوط دیگه از این ابزارها برای این مورد خاص استفاده نمیکردم. شما بگین که آیا جمله‌ی «یونیلور، Fair & Lovely را متوقف کن، دادخواست را امضا کنید!» شاد و سرخوش به نظر میرسه؟ ??‍♀️

اما بیاین فرض کنیم توسعه‌دهنده‌ی فرضی ما هنوز فکر میکنه استفاده از این ابزارها مفیده. در این صورت باید موارد زیر رو در نظر بگیریم. این رو هم بگم که این لیست خیلی ابتداییه و به هیچ وجه لیست کاملی نیست. اما حداقل به شما نشون میده به عنوان یک توسعه دهنده موقع تصمیم‌گیری برای استفاده از یک ابزار دنبال چه چیزی بگردید.

ثبت نام: سیاستهای حریم خصوصی (Privacy Policies) و شرایط خدمات‌دهی (Terms of Service)

موقع ثبت‌نام برای دریافت حساب کاربری توسعه دهنده،‌ همیشه شرایط خدمات‌دهی (ToS) و سیاستهای حریم خصوصی رو به طور کامل مطالعه کنید.

به طور خاص، در مورد اینکه اطلاعات خودتون و اطلاعاتی که به عنوان داده‌های ورودی به شرکت میدین چطور استفاده میشه به خوبی کنجکاو باشید. سرویسی به نام Polisis وجود داره که به شما کمک میکنه سیاست‌های خدمات‌دهنده‌های مختلف رو باهم مقایسه کنید (عالی نیست اما میتونه بهتون کمک کنه).

سیاستهای حریم خصوصی توسعه دهنده و سیاستهای مختص به هر محصول رو مطالعه کنید تا بفهمید این شرکت چه اطلاعاتی از شما --به عنوان دارنده‌ی حساب کاربری-- جمع‌آوری میکنه، چطور از این اطلاعات محافظت میکنه؟ آیا داده‌های در حال سکون و در حال حرکت رمزگذاری میشن؟ آیا منظورشون از metadata رو درست تعریف کردن؟ آیا داده‌هایی که شما به عنوان ورودی به اون‌ها میدین رو نگهداری میکنن؟ برای چه مدت؟ آیا فایلهای ورودی ذخیره میشن؟

در اینجا مقایسه‌ای بین سیاستهای دو سرویس مورد نظر خواهیم داشت. (از اینجا به بعد، مقایسه‌های من بین جزییات تحلیلگر لحن IBM (IBM Tone Analyzer API) و تحلیلگر متن ParallelDots (ParallelDots Text Analysis Emotion API در باکس‌های خاکستری مانند زیر نشون داده میشه)

تحلیلگر لحن IBM (IBM Tone Analyzer API): وقتی حساب کاربر توسعه دهنده‌تون رو میسازید، IBM سیاستهای حریم خصوصی‌اش رو به شما نشون میده که از بازدید وبسایت گرفته تا خدمات ابری رو شامل میشه. بعضی از چیزایی که میگن یک مقدار مبهمه. برای مثال:
«IBM ممکن است اطلاعات شخصی شما را با شرکای منتخب مطرح کند تا به کمک آنها به شما سرویس ارائه...» اما شرکاشون چه کسانی هستن؟
یا «ما اطلاعات شخصی شما را بیش از زمانی که لازم باشد که به اهداف مورد نظر برسیم نگهداری نمیکنیم». «بیش از زمانی که لازم باشد» یعنی چه‌قدر؟

اگه میخواین اطلاعات مخصوص به جمع‌آوری داده و نگهداریشون توسط API تحلیلگر لحن رو بدونید به قسمت مستندات (document page) مراجعه کنید. بعضی اطلاعات مفیدی که دادن اینهاست:

. لیست درخواستها (request loggings) در تحلیلگر لحن غیرفعال شده.
. این سرویس داده‌های مربوط به درخواست‌ها و پاسخ‌ها رو لیست‌بندی یا ذخیره نمیکنه.
. این سرویس «اطلاعات کاربران را پردازش میکند اما آن را ذخیره نمیکند. کاربران تحلیلگر لحن نیازی به احراز هویت، حفاظت و یا حذف اطلاعات خود از این سرویس ندارند».

ParallelDots: وب سایت ParallelDots ادعا میکنه این مجموعه «از داده‌های شما محافظت میکند و مفاد قرارداد GDPR را کلمه به کلمه اجرا میکند». ولی توضیح بیشتری داده نشده. کدوم داده‌ها؟ ابرداده‌ها (metadata) یا اطلاعات توسعه دهنده یا اطلاعات کاربری؟
شرایط استفاده از خدمات ParallelDots میگه «شما نمیتوانید از این سرویس به هدف مانیتورینگ،‌ بازدهی یا کارایی یا دیگر اهداف مقایسه‌ی شرکتها با یکدیگر و رقابت استفاده کنید». این خیلی برای من عجیبه. این یعنی من همین الان با نوشتن این پست شرایط استفاده از خدماتشون رو نقض کردم؟

مستندسازی

اگه شرکتی مستنداتی مانند Model Card for Model Reporting رو برای یک مدل یادگیری ماشین به‌خصوص تهیه کرده باشه، قبل از استفاده‌ی سرویس اون رو مطالعه کنید. مستندات API رو مطالعه کنید و دنبال اطلاعات درباره‌ی امنیت API، تحقیقات پیش-زمینه‌ای، داده‌های آموزشی، معماری و الگوریتم‌ها و معیارها‌ی سنجش مدل بگردید.

? امنیت API

در چند سال گذشته مثال‌های زیادی از درز اطلاعات استفاده شده در APIهای ناامن اتفاق افتاده. این وظیفه‌ی تامین‌کننده‌ی API هست که نقاط ضعف امنیتی رو برطرف کنه، درخواستهای مشکوک رو شناسایی کنه و مخابره‌ها رو رمزگذاری کنه. حتما مطمئن بشید که تامین کننده‌ی API این مسائل امنیتی رو رعایت کرده باشه- برای اطلاعات بیشتر درباره‌ی امنیت APIها اینجا رو بخونید.

در زیر مقایسه‌ی دیگری بین امنیت API ها برای دو سرویس مورد نظرمون انجام شده:

تحلیل‌گر متن IBM: پیشنهاد IBM به توسعه دهندگان اینه که از IBM Cloud Activity Tracker with LogDN برای مانیتورینگ فعالیت‌هایی که در حساب کاربری ابری اتفاق می‌افته استفاده کنند و فعالیت‌های مشکوک رو بررسی کنند.
برای افتتاح حساب از شما خواسته میشه پسورد قوی‌ای انتخاب کنید و برای شما یک کد تایید فرستاده می‌شه تا به حساب کاربری توسعه دهنده‌تون تایید بشه.

ParallelDots: اطلاعاتی راجع به امنیت API در صفحه مستنداتش موجود نیست. توسعه دهندگان موقع ثبت نام لازم نیست پسورد قوی‌ای انتخاب کنند،‌ البته ParallelDots برای شما یک ایمیل تاییدیه می‌فرسته تا حساب کاربری¬تون رو تایید کنه.

? مدل دقیق و جامع.. اما برای چه گروهی؟

در داستان «روشن و دوستداشتنی» زبان نقش بسیار مهمی رو ایفا میکنه. توییت‌هایی که فقط به زبان انگلیسی نوشته شده نمیتونه درک درستی از گفتگوهای مربوط به این کمپین که در هندوستان اتفاق افتاده به ما بده چون این محصول منحصر به یک زبان نیست.

مستندات API مدنظرتون رو چک کنید و ببینید زبان دیگری رو پشتیبانی میکنه یا خیر. اگه جواب مثبته، میزان دقتش برای زبانهای مختلف به چه شکله؟ سرویس دهنده‌ها معمولا ادعا می‌کنند که زبان‌های مختلفی رو پشتیبانی میکنند اما اطلاعاتی راجع به دقت مدل و معیارهای محاسبه برای هر زبان به‌خصوص رو ارائه نمیدن. مستندات API و تحقیقات زمینه‌ای رو زیر و رو کنید، تا بفهمید معیارهاشون برای هر زیرگروه چیه.

در مورد موضوع مدنظرمون من این موارد رو پیدا کردم:

تحلیل‌گر لحن IBM: این شرکت ۱۱ زبان پشتیبانی شده رو لیست کرده. البته،‌ هیچ اطلاعات دقیق‌تری راجع به دقت یا معیارهای دیگه‌ی محاسبه برای زبان‌های مختلف ارائه نشده.

ParallelDots: این شرکت هم ۱۴ زبان پشتیبانی شده رو لیست کرده. و هیچ اطلاعات بیشتری درباره‌ی دقت یا معیارهای محاسبه برای زبان‌های مختلف ارائه نکرده.

❗️باید و نباید‌های استفاده از مدل

بعضی از شرکت‌ها شما رو درباره‌ی کاربردهای پیشنهادی خدماتشون راهنمایی میکنند، مثلا میگن این محصول به درد آنالیز کامنت‌ها و ریووهای مربوط به محصولتون یا بازاریابی میخوره.‌ اما بعضی وقتها این کاربردها خطرناک یا غیراخلاقی اند و منجر به تبعیض بین گروه‌های اجتماعی مختلف، تجسس بیجا و نقض حریم خصوصی میشن. این شرکتها باید در مورد مواردی که توسعه دهنده نباید از خدمات اون‌ها استفاده کنه هم شفاف عمل کنند (هر چند که این موضوع باید و نباید‌ها پیچیدگی‌های زیادی داره...)

تحلیل‌گر متن IBM: موارد پیشنهادی استفاده ایناست: بررسی رضایت مشتری در فروم‌های پشتیبانی؛ بررسی رضایت مشتری در پاسخ‌های توییتر؛ پیش‌بینی و جفت کردن کسانی که در اپلیکیشن‌های زوج‌یابی آنلاین شرکت میکنن؛ پیش‌بینی احساسات و تشویق‌ها در سخنرانی‌های TED. چیزی درباره‌ی موارد عدم استفاده گفته نشده.

سرویس ParallelDots: دو مورد پیشنهادی استفاده از این سرویس وجود داره: «شناسایی منتقدین و بدگویان به منظور بهبود خدمات برای آن‌ها» و «زیرنظر داشتن برند». چیزی درباره‌ی موارد عدم استفاده گفته نشده.

⚖️ سوگیری و برابری

در چند سال گذشته محققین و متخصصان راجع به به سوگیری‌ها و پیامدهای تبعیض‌آمیز سیستمهای یادگیری ماشین هشدارهایی دادند. متخصصین این حوزه که معمولا روی fairness, accountability, and transparency in machine learning کار میکنن جعبه‌ابزارهای (Toolkit) بیشماری ارائه کردن تا شرکت‌ها بتونن موارد مربوط به حقوق کاربران رو در محصولات مبتنی بر یادگیری ماشین‌شون ارزیابی کرده و در مورد ریسک‌های اجتماعی ممکن شفاف عمل کنند. در اینجا یه لیستی درست کردم از جعبه‌ابزارها،‌ مقالات و نوآوری‌های موجود در زمینه‌ی سوگیری و عدالت.

تحلیلگر متن IBM: IBM یک سری اطلاعات راجع به تحقیقات پیش‌زمینه‌ای، روند جمع‌آوری داده (داده‌ی توییتر)،‌و روش تفسیر داده‌ها در اختیار شما میذاره. البته اشاره‌ای به پیامدهای تبعیض‌آمیز محتمل نمیکنه و هیچ اطلاعات دقیق‌تری راجع به ساختار جمعیتی و اندازه‌گیری بر اساس زیرگروه‌های متفاوت (زبانی، جنسیتی، سنی و غیره) به ما نمیده.
نکته‌ی جالب: محققین IBM خودشون یکی از پیشگامان ارائه‌ی جعبه ابزارهای fairness هستن (سری به IBM 360 بزنین). مثلا یکی از پیشنهادات خودشون این بوده که برای هر مدل ML از فکت‌شیت استفاده بشه تا منبع داده‌ها ، جزییات مدل‌ها، و موارد استفاده مشخص بشه. اما وقتی مدل و محصول خودشون رو می‌بینی نشانی از همچین اطلاعاتی در صفحات محصول نیست. این داستان من رو یاد این شعر نظامی انداخت:

عیب کسان منگر و احسان خویش دیده فرو کن به گریبان خویش

ParallelDots: هیچ اطلاعاتی درباره‌ی سوگیری و رعایت عدالت پیدا نکردم.

? نگهداری و به روز رسانی

تحلیل‌گر متن IBM: این شرکت به طور مداوم خدمات خودش رو به روز رسانی می‌کنه و اطلاعاتی درباره‌ی آپدیت‌ها در اختیار شما می‌ذاره. البته در بعضی آپدیت‌ها از جملات مبهم و کلی‌ای مثل «همچنین در این آپدیت تغییرات داخلی انجام شد و بهبود یافت» استفاده شده، این تغییرات داخلی چی هستن؟

ParallelDots: نتونستم اطلاعاتی درباره‌ی به روز رسانی و نگهداری پیدا کنم.

? فروم‌های توسعه‌دهندگان

فروم‌های توسعه دهندگان (در Slack Workspace، Stack Overflow، GitHub،‌ و غیره) به توسعه‌دهنده‌ها کمک میکنند تا بازخوردها رو باهم به اشتراک بگذارن، با همدیگه و خدمات دهنده ارتباط برقرار کنن،‌ و راجع به مسائل مختلفی مثل حریم خصوصی،‌ امنیت،‌ سوگیری و عدالت، توضیح‌پذیexplainabilitylity) یک محصول مشخص و در یک حوزه‌ی خاص با هم مباحثه کنند.

تحلیل‌گر متن IBM: IBM Watson یه Slack Workspace داره و فروم توسعه‌دهندگان Stack Overflo w. صفحه‌ی GitHub تحلیل‌گر لحن رو می‌تونید اینجا ببینید.

ParallelDots: این شرکت هم یک صفحه‌ی GitHub داره.

پیشنهادات

پیشنهاداتی به توسعه دهندگان

از APIهای یادگیری ماشین کورکورانه استفاده نکنید، مخصوصا وقتی سازوکارشون شفاف نیست. علاوه بر معیارهایی چون هزینه،‌ سرعت، و دقت معیارهای مربوط به سوگیری و عدالت، حریم خصوصی، امنیت و شفافیت و explainability و interoperability رو هم در نظر بگیرید.
اگه در بخش مستندات چیزی راجع به سوگیری پیدا نکردید از سرویس‌دهنده بخواین که اگر مدل رو بر اساس معیار‌های سوگیری ارزیابی کردن، مدارکش رو در اختیارتون بذارن. وظیفه‌ی اونهاست که این اطلاعات رو به صورت آنلاین منتشر کنن یا جزییاتش رو در اختیارتون بذارن. از قدرتتون در جایگاه توسعه‌دهنده و خریدار سرویس استفاده کنید، حتما توجه میکنن!
به موضوعی که میخواین برای اون از ابزار استفاده کنید فکر کنید. چه کسی ممکنه از پیامدهای استفاده از اون API یادگیری ماشین برای محصول مورد نظر آسیب ببینه؟ به جنسیت، نژاد، مذهب، سن، زبان، لهجه،‌کشور، موقعیت اجتماعی-اقتصادیشون فکر کنید (برای مطالعه‌ی بیشتر درباره‌ی گروه‌های آسیب‌پذیری که تحت حفاظت پیمان‌نامه‌های حقوق بشری هستند اینجا رو مطالعه کنید). در اینجا ابزارهای ارزیابی ML رو به روز رسانی میکنم؛ ممکنه این لیست به روند ارزیابی شما کمک کنه.
به دنبال مجموعه داده‌ها و benchmark‌هایی باشید که بتونید از اون‌ها برای ارزیابی پیامدهای تبعیض‌آمیز پروژه‌های ML استفاده کنید (برای مثال Equity Evaluation Corpus یک مجموعه داده‌ی نشان‌شده است که برای سنجش وجود تبعیض در سیستمهای تحلیل احساس استفاده میشه). با افرادی که در ساخت چنین benchmark هایی نقش دارن ارتباط بگیرید و از اونها برای بررسی مدل مد نظرتون در حوزهای که کار می‌کنید کمک بگیرید. برای پیدا کردن افرادی که روی این مسائل کار میکنند به FAccT conference مراجعه کنید.
وقتی متوجه شدید که سرویس API یادگیری ماشینی که باهاش کار میکنید در حوزه‌ی کاری بخصوص شما از نظر اخلاقی مشکلاتی داره، از طریق ساخت یک زیرگروه یا issue در صفحه‌ی GitHub اون شرکت،‌ یا Stack Overflow، و یا صفحات اجتماعی مختص توسعه‌دهندگان و پرداختن به موضوع مورد نظرتون،‌ توسعه‌دهنده‌های دیگه رو هم از این موضوع با خبر کنید. تقریبا تمام سرویس‌دهندگان چنین پلتفرم‌هایی دارن که توسعه‌دهنده‌ها بتونن اونجا مسائل‌شون رو باهم به اشتراک بگذارن. سرویس‌دهندگان معمولا میگن امتحان و بررسی ابزارهاشون برای تک تک حوزه‌های مورد استفاده عملا غیر ممکنه، چون خدماتشون ابزاری با استفاده‌ی عامه (general purpose). اما شما میتونید بهشون اطلاع بدید که چه مشکلات اخلاقی‌ای حین استفاده از این ابزار تو حوزه‌ی خاص شما وجود داشته. و با انتشار عمومی این اطلاعات می‌تونید به بقیه‌ی توسعه‌دهنده‌هایی که میخوان از این سرویس استفاده کنند هم کمک کنید.
اگه تو نرم‌افزارتون از یک API یادگیری ماشین شرکت ثالث هم استفاده میکنید، در سیاست حریم خصوصی و شرایط خدمات این قضیه رو ذکر کنید. به ذکر جمله‌ی «ما از خدمات دیگر شرکت‌ها هم استفاده میکنیم» بسنده نکنید. اطلاعاتی درباره‌ی اون خدمات ثالث هم بدین. در مورد این که حضور این سرویس‌دهنده‌ی ثالث چه تاثیری بر پردازش داده‌ها داره به صورت شفاف توضیح بدین.

پیشنهاداتی به سرویس‌دهندگان API یادگیری ماشین

درسته که تمرکز این مقاله روی توسعه‌دهندگان شخص ثالثه و نه روی سرویس‌دهندگان. اما برای اینکه بدونیم مسئولیت‌های مهم سرویس‌دهندگان در قبال اطلاع رسانی به توسعه دهندگان چیه، میشه گفت:

مستندسازی کنید و شفاف باشید!‌ معیارهای مربوط به سوگیری و عدالت رو در لا‌به‌لای یک کتابچه‌ی ۵۰۰ صفحه‌ای پنهان نکنید. از زبان ساده‌تر و UI شفاف و با کارکرد آسان استفاده کنید که توسعه دهندگان رو حین مطالعه‌ی معیارهای مربوط به عدالت و حریم خصوصی راهنمایی کنه، اون هم قبل از اینکه در سرویس شما ثبت نام کنن.
در صفحات اجتماعی و پورتال‌های توسعه‌دهندگان‌تون زیرگروه‌هایی درباره‌ی سوگیری، امنیت و حریم خصوصی API تون ایجاد کنید. اجازه بدین توسعه دهندگان از طریق این پورتال‌ها درباره‌ی این مسائل بحث کنن (برای مثال ایجاد یک Slack channel مخصوص در workspace توسعه دهندگان) و از توسعه‌دهندگان بخواید تجربیاتشون رو در مورد مسائلی مثل تبعات اخلاقی و اجتماعی، سوگیری و عدالت، امنیت، و حریم خصوصی حین استفاده از سرویس شما به اشتراک بگذارن (بعضی نمونه‌های خوب عبارتند از IBM 360 Slack Channel, Salesforce UI warnings ).
هر نوع حساب کاربری توسعه دهنده (رایگان،‌ استاندارد، ویژه) میزان مسئولیت متفاوتی رو برای شما ایجاد میکنه. برای نظارت سواستفاده‌های احتمالی از سرویستون،‌ حفاظت حریم خصوصی‌اش رو ارتقا بدین. این مقاله چند راه حل امکان‌پذیر رو بهتون ارائه میده: نظارت مسئولانه‌ی سواستفاده از «هوش مصنوعی به عنوان یک خدمات».

پیشنهاداتی به منتقدین ML و فعالان حوزه‌ی حقوق بشر و تکنولوژی

حرفهای زیادی درباره‌ی دموکراتیزه کردن فناوریهای دیجیتال به گوش میرسه. همینطور درباره‌ی تعامل متقابل
(interoperability) خدمات دیجیتال. اینها خیلی خوبه. اما به همراهش نوع جدیدی از تعاملات،‌ جریان اطلاعات، و مالکیت و تسلط بر داده به وجود میاد.

هدف این مقاله ایجاد آگاهی درباره‌ی اهمیت این ارتباطات و نقش‌آفرین‌هاییه که معمولا نادیده گرفته میشن. برای توسعه‌دهنده‌ها، که قبل از اینکه این APIها رو با نرم‌افزار خودشون تلفیق کنن،‌ به مسئولیت‌های این کار فکر کنن. همینطور برای محققین سیاست‌گذاری‌های تکنولوژی که این مسائل را تشریح کنن و یک راهنمای عملی برای کمک به بازیگران به ظاهر کوچک این دنیای داده-محور تهیه کنن.

وقتی یک سرویس/محصول به خصوص رو نقد می‌کنید با دقت روابط شخص ثالث رو بررسی کنید و پیامدهایی که ممکنه حقوق کاربران رو خدشه دار کنه شناسایی و ارزیابی کنید. حین کارتون توجه بیشتری به مسائلی مثل زنجیره‌ی تامین داده و محصول داشته باشید و نقش و مسئولیت‌های نقش‌آفرینان مختلف اکوسیستم فناوری‌های دیجیتال رو با دقت بررسی کنید.

کار من تحقیق روی تاثیرات اجتماعی و حقوق بشری فناوری‌های جدیده. اگر سوالی داشتید برای من ایمیل بفرستید (rpakzad@taraazresearch.org) یا تو توییتر پیام بدید. خوشحال میشم باهاتون صحبت کنم. آدرس وبسایت ما هم اینجاست: taraazresearch.org

یادگیری ماشینapi

Taraaz - تراز

صفحه‌ای برای انتشار مطالبی در مورد مسئولیت‌‌های شرکت‌های فناوری، توسعه‌دهندگان و برنامه‌نویسان در قبال حقوق کاربران. https://taraazresearch.org

شاید از این پست‌ها خوشتان بیاید