نوشته های Taraaz

نوشته های Taraaz - تراز https://virgool.io/feed/@taraaz صفحه‌ای برای انتشار مطالبی در مورد مسئولیت‌‌های شرکت‌های فناوری، توسعه‌دهندگان و برنامه‌نویسان در قبال حقوق کاربران. https://taraazresearch.org fa 2026-06-10 14:46:58 https://files.virgool.io/upload/users/333732/avatar/94GyBZ.png?height=120&width=120 Taraaz - تراز https://virgool.io/@taraaz راهنمای رعایت حقوق دیجیتال کاربران برای شرکت‌های فناوری https://virgool.io/@taraaz/%D8%B1%D8%A7%D9%87%D9%86%D9%85%D8%A7%DB%8C-%D8%B1%D8%B9%D8%A7%DB%8C%D8%AA-%D8%AD%D9%82%D9%88%D9%82-%D8%AF%DB%8C%D8%AC%DB%8C%D8%AA%D8%A7%D9%84-%DA%A9%D8%A7%D8%B1%D8%A8%D8%B1%D8%A7%D9%86-%D8%A8%D8%B1%D8%A7%DB%8C-%D8%B4%D8%B1%DA%A9%D8%AA-%D9%87%D8%A7%DB%8C-%D9%81%D9%86%D8%A7%D9%88%D8%B1%DB%8C-ki9mrptqrwhx تهیه شده برای شرکت‌های فناوری نوپا، بر اساس شاخص رتبه بندی حقوق دیجیتال Ranking Digital Rights Corporate Accountability Indexسال گذشته با همکاری گروه فیلتربان گزارشی تهیه کردیم در رابطه با حقوق دیجیتال کاربران و مسئولیت شرکت‌های فناوری. تو اون گزارش از شاخص رتبه بندی حقوق دیجیتال Ranking Digital Rights و اصول راهنمای تجارت و حقوق بشر سازمان ملل استفاده کردیم تا عملکرد بعضی از شرکت‌های پیام‌رسان ایرانی و غیر‌ایرانی رو در رابطه با میزان شفافیت و احترام‌شون به حقوق کاربران بررسی کنیم. میتونید گزارش رو تو این صفحه بخونید. ولی جدا از اون گزارش و تمرکزش رو شرکت‌های پیام‌رسان، یه دفترچه‌ی راهنما هم درست کردیم و توصیه‌هایی ارائه دادیم که تقریبا قابل تعمیم به اکثر شرکت‌های نرم‌افزاری ارائه‌ی سرویس و تولید محتوا هم میشه. تو این پست ویرگول تصمیم گرفتیم خلاصه‌ای از کارمون رو بنویسیم.این مطلب به دو بخش تقسیم شده، بخش اول یه‌سری توصیه‌ی کلی رو در رابطه با حقوق دیجیتال و مسئولیت شرکت‌های فناوری ارائه میده. بخش دوم این پست میگه که چه‌طور این توصیه‌ها رو عملی کنید. برای مثال یه دفترچه‌ی راهنمایی درست کردیم که شامل راهنمای برگزاری ورکشاپ حقوق دیجیتال و سه گوگل شیت مربوط به حریم خصوصی، آزادی بیان و سیاست‌‌‌گذاری‌های شرکت میشه. در آخر هم مثالی از همین پلتفرم ویرگول آورده شده که بهتون میگه چه‌طور این گوگل‌شیت‌ها رو در طول ورکشاپ تکمیل کنید. ? توصیه‌هایی برای شرکت‌های فناوریشفافیت در سیاست‌های حفظ حریم خصوصیسیاست‌های حفظ حریم خصوصی باید به زبانی ساده و غیرتخصصی نوشته شوند. این سیاست‌ها باید روی وب‌سایت‌ شرکت‌ها و فروشگاه‌های اپلیکیشن به‌راحتی در دسترس باشند.هر موقع شرکت‌ها سیاست‌های حفظ حریم خصوصی خود را به‌روزرسانی می‌‌کنند، می‌بایست با فرستادن پیام، ایمیل یا notification کاربران را از این تغییرات مطلع ساخته و آرشیو تغییرات را روی وبسایت خود نگه دارند.شرکت‌ها باید به صورت علنی اعلام کنند که چه نوع داده‌هایی جمع‌آوری‌ می‌شود، به چه دلیل جمع‌آوری می‌شوند، به چه صورت ذخیره می‌شوند، و برای چه مدتی نگه داشته می‌شوند.شرکت‌ها باید در بخش سیاست‌های حفظ حریم خصوصی و داده‌ها، درباره روش‌های به اشتراک‌گذاری داده با شرکت‌های تبلیغاتی و کارگزاران داده، چگونگی استفاده از کوکی‌ها و همینطور سیاست‌های عرضه‌ی APIهای خود، شفافیت داشته باشند.طراحی بر مبنای حفظ حریم خصوصی و امنیت دیجیتال کاربرانشرکت‌ها، برای سرویس‌هایی که نیازمند ساخت حساب کاربری هستند، می‌بایست از کاربران بخواهند تا رمز عبور قوی و مطمئن انتخاب کنند. اگر شرکتی به اطلاعات حساس افراد مانند نام، شماره تلفن، نشانی و غیره دسترسی دارد، باید حتماً گزینه‌ی تصدیق حساب چند مرحله‌ای (Multi-factor Authentication) را برای کاربران خود فراهم کند.شرکت‌ها می‌بایست جمع‌آوری اطلاعات کاربران خود را به میزانی که فقط برای ارائه‌ی صحیح سرویس ضروری است محدود کنند. بسته به نوع سرویس، جمع‌آوری، پردازش، و ذخیره‌ی اطلاعات حساس کاربران باید از روش‌های مخفی نگه داشتن هویت، مانند مستعارسازی (pseudonymization)، ناشناس سازی (anonymization) و غیره استفاده شود. اصول privacy by design را مطالعه و پیاده‌سازی کنید. شرکت‌ها می‌بایست برای رمزنگاری داده‌ها از الگوریتم‌های قوی و مورد تایید پژوهشگران حریم خصوصی استفاده کنند تا اطلاعات کاربران را در زمان انتقال و همینطور تا زمانی که این داده‌ها ذخیره می‌شوند، حفاظت کنند. رمزنگاری قوی باید به صورت پیش‌فرض (by default) تعبیه شود. در جایی که این امکان وجود داشته باشد، از جمله اپلیکیشن‌های پیام‌رسان و سرویس‌های VoIP، باید رمزگذاری سرتاسری (End to End Encryption) پیاده‌سازی شود. گزارش‌های فنی که شامل توضیحات درباره الگوریتم‌های رمزنگاری هستند، باید به صورت علنی روی صفحات آنلاین رسمی هر شرکت -- برای مثال صفحه‌ی گیتهاب، در دسترس عموم و بالاخص پژوهشگران حریم خصوصی و امنیت سایبری قرار بگیرند. شرکت‌ها می‌بایست یک تیم داخلی مخصوص امنیت سایبری داشته باشند - که بتوانند شیوه‌های مرسوم امنیت سایبری مانند تشکیل تیم قرمز و آبی (red and blue teaming) یا مدل‌سازی تهدیدهای سایبری (threat modeling) را برای سرویس‌های شرکت پیاده‌سازی کنند - این تیم‌ها باید پیش از عرضه یک محصول، ‌تست‌های مختلف امنیت سایبری را روی آن محصول اجرا کنند. علاوه بر این، شرکت‌ها باید پذیرای دریافت گزارش بررسی از محققان امنیت و حریم خصوصی نیز باشند؛ این محققان سعی می‌کنند نقاط ضعف و باگ‌های امنیتی را پیدا ‌کنند، روشی متداول که باگ باونتی (bug bounty) نامیده می‌شود. علاوه بر این، هنگام طراحی و کدنویسی یک نرم افزار، شرکت‌ها باید بهترین روش‌های امنیتی را، از جمله پرهیز استفاده از کتابخانه‌های ناامن، بکار گیرند. برای دریافت اطلاعات بیشتر در زمینه روش‌های حفظ امنیت و حریم خصوصی در طراحی و کدنویسی برای خدمات خود به منابعی چون the Digital Standards و OWASP Security Testing Guide رجوع کنید.طراحان UX/UI، هنگام طراحی یک اپلیکیشن باید دسترسی به تنظیمات مربوط به حریم خصوصی و امنیت را تا حدی ساده طراحی کنند که افراد با سطوح مختلف سواد دیجیتالی و همینطور افراد با توانایی‌های متفاوت جسمانی و بینایی نیز بتوانند این تنظیمات را متوجه شده و از آنها استفاده کنند. پیشنهاد میدهیم از این چک‌لیست استفاده کنید.روش‌های طراحی به کار گرفته شده به منظور حفظ حریم خصوصی و امنیت، مانند گزارش‌ها و جزییات فنی، کدهای متن-باز و غیره باید روی وبسایت (وبلاگ رسمی، شبکه‌های چندرسانه‌ای و پلتفرم‌های میزبانی نرم‌افزار مانند GitHub و صفحات کدنویسان و سوالات متداول)، برای عموم در دسترس باشد.شفافیت در شرایط و ضوابط استفاده از خدمات و چگونگی اعمال این ضوابطبا ایجاد ضوابطی شفاف و قابل دسترس عموم-- تحت عنوان شرایط و ضوابط استفاده از خدمات--، شرکت‌ها باید نوع محتوا و فعالیت‌های مجاز و غیرمجاز بر روی سرویس خود را اعلام کنند.شرکت‌ها باید به صورت شفاف اعلام کنند که چطور شروط لازم برای کاربری و ضوابط استفاده از خدمات را اعمال می‌کنند. باید اعلام کنند که از چه شیوه‌های خودکار یا غیرخودکاری برای نظارت و کنترل فعالیت‌ها و محتوای منتشر شده استفاده می‌کنند، و اگر این ضوابط زیر پا گذاشته شوند، با آن کاربر یا محتوای منتشر شده چه برخوردی می‌کنند. در صورت زیر پا گذاشتن ضوابط، اگر شرکتی بخواهد محتوای منتشر شده را حذف کند یا دسترسی آن کاربر را به خدمات شرکت محدود کند، باید پیش از این اقدام کاربر را مطلع سازد و به صورت شفاف دلیل این کار را توضیح دهند.شرکت‌ها می‌بایست ضوابط استفاده از API و بات‌های اینترنتی خود را به صورت شفاف برای توسعه‌دهندگان و برنامه‌نویسان مشخص کنند. همچنین باید اطلاعاتی درباره روش‌های مبتنی بر اصول امنیت سایبری خود برای جلوگیری از سوء استفاده از APIها، در نظر بگیرند.گزارش شفافیتشرکت‌ها می‌بایست بر روی وبسایت خود سامانه شفافیت داشته باشند. در سامانه شفافیت، شرکت‌ها می‌بایست گزارش‌های خود را به صورت متناوب (هر شش ماه یا هر یک سال یک‌بار) منتشر کرده و با اعلام علنی موارد زیر، درباره عملکرد خود شفاف‌سازی کنند:▫️ تعداد پست‌ها، اکانت و یا صفحات کاربری که حذف شده‌اند، چه به صورت خودکار و چه به صورت غیرخودکار.▫️ تعداد درخواست‌های دریافت شده از نهادهای دولتی و مقامات قضایی برای حذف محتوا یا اکانت و صفحات کاربری و درخواست دسترسی به اطلاعات آنها، افزون بر اینکه چه تعداد از این درخواست‌ها پذیرفته شده و چه تعداد رد شده است.▫️ تعداد درخواست‌های دریافت شده از نهادهای غیردولتی (طرفین ثالث، شرکت‌های دیگر، کاربران و غیره) برای حذف محتوای سایر کاربران و درخواست دسترسی به اطلاعات آنها، افزون بر اینکه چه تعداد از این درخواست‌ها پذیرفته و چه تعداد رد شده است.▫️ طبقه‌بندی محتوا، صفحات و حساب‌های کاربری، و بات‌های حذف شده بر اساس نوع تخطی در ضوابط استفاده از خدمات (برای مثال: مطالب مربوط به سوءاستفاده و آسیب جنسی به کودکان، زیر پا گذاشتن قانون کپی‌رایت، پورنوگرافی، اقدام تروریستی، و غیره)▫️ شرکت‌ها باید سامانه‌‌ی مخصوصی برای درخواست‌های نهادهای دولتی، مقامات قضایی و انتظامی برای دسترسی به اطلاعات کاربران و یا حذف محتوا، داشته باشند. شرکت‌ها در این سامانه، می‌بایست خط قرمزهای خود و روند رسمی مرحله به مرحله‌ی خود را برای دریافت چنین درخواست‌هایی از مقامات و چگونگی بررسی آنها ارائه دهند. همچنین باید نمونه‌های فرضی از درخواست موجه و غیرموجه را نیز در این سامانه اضافه کنند.برای جزییات بیشتر می‌توانید «قواعد سانتا کلارا درباره شفافیت و پاسخگویی» را مطالعه کنید و نمونه‌های مختلف گزارش‌های شفافیت را در این وبسایت مرور کنید.در مصور‌سازی اطلاعات مربوط به گزارش شفافیت می‌بایست از استفاده از عبارات دوپهلو و روش‌های مصور‌سازی گمراه کننده اجتناب شود. روند دریافت و بررسی درخواست‌های تجدیدنظر و کانال‌های دریافت نظر و پیشنهادشرکت‌ها می‌بایست روندی ساده و قابل فهم برای درخواست‌های تجدیدنظر فراهم کنند. کاربری که محتوا یا صفحه او محدود یا مسدود شده است، باید به راهی دسترسی داشته باشد که بتواند درخواست تجدیدنظر کند و یا توضیحات واضح شرکت در مورد این تصمیم را جویا شود.شرکت‌ها می‌بایست آدرس ایمیل، شماره تلفن برای خدمات مشترکین، شبکه‌های رسانه‌ اجتماعی، فرم‌های آنلاین و پرسشنامه داشته باشند تا بین خود، کاربران و هر گروه دیگری که در عملکرد این شرکت سهیم است، امکان ارتباط و دریافت نظرها و پیشنهادها را فراهم کنند.شفافیت در مالکیت و ساختار حکمرانی شرکتشرکت‌ها می‌بایست روی وبسایت خود، بخش «درباره ما» داشته باشند. در این صفحه باید با شفافیت درباره اینکه این شرکت متعلق به چه سازمان یا شخصی است و اینکه آیا از سوی یک شرکت مادر اداره می‌شود توضیح دهند. همچنین اعلام کنند که اسم شرکت مادر چیست، آیا وابسته به نهادی دولتی یا حکومتی است یا خیر.در صورت وقوع هرگونه نشت اطلاعاتی‌‌، شرکت‌ها موظف هستند تا عموم را از طریق نشر اطلاعیه‌ی عمومی و فرستادن ایمیل به کاربران، از ابعاد و نحوه‌ی ایجاد این نشت مطلع سازند. علاوه بر این، تمام این اطلاعات را باید در گزارش شفافیت خود که به صورت متناوب منتشر می‌شود، درج کنند.شرکت‌ها می‌بایست از «اصول راهنمای تجارت و حقوق بشر سازمان ملل» جهت ارزیابی اثرات حقوق بشری — که به سبب ارائه خدمات و فعالیت‌های شرکت در آن دخیلند— استفاده کنند. آنها باید به صورت علنی اعلام کنند که از طریق عضویت در طرح‌های چند-ذینفعی با جامعه مدنی — بالاخص با نهادهایی که با گروه‌های آسیب‌پذیر جامعه مانند کودکان، اقلیت‌های قومی، جنسی و جنسیتی، مذهبی و پناهجویان کار می‌کنند— مشاوره می‌گیرند. برای حصول اطمینان از این موضوع که کارکنان یک شرکت با مسائل مربوط به حقوق دیجیتال آشنایی دارند، آن شرکت می‌بایست برای کارکنان خود (از مدیران عالی‌رتبه گرفته تا کارشناسان فنی، و گروه‌های حقوقی، فروش، منابع انسانی) مطالب و ورکشاپ‌های آموزشی فراهم کند تا کارکنان بدانند چطور باید از آسیب‌های احتمالی به حقوق کاربران در فعالیت‌های مرتبط با حرفه‌ی خود جلوگیری کرده یا آن‌ها را محدود کنند.شرکت‌ها باید در روند قانونگذاری کشور، در جایی که مرتبط با حوزه‌ی تکنولوژی است، با کمیسیون‌های مجلس و نهاد‌های دولتی گفتگو داشته باشند، نگرانی‌های خود را اعلام کنند و از حقوق دیجیتال کاربران خود پشتیبانی کنند. اتحادهای میان-شرکتی، نوشتن نامه‌های سرگشاده به مسئولان، گفتگو با رسانه‌ها و مطبوعات از جمله راهکارهایی است که به تحقق این امر کمک می‌کند.? دفترچه‌ی راهنمای رعایت حقوق کاربران این دفترچه راهنما برای چه کسانی تهیه شده است؟ مخاطب این دفترچه شرکت‌های فناوری نوپا در ایران میباشد که میخواهند ارزش‌های حقوق دیجیتال را از همان قدمهای اول در تمامی فعالیتهای مربوط به طراحی و توسعه‌ی محصولشان اجرا کنند.چطور میتوانید از این دفترچه‌ی راهنما استفاده کنید؟ ما پیشنهاد میکنیم که ورکشاپ‌های یک روزه یا دو روزه‌ای ترتیب دهید تا زیرمولفه‌ یا سنجه‌های مختلف این دفترچه راهنما را با دقت مرور کنید.مقدمات ورکشاپیکی از اعضای تیم مدیریتی/اجرایی باید برای ترتیب دادن یک ورکشاپ پیش‌قدم شود. این شخص، پیش از هر چیز، باید این گزارش و دیگر منابع از جمله اصول راهنمای تجارت و حقوق بشر سازمان ملل را مطالعه کند، سپس این منابع را بین اعضای تیم پخش کند. فرد متصدی می‌بایست اعضای بخش‌هایی که در زیر فهرست شده‌اند را برای شرکت در این ورکشاپ دعوت کند:وسایل مورد نیاز ورکشاپفعالیت‌های ورکشاپ فرد متصدی، ورکشاپ را با ارائه یک پرزنتیشن کوتاه درباره اصول راهنمای تجارت و حقوق بشر سازمان ملل و شاخص رتبه‌بندی مسئولیت شرکت‌ها در قبال حقوق دیجیتال - RDR آغاز خواهد کرد. پس از آن به اهداف و دلایل برگزاری ورکشاپ می‌پردازد. شخص برگزار کننده همچنین میبایست فعالیت‌های ورکشاپ را توضیح داده و یک نفر را برای یادداشت‌برداری و یک داوطلب را برای جمع‌آوری یادداشتها و کمک در بهتر برگزار شدن گفتگو، برگزیند.جدول مولفه‌ها به دفترچه راهنمای اکسل‌ یا گوگل‌شیت مراجعه کنید و فایلهای اکسل حریم خصوصی، آزادی بیان و سیاست‌گذاری‌های شرکت را دانلود کنید یا کپی کنید. فایل مربوط به مولفه‌های حریم خصوصیفایل مربوط به مولفه‌های آزادی بیانفایل مربوط به مولفه‌های حکمرانی شرکتگفتگوی گروهیفرد برگزار‌کننده‌ ورکشاپ، هر یک از مولفه‌ها در دفترچه راهنما را میخواند و گروه،گفتگو را با پاسخ دادن به این سوالات آغاز میکند:مثالی از «ویرگول»این کلیپ کوتاه بهتون میگه که گوگل‌شیت‌ها رو چه‌طور تکمیل کنید. ما از مثال سیاست‌های حریم خصوصی ویرگول -- که اینجا قابل دسترسه https://virgool.io/privacy -- استفاده کردیم.لینک ویدیو YouTubeلینک مربوط به مولفه‌های حریم خصوصیلینک مربوط به مولفه‌های آزادی بیانلینک مربوط به مولفه‌های حکمرانی شرکت اینم یه gif اگر حوصله‌ی ویدیو دیدن رو ندارید:https://www.youtube.com/watch?v=KYO6KnDTJswمسئولیت انتشار این مطلب روی پلتفرم «ویرگول» بر عهده‌ی موسسه‌ی تراز می‌باشد. برای تماس با ما و یا اطلاع بیشتر از فعالیت‌های ما به وبسایت‌ https://taraazresearch.org/ مراجعه کنید. Taraaz - تراز Taraaz - تراز Thu, 29 Jul 2021 00:13:19 +0430 راهنمای استفاده‌ی مسئولانه از APIهای یادگیری ماشین https://virgool.io/@taraaz/%D8%B1%D8%A7%D9%87%D9%86%D9%85%D8%A7%DB%8C-%D8%A7%D8%B3%D8%AA%D9%81%D8%A7%D8%AF%D9%87-%DB%8C-%D9%85%D8%B3%D8%A6%D9%88%D9%84%D8%A7%D9%86%D9%87-%D8%A7%D8%B2-api%D9%87%D8%A7%DB%8C-%DB%8C%D8%A7%D8%AF%DA%AF%DB%8C%D8%B1%DB%8C-%D9%85%D8%A7%D8%B4%DB%8C%D9%86-dpnu7di1ef7v اصل متن توسط رویا پاکزاد و به زبان انگلیسی نوشته شده است. با تشکر از پ. برای ترجمه.ماه پیش، دوستی استوری‌ا‌ی در اینستاگرامش منتشر کرد. استوری درباره‌ی تحریم خرید یک محصول روشن‌کننده‌ی پوست در هندوستان بود با اسم تجاری «روشن و دوستداشتنی» (Fair and Lovely). هدف تحریم چی بود؟ اینکه افکار عمومی رو با مساله‌ی مهم‌تری به نام رنگ گرایی (colorism) در هندوستان آشنا کنه.درسته من هندی نیستم، اما پیام این کمپین برام یادآور خاطرات مشابهی در ایران بود. بین فامیل هم با چنین محصولات «زیبایی»‌ای که ادعا می‌کنه پوست مصرف کننده رو روشن‌تر میکنه روبه‌رو شده بودم. سنم کم بود و فکر نمی‌کردم واقعا چیز مهمی باشه. اما این روزها، مطرح شدن جنبش سیاهان در ایالات متحده (Black Lives Matter) باعث شده همه‌ی کسانی که تو کشور خودشون با نوعی نژادپرستی یا رنگ‌گرایی مواجه شده بودن هم به فکر فرو برن.ترجمه توییت دکتر لوکر: حذف کلمه‌ی «روشن» از «روشن و دوست‌داشتنی» و تولید دوباره‌ی اون با نام جدید چیزی رو عوض نمیکنه چون در نهایت باز هم این محصول به عنوان روشن کننده و به قیمت تحقیر شدن افراد با رنگ پوستهای متفاوت به فروش میرسه.وقتی داشتم توییت‌های مربوط به این کمپین رو میخوندم، به این فکر افتادم که شرکت سازنده‌‌‌ی کرم روشن‌کننده‌ی پوست، یعنی ‌‌یونیلور، برداشت و برخوردش با این توییت‌ها چیه؟ آیا از ابزارهای تحلیلگر رسانه‌های مجازی –مبتنی بر تکنولوژی تشخیص احساسات– استفاده میکنه که بتونه درک سریعی از بازخورد مردم داشته باشه؟ چون میدونم جدیدا خیلی مرسومه که شرکت‌ها از ابزارهای تحلیلگر متن استفاده کنن تا با توجه به چیزهایی که در رسانه‌های مجازی مطرح میشه رضایت مشتریان رو تخمین بزنن.من یک پژوهشگر امور تکنولوژی و حقوق بشر هستم. کار من درک تاثیرات اجتماعی و حقوق بشری تکنولوژی‌های دیجیتاله. به همین دلیل بود که تصمیم گرفتم از قضیه‌ی کمپین «روشن و دوست‌داشتنی» برای بررسی APIهای معمول تحلیلگر احساس استفاده کنم. به خصوص، این موضوع برام سوال بود که مثبت بودن عبارت «روشن و دوستداشتنی» (Fair & Lovely) از نظر احساسی، تا چه حدی ممکنه ابزار تحلیل احساس را گمراه کنه و منجر به اشتباه در دسته‌بندی احساس جمله‌ها بشه، حتی اگه جمله از لحاظ احساسی اصلا بار معنایی مثبتی هم نداشته باشه.این سوال باعث شد که این پست رو بنویسم، مخصوصا برای توسعه‌دهندگانی که از تکنولوژی‌های یادگیری ماشین به عنوان خدمات (MLaaS) استفاده میکنن و همینطور برای همکارانم که به تاثیرات اجتماعی و حقوق بشری تکنولوژی علاقه‌مندن.من API تحلیلگر لحن IBM (IBM Tone Analyzer API) و API تحلیلگر احساس متن ParallelDots (ParallelDots Text Analysis Emotion API) رو انتخاب کردم و نتایجشون رو روی توییت‌های مربوط به محصول «Fair & Lovely» شرکت یونیلور امتحان کنم. در ادامه توضیح میدم که ارائه دهندگان این APIها چه سیاست‌های حفظ حریم خصوصی‌ای دارن، شرایط خدمات اون‌ها به چه صورته، چه مستنداتی از مدل‌های یادگیری ماشین‌شون ارایه میدن و در آخر بهتون میگم که برای انتخاب API چه معیارهایی باید داشته باشین.خب، فرض میکنیم شما یک توسعه‌دهنده یا تحلیلگر رسانه‌های مجازی هستید، و شرکت یونیلور سراغتون اومده تا احساس مشتریاش رو از محتویات رسانه‌های مجازی تحلیل کنید. چیکار می‌کنید؟فرض می‌کنیم شما مهارت، اطلاعات و داده‌ی لازم برای ساختن مدل یادگیری ماشین مخصوص این موضوع رو ندارید و نمی‌خواید از مدلهای از پیش ساخته شده (pre-trained) هم استفاده کنید. در عوض ساده ترین مسیر رو انتخاب میکنید: استفاده از API تحلیلگر احساس حاضر و آماده که مدل اصلی‌اش توسط یه شرکت دیگه ساخته شده. حالا اگر شما جزو دسته‌ی آخر هستید، برای انتخاب و بکارگیری مسئولانه‌ی این APIها چه معیاری دارید؟ای-پی-آی ها (API) قانونی دارند -- و قدرتی!اول از پایه شروع میکنیم. رابط برنامه‌نویسی کاربردی (API) به نرم‌افزارهای مختلف کمک میکنه با هم ارتباط برقرار کنن. API اجازه میده که یک اپلیکیشن درخواستی ارائه بده (درخواست دسترسی به داده یا خدمات) و یک اپلیکیشن دیگه به این درخواست پاسخ بده و اون دسترسی رو میسر کنه. برای مثال، اگه شما یک شرکتی مثل توییتر هستید و از پژوهشگران میخواید که از داده‌های شما برای کار پژوهشی‌شون استفاده کنن، با یک API اجازه‌ی دسترسی به این داده‌ها رو در اختیارشون میذارید یا مثلا اگر بخواید با استفاده از اینترنت اشیا (IoT) وسایل هوشمند خونه‌تون رو به هم متصل کنید تا با هم ارتباط برقرار کنن (مثلا لامپ هوشمند‌تون به رویدادهای سالنامه‌ی گوگل‌تون واکنش نشون بده) باید این خدمات رو از طریق API به هم مرتبط کنید.اما مثل هر جور تعاملی، باید بین این سرویس‌ها قبل از شروع تعامل قوانینی وجود داشته باشه. این قوانین از طریق سیاستهای API، سیاستهای مرتبط با توسعه‌دهنده‌ها و شرایط خدمات شرکت ارائه دهنده‌ی API وضع میشه. اما این تعاملات و سیاست‌هایی که گاهی شامل دسترسی به اطلاعات شما هم میشه چی هستن؟ اصلا چرا باید مهم باشن؟ این مثال‌‌ها نشون میده که چرا همچین چیزی مهمه.１) داستان کمبریج آنالتیکا و فیسبوک رو یادتونه؟ (محض یادآوری، اطلاعات ۸۷ میلیون کاربر در اختیار کمبریج آنالتیکا قرار گرفت که با استفاده از اون رفتار و علایق سیاسی کاربران فیسبوک رو تحلیل کنه و در نهایت رو انتخاب‌های سیاسی‌شون تاثیر بذاره). خلاصه اینکه، دلیل اصلی این شکل تجاوز به حریم کاربران و اشتراک داده‌ها، سواستفاده از APIهای دسترسی به داده‌‌های فیسبوک بود. نتیجه این شد که بعد از داستان کمبریج آنالتیکا فیسبوک دسترسی توسعه دهنده‌ها به داده‌ها رو با ایجاد تغییراتی در سیاست‌های APIهاش محدود کرد.２) موقع استفاده از APIهای یادگیری ماشین به عنوان خدمات تحلیلگر هم نگرانی‌هایی وجود داره. در چنین موردی قضیه برعکس مثال بالاست. توسعه‌دهنده‌ها داده‌هایی در اختیارشون هست و از شرکتهای بزرگ فناوری میخوان که با دادن دسترسی به APIهای یادگیری ماشین، این داده‌ها رو براشون تحلیل کنن (MLaaS). تحقیقات جوی بولاموینی (Joy Buolamwini) و تیمنیت گبرو (Timnit Gebru) روی مطالعات جنسیتی نشون داد که بسیاری از مدل‌‌های یادگیری ماشین تشخیص چهره تبعیض نژادی و جنسیتی قائل میشن. در نتیجه‌ی این مطالعات، شرکتهای بزرگ فناوری خدمات API شون رو برای سازمانهای آمریکایی محدود کردن (اما کسی نمیدونه که هنوز چه روابط تجاری با سایر کشورها دارن... ??‍♀️).اما مسئولیت توسعه‌دهنده‌هایی که میخوان از این APIهای یادگیری ماشین شرکت‌های فناوری استفاده کنن چیه؟ آیا راهنمایی وجود داره که بهشون کمک کنه APIهای یادگیری ماشین را برای حوزه‌های خاص خودشون یه‌کمی مسئولانه‌تر و بادقت‌تر انتخاب کنن و به کار بگیرن؟تحلیل احساس: تحلیلگر لحن IBM (IBM Tone Analyzer API) یا تحلیلگر احساس ParallelDots (ParallelDots Text Analysis Emotion API)خب، برای اینکه از APIهای یادگیری ماشین مبتنی بر فضای ابری که حی و حاضر و به‌ وفور موجوده استفاده کنید، چه‌کار میکنید؟ یک حساب کاربری میسازید و دسترسی به API به شما داده میشه. داده‌های ورودی رو وارد میکنید، خدمات‌دهنده‌ی ابری «جادو»ش رو روی اون‌ها اجرا میکنه، و نتایج به عنوان داده خروجی در اختیار شما قرار میگیره. خیلی راحت!‌ حتی لازم نیست دانشی از علوم داده و یادگیری ماشین داشته باشید تا بتونید این API رو با محصولتون تلفیق کنید. یا حداقل میشه گفت این ادعاییه که شرکتها میکنن تا خدماتشون رو در بازار ارائه کنن، مثل تصویر زیر:?ولی از شوخی گذشته، به‌ عنوان یک توسعه‌دهنده شما یک سری معیار برای انتخاب یک سرویس دارید: معیارهایی مثل دقت، هزینه، و سرعت. اما اگه بخواید بر اساس معیارهای دیگه‌ای مثل حریم خصوصی، امنیت، عادلانه بودن، و شفافیت یه سرویس یادگیری ماشینی رو انتخاب کنید چطور؟ چه روندی رو طی میکنید؟ چه چیزهایی رو چک میکنید؟بیاید برگردیم به توییت‌های «Fair & Lovely». من با فرض اینکه خودم یک توسعه‌دهنده باشم، چند صدتا توییت درباره‌ی «Fair & Lovely» به زبان انگلیسی رو به کمک Twint جمع‌آوری کردم. بعد رفتم سراغ RapidAPI که پلتفرمیه که به توسعه‌دهنده‌ها کمک میکنه APIهای مختلف رو مقایسه و انتخاب کنن، و تحلیل‌گر لحن IBM (IBM Tone Analyzer API) و تحلیل‌گر متن ParallelDots (ParallelDots Text Analysis Emotion API) رو به عنوان بهترین گزینه‌ها انتخاب کردم. هر دو سرویس تعهد میدن که احساساتی مثل ترس، عصبانیت، لذت، شادی و غیره رو از توییت‌ها برداشت کنن.بعد توی هر دو سرویس ثبت‌نام کردم و اعتبار لازم برای حساب کاربر توسعه دهنده رو دریافت کردم. حساب کاربری رایگان IBM آی-بی-ام ۲۵۰۰ درخواست API در ماه رو میپذیره، و ParallelDots برای ۱۰۰۰ درخواست در روز رایگانه.در نهایت، آزمایش زیر رو اجرا کردم. نتایج زیر از نوشته‌های توییت‌های «روشن و دوستداشتنی» به عنوان داده ورودی و جمع‌آوری خروجی API ها بدست اومده. که میتونید توی این spreadsheet هم ببینیدش.لطفا به تفاوت چشمگیر نتایج بین دو سرویس توجه کنین.منبعهمچنین عبارت «Fair & Lovely» را به عبارتهای خنثی‌تری مثل «your product» و «this product» تغییر دادم. نتیجه‌ی خروجی تغییر کرد! هر چند که بر مبنای تحلیل آدمی‌زادی عملا این جمله‌ها و احساس ‌پشتشون یکی ‌هستن.منبعاگر من جای توسعه‌دهنده‌ی فرضی‌ داستانمون بودم با این نتایج غلط و غلوط دیگه از این ابزارها برای این مورد خاص استفاده نمیکردم. شما بگین که آیا جمله‌ی «یونیلور، Fair & Lovely را متوقف کن، دادخواست را امضا کنید!» شاد و سرخوش به نظر میرسه؟ ??‍♀️اما بیاین فرض کنیم توسعه‌دهنده‌ی فرضی ما هنوز فکر میکنه استفاده از این ابزارها مفیده. در این صورت باید موارد زیر رو در نظر بگیریم. این رو هم بگم که این لیست خیلی ابتداییه و به هیچ وجه لیست کاملی نیست. اما حداقل به شما نشون میده به عنوان یک توسعه دهنده موقع تصمیم‌گیری برای استفاده از یک ابزار دنبال چه چیزی بگردید.ثبت نام: سیاستهای حریم خصوصی (Privacy Policies) و شرایط خدمات‌دهی (Terms of Service)موقع ثبت‌نام برای دریافت حساب کاربری توسعه دهنده،‌ همیشه شرایط خدمات‌دهی (ToS) و سیاستهای حریم خصوصی رو به طور کامل مطالعه کنید. به طور خاص، در مورد اینکه اطلاعات خودتون و اطلاعاتی که به عنوان داده‌های ورودی به شرکت میدین چطور استفاده میشه به خوبی کنجکاو باشید. سرویسی به نام Polisis وجود داره که به شما کمک میکنه سیاست‌های خدمات‌دهنده‌های مختلف رو باهم مقایسه کنید (عالی نیست اما میتونه بهتون کمک کنه).سیاستهای حریم خصوصی توسعه دهنده و سیاستهای مختص به هر محصول رو مطالعه کنید تا بفهمید این شرکت چه اطلاعاتی از شما --به عنوان دارنده‌ی حساب کاربری-- جمع‌آوری میکنه، چطور از این اطلاعات محافظت میکنه؟ آیا داده‌های در حال سکون و در حال حرکت رمزگذاری میشن؟ آیا منظورشون از metadata رو درست تعریف کردن؟ آیا داده‌هایی که شما به عنوان ورودی به اون‌ها میدین رو نگهداری میکنن؟ برای چه مدت؟ آیا فایلهای ورودی ذخیره میشن؟در اینجا مقایسه‌ای بین سیاستهای دو سرویس مورد نظر خواهیم داشت. (از اینجا به بعد، مقایسه‌های من بین جزییات تحلیلگر لحن IBM (IBM Tone Analyzer API) و تحلیلگر متن ParallelDots (ParallelDots Text Analysis Emotion API در باکس‌های خاکستری مانند زیر نشون داده میشه) تحلیلگر لحن IBM (IBM Tone Analyzer API): وقتی حساب کاربر توسعه دهنده‌تون رو میسازید، IBM سیاستهای حریم خصوصی‌اش رو به شما نشون میده که از بازدید وبسایت گرفته تا خدمات ابری رو شامل میشه. بعضی از چیزایی که میگن یک مقدار مبهمه. برای مثال:«IBM ممکن است اطلاعات شخصی شما را با شرکای منتخب مطرح کند تا به کمک آنها به شما سرویس ارائه...» اما شرکاشون چه کسانی هستن؟یا «ما اطلاعات شخصی شما را بیش از زمانی که لازم باشد که به اهداف مورد نظر برسیم نگهداری نمیکنیم». «بیش از زمانی که لازم باشد» یعنی چه‌قدر؟ اگه میخواین اطلاعات مخصوص به جمع‌آوری داده و نگهداریشون توسط API تحلیلگر لحن رو بدونید به قسمت مستندات (document page) مراجعه کنید. بعضی اطلاعات مفیدی که دادن اینهاست:. لیست درخواستها (request loggings) در تحلیلگر لحن غیرفعال شده.. این سرویس داده‌های مربوط به درخواست‌ها و پاسخ‌ها رو لیست‌بندی یا ذخیره نمیکنه. . این سرویس «اطلاعات کاربران را پردازش میکند اما آن را ذخیره نمیکند. کاربران تحلیلگر لحن نیازی به احراز هویت، حفاظت و یا حذف اطلاعات خود از این سرویس ندارند». ParallelDots: وب سایت ParallelDots ادعا میکنه این مجموعه «از داده‌های شما محافظت میکند و مفاد قرارداد GDPR را کلمه به کلمه اجرا میکند». ولی توضیح بیشتری داده نشده. کدوم داده‌ها؟ ابرداده‌ها (metadata) یا اطلاعات توسعه دهنده یا اطلاعات کاربری؟ شرایط استفاده از خدمات ParallelDots میگه «شما نمیتوانید از این سرویس به هدف مانیتورینگ،‌ بازدهی یا کارایی یا دیگر اهداف مقایسه‌ی شرکتها با یکدیگر و رقابت استفاده کنید». این خیلی برای من عجیبه. این یعنی من همین الان با نوشتن این پست شرایط استفاده از خدماتشون رو نقض کردم؟مستندسازیاگه شرکتی مستنداتی مانند Model Card for Model Reporting رو برای یک مدل یادگیری ماشین به‌خصوص تهیه کرده باشه، قبل از استفاده‌ی سرویس اون رو مطالعه کنید. مستندات API رو مطالعه کنید و دنبال اطلاعات درباره‌ی امنیت API، تحقیقات پیش-زمینه‌ای، داده‌های آموزشی، معماری و الگوریتم‌ها و معیارها‌ی سنجش مدل بگردید.? امنیت APIدر چند سال گذشته مثال‌های زیادی از درز اطلاعات استفاده شده در APIهای ناامن اتفاق افتاده. این وظیفه‌ی تامین‌کننده‌ی API هست که نقاط ضعف امنیتی رو برطرف کنه، درخواستهای مشکوک رو شناسایی کنه و مخابره‌ها رو رمزگذاری کنه. حتما مطمئن بشید که تامین کننده‌ی API این مسائل امنیتی رو رعایت کرده باشه- برای اطلاعات بیشتر درباره‌ی امنیت APIها اینجا رو بخونید.در زیر مقایسه‌ی دیگری بین امنیت API ها برای دو سرویس مورد نظرمون انجام شده:تحلیل‌گر متن IBM: پیشنهاد IBM به توسعه دهندگان اینه که از IBM Cloud Activity Tracker with LogDN برای مانیتورینگ فعالیت‌هایی که در حساب کاربری ابری اتفاق می‌افته استفاده کنند و فعالیت‌های مشکوک رو بررسی کنند. برای افتتاح حساب از شما خواسته میشه پسورد قوی‌ای انتخاب کنید و برای شما یک کد تایید فرستاده می‌شه تا به حساب کاربری توسعه دهنده‌تون تایید بشه. ParallelDots: اطلاعاتی راجع به امنیت API در صفحه مستنداتش موجود نیست. توسعه دهندگان موقع ثبت نام لازم نیست پسورد قوی‌ای انتخاب کنند،‌ البته ParallelDots برای شما یک ایمیل تاییدیه می‌فرسته تا حساب کاربری¬تون رو تایید کنه.? مدل دقیق و جامع.. اما برای چه گروهی؟ در داستان «روشن و دوستداشتنی» زبان نقش بسیار مهمی رو ایفا میکنه. توییت‌هایی که فقط به زبان انگلیسی نوشته شده نمیتونه درک درستی از گفتگوهای مربوط به این کمپین که در هندوستان اتفاق افتاده به ما بده چون این محصول منحصر به یک زبان نیست.مستندات API مدنظرتون رو چک کنید و ببینید زبان دیگری رو پشتیبانی میکنه یا خیر. اگه جواب مثبته، میزان دقتش برای زبانهای مختلف به چه شکله؟ سرویس دهنده‌ها معمولا ادعا می‌کنند که زبان‌های مختلفی رو پشتیبانی میکنند اما اطلاعاتی راجع به دقت مدل و معیارهای محاسبه برای هر زبان به‌خصوص رو ارائه نمیدن. مستندات API و تحقیقات زمینه‌ای رو زیر و رو کنید، تا بفهمید معیارهاشون برای هر زیرگروه چیه.در مورد موضوع مدنظرمون من این موارد رو پیدا کردم:تحلیل‌گر لحن IBM: این شرکت ۱۱ زبان پشتیبانی شده رو لیست کرده. البته،‌ هیچ اطلاعات دقیق‌تری راجع به دقت یا معیارهای دیگه‌ی محاسبه برای زبان‌های مختلف ارائه نشده. ParallelDots: این شرکت هم ۱۴ زبان پشتیبانی شده رو لیست کرده. و هیچ اطلاعات بیشتری درباره‌ی دقت یا معیارهای محاسبه برای زبان‌های مختلف ارائه نکرده.❗️باید و نباید‌های استفاده از مدل بعضی از شرکت‌ها شما رو درباره‌ی کاربردهای پیشنهادی خدماتشون راهنمایی میکنند، مثلا میگن این محصول به درد آنالیز کامنت‌ها و ریووهای مربوط به محصولتون یا بازاریابی میخوره.‌ اما بعضی وقتها این کاربردها خطرناک یا غیراخلاقی اند و منجر به تبعیض بین گروه‌های اجتماعی مختلف، تجسس بیجا و نقض حریم خصوصی میشن. این شرکتها باید در مورد مواردی که توسعه دهنده نباید از خدمات اون‌ها استفاده کنه هم شفاف عمل کنند (هر چند که این موضوع باید و نباید‌ها پیچیدگی‌های زیادی داره...)تحلیل‌گر متن IBM: موارد پیشنهادی استفاده ایناست: بررسی رضایت مشتری در فروم‌های پشتیبانی؛ بررسی رضایت مشتری در پاسخ‌های توییتر؛ پیش‌بینی و جفت کردن کسانی که در اپلیکیشن‌های زوج‌یابی آنلاین شرکت میکنن؛ پیش‌بینی احساسات و تشویق‌ها در سخنرانی‌های TED. چیزی درباره‌ی موارد عدم استفاده گفته نشده.سرویس ParallelDots: دو مورد پیشنهادی استفاده از این سرویس وجود داره: «شناسایی منتقدین و بدگویان به منظور بهبود خدمات برای آن‌ها» و «زیرنظر داشتن برند». چیزی درباره‌ی موارد عدم استفاده گفته نشده.⚖️ سوگیری و برابری در چند سال گذشته محققین و متخصصان راجع به به سوگیری‌ها و پیامدهای تبعیض‌آمیز سیستمهای یادگیری ماشین هشدارهایی دادند. متخصصین این حوزه که معمولا روی fairness, accountability, and transparency in machine learning کار میکنن جعبه‌ابزارهای (Toolkit) بیشماری ارائه کردن تا شرکت‌ها بتونن موارد مربوط به حقوق کاربران رو در محصولات مبتنی بر یادگیری ماشین‌شون ارزیابی کرده و در مورد ریسک‌های اجتماعی ممکن شفاف عمل کنند. در اینجا یه لیستی درست کردم از جعبه‌ابزارها،‌ مقالات و نوآوری‌های موجود در زمینه‌ی سوگیری و عدالت.تحلیلگر متن IBM: IBM یک سری اطلاعات راجع به تحقیقات پیش‌زمینه‌ای، روند جمع‌آوری داده (داده‌ی توییتر)،‌و روش تفسیر داده‌ها در اختیار شما میذاره. البته اشاره‌ای به پیامدهای تبعیض‌آمیز محتمل نمیکنه و هیچ اطلاعات دقیق‌تری راجع به ساختار جمعیتی و اندازه‌گیری بر اساس زیرگروه‌های متفاوت (زبانی، جنسیتی، سنی و غیره) به ما نمیده. نکته‌ی جالب: محققین IBM خودشون یکی از پیشگامان ارائه‌ی جعبه ابزارهای fairness هستن (سری به IBM 360 بزنین). مثلا یکی از پیشنهادات خودشون این بوده که برای هر مدل ML از فکت‌شیت استفاده بشه تا منبع داده‌ها ، جزییات مدل‌ها، و موارد استفاده مشخص بشه. اما وقتی مدل و محصول خودشون رو می‌بینی نشانی از همچین اطلاعاتی در صفحات محصول نیست. این داستان من رو یاد این شعر نظامی انداخت: عیب کسان منگر و احسان خویش دیده فرو کن به گریبان خویش ParallelDots: هیچ اطلاعاتی درباره‌ی سوگیری و رعایت عدالت پیدا نکردم.? نگهداری و به روز رسانیتحلیل‌گر متن IBM: این شرکت به طور مداوم خدمات خودش رو به روز رسانی می‌کنه و اطلاعاتی درباره‌ی آپدیت‌ها در اختیار شما می‌ذاره. البته در بعضی آپدیت‌ها از جملات مبهم و کلی‌ای مثل «همچنین در این آپدیت تغییرات داخلی انجام شد و بهبود یافت» استفاده شده، این تغییرات داخلی چی هستن؟ ParallelDots: نتونستم اطلاعاتی درباره‌ی به روز رسانی و نگهداری پیدا کنم.? فروم‌های توسعه‌دهندگان فروم‌های توسعه دهندگان (در Slack Workspace، Stack Overflow، GitHub،‌ و غیره) به توسعه‌دهنده‌ها کمک میکنند تا بازخوردها رو باهم به اشتراک بگذارن، با همدیگه و خدمات دهنده ارتباط برقرار کنن،‌ و راجع به مسائل مختلفی مثل حریم خصوصی،‌ امنیت،‌ سوگیری و عدالت، توضیح‌پذیexplainabilitylity) یک محصول مشخص و در یک حوزه‌ی خاص با هم مباحثه کنند.تحلیل‌گر متن IBM: IBM Watson یه Slack Workspace داره و فروم توسعه‌دهندگان Stack Overflow. صفحه‌ی GitHub تحلیل‌گر لحن رو می‌تونید اینجا ببینید. ParallelDots: این شرکت هم یک صفحه‌ی GitHub داره.پیشنهاداتپیشنهاداتی به توسعه دهندگان از APIهای یادگیری ماشین کورکورانه استفاده نکنید، مخصوصا وقتی سازوکارشون شفاف نیست. علاوه بر معیارهایی چون هزینه،‌ سرعت، و دقت معیارهای مربوط به سوگیری و عدالت، حریم خصوصی، امنیت و شفافیت و explainability و interoperability رو هم در نظر بگیرید. اگه در بخش مستندات چیزی راجع به سوگیری پیدا نکردید از سرویس‌دهنده بخواین که اگر مدل رو بر اساس معیار‌های سوگیری ارزیابی کردن، مدارکش رو در اختیارتون بذارن. وظیفه‌ی اونهاست که این اطلاعات رو به صورت آنلاین منتشر کنن یا جزییاتش رو در اختیارتون بذارن. از قدرتتون در جایگاه توسعه‌دهنده و خریدار سرویس استفاده کنید، حتما توجه میکنن!به موضوعی که میخواین برای اون از ابزار استفاده کنید فکر کنید. چه کسی ممکنه از پیامدهای استفاده از اون API یادگیری ماشین برای محصول مورد نظر آسیب ببینه؟ به جنسیت، نژاد، مذهب، سن، زبان، لهجه،‌کشور، موقعیت اجتماعی-اقتصادیشون فکر کنید (برای مطالعه‌ی بیشتر درباره‌ی گروه‌های آسیب‌پذیری که تحت حفاظت پیمان‌نامه‌های حقوق بشری هستند اینجا رو مطالعه کنید). در اینجا ابزارهای ارزیابی ML رو به روز رسانی میکنم؛ ممکنه این لیست به روند ارزیابی شما کمک کنه.به دنبال مجموعه داده‌ها و benchmark‌هایی باشید که بتونید از اون‌ها برای ارزیابی پیامدهای تبعیض‌آمیز پروژه‌های ML استفاده کنید (برای مثال Equity Evaluation Corpus یک مجموعه داده‌ی نشان‌شده است که برای سنجش وجود تبعیض در سیستمهای تحلیل احساس استفاده میشه). با افرادی که در ساخت چنین benchmark هایی نقش دارن ارتباط بگیرید و از اونها برای بررسی مدل مد نظرتون در حوزهای که کار می‌کنید کمک بگیرید. برای پیدا کردن افرادی که روی این مسائل کار میکنند به FAccT conference مراجعه کنید.وقتی متوجه شدید که سرویس API یادگیری ماشینی که باهاش کار میکنید در حوزه‌ی کاری بخصوص شما از نظر اخلاقی مشکلاتی داره، از طریق ساخت یک زیرگروه یا issue در صفحه‌ی GitHub اون شرکت،‌ یا Stack Overflow، و یا صفحات اجتماعی مختص توسعه‌دهندگان و پرداختن به موضوع مورد نظرتون،‌ توسعه‌دهنده‌های دیگه رو هم از این موضوع با خبر کنید. تقریبا تمام سرویس‌دهندگان چنین پلتفرم‌هایی دارن که توسعه‌دهنده‌ها بتونن اونجا مسائل‌شون رو باهم به اشتراک بگذارن. سرویس‌دهندگان معمولا میگن امتحان و بررسی ابزارهاشون برای تک تک حوزه‌های مورد استفاده عملا غیر ممکنه، چون خدماتشون ابزاری با استفاده‌ی عامه (general purpose). اما شما میتونید بهشون اطلاع بدید که چه مشکلات اخلاقی‌ای حین استفاده از این ابزار تو حوزه‌ی خاص شما وجود داشته. و با انتشار عمومی این اطلاعات می‌تونید به بقیه‌ی توسعه‌دهنده‌هایی که میخوان از این سرویس استفاده کنند هم کمک کنید.اگه تو نرم‌افزارتون از یک API یادگیری ماشین شرکت ثالث هم استفاده میکنید، در سیاست حریم خصوصی و شرایط خدمات این قضیه رو ذکر کنید. به ذکر جمله‌ی «ما از خدمات دیگر شرکت‌ها هم استفاده میکنیم» بسنده نکنید. اطلاعاتی درباره‌ی اون خدمات ثالث هم بدین. در مورد این که حضور این سرویس‌دهنده‌ی ثالث چه تاثیری بر پردازش داده‌ها داره به صورت شفاف توضیح بدین.پیشنهاداتی به سرویس‌دهندگان API یادگیری ماشیندرسته که تمرکز این مقاله روی توسعه‌دهندگان شخص ثالثه و نه روی سرویس‌دهندگان. اما برای اینکه بدونیم مسئولیت‌های مهم سرویس‌دهندگان در قبال اطلاع رسانی به توسعه دهندگان چیه، میشه گفت:مستندسازی کنید و شفاف باشید!‌ معیارهای مربوط به سوگیری و عدالت رو در لا‌به‌لای یک کتابچه‌ی ۵۰۰ صفحه‌ای پنهان نکنید. از زبان ساده‌تر و UI شفاف و با کارکرد آسان استفاده کنید که توسعه دهندگان رو حین مطالعه‌ی معیارهای مربوط به عدالت و حریم خصوصی راهنمایی کنه، اون هم قبل از اینکه در سرویس شما ثبت نام کنن.در صفحات اجتماعی و پورتال‌های توسعه‌دهندگان‌تون زیرگروه‌هایی درباره‌ی سوگیری، امنیت و حریم خصوصی API تون ایجاد کنید. اجازه بدین توسعه دهندگان از طریق این پورتال‌ها درباره‌ی این مسائل بحث کنن (برای مثال ایجاد یک Slack channel مخصوص در workspace توسعه دهندگان) و از توسعه‌دهندگان بخواید تجربیاتشون رو در مورد مسائلی مثل تبعات اخلاقی و اجتماعی، سوگیری و عدالت، امنیت، و حریم خصوصی حین استفاده از سرویس شما به اشتراک بگذارن (بعضی نمونه‌های خوب عبارتند از IBM 360 Slack Channel, Salesforce UI warnings ). هر نوع حساب کاربری توسعه دهنده (رایگان،‌ استاندارد، ویژه) میزان مسئولیت متفاوتی رو برای شما ایجاد میکنه. برای نظارت سواستفاده‌های احتمالی از سرویستون،‌ حفاظت حریم خصوصی‌اش رو ارتقا بدین. این مقاله چند راه حل امکان‌پذیر رو بهتون ارائه میده: نظارت مسئولانه‌ی سواستفاده از «هوش مصنوعی به عنوان یک خدمات».پیشنهاداتی به منتقدین ML و فعالان حوزه‌ی حقوق بشر و تکنولوژیحرفهای زیادی درباره‌ی دموکراتیزه کردن فناوریهای دیجیتال به گوش میرسه. همینطور درباره‌ی تعامل متقابل (interoperability) خدمات دیجیتال. اینها خیلی خوبه. اما به همراهش نوع جدیدی از تعاملات،‌ جریان اطلاعات، و مالکیت و تسلط بر داده به وجود میاد.هدف این مقاله ایجاد آگاهی درباره‌ی اهمیت این ارتباطات و نقش‌آفرین‌هاییه که معمولا نادیده گرفته میشن. برای توسعه‌دهنده‌ها، که قبل از اینکه این APIها رو با نرم‌افزار خودشون تلفیق کنن،‌ به مسئولیت‌های این کار فکر کنن. همینطور برای محققین سیاست‌گذاری‌های تکنولوژی که این مسائل را تشریح کنن و یک راهنمای عملی برای کمک به بازیگران به ظاهر کوچک این دنیای داده-محور تهیه کنن.وقتی یک سرویس/محصول به خصوص رو نقد می‌کنید با دقت روابط شخص ثالث رو بررسی کنید و پیامدهایی که ممکنه حقوق کاربران رو خدشه دار کنه شناسایی و ارزیابی کنید. حین کارتون توجه بیشتری به مسائلی مثل زنجیره‌ی تامین داده و محصول داشته باشید و نقش و مسئولیت‌های نقش‌آفرینان مختلف اکوسیستم فناوری‌های دیجیتال رو با دقت بررسی کنید.کار من تحقیق روی تاثیرات اجتماعی و حقوق بشری فناوری‌های جدیده. اگر سوالی داشتید برای من ایمیل بفرستید (rpakzad@taraazresearch.org) یا تو توییتر پیام بدید. خوشحال میشم باهاتون صحبت کنم. آدرس وبسایت ما هم اینجاست: taraazresearch.org Taraaz - تراز Taraaz - تراز Thu, 25 Mar 2021 05:17:12 +0430 نگاهی به ملاحظات اخلاقی در طراحی و استفاده از ابزار «ادراکات شخصیتی» یا Personality Insights شرکت IBM https://virgool.io/@taraaz/%D9%86%DA%AF%D8%A7%D9%87%DB%8C-%D8%A8%D9%87-%D9%85%D9%84%D8%A7%D8%AD%D8%B8%D8%A7%D8%AA-%D8%A7%D8%AE%D9%84%D8%A7%D9%82%DB%8C-%D8%AF%D8%B1-%D8%B7%D8%B1%D8%A7%D8%AD%DB%8C-%D9%88-%D8%A7%D8%B3%D8%AA%D9%81%D8%A7%D8%AF%D9%87-%D8%A7%D8%B2-%D8%A7%D8%A8%D8%B2%D8%A7%D8%B1-%D8%A7%D8%AF%D8%B1%D8%A7%DA%A9%D8%A7%D8%AA-%D8%B4%D8%AE%D8%B5%DB%8C%D8%AA%DB%8C-%DB%8C%D8%A7-personality-insights-%D8%B4%D8%B1%DA%A9%D8%AA-ibm-albz7qi5g2aj اصل متن توسط رویا پاکزاد و به زبان انگلیسی نوشته شده است. با تشکر از پ. برای ترجمه.من اصلا از تست‌های شخصیت‌شناسی خوشم نمیاد!مهم نیست که چیزی که درباره‌ت میگن درست باشه یا غلط، دوست ندارم درک مردم از من به چهار حرف، یا پنج عدد، یا چند نشونه خلاصه بشه. اگر بخوام میتونم صفحه‌ها راجع به این بنویسم که چطور این «درک» سرسری و بی‌دقت از شخصیت آدم‌ها میتونه منجر به تبعیض در محل کار، قضاوت‌های اشتباه، یا تجاوز به حریم شخصی اون‌ها بشه، اما هدف این پست این نیست - هر چند که همین موضوع انگیزه‌ی نوشتن این مطب بوده.در اینجا، روی یکی از اشکال جدید تست شخصیت تمرکز میکنم که بر اساس یادگیری ماشین ساخته شده. تست مورد نظر من متعلق به شرکت IBM Watson هست با نام ادراکات شخصیتی (Personality Insights). اونطور که سایت IBM مدعی شده، این ابزار «از تحلیلگرهای زبانی استفاده میکند تا ویژگی‌های شخصیتی ذاتی فرد، شامل پنج اصل (یا O.C.E.A.N)، نیازها و ارزش‌هایش را از طریق ارتباطات دیجیتال مانند ایمیل، پیام‌های متنی، توییت‌ها،‌ و پست‌های فروم‌ها، استخراج کند.»بذارین بهتون بگم این یعنی چه: من محتوای توییترم رو وارد این ابزار کردم و به عنوان خروجی نتیجه‌ی زیر رو دریافت کردم که فرضا قراره نشون‌دهنده‌ی ویژگی‌های شخصیتی، نیازهای مصرفی و ارزش‌های من باشه:اگه به فایل خروجی که اینجا در دسترسه دقت کنید می‌بینید که، براساس نتیجه‌گیری این ابزار من آدمی هستم که احتمالا «هنگام خرید محصول تحت تاثیر تبلیغات آنلاین قرار میگیرم.» علاوه بر این، احتمالا آدمی هستم که دغدغه‌های محیط زیستی دارم و به دیدن مستند علاقه دارم و احتمال اینکه فیلم‌های موزیکال رو دوست داشته باشم کمتره (اعتراض: راستش یکی از سریال‌های مورد علاقه‌ی این روزام Crazy Ex-Girlfriend هست که اتفاقا موزیکاله).بعد از دیدن این نتایج، ذهن منفی‌بافم سریع رفت سمت شرکت Cambridge Analytica،‌ شرکتی که از فعالیت‌های شبکه‌های اجتماعی افراد استفاده کرده بود تا شرح حال روانی و ترجیحات سیاسی‌شون رو حدس بزنه و بر اساس اون رفتارشون تو انتخابات رو پیش‌بینی کنه.بنابراین به عنوان یک محقق در زمینه‌ی تکنولوژی و حقوق بشر، تصمیم گرفتم که در مورد این ابزار تحقیق بیشتری کنم.اول، بیاید ببینیم که ابزار ادراکات شخصیتی (Personality Insights) چطور کار میکنه:در اینجا یه مرور کلی خواهیم داشت که بخشی از اون بر اساس صفحه‌ی GitHub ادراکات شخصیتی IBM و یک سری مستندات منتشر شده‌ی دیگه‌ست:? ورودی: ادراکات شخصیتی توییت‌ها، ایمیل‌ها، پیام‌های متنی،‌ پست‌های وبلاگی، و/یا هرچیزی که فردی که شخصیتش قراره مورد ارزیابی قرار بگیره رو دریافت میکنه. این ابزار در حال حاضر زبان‌های انگلیسی، اسپانیایی، ژاپنی، کره‌ای، و عربی رو طبق گفته‌ی وبسایتش پشتیبانی میکنه،‌ نتایج این ابزار برای زبان‌های عربی و کره‌ای اونقدر خوب نیست و نمیشه روش حساب کرد. کمترین میزان کلمه‌ای که میتونین وارد ابزار کنید تا نتیجه بگیرید ۱۰۰ کلمه‌ست،‌ البته، برای اینکه نتیجه دقت لازم رو داشته باشه حدود ۳۰۰۰ کلمه برای متن ورودی لازم دارید. (demo و مستندات IBM جزییات بیشتری از نوع داده‌ی قابل قبول ارائه کرده‌ان.)? خروجی: بعد از پردازش داده‌های ورودی، ابزار نتیجه‌ی کامل رو ارائه میکنه ( با فرمت JSON یا CSV) که ۵۲ ویژگی شخصیتی شما به ترتیب امتیازی و همچنین رفتار مصرفی شما رو نشون میده. امتیاز بر اساس درصدی از جامعه‌ی نمونه بیان میشه. مثلا، اگه ویژگی «ماجراجویی» من براساس چیزهایی که مینویسم امتیاز ۰.۲۵ گرفته باشه به این معنیه که من از ۲۵٪ جامعه نمونه ماجراجو‌ترم و از ۷۵٪ اونها کمتر ماجراجو هستم.نکته: جامعه‌ی نمونه از کاربران توییتری تشکیل شده که اطلاعات خودشون رو برای تحلیل در اختیار ابزار ادراکات شخصیتی شرکت IBM گذاشته بودن. جامعه‌ی نمونه برای زبان انگلیسی یک میلیون کاربر، برای زبان عربی و ژاپنی صد‌هزار کاربر و برای زبان اسپانیایی هشتاد‌هزار کاربره. شاخصه‌های فردی جامعه‌ی نمونه، مثل سن، جنسیت، سطح سواد و غیره، جایی عنوان نشده بود.ابزار یه امتیاز خام هم در اختیار شما قرار میده که میتونید اگه خواستید برای مقایسه‌ی خودتون با جامعه نمونه‌ی دلخواه خودتون ازش استفاده کنید ( برای مثال امتیاز شما در مقایسه با کارکنان شرکتی که توش کار میکنید).برای کسب اطلاعات بیشتر راجع به فرمت خروجی و تفسیرش به اینجا و اینجا مراجعه کنید.? مدل: روش بنیادی این ابزار بر اساس رویکرد open-vocabulary هست. این روش رو محققان دانشگاه پنسیلوانیا ارائه دادن که روی تحلیل استاتوس‌های فیسبوک ۷۵۰۰۰ کاربر داوطلب کار میکردن. بر اساس این تحلیل و اضافه کردن پرسشنامه‌های شخصیتی، اونها تونستن مدل‌هایی رو بسازن که بر اساس استاتوس‌ها، سن، جنسیت و شخصیت فرد رو میتونه پیش‌بینی کنه.زیرساخت تحلیل زبان Open Vocabulary (منبع)البته ورژن‌‌های اولیه‌ی ابزار ادراکات شخصیتی از تحقیق زبان‌شناسی و فرهنگ لغت روان‌شناسی-زبانی شمارش واژه (LIWC) استفاده میکرد. (برای اطلاعات بیشتر درباره‌ی فرهنگ لغت LIWC میتونین به اینجا مراجعه کنین.)پژوهشگران IBM برای ساختن ابزار ادراکات شخصیتی،‌ یک سری مطالعات انجام دادن و مدل‌های یادگیری ماشین متعددی رو ساختن که بتونن رابطه‌ی بین فعالیت توییتر افراد و ویژگی‌های شخصیتی‌شون رو درک کنن. برای مثال،‌ با مطالعه‌ی ۳۵۰۰ کاربر توییتر،‌ متوجه شدن که افرادی که بیشتر ریتوییت میکنن احتمال اینکه به عنوان فردی متواضع، روراست و خودمانی به حساب بیان، بیشتره. ( لینک مطالعات)به طور خلاصه، ابزار ادراکات شخصیتی از تکنیک تعبیه کلمات GloVe برای ساختن یک جانشین برداری به ازای هر کلمه‌ی متن ورودی استفاده میکنه. بعد اونها رو وارد یه الگوریتم یادگیری ماشین میکنه تا تست بشن و روشون کار انجام بشه (توضیح بیشتری درباره‌ی جزییات این الگوریتم داده نشده؛ گرچه محققین IBM تو مطالعه‌ای با عنوان ۲۵ توییت تا شناختن شما: مدلی جدید برای پیشبینی شخصیت بر اساس شبکه‌های اجتماعی، ویژگی‌های تکنیک تعبیه کلمات GloVe رو با رگرسیون فرایند گاوسی ترکیب کردن تا ویژگی‌های شخصیتی رو استخراج کنن.)? آموزش: این مدل بر اساس پرسشنامه‌های پخش شده بین هزاران کاربر، به همراه اطلاعات به دست اومده از توییتر اونها آموزش داده میشه. اطلاعات بیشتری راجع به ترکیب جمعیتی اونها (سن،‌ جنسیت، زبان، سطح سواد) وجود نداره، اما مطالعات قبلی IBM بیشتر از اطلاعات توییتر و پرسشنامه‌هایی که کاربران انگلیسی زبان پر کرده بودن مدلهاشون رو آموزش داده و تست میکردن.⚖️ معیارهای سنجش: برای فهمیدن دقت ابزار ادراکات شخصیتی، شرکت IBM یک مطالعه‌ی اعتبارسنجی ترتیب داد و پرسشنامه‌های پاسخ داده شده و فید توییتر ۱۵۰۰ تا ۲۰۰۰ شرکت کننده در همه‌ی زبان‌ها رو استفاده کرد. بعد امتیازات به دست اومده از نظرسنجی رو با امتیازات ابزار ادراکات شخصیتی و خطای مطلق میانگین (MAE) و میانگین همبستگی بین دو امتیاز مربوط به موضوعات مختلف ویژگی‌های شخصیتی مقایسه کردن. (در نظر داشته باشید که MAE عددی بین صفر و یکه، و صفر یعنی امتیاز پیش‌بینی شده دقیقا مساویه با امتیاز واقعی (پرسشنامه)، و یک یعنی ماکزیمم خطا. همبستگی عددی بین منفی یک و یکه. در نظر داشته باشید که بهترین همبستگی میانگین عدد ۰.۳۵ هست که خیلی بالا نیست، اما برا اساس چیزی که وبسایت IBM گفته تو ادبیات تحقیق این حوزه، همبستگی‌های بالای ۰.۲ قابل قبول به حساب میاد.)خطای مطلق میانگین و همبستگی میانگین بر اساس زبان در ادراکات شخصیتی IBM (منبع)چند نکته‌ی مهم درباره ی مدل نهایی Personality Insights:مدل‌هایی که قرار باشه با همه ی زبون‌ها کار کنن به یک شکل ساخته میشن. در مورد متن توییتر،‌ مدل تصور میکنه که رفتار افراد در توییتر مستقل از زبان/کشورشون هست. در صورتی که میدونیم اینطور نیست، مثلا این مقاله (Do all birds tweet the same?: characterizing twitter around the world) رو نگاه کنید.این ابزار شاخصه‌های فردی کاربرا مثل سن، جنسیت، نژاد و فرهنگ رو در نظر نمیگیره (برای مطالعه‌ی بیشتر اینجا رو بخونید). البته این امکان وجود داره که IBM در آینده مد‌ل‌هایی طراحی کنه که برای شاخصه‌های فردی رفتار بخصوصی داشته باشه. IBM در همکاری با Acxiom مطالعه‌ای ترتیب داد که در اون بیان شده «به کار گرفتن شاخصه‌های فردی به همراه ویژگی‌های شخصیتی معمولا دقت بیشتری رو در پیش‌بینی رفتار مصرفی افراد در استفاده‌های بازاریابی به همراه داره».خب بعد از کسب یه کمی اطلاعات درباره‌ی روش کار این ابزار، تصمیم گرفتم یه سری آزمایش که در ادامه راجع بهشون حرف میزنم رو انجام بدم:آیا میتونم سیستم رو «بازی» بدم و خودمو کاندیدای شغلی بهتری معرفی کنم؟فرض کنیم من برای کاری درخواست پر کردم که از الزاماتش وبلاگ نوشتن هم هست. شرکت مربوطه از من میخواد که نمونه نوشته‌هام رو براشون بفرستم و من تصمیم میگیرم اونا رو به پستهای قبلی وبلاگم ارجاع بدم. مدیر بخش استخدام هم برنامه‌ش اینه که با استفاده از ابزار اداراکات شخصیتی یه چیزایی درباره‌ی من دستگیرش بشه؛ و سه تا از پستهای قبلی وبلاگ منو وارد ابزار میکنه (Swipe Left: Privacy Practices of Online Dating Apps, Tech workers of the world, unite for human rights!, and Announcing the Humane AI newsletter) و نتیجه‌ش رو میگیره. بعد متوجه میشه که با توجه به این ابزار من تو زمینه‌های «نظم و ترتیب»، «وظیفه‌شناسی»، و «اجتماعی بودن» افتضاحم! آره دقیقا همون ویژگی‌های خوبی که رییست میخواد که حتما داشته باشی...چطوری میتونم درستش کنم؟ ? ممکنه بخوام توی متن‌هام یه تغییرات کوچیکی انجام بدم تا نتایج رو تغییر بده و اینطوری خودم رو کاندیدای بهتری برای این شغل معرفی کنم. وقتی بیشتر درباره‌ی فرهنگ لغت LIWC مطالعه کردم فهمیدم‌ که استفاده‌ی مکرر از یک سری دسته لغت خاص، با ویژگیهای شخصیتی ارتباط مستقیم داره. بنابراین تصمیم گرفتم که ضمیرهای اول شخص مفرد رو تبدیل به جمع کنم و روی متن اصلی یک سری اصلاحات ریز انجام دادم.تغییراتی که روی متن اعمال کردم رو در ادامه میتونید ببینید (که به رنگ سبز کدگذاری شده):قطعه‌ای از پست وبلاگم، ورودی ابزار ادراکات شخصیتی (عبارت‌های تغییرداده شده به رنگ سبز)ماموریت با موفقیت انجام شد! فقط با چند تغییر کوچیک (مثل حذف کردن کلماتی که ممکنه منفی یا خودخواهانه به نظر بیان، مثلا «نگران»، «مال من» و «خودم») ویژگیهای شخصیتی‌‌ام رو طوری بهبود دادم که دیگه یه شخص قابل اعتمادتر و وظیفه‌شناس‌تر به نظر بیام، ایده‌آل برای استخدام!نتیجه¬ی ابزار ادراکات شخصیتی روی پست وبلاگم (متن¬های اصلی و تغییرداده شده؛امتیازات به درصد)یک جایی وسط این تغییرات، علایق احساسی و هنریم رو هم از دست دادم. علاوه بر این، این رو هم در نظر داشته باشید که این نتایج –چه متن اصلی وبلاگم و چه متن تغییر داده شده- با نتایجی که بر اساس توییترم به دست اومده بود (که اول این پست نشون داده بودم) کاملا متفاوتن. فایل‌های ورودی و خروجی رو میتونید از اینجا ببینید.آیا مذهب تاثیر داره؟تو آزمایش دوم، تصمیم گرفتم سخنرانی‌های عمومی ایلهان عمر (نماینده‌ی مسلمان مجلس نمایندگان ایالات متحده) رو به عنوان ورودی به ابزار بدم. درست مثل آزمایش قبلی، متن رو طبق چیزی که در ادامه می‌بینید تغییرات جزیی‌ای دادم:قطعه‌ای از سخنرانی ایلهان عمر، نماینده‌‌ی مسلمان مجلس نمایندگان ایالات متحده (کلمات سخنرانی اصلی به رنگ مشکی و تغییرات به رنگ سبز)و نتیجه این شد که میبینید. تغییرات خیلی چشمگیر نیستن اما باز هم باعث شد به فکر فرو برم که تو مقیاس بزرگتر ممکنه چه تاثیری داشته باشن! (برای دیدن فایل‌های ورودی و خروجی اینجا رو ببینید).نتایج ابزار ادراکات شخصیتی روی سخنرانی ایلهان عمر (متن‌های اصلی و تغییر‌داده شده؛امتیازات به درصد)با به‌کارگرفتن همچین مثالی، قصد ندارم نتیجه بگیرم که ادراکات شخصیتی IBM علیه گروه مذهبی خاصی رفتار تبعیض‌آمیز داره. ولی میخوام نشون بدم که حتما یک متغیر یا ترکیبی از متغیرها یا نوعی الگو درون داده‌های آموزشی (یا قسمت ارائه‌ی واژگان GloVe یا مدل نهایی) وجود داره که چنین تفاوت‌هایی رو ایجاد کرده و درک منطقی که پشت این تفاوتها وجود داره، خیلی ارزشمنده.تا وقتی این مدل مثل یه جعبه سیاه اطلاعاتش نامشخص باشه، نمیتونیم منطق تغییراتی که توی خروجی به وجود میاد رو تفسیر کنیم. نگرانی من اینه که این عدم شفافیت در روش‌های تصمیم‌گیری ابزار، میتونه برای بعضی گروه‌های مذهبی آسیب‌زا باشه. مثلا فرض کنیم که دولت بخواد از این ابزار برای بررسی اپلیکیشن‌ها و درک ویژگی‌های شخصیتی افراد پناهجو استفاده کنه که تو کشور خودشون بخاطر نوشتن و فعالیت‌های مذهبی‌شون محکوم شده باشن.موارد کاربردی و پیامدهای اخلاقیمیشه آزمایش‌های زیادی طراحی کرد که باهاش ابزار ادراکات شخصیتی رو تست کنیم. ولی برای من بیشتر پیامدهای اخلاقی و حقوقی این ابزار اهمیت داره. چه موارد کاربردی واقعی‌ای وجود داره؟ این ابزار روی حق و حقوق اشتغال ما چه تاثیری میتونه داشته باشه؟ روی حریم خصوصی؟ آزادی بیان و عقیده؟ برای جلوگیری از ریسک پیامدهای مضر احتمالی، IBM چه کارهایی میتونه انجام بده؟برای اینکه درک بهتری از پیامدهای اخلاقی و حقوقی این ابزار داشته باشم، از «اصول راهنمای تجارت و حقوق بشر سازمان ملل» یا UN Guiding Principles on Business and Human Rights به‌ عنوان راهنما استفاده کردم که بتونم درک کنم که در موارد مختلف چطور حقوق گروه‌های آسیب‌پذیر ممکنه تحت تاثیر قرار بگیره. در اینفوگرافیکی که میبینید، سعی کردم منظورم‌ رو از UNGP و «سنجش اثرات حقوق بشری» نشون بدم.خلاصه‌ای از حقوق بشر جهان‌شمول، اصول راهنمای تجارت و حقوق بشر سازمان ملل و لیست کنوانسیون‌ها شرکت IBM ادعا میکنه که ابزار ادراکات شخصیتی میتونه برای اهداف بازاریابی و جذب مشتری، ایجاد ارتباط بین افراد (مثلا زوج‌یابی، پیدا کردن دکتر و...)، و نوشتن رزومه مورد استفاده قرار بگیره. علاوه براین کاربردهای خاصی هم برای این ابزار وجود داره مثل «پایش و پیش‌بینی سلامت روانی» و «پایش عناصر رادیکال و نابهنجار از طریق شبکه‌های اجتماعی» (شناسایی کردن نشانه‌های زودهنگام رادیکالیزه شدن).وقتی داشتم پستهای وبلاگ IBM رو درباره‌ی بعضی مواردی که در اون از ابزار ادراکات شخصیتی استفاده شده مطالعه میکردم، دو کاربردی که در ادامه میگم نظرم رو جلب کرد.شرکت KangoGift ابزارهای مربوط به منابع انسانی (HR) رو به منظور «تصویر کردن، شناسایی، پاداش دادن، و تقویت رفتارها و اعمال کارکنان نمونه» ارائه میده. با کمک IBM Cloud و تحلیل‌گر لحن واتسون و ابزار ادراکات شخصیتی. این شرکت ادعا میکنه که «هزاران مدیر از ۲۰ کشور دنیا از ابزارهای ما برای تشخیص اینکه چه کسی، جه زمانی و چرا باید در محل کار مورد توجه قرار گیرد استفاده می‌کنند.»این شرکت ابزارهای مربوط به منابع انسانی (HR) رو به منظور «تصویر کردن، شناسایی، پاداش دادن، و تقویت رفتارها و اعمال کارکنان نمونه» ارائه میده. با کمک IBM Cloud و تحلیل‌گر لحن واتسون و ابزار ادراکات شخصیتی. https://www.ibm.com/blogs/client-voices/high-tech-ai-solution-boosts-employee-engagement/شرکت MXM از ادراکات شخصیتی IBM برای تصمیم‌هایی مربوط به استخدام افراد،‌ مدیریت استعدادها، و بهینه کردن بازدهی تیمی استفاده میکنه. MXM ادعا میکنه که موسسه‌های آموزشی هم میتونن از خدمات اونا برای «کمک به دانشجویان برای انتخاب رشته‌ی درست» استفاده کنن. همچنین ادعا میکنه که اونها یکی از بهترین ارائه‌کنندگان خدمات منابع انسانی برزیل هستن. میتونید از اینجا بیشتر راجع بهشون بخونید.به نظر من، درباره‌ی موارد اشاره شده در بالا، مهم‌ترین نگرانی‌هایی که در مورد حقوق افراد وجود داره اینها هستند:حق برابری و آزادی از تبعیض (بند۲ بیانیه‌ی جهانی حقوق بشر یا UDHR)حق داشتن شرایط عادلانه و مطلوب کاری و فرصت‌های شغلی برابر (بند ۲۳ UDHR؛ عنوان هفتم حقوق شهروندی قانون ۱۹۶۴ آمریکا)شاید براتون سوال باشه که چرا این قطعه از بیانه‌ی جهانی حقوق بشر به موضوع بحثمون مرتبطه؟ الان با یه مثال براتون میگم:انگلیسی زبان دوم منه. اگه شما ایرانی باشید - یا دوستهای ایرانی داشته باشید- میدونید که ما گاهی موقع صحبت کردن و نوشتن به انگلیسی حروف تعریف (a, an, the) رو جا میندازیم. بعضی وقتها هم پیش میاد که he و she رو به جای هم به کار میبریم چون تو فارسی ضمیرها جنسیتی نیست.افراد مختلف عادت‌های نوشتاری و گفتاری متفاوتی دارن. آیا این اشتباهات لپی امتیاز شخصیتی من رو تو ابزار پایین میاره؟ اگه یکی از شرکتهایی که اسمشون آورده شده بخواد متن مصاحبه‌ی من یا یکی از نوشته‌هام رو برای ارزیابی استفاده کنه که تصمیم بگیره من رو استخدام کنه یا بهم ترفیع بده یا نه، در مقابل یه فردی که انگلیسی زبان مادریش هست من چه فرقی خواهم داشت؟در پروژهای به نام «مراقب کلماتت باش» که انجمن ۲۰۱۹ هاروارد/ام‌آی‌تی انجام داده بود،‌ محققین نشون دادن که غلطهای املایی و استفاده‌ی متفاوت از فاصله و ضمایر میتونه چه تاثیر چشمگیری روی نتیجه‌ای که سیستم‌های پردازنده‌ی زبانی معمول به ما میدن، داشته باشه. مطالعات دیگری هم وجود داره که روی نابرابری نژادی که سیستمهای NLP بین توییت‌های انگلیسی آفریقایی-آمریکایی ها و سایر آمریکایی‌ها قائل میشن، متمرکز شده. بعلاوه، محققین به مشکل بزرگی اشاره کردن بعنوان کلیشه‌ها و تعصبات جنسیتی در مفهوم کلمات، که ابراز ادراکات شخصیتی خیلی وسیع ازش استفاده میکنه.خلاصه اینکه،‌ این فاکتورها باعث میشن که اگر بخوان کارکنان رو با ابزارهایی مثل ادراکات شخصیتی ارزیابی کنن، حفظ «شرایط کاری عادلانه و مطلوب» کار خیلی سختی باشه.اما این همه‌ی ماجرا نیست. موارد بسیار زیاد دیگه‌ای هم وجود دارن که در اونها هم حقوق فردی کارکنان ممکنه تحت تاثیر قرار بگیره و محدود بشه. دو نمونه دیگه از مواردی که ممکنه این ابزار حقوق افراد رو زیر پا بذاره یا محدود کنه هم میگم:حق آزادی بیان و عقیده (بند ۱۹ UDHR)حق آزادی گردهمایی و تجمعات صلح‌آمیز،‌ حق سازماندهی و مذاکره‌ی جمعی (بند ۲۰ UDHR، بیانیه ILO در مورد قواعد و حقوق اساسی در کار)بیاین دوباره برگردیم به آزمایشی که رو پست وبلاگم انجام داده بودم. همونطوری که ممکنه یادتون باشه، با یک سری تغییرات جزیی تونستم کاری کنم که کاندیدای شغلی قابل اعتمادتر و وظیفه‌شناس‌تری به نظر بیام. پس اگه بدونم که قراره بر‌اساس توییت‌هام در مورد آینده‌ی شغلی‌ام تصمیم گرفته بشه، این مساله روی اینکه چی مینویسم و چطور مینویسم تاثیر نخواهد گذاشت؟اگه به دلایل نامشخصی (براساس قوانین نامشخصی که ابزار داره) امتیاز ویژگی «به چالش کشیدن قدرت» من بالا باشه، این باعث میشه مدیران اون شرکت در مورد من گارد داشته باشن؟در طول چندسال گذشته،‌ کارکنان حوزه‌ی تکنولوژی و سازمان‌های کارگری اعتراضات زیادی برای محکوم کردن نوع فعالیت‌های شرکت‌ها انجام دادند و خواستار شفافیت بیشتر شدن. آیا کمپانی‌هایی مثل Palantir، Amazon، Uber یا هر کمپانی دیگه‌ای از ابزارهایی مثل ابزار ادراکات شخصیتی استفاده میکنه و امتیاز مربوط به ویژگی «به چالش کشیدن قدرت» رو در کارکنانش براساس ارتباطات ایمیلی، توییت‌ها یا پست‌های فروم‌های عمومی رو از این طریق ارزیابی میکنه؟ آیا این کار مغایر با حق کارکنان برای آزادی اعتراض صلح آمیز و سازماندهی نیست؟یه مثال دیگه هم براتون میزنم:حق برخورداری از حریم خصوصی (بند ۱۲ UDHR)شرکت IBM ادعا میکنه که ابزار ادراکات شخصیتی یه ابزار stateless؛ یعنی «هیچ محتوایی (شامل هرگونه اطلاعات شخصی فرد) در این سرویس ابری ذخیره نمیشود» این خبر خوبیه، البته به نظر من. اما نگرانی من فقط این نیست که آیا IBM خودش این داد‌ه‌ها رو ذخیره میکنه یا نه، بلکه راجع به وجود اون توسعه‌دهندههای شخص ثالثی نگرانم که از API ادراکات شخصیتی برای اپلیکیشنهای خودشون استفاده میکنن. براساس چیزی که IBM میگه «مشتریان مسئولند که در مورد سازگاری مسائل خود با قوانین و مقررات مختلف اطمینان کسب کنند، شامل قانون حفاظت از داده‌های عمومی اتحادیه اروپا. [...] IBM هیچگونه مشاوره‌ی حقوقی، حسابداری یا حسابرسی ارائه نمی‌کند یا گارانتی نمی‌کند که هیچیک از خدمات یا محصولاتش در مورد سازگاری با قوانین یا مقررات برای مشتریان قابل قبول باشد.» (منبع) طرح Lite شرکت IBM به شما اجازه میده بدون پرداخت هیچ هزینه‌ای ۱۰۰۰ درخواست API در ماه برای ابزار ادراکات شخصیتی داشته باشید.خلاصه اینکه،‌ هرکسی به هر دلیلی، میتونه از ابزار ادراکات شخصیتی استفاده کنه و شخصیت شما رو بر اساس نوشته‌های عمومی‌تون، یا ارتباطات ایمیلی‌تون یا فعالیت‌های شبکه‌های اجتماعی‌تون نتیجه‌گیری کنه- بدون اینکه حتی به شما اطلاع داده بشه.??‍♀️ حرف پایانیاونچه که من تو این پست نوشتم فقط نمونه‌ای از خروارها سیستم‌های یادگیری ماشین جعبه-سیاه ماننده که اخیرا به سرعت در حال تکثیرن – شرکت IBM Watson به‌هرحال یکی از هزاران مورده- که میتونن عواقب ناخواسته‌ای داشته باشن. درسته، شکی نیست که موارد استفاده‌ی معتبری برای این ابزار و ابزارهای دیگه مثل این وجود داره. اما به نظر میاد که اثرات بالقوه‌ی اون به خوبی در نظر گرفته نشده بود: چطور میتونیم اطمینان کسب کنیم که فواید چنین ابزاری از آسیب‌های احتمالی که برای ضعیف‌ترین اقشار جامعه ممکنه داشته باشه بیشتره؟اگه شما یک توسعه دهنده هستید که میخواید از هرگونه سرویس‌های ML مبتنی بر فضای ابری برای اپلیکیشن شخصی خودتون استفاده کنید، بهتون قویا توصیه میکنم که مستندات اون سرویس رو زیر و رو کنید و مسائل مربوط به اخلاقیات و حقوق فردی و اجتماعی رو بررسی کنید. سناریو‌های فرضی بسازید و قبل از اینکه بخواید ازش استفاده کنید ابزار رو با اونها تست کنید و ببینید چه تاثیری ممکنه روی افراد و گروه‌های مختلف مثل اقلیت‌های جنسی و جنسیتی، کودکان، اقلیت‌های مذهبی، پناهجویان، و غیره میتونه داشته باشه. ببینید که هر چند‌وقت یه بار سرویس‌ها و مستنداتشون رو آپدیت میکنن. و همیشه به تاثیرات و کاربردهای بزرگتر فکر کنید. (ممکنه روش کاری که تو این دو پست استفاده شده به دردتون بخوره: تعصب جنسیتی و نژادی در APIهای احساسات مبتنی بر فضای ابری NLP، از بین رفتن کیفیت: تکامل ضمنی سرویسهای بینشی کامپیوتری).و در آخر، در مورد خود شرکت IBM، فقط یه درخواست دارم.این «فکت شیت» که کارکنان خودتون در تیم تحقیقاتی IBM پیشنهاد کردن رو پر کنید و به طور عمومی منتشرش کنید: فکت شیت‌ها: اعتماد فزاینده به سرویسهای AI از طریق سند تضمین اعتبار از سوی تهیه کننده. اگه نمیتونید ساختن ابزارهای جعبه سیاه مانند رو متوقف کنید، حداقل به پیشنهاد کارکنان خودتون عمل کنید و یه «فکت شیت» منتشر کنید. شفاف عمل کنید و نشون بدید میتونید یه نمونه‌ی خوب از کاربرد یادگیری ماشین باشید، نه یه نمونه‌ی بد. Taraaz - تراز Taraaz - تراز Wed, 30 Dec 2020 09:17:32 +0330