ویرگول
ورودثبت نام
ادیب شاکر
ادیب شاکر
خواندن ۵ دقیقه·۶ سال پیش

آمار و اطلاعات: ابزار برای پیشرفت یا گرگی در لباس گوسفند؟ (قسمت اول)

در ابتدا پیش از هر چیزی باید این مطلب را بیان کنم که نوشتار ذیل به صورت کامل حاصل تحقیقات فردی بنده نیست و این مکتوب صرفا اقتباسی از مطالعات بنده در علوم داده و آمار میباشد.


قسمت اول: اخلاقیات چگونه وارد آمار و اطلاعات میشود


علم آمار و اطلاعات یکی از گسترده ترین و پردامنه ترین علوم میباشد.
علم آمار و اطلاعات یکی از گسترده ترین و پردامنه ترین علوم میباشد.

همه ی ما هر روز زمانی را صرف مطالعه و مشاهده رسانه ها، تبلیغات، جراید، فضاهای مجازی و ... میکنیم. با کمی دقت بیشتر در مطالب و محتوای رسانه ای که هر روزه شاهد و ناظر آن هستیم، میتوانیم متوجه شویم که نقش آمار و اطلاعات و نتیجه گیری های حاصل از تحلیل آن ها به وسیله علم آمار روز به روز چشم گیرتر، پر رنگ تر و از جهات دیگر ابزاری تر میشود. هر روزه ما در اخباری که دنبال میکنیم شاهد دست کم یک یا دو خبر در دسته های خبری هستیم که شامل نمودارهای رنگارنگ، اعداد و ارقام با صفرهای غیر قابل شمارش، آمار و درصد های پیشرفت یا نزول اقصادی یا فرهنگی و از این قبیل مطالب را به خورد بیننده و شنونده میدهند. اما این آمار از کجا به دست آمده است؟ منبع اینها کجاست؟ طبق چه روش آماری به دست آمده و طی چه پروسه ای تحلیل شده و نتیجه ی آن با چه منطقی به صورت Feed به دست مخاطب میرسد؟

همواره آمار و ارقام نمایش داده شده در رسانه ها برای بخش اعظمی از مخاطبین نامفهوم بوده و منشا آن ها نیز نامشخص است.
همواره آمار و ارقام نمایش داده شده در رسانه ها برای بخش اعظمی از مخاطبین نامفهوم بوده و منشا آن ها نیز نامشخص است.

پاسخ به سوالات بالا نیازمند بیان مباحث تخصصی و پیچیده ای است که از حوصله خوانندگان این نوشتار خارج خواهد شد. اما مساله قابل تامل در کلیه این مباحث نقش قوانین حاکم و حدود اخلاقی و عرفی است که چهارچوب فکری تحقیق و شخص محقق آن را تشکیل میدهد.

یکی از مهم ترین مباحث در حوزه اطلاعات و داده، امنیت داده و حدود عرفی جوامع و اخلاقیات میباشد. در چند ساله گذشته به کررات شاهد مسائلی از قبیل استفاده غیر قانونی از داده های مربوط به کاربران، دزدی اطلاعات، اخاذی به وسیله اطلاعات لو رفته از کاربران و... بوده ایم. اولین و مهم ترین چالش هر تحلیلگر داده و محققی میبایست تعیین چهارچوب و حدود و خطوط قرمز برای پروژه تحقیقی باشد.

اخلاقیات و حدود اخلاقی در مباحث داده و اطلاعات در چندین مرحله از پروسه تحلیل داده مطرح میشود که به صورت کوتاه به شرح ذیل هستند:

1- جمع آوری اطلاعات: جمع آوری داده و اطلاعات باید به صورتی انجام شود که اولا به صورت کاملا شفاف و واضح اجازه دسترسی به اطلاعات از صاحب اطلاعات و داده (کاربر و یا شخص مصاحبه شونده) اخذ شود و ثانیا هیچگونه ضربه ای (احساسی، روانی، مالی و ...) به وی وارد ننماید. همچنین داده های جمع آوری شده میبایست شامل نمونه های مختلف جامعه هدف باشد و هیچگونه جهت گیری خاصی در زمان جمع آوری صورت نگیرد.

2- پاک سازی داده: در زمان پاک سازی و آماده سازی داده (اصطلاح تخصصی: Data Clearance & Data Preparation) به صورت جهت گیرانه و تعصبی با داده های در دسترس برخورد نشود و موجب حذف برخی از جامعه مورد بررسی نشود.

3- تحلیل داده: روش های تحلیل، بررسی، مدل های مورد استفاده و... نباید به صورتی طراحی و پیاده سازی شود که فقط قشر خاصی از جامعه هدف را تحلیل کرده و همچینین بیانگر کلیه واقعیات موجود در داده های جمع آوری شده باشد. (این مساله در زمینه Machin Learning و در سطوح بالاتر در زمینه Artificial Intelligence بسیار عمیق تر و پر رنگ تر باید مد نظر قرار گیرد.)

4- عرضه و نشر نتیجه گیری تحلیل: انتشار نتایج داده نباید موجب وارد شدن ضربه به قشر خاصی از جامعه شود و از طرفی بیانگر واقعیات کلی تحقیق نیز باشد.

همچنین انتشار نتیجه گیری باید به همراه انتشار روند تحلیل و بررسی و مدل های مورد استفاده صورت گیرد تا صحت تحلیل قابل اثبات باشد.

در پروسه یک تحلیل و تحقیق آماری، میتواند یک، دو یا چند محقق دخیل باشند که هر کدام جهتگیری فکری، اخلاقی و اجتماعی به خصوص خود را دارند.
در پروسه یک تحلیل و تحقیق آماری، میتواند یک، دو یا چند محقق دخیل باشند که هر کدام جهتگیری فکری، اخلاقی و اجتماعی به خصوص خود را دارند.


به صورت کلی بر خلاف تصور عامیانه موجود، در حوزه اطلاعات و علوم داده، حدود عرف و اخلاقیات حاکمیت زیادی در کار تحلیلگران و محققین داده دارد. اما مساله قابلل تامل این است که حدود اخلاقی و عرفی در هر کجای جهان تعاریف مختلفی دارد و نمیتوان حدود تعریف شده در یک تحقیق را به تحقیق دیگری تعمیم داد. به همین دلیل هر روزه شاهد موارد زیادی از تخطی از این حدود هستیم و تقریبا میتوان گفت قوانین محکم و مدونی در جوامع توسعه یافته و در حال توسعه برای جلوگیری از این موضوع موجود نیست.

در سال های اخیر تلاش بسیار زیادی در جوامع بین المللی (علی الخصوص جوامع اروپایی) به جهت تدوین قوانین مدون و تعیین حدود مشخص برای جمع آوری و استفاده از داده و اطلاعات (مخصوصا کاربران اینترنتی) صورت گرفته که نتایج مطلوب و چشمگیری از جمله تدوین قانون GDPR (General Data Protection Regulation) داشته است. اما با سرعت کنونی پیشرفت تکنولوژی علی الخصوص در حوزه داده و اطلاعات، زمان نسبتا زیادی طول خواهد کشید تا قوانین و مقررات بتوانند خود را با پیشرفت این حوزه وفق دهند.



در این نوشتار سعی کردم به ساده ترین و کوتاه ترین شکل ممکن روند کلی تحلیل اطلاعات و داده را توضیح داده و نقش اخلاقیات و حدود جوامع را در این زمینه بیان کنم.

در نوشتار آتی قصد دارم به نقش رسانه ها و نحوه دستکاری اطلاعات در رسانه های عمومی و همچنین تاثیر آن در خط تفکر جوامع بپردازم. خواهش میکنم در صورت تمایل نوشتار های بنده را دنبال فرمایید.

خوشحال میشوم نظرات و انتقادات خودتان را در مورد نوشتار بنده بیان کنید.




منابع اقتباس:

Ethics and Law in Data Analytics-Geneva Lasprogata, Nathan Colaner, Ben Olsen

Microsoft's Ethics and Law in Analytics and AI

منابع عکس ها:

عکس اول

عکس دوم

عکس سوم

تکنولوژیآماراطلاعاتدادهاخلاقیات
ادیب هستم. در زمینه های مختلفی فعالیت میکنم. عمران، داده و اطلاعات، عکاسی، فروش و... عاشق تکنولوژی! عاشق فیزیک و اخترفیزیک! عاشق گیم! و تقریبا توی هر مبحثی که ازش خوشم بیاد ناخونک میزنم!
شاید از این پست‌ها خوشتان بیاید