javad sadeghi
javad sadeghi
خواندن ۵ دقیقه·۴ سال پیش

کلان داده یا بیگ دیتا در سیاست گذاری : طرح موضوع

مقدمه: توضیحات ابتدایی در ارتباط با موضوع کلان داده و سیاست گذاری

گزارش پیش رو قسمت اول جستاری در باب استفاده از تکنولوژی‌های اطلاعاتی به ویژه کلان داده ها یا بیگ دیتا در اجرای خط‌مشی است. در عدم استفاده از عبارت "فناوری اطلاعات" در عنوان، قصد و نیت‌مندی داشتم و آن هم این بود که عبارت "فناوری اطلاعات" در ایران و در میان فارسی زبانان بیشتر از آن که بار معنایی "فناوری" داشته باشد بار معنایی "ارتباطی" دارد. یعنی با استفاده از این عبارت آن چنان که شایسته است خواننده یا شنونده این آگاهی و هشیاری را به دست نمی‌آورد که در حال صحبت کردن در مورد یک تکنولوژی (مثل کلان داده) است. زمینه شناسی این اتفاق را می‌توان از نگاه‌های متعددی انجام داد که در این مجال نه می‌گنجد و نه منظور است؛ آنچه برای ما اهمیت دارد این است که خواننده به طور کامل هوشیار باشد که با مفهوم و برساخت‌های مربوط به تکنولوژی رو در رو است.

نکته حائز اهمیت بعدی در مطالعه کلان داده یا بیگ دیتا استفاده از عبارت توانمندسازی است. با به کارگیری این عبارت بیشتر تلاش داشته‌ام تا در میان مباحث مهم و اساسی که در این حوزه‌ی جدید در جریان است بخشی را برجسته و از سایرین مرزبندی کنم. تکنولوژی‌های اطلاعاتی در حال حاضر موضوع روز دنیای علم به حساب می‌آیند؛ به طوری که از بیوتکنولوژی تا حقوق همه به گونه‌ای با آن سروکار دارند. سیاست‌گذاری هم از این جریان جدا نبوده و نیست. آنچه ما در میان موضوعات گسترده مورد بحث در مورد تکنولوژی‌های اطلاعاتی برای بررسی انتخاب کرده‌ایم "توانمندسازی"ها است. در واقع شاید بسیاری از منظرهای گوناگون دیگر مانند "سیاست‌گذاریِ تکنولوژی‌های اطلاعاتی" به این مسأله بپردازند؛ مثلاً سیاست‌های مورد نیاز هوش مصنوعی، رمزارزها و ماشین‌های خودران را بررسی و ارزیابی کنند. اما ما در این جستار بیشتر در پی آن هستیم که هر یک از این تکنولوژی‌های اطلاعاتی به چه صورت می‌تواند در زمینه اجرا ، سیاست‌گذران را یاری کند.

یک سوی تحلیل به حوزه اجرا محدود است. در واقع اگر نگاه مرحله‌ای را مد نظر داشته باشیم در این نوشتار اشاره ای به مراحل دیگر مانند دستورگذاری، فرمولیشن، مشروعیت‌دهی و... نداریم. در مقابل در انتخاب تکنولوژی‌ها تا حد امکان دست خود را باز گذاشته‌ایم. یعنی از میان گونه‌های مختلف تکنولوژی مانند کلان داده، بلاکچین، داده باز، هوش مصنوعی، وب معنایی، شبکه‌های اجتماعی و... به گونه‌ای خاص محدود نشده و تلاش کرده ایم تا در صورت وجود کاربرد به این موارد اشاره کنیم. اما از آنجایی که مه‌داده‌ها یا کلان داده‌ها جنس اصلی مورد تحلیل ما هستند در ابتدا در حدی که به کلیت بحث آسیبی وارد نکند به معرفی آن‌ها می‌پردازیم. لازم به ذکر است در مورد بقیه انواع تکنولوژی‌ها در هرکجای متن که به آن‌ها اشاره شد درکادر کوچکی در چند خط آن‌ها را تعریف و در موردشان توضیح خواهیم داد.

کلان داده

اصطلاح کلان داده برای اولین بار در سال ۲۰۰۱ از سوی داگ تنی در موسسه گارتنر، برای اشاره به داده‌هایی که از نظر حجم، سرعت و تنوع در حال افزایش هستند مطرح شد. طبق تعریف داگ تنی، کلان داده شامل اطلاعاتی با حجم زیاد است که با روش‌های نوین پردازش و ذخیره‌سازی برای درک بهتر از دنیا و روند تصمیم‌گیری دقیق‌تر، مورد استفاده قرار می‌گیرند. در سال‌های اخیر، روند توسعه کلان داده در سه بعد مطرح شده از سوی دانگ لنی، رشد چشمگیر و خیره کننده‌ای داشته است. در پژوهش‌های دمکنكور، انگور و ممبری (۲۰۱۳)، سی ال پی چین و ژانگ (۲۰۱۴) و ام. چن، مائو و ليو (۲۰۱۴) گسترش این تعریف در حوزه‌های مختلف بررسی شده که برخی از آن‌ها به شرح زیر است:

کلان داده از نظر تنوع:

کلان داده‌ ها از ابزار و تجهیزات مختلف مانند گوشی‌های موبایلی، حسگرهای محیطی، لاگ نرم‌افزارهای مختلف، دوربین‌ها، میکروفون‌ها، سامانه بازشناسی با امواج رادیویی به شبکه‌های حسگر بی‌سیم و غيره توليد مي‌شوند.

از حیث تنوعموضوعی کلان داده‌ ها، داده‌ها در حوزه‌هایی مانند هواشناسی، ژنتیک، شبیه‌سازی‌های پیچیده فیزیک، تحقیقات زیست شناسی و محیطی جست‌وجوی اینترنت، تبلیغات، جاسوسی، تحلیل‌های اقتصادی و مالی و تجاری تولید و مورد استفاده قرار می‌گیرند.

کلان داده از نظر حجم تولید داده:

بر اساس یک گزارش بین المللی كل داد‌ه‌های جهان در سال ۲۰۰۵ حد ۱۳۰ اگزا بایت، و در سال ۲۰۲۰ به حدود ۴۰ زتا پایت خواهد رسید و حجم تولید داده در هر سال ۹ برابر افزایش پیدا می‌کند.

از نظر سرعت تولید داده:

در هر ثانیه ۱۷ میلیون میلیارد بایت معادل حجم ۳۶۰ هزار لوح فشرده داده در دنیا تولید می‌شود.

در سال ۲۰۱۰ اطلاعات تولید شده در هر روز بیش از کل داده‌های تولید شده تا سال ۲۰۰۳ است.

در گوگل پردازش صدها پایتا بایت در روز و در فیسبوک تولید بالاي ده پتابایت لاگ فایل در هر ماه، انجام می‌شود.


در پژوهش‌های اخیر، علاوه بر ویژگی‌های اشاره شده، ۵ ویژگی دیگر نیز برای کلان داده در نظر گرفته شده است که در مجموع تحت عنوان هشت وی شناخته می‌شوند. این ویژگی‌های جدید عبارتند از: صحت کلان داده ها (كيفيت داده و حفظ مشخصات آن)، نوسان کلان داده ها (نرخ تغییرات زمانی داده‌ها با مدت زمان و دوره نگهداری اطلاعات)، مصورسازی کلان داده ها (به‌کارگیری گراف‌های تصویری و بصری‌سازی اطلاعات برای فهم روابط پیچیده بین آن‌ها)، اعتبار کلان داده ها (اطمینان از روایی اطلاعات علاو بر صحت آن‌ها) و ارزش کلان داده ها (برآورد میزان هزینه جمع‌آوری پردازش و نگهداری اطلاعات در برابر حجم داده) است.



پی‌نوشت
اگر پژوهشگرِ خط‌مشی‌گذاری هوش مصنوعی و یا کنشگر در سطوح مختلف مدیریتی باشید حتما نیاز به مطالعه مجموعه‌ای از اسناد مربوط به این موضوع دارید .در AI Policies and Plans Repository مجموعه‌ای قابل دانلود از
استراتژی‎های ملی در حوزه هوش مصنوعی،
خط مشی گذاری‌های در حوزه هوش مصنوعی،
انواع نقشه‎راه در حوزه خط مشی گذاری هوش مصنوعی،
انواع گزارش‎های معتبر سیاستی معتبر در بعد حاکمیتی هوش مصنوعی،
انواع ابزارهای تحلیلی برای توسعه و ارزیابی هوش مصنوعی،
رتبه‎بندی‌های مختلف در ارتباط سیاست گذاری هوش مصنوعی،
و معرفی منابع معتبر آموزشی و علمی در ارتباط با هوش مصنوعی است.
اطلاعات بیشتر و نحوه دسترسی به این پروژه را در پست زیر بخونید
درباره AI Policies and Plans Repository



از طریق کانال‌های زیر می‌توانید با من در ارتباط باشید:

ایمیل من: javadsadeqi@gmail.com

آیدی تلگرام من: https://t.me/javaadsaadeghi

لینکدین من

توئیتر من

حکمرانی دادهخط مشی گذاری کلان دادهخط مشی گذاری هوش مصنوعیسیاست گذاری هوش مصنوعی
مفلسانیم و هوای می و مطرب داریم...
شاید از این پست‌ها خوشتان بیاید