مقدمه: توضیحات ابتدایی در ارتباط با موضوع کلان داده و سیاست گذاری
گزارش پیش رو قسمت اول جستاری در باب استفاده از تکنولوژیهای اطلاعاتی به ویژه کلان داده ها یا بیگ دیتا در اجرای خطمشی است. در عدم استفاده از عبارت "فناوری اطلاعات" در عنوان، قصد و نیتمندی داشتم و آن هم این بود که عبارت "فناوری اطلاعات" در ایران و در میان فارسی زبانان بیشتر از آن که بار معنایی "فناوری" داشته باشد بار معنایی "ارتباطی" دارد. یعنی با استفاده از این عبارت آن چنان که شایسته است خواننده یا شنونده این آگاهی و هشیاری را به دست نمیآورد که در حال صحبت کردن در مورد یک تکنولوژی (مثل کلان داده) است. زمینه شناسی این اتفاق را میتوان از نگاههای متعددی انجام داد که در این مجال نه میگنجد و نه منظور است؛ آنچه برای ما اهمیت دارد این است که خواننده به طور کامل هوشیار باشد که با مفهوم و برساختهای مربوط به تکنولوژی رو در رو است.
نکته حائز اهمیت بعدی در مطالعه کلان داده یا بیگ دیتا استفاده از عبارت توانمندسازی است. با به کارگیری این عبارت بیشتر تلاش داشتهام تا در میان مباحث مهم و اساسی که در این حوزهی جدید در جریان است بخشی را برجسته و از سایرین مرزبندی کنم. تکنولوژیهای اطلاعاتی در حال حاضر موضوع روز دنیای علم به حساب میآیند؛ به طوری که از بیوتکنولوژی تا حقوق همه به گونهای با آن سروکار دارند. سیاستگذاری هم از این جریان جدا نبوده و نیست. آنچه ما در میان موضوعات گسترده مورد بحث در مورد تکنولوژیهای اطلاعاتی برای بررسی انتخاب کردهایم "توانمندسازی"ها است. در واقع شاید بسیاری از منظرهای گوناگون دیگر مانند "سیاستگذاریِ تکنولوژیهای اطلاعاتی" به این مسأله بپردازند؛ مثلاً سیاستهای مورد نیاز هوش مصنوعی، رمزارزها و ماشینهای خودران را بررسی و ارزیابی کنند. اما ما در این جستار بیشتر در پی آن هستیم که هر یک از این تکنولوژیهای اطلاعاتی به چه صورت میتواند در زمینه اجرا ، سیاستگذران را یاری کند.
یک سوی تحلیل به حوزه اجرا محدود است. در واقع اگر نگاه مرحلهای را مد نظر داشته باشیم در این نوشتار اشاره ای به مراحل دیگر مانند دستورگذاری، فرمولیشن، مشروعیتدهی و... نداریم. در مقابل در انتخاب تکنولوژیها تا حد امکان دست خود را باز گذاشتهایم. یعنی از میان گونههای مختلف تکنولوژی مانند کلان داده، بلاکچین، داده باز، هوش مصنوعی، وب معنایی، شبکههای اجتماعی و... به گونهای خاص محدود نشده و تلاش کرده ایم تا در صورت وجود کاربرد به این موارد اشاره کنیم. اما از آنجایی که مهدادهها یا کلان دادهها جنس اصلی مورد تحلیل ما هستند در ابتدا در حدی که به کلیت بحث آسیبی وارد نکند به معرفی آنها میپردازیم. لازم به ذکر است در مورد بقیه انواع تکنولوژیها در هرکجای متن که به آنها اشاره شد درکادر کوچکی در چند خط آنها را تعریف و در موردشان توضیح خواهیم داد.
کلان داده
اصطلاح کلان داده برای اولین بار در سال ۲۰۰۱ از سوی داگ تنی در موسسه گارتنر، برای اشاره به دادههایی که از نظر حجم، سرعت و تنوع در حال افزایش هستند مطرح شد. طبق تعریف داگ تنی، کلان داده شامل اطلاعاتی با حجم زیاد است که با روشهای نوین پردازش و ذخیرهسازی برای درک بهتر از دنیا و روند تصمیمگیری دقیقتر، مورد استفاده قرار میگیرند. در سالهای اخیر، روند توسعه کلان داده در سه بعد مطرح شده از سوی دانگ لنی، رشد چشمگیر و خیره کنندهای داشته است. در پژوهشهای دمکنكور، انگور و ممبری (۲۰۱۳)، سی ال پی چین و ژانگ (۲۰۱۴) و ام. چن، مائو و ليو (۲۰۱۴) گسترش این تعریف در حوزههای مختلف بررسی شده که برخی از آنها به شرح زیر است:
کلان داده از نظر تنوع:
کلان داده ها از ابزار و تجهیزات مختلف مانند گوشیهای موبایلی، حسگرهای محیطی، لاگ نرمافزارهای مختلف، دوربینها، میکروفونها، سامانه بازشناسی با امواج رادیویی به شبکههای حسگر بیسیم و غيره توليد ميشوند.
از حیث تنوعموضوعی کلان داده ها، دادهها در حوزههایی مانند هواشناسی، ژنتیک، شبیهسازیهای پیچیده فیزیک، تحقیقات زیست شناسی و محیطی جستوجوی اینترنت، تبلیغات، جاسوسی، تحلیلهای اقتصادی و مالی و تجاری تولید و مورد استفاده قرار میگیرند.
کلان داده از نظر حجم تولید داده:
بر اساس یک گزارش بین المللی كل دادههای جهان در سال ۲۰۰۵ حد ۱۳۰ اگزا بایت، و در سال ۲۰۲۰ به حدود ۴۰ زتا پایت خواهد رسید و حجم تولید داده در هر سال ۹ برابر افزایش پیدا میکند.
از نظر سرعت تولید داده:
در هر ثانیه ۱۷ میلیون میلیارد بایت معادل حجم ۳۶۰ هزار لوح فشرده داده در دنیا تولید میشود.
در سال ۲۰۱۰ اطلاعات تولید شده در هر روز بیش از کل دادههای تولید شده تا سال ۲۰۰۳ است.
در گوگل پردازش صدها پایتا بایت در روز و در فیسبوک تولید بالاي ده پتابایت لاگ فایل در هر ماه، انجام میشود.
در پژوهشهای اخیر، علاوه بر ویژگیهای اشاره شده، ۵ ویژگی دیگر نیز برای کلان داده در نظر گرفته شده است که در مجموع تحت عنوان هشت وی شناخته میشوند. این ویژگیهای جدید عبارتند از: صحت کلان داده ها (كيفيت داده و حفظ مشخصات آن)، نوسان کلان داده ها (نرخ تغییرات زمانی دادهها با مدت زمان و دوره نگهداری اطلاعات)، مصورسازی کلان داده ها (بهکارگیری گرافهای تصویری و بصریسازی اطلاعات برای فهم روابط پیچیده بین آنها)، اعتبار کلان داده ها (اطمینان از روایی اطلاعات علاو بر صحت آنها) و ارزش کلان داده ها (برآورد میزان هزینه جمعآوری پردازش و نگهداری اطلاعات در برابر حجم داده) است.
پینوشت
اگر پژوهشگرِ خطمشیگذاری هوش مصنوعی و یا کنشگر در سطوح مختلف مدیریتی باشید حتما نیاز به مطالعه مجموعهای از اسناد مربوط به این موضوع دارید .در AI Policies and Plans Repository مجموعهای قابل دانلود از
استراتژیهای ملی در حوزه هوش مصنوعی،
خط مشی گذاریهای در حوزه هوش مصنوعی،
انواع نقشهراه در حوزه خط مشی گذاری هوش مصنوعی،
انواع گزارشهای معتبر سیاستی معتبر در بعد حاکمیتی هوش مصنوعی،
انواع ابزارهای تحلیلی برای توسعه و ارزیابی هوش مصنوعی،
رتبهبندیهای مختلف در ارتباط سیاست گذاری هوش مصنوعی،
و معرفی منابع معتبر آموزشی و علمی در ارتباط با هوش مصنوعی است.
اطلاعات بیشتر و نحوه دسترسی به این پروژه را در پست زیر بخونید
درباره AI Policies and Plans Repository
از طریق کانالهای زیر میتوانید با من در ارتباط باشید:
ایمیل من: javadsadeqi@gmail.com
آیدی تلگرام من: https://t.me/javaadsaadeghi