#مدیر محصول #علاقهمند به هوش مصنوعی #هوادار نرمافزار آزاد #همبنیانگذار جامعه آزاد رایانش ابری اصفهان
مِهداده (کلان داده) چیست؟ (۷)
در قسمتهای پیشین این مجموعه نوشتار به مقدمه، تعاریف، تاریخچه، زنجیره ارزش، نقشه راه فناوری و معماری مِهداده پرداختم. لینک قسمتهای پیشین در پایین همین صفحه گذاشته شده. در ادامه به چالشهای طراحی سیستم مِهداده میپردازم:
طراحی و ساخت یک سیستم تحلیل مِهداده کاری آسان نیست. همانطور که در تعاریف بیان شد، مِهداده ماورای توانایی بسترهای نرمافزاری و سختافزاری موجود است. نرمافزارها و سختافزارهای جدید نیازمند زیرساختها و مدلهای جدیدی برای برطرف کردن یا کاهش چالشهای مربوط به مِهداده است. پژوهشهای اخیر [۱، ۲ و ۳] به بررسی و بحث پیرامون موانع اصلی و بالقوه رشد نرمافزارها و سختافزارهای مِهداده پرداختهاند. این موانع و چالشها به سه دسته تقسیمبندی میشوند که عبارتند از:
۱. چالشهای مربوط به جمعآوری و مدیریت دادهها
۲. چالشهای تحلیل دادهها
۳. مشکلات و چالشهای سیستم
۱. چالشهای جمعآوری و مدیریت دادهها
جمعآوری و مدیریت دادهها به حجم زیادی از دادههای ناهمگن و پیچیده اشاره دارد. برخی از چالشهای این حوزه که باید مورد توجه قرار گیرند در ادامه ذکر شده است.
نمایش دادهها: بسیاری از مجموعه دادهها در نوع، ساختار، مفهوم، سازماندهی، دستهبندی و غیره ناهمگن هستند. یک سیستم نمایش داده مناسب باید طراحی شود تا این ساختار، تنوع و مفاهیم دادهها را به خوبی نمایش دهد و یک فن یکپارچهسازی باید طراحی شود تا این عملیات را به صورت موثر بروی مجموعه دادههای مختلف انجام دهد.
کاهش افزونگی و فشردهسازی دادهها: به طور معمول مقدار زیادی افزونگی داده در مجموعه دادههای خام وجود دارد. روشهای کاهش افزونگی و فشردهسازی خوب میتوانند موثرترین راه برای کاهش سربار باشند.
مدیریت چرخه عمر دادهها: انجام سنجش و محاسبات گسترده روی دادههای در حال تولید با نرخ بیسابقهای در حال افزایش است و مقیاس آن بسیار فراتر از پیشرفتهای بسیار کوچک در فناوری ساخت سیستمهای ذخیرهسازی است. یکی از چالشهای اساسی این است که سیستمهای ذخیرهسازی کنونی نمیتوانند میزبان این حجم از دادهها باشند. در کل ارزش پنهان شده در مِهداده وابسته به تازگی و مداوم بودن دادهها است. در اینجا باید یک تصمیم اساسی گرفته شود که چه قسمتهایی از دادهها باید ذخیره و تحلیل شوند و چه قسمتهایی را باید نادیده گرفت.
حفظ حریم خصوصی و امنیت دادهها: با زیاد شدن خدمات خطوط و گوشیهای تلفن همراه نگرانیها از امنیت و حفظ حریم خصوصی در دسترسی و تحلیل اطلاعات شخصی در حال افزایش است و فهمیدن آنچه باید به منظور حفظ حریم خصوصی انجام شود تا به حریم خصوصی افراد تجاوز نشود بسیار ضروری است.
۲. چالشهای تحلیل دادهها
چالشهای مربوط به تحلیل شامل چالشهای حوزههای مدلسازی، پیشبینی و شبیهسازی که اغلب به دلیل تنوع و ناهمگن بودن در ساختار و کاربرد دادهها به وجود میآید که در ادامه بیان شدهاند.
تحلیل تقریبی: با توجه به این که حجم دادهها در حال افزایش است تحلیل بلادرنگ یک نیاز اساسی است. به دلیل دشوار بودن تحلیل بلادرنگ در چنین مجموعههایی میتوان از نتایج تقریبی استفاده کرد.
تحلیل عمیق: یکی از مباحث مورد توجه در حوزه تحلیل مِهداده کسب دید عمیق و مفید از دادهها است. فنون تحلیلی خبره مانند فنون یادگیری ماشین جهت تحقق این امر بسیار اساسی هستند.
مهمترین ارکان مکانیسم حفظ حریم خصوصی و امنیت، کنترل دسترسی، تبادل امن دادهها و تحلیل با حفظ حریم خصوصی وجود امنیت در ذخیرهسازی و مدیریت دادهها است.
۳. چالشهای سیستم
سیستمهای موازی با مقیاس بزرگ مشکلاتی دارند که برخی از آنها در ادامه بیان شدهاند.
قیاسپذیری: یک سیستم تحلیل مِهداده باید توانایی پشتیبانی از مجموعه دادههای بسیار بزرگ را هم اکنون و هم در آینده داشته باشد. تمامی اجزای یک سیستم مِهداده باید توانایی مقیاسپذیری و انعطافپذیری را با رشد حجم و پیچیدگی دادهها داشته باشند.
همکاری: تحلیل مِهداده یک زمینه تحقیقاتی بین رشتهای است که نیازمند همکاری چندین رشته برای تحلیل و کاوش اطلاعات مخفی و ارزشمند است. یک زیرساخت منسجم مِهداده به دانشمندان و مهندسان از بسیاری از رشتهها اجازه دسترسی به دادهها را میدهد. همین امر ضمن داشتن مزایای متعدد، نیاز به متخصصان از حوزههای گوناگون برای طراحی سیستمهای مِهداده را ایجاد میکند.
پ.ن.۱. باگینامه (وبلاگ شخصیم) با مطالبی در رابطه با دادهکاوی و دیگر مسائل مورد علاقهام به روز میشود.
پ.ن.۲. قسمتهای پیشین را مطالعه کنید:
قسمت اول: مِهداده (کلان داده) چیست؟ (۱)
قسمت دوم: مِهداده (کلان داده) چیست؟ (۲)
قسمت سوم: مِهداده (کلان داده) چیست؟ (۳)
قسمت چهارم: مِهداده (کلان داده) چیست؟ (۴)
قسمت پنجم: مِهداده (کلان داده) چیست؟ (۵)
قسمت ششم: مِهداده (کلان داده) چیست؟ (۶)
مراجع:
[۱]E. B. S. D. D. Agrawal et al., ‘‘Challenges and opportunities with big data—A community white paper developed by leading researchers across the united states,’’ The Computing Research Association, CRA White Paper, Feb. 2012
[۲]A. Labrinidis and H. V. Jagadish, ‘‘Challenges and opportunities with big data,’’ Proc. VLDB Endowment, vol. 5, no. 12, pp. 2032–2033, Aug. 2012.
[۳] S. Chaudhuri, U. Dayal, and V. Narasayya, ‘‘An overview of business intelligence technology,’’ Commun. ACM, vol. 54, no. 8, pp. 88–98, 2011.
مطلبی دیگر از این انتشارات
Machine Learning and EU Data Sharing Practices
مطلبی دیگر از این انتشارات
چرا باید کتاب «همه دروغ میگویند» را بخوانید
مطلبی دیگر از این انتشارات
هوش مصنوعی به کشف قایقهای چینی پنهان در آبهای کره شمالی کمک کرد!