کلان داده به مجموعه های وسیع و متنوعی از اطلاعات اشاره دارد که با سرعت های فزاینده ای رشد می کنند. این شامل حجم اطلاعات، سرعت یا سرعتی است که در آن ایجاد و جمعآوری میشود، و تنوع یا دامنه نقاط دادهای که تحت پوشش قرار میگیرند (معروف به "سه برابر" دادههای بزرگ). کلان داده اغلب از داده کاوی به دست می آید و در قالب های مختلف به دست می آید.
کلان داده ها را می توان به عنوان بدون ساختار یا ساخت یافته طبقهبندی کرد. داده های ساختاریافته شامل اطلاعاتی است که قبلاً توسط سازمان در پایگاه های داده و صفحات گسترده مدیریت شده است. غالباً ماهیت عددی دارد. داده های بدون ساختار اطلاعاتی هستند که سازماندهی نشده اند و در یک مدل یا قالب از پیش تعیین شده قرار نمی گیرند. این شامل داده های جمعآوری شده از منابع رسانه های اجتماعی است که به موسسات کمک می کند اطلاعات مربوط به نیازهای مشتری را جمعآوری کنند.
کلان داده ها را می توان از نظرات به اشتراک گذاشته شده عمومی در شبکه های اجتماعی و وب سایت ها، که به طور داوطلبانه از وسایل الکترونیکی شخصی و برنامه ها جمعآوری می شود، از طریق پرسشنامه، خرید محصول و بررسی الکترونیکی جمعآوری کرد. وجود حسگرها و سایر ورودیها در دستگاههای هوشمند امکان جمعآوری دادهها را در طیف وسیعی از موقعیتها و شرایط فراهم میکند.
کلان داده ها اغلب در پایگاه های داده کامپیوتری ذخیره می شوند و با استفاده از نرم افزارهایی که به طور خاص برای مدیریت مجموعه های داده های بزرگ و پیچیده طراحی شده اند، تجزیه و تحلیل می شوند. بسیاری از شرکت های نرمافزار به عنوان سرویس (SaaS) در مدیریت این نوع داده های پیچیده تخصص دارند.
تحلیلگران دادهها به رابطه بین انواع مختلف دادهها، مانند دادههای جمعیتی و سابقه خرید، نگاه میکنند تا تعیین کنند که آیا همبستگی وجود دارد یا خیر. چنین ارزیابیهایی ممکن است توسط شخص ثالثی که بر پردازش دادههای بزرگ در قالبهای قابل هضم تمرکز دارد، در داخل یا خارج از کشور انجام شود. کسبوکارها اغلب از ارزیابی دادههای بزرگ توسط چنین کارشناسانی استفاده میکنند تا آنها را به اطلاعات عملی تبدیل کنند.
بسیاری از شرکتها مانند آلفابت و متا (فیسبوک سابق) از دادههای بزرگ برای تولید درآمد تبلیغاتی با قرار دادن تبلیغات هدفمند برای کاربران در رسانههای اجتماعی و کسانی که در وب گردی میکنند، استفاده میکنند.
تقریباً هر بخش در یک شرکت می تواند از یافته های تجزیه و تحلیل داده ها، از منابع انسانی و فناوری گرفته تا بازاریابی و فروش، استفاده کند. هدف کلان داده افزایش سرعت ورود محصولات به بازار، کاهش زمان و منابع مورد نیاز برای جذب بازار، مخاطبان هدف، و اطمینان از راضی ماندن مشتریان است.
افزایش حجم داده های موجود هم فرصت ها و هم مشکلاتی را ایجاد می کند. به طور کلی، داشتن دادههای بیشتر در مورد مشتریان (و مشتریان بالقوه) باید به شرکتها اجازه دهد تا محصولات و تلاشهای بازاریابی را بهمنظور ایجاد بالاترین سطح رضایت و تکرار کسبوکار، بهتر طراحی کنند. شرکتهایی که حجم زیادی از دادهها را جمعآوری میکنند، این فرصت را دارند که تجزیه و تحلیل عمیقتر و غنیتر را به نفع همه ذینفعان انجام دهند.
با توجه به حجم داده های شخصی موجود در افراد امروزی، بسیار مهم است که شرکت ها اقداماتی را برای محافظت از این داده ها انجام دهند. موضوعی که به یک بحث داغ در دنیای آنلاین امروزی تبدیل شده است، به ویژه با نقض داده های بسیاری که شرکت ها در چند سال اخیر تجربه کرده اند.
در حالی که تجزیه و تحلیل بهتر مثبت است، داده های بزرگ نیز می توانند اضافه بار و نویز ایجاد کنند و مفید بودن آن را کاهش دهند. شرکت ها باید حجم بیشتری از داده ها را مدیریت کنند و تعیین کنند که کدام داده ها سیگنال ها را در مقایسه با نویز نشان می دهند. تصمیم گیری در مورد اینکه چه چیزی داده ها را مرتبط می کند به یک عامل کلیدی تبدیل می شود.
علاوه بر این، ماهیت و قالب دادهها میتواند نیاز به رسیدگی خاصی داشته باشد، قبل از اینکه روی آن عمل شود. داده های ساختاریافته، متشکل از مقادیر عددی، می توانند به راحتی ذخیره و مرتب شوند. دادههای بدون ساختار، مانند ایمیلها، ویدئوها و اسناد متنی، ممکن است نیاز به تکنیکهای پیچیدهتری داشته باشند تا قبل از مفید شدن استفاده شوند
وبسایت من : اینجا کلیک کنید.
لینک حمایت مالی برای ادامه راه : اینجا کلیک کنید.
آدرس لینکدین من و جواب به سوالات شما : اینجا کلیک کنید.
آدرس توییتر من برای مشارکت در گفت و گو ها : اینجا کلیک کنید.
انجام پروژه های ماشین لرنینگ و یادگیری عمیق در تلگرام : Mashayekhi_Ai@