چکیده
اینترنت اشیاء (IoT) قرار است به یکی از پیشرفت های کلیدی فناوری زمان ما تبدیل شود؛ به شرطی که بتوانیم از پتانسیل کامل آن استفاده کنیم. انتظار می رود که تعداد اشیاء متصل به IoT تا سال 2020 به 50 میلیارد برسد زیرا هجوم گسترده ای از اشیاء متنوع به تدریج در حال ظهور است. از این رو، انتظار می رود که IoT یک تولید کننده اصلی داده (big data) باشد. به اشتراک گذاری و تعامل داده ها و سایر منابع می تواند کلیدی برای ایجاد محیط های پایدار فراگیر، مانند شهرهای هوشمند و جوامع باشد. تلفیق و تجزیه و تحلیل به موقع داده های بزرگ که از IoT و سایر منابع به دست می آید، برای ایجاد تصمیم گیری دقیق و با قابلیت اطمینان و مدیریت بسیار کارآمد محیط های فراگیر می تواند یک چالش بزرگ آینده باشد. هوش کامپیوتری در این چالش نقش کلیدی ایفا می کند. تعدادی از مطالعات بر روی تلفیق داده ها وجود دارد. با این حال، اینها عمدتا بر روی حوزه های کاربردی خاص یا دسته بندی های خاص تمرکز می کنند. هدف از این مقاله بررسی ادبیات تلفیق داده ها برای IoT با یک توجه خاص به روش های ریاضی (از جمله روش های احتمالاتی، هوش مصنوعی و نظریه اعتقاد) و محیط های خاص IoT (محیط های توزیع شده، ناهمگن، غیر خطی و ردیابی شیء) می باشد. فرصت ها و چالش هایی برای هر یک از روش ها و محیط های ریاضی ارائه شده است. تحولات آینده، از جمله حوزه های نوظهور که ذاتا از تلفیق داده ها و IoT، وسایل نقلیه مستقل(خود مختار)، یادگیری عمیق برای تلفیق داده ها و شهرهای هوشمند بهره می برند، مورد بحث قرار می گیرد.
مقدمه
اینترنت اشیا (IoT) [1] قرار است به یکی از پیشرفت های مهم فناوری زمان ما تبدیل شود به شرطی که بتوانیم از پتانسیل کامل آن استفاده کنیم [2]. IoT "یک زیرساخت جهانی برای جامعه اطلاعاتی است و خدمات پیشرفته را بوسیله اتصالات (فیزیکی و مجازی) اشیاء بر اساس تعامل فناوری اطلاعات و ارتباطات در حال توسعه موجود را به وجود اورد." [3] در گزارش سال 2008 [4] شورای ملی اطلاعات ایالات متحده (NIC) از میان شش کلید فن آوری های مدنی که می تواند به طور بالقوه بر قدرت ایالات متحده تأثیر بگذارد، به نام IoT نامگذاری شد. IoT یک ابزار محاسباتی فراگیر است که توسط Mark Weiser طراحی شده است. شکل 1 حوزه کاربردی IoT را نشان می دهد: خانه های هوشمند، سیستم های هشدار دهنده، خرید هوشمندانه، ابزارهای هوشمند، شهرهای هوشمند، جاده های هوشمند، مراقبت های بهداشتی، سیستم های آتش نشانی، سیستم های شناسایی تهدیدها، ردیابی و نظارت.
انتظار می رود که تعداد اشیاء متصل به IoT تا سال 2020 به 50 میلیارد برسد زیرا هجوم وسیعی از اشیای متنوع به تدریج در حال ظهور است [5]. هدف اصلی این افزایش تعداد و انواع اشیاء IoT، تولید اطلاعات مفید درباره محیط اطراف است تا آنها را هوشمندانه تر کند. این امر با فراهم آوردن دسترسی محیط ها به اطلاعات مورد نیاز خود از طریق جمع آوری و تجزیه و تحلیل داده های گذشته، حال و آینده انجام می شود. داده ها اجازه می دهند تصمیم بهینه در مورد ما و محیط های ما در زمان واقعی انجام شود.
مشارکت این کار
اصطلاح "اینترنت اشیاء" در ابتدا توسط کوین اشتون در سال 1999 معرفی شد [8]. با این حال، پژوهش و توسعه کلیدی کارها در IoT در سال 2010 آغاز شده است. یکی از اولین و مشهور ترین مطالعات توسط Atzori و همکارانش بود. [1]، در سال 2010، جایی که آنها بلوک های بنیادی IoT و برنامه های کاربردی آن را توصیف کردند. این بررسی در [9] گسترش یافت. Al-Fuqaha و همکاران در سال 2015، یک مطالعه از فناوری ها، پروتکل ها و برنامه های کاربردی فعال سازی IoT ارائه شد [10]. در [11]، تصویر ماهواره ای روش های تلفیق چند حسگر بررسی شده است. این بررسی [12] ادبیات ادغام داده ها را به سه دسته تقسیم می کند: ارتباط داده ها، تلفیق تصمیم گیری و تخمین وضعیت. در همان سال 2013، یک مقاله دیگر [13] ادبیات تلفیق داده ها را براساس خواص داده های دریافت شده مانند نقص ها، همبستگی و ناسازگاری داده دسته بندی کرد. در [14]، پیشرفت و چالش های مختلف برای تلفیق داده ها در سیستم های حمل و نقل هوشمند مورد بحث قرار گرفته است. یک مطالعه اخیر [15] بررسی انتقادی تحولات تلفیق داده ها براساس سنسورهای تعبیه شده در دستگاه های تلفن همراه با تمرکز ویژه بر شناسایی فعالیت های انسانی ارائه کرده است. جدول 1 مطالعات مربوط به مقاله ما را بیشتر توضیح می دهد. خلاصه ای از تمرکز اصلی هر مقاله مربوطه مورد بررسی قرار گرفته است.
فرصت ها و چالش ها تلفیق داده ها
مقدار بسیار زیادی داده در طول زمان به طور سریع در محیط IoT تولید می شود. چگونه می توان این حجم زیاد از داده، کامل و بسیار دقیق ساخته شوند، یک مشکل باز است که باید حل شود، زیرا کیفیت اطلاعات نقش مهمی در تصمیم گیری دارد. اطلاعات قابل اعتماد و دقیق بسیار مهم است. این می تواند با تلفیق داده یا تلفیق اطلاعات (اصطلاحاتی که می توانند جایگزین استفاده شوند) حاصل شود. تلفیق داده یک راه موثر برای استفاده بهینه از حجم زیادی از داده ها از منابع مختلف است [11]. تلفیق داده های چند حسگر به دنبال تلفیق اطلاعات از چندین حسگر و منابع برای دستیابی به نتیجه هایی است که از یک تک سنسور یا منبع ممکن نیست [19]. تلفیق اطلاعات از سنسورهایی با ویژگی های فیزیکی مختلف، درک محیط اطراف ما را افزایش می دهد و پایه ای برای برنامه ریزی، تصمیم گیری و کنترل ماشین های مستقل و هوشمند را فراهم می کند.
فرصت های تلفیق داده
تلفیق داده در نمونه اینترنت اشیاء (IoT)می تواند در موفقیت خود به خاطر دلایل زیر نقش مهمی داشته باشد: [7]، [17]:
• تلفیق داده باعث می شود اطلاعات هوشمندتر، قطعی، منطقی و دقیق تر باشد که از چندین سنسور و منابع بدست می اید. اطلاعات از هر سنسور در خود ممکن است خیلی حساس نباشد.
• یک آماری موفق از تلفیق با محاسبه N مشاهدات مستقل حاصل می شود؛ می توان پیش بینی کرد که داده ها به طور بهینه ادغام می شوند.
روش های ریاضی برای تلفیق داده ها
تکنیک های تلفیق داده ها می توانند براساس روش های ریاضی به سه دسته گسترده تر طبقه بندی شوند:
• روش های مبتنی بر احتمال، از جمله تجزیه و تحلیل بیزی، آمار و اپراتورهای بازگشتی.
• تکنیک های هوش مصنوعی (AI) شامل یادگیری ماشین کلاسیک، منطق فازی، شبکه های عصبی مصنوعی (ANN) و ارزیابی ژنتیکی است.
• روش های تلفیق داده ها مبتنی بر نظریه شواهد
الگوریتم های تلفیق داده احتمالاتی
در این بخش، ما برخی از کارهای اخیر مربوط به تکنیک های تلفیق داده احتمالی و الگوریتم ها را بررسی کردیم. تکنیک های احتمالی کلاسیک تر هستند، پیچیدگی کمتری دارند و به طور گسترده برای تلفیق داده استفاده می شوند، اگرچه ممکن است دقتشان نسبت به روش های انتگرال کم تر باشند [19]، [24]. اکثر الگوریتم های معمول برای تلفیق داده برای تلفیق داده ها در هسته هایشان احتمال دارند. با این حال، برخی از چالش هایی که برای تلفیق داده احتمالاتی وجود دارد، شامل: تحقیقات نشان می دهد که سیستم های تلفیق داده احتمالاتی نمیتوانند اطلاعات کامل را که برای تعریف و مجسم کردن حس کردن و عملیات تلفیق داده ها مورد نیاز است، فراهم آورند، سطح بالایی از پیچیدگی در بررسی منطق غیریکنواخت از طریق احتمال وجود دارد، و برای بررسی عضویت درجه بندی شده در مقایسه با منطق فازی در یک مجموعه، مشکل است [19]. نظریه بیز، زنجیره مارکوف و روش مونت کارلو، برخی از روش های مورد مطالعه اخیر و به طور گسترده استفاده شده در تلفیق داده ها در زمان های اخیر هستند.
روش های تلفیق داده برای محیط های خاص IoT
چندین چالش مرتبط با حسگر داده وجود دارد. برخی از چالش های کلی عبارتند از:
• محیط توزیع شده WSN ها که زیر مجموعه ای از IoT هستند.
• ماهیت بسیار ناهمگن IoT به علت دستگاه ها و داده های ناهمگن مختلف.
• مسائل غیر خطی و ردیابی مثل: ردیابی چند هدفه (MTT)، هزینه غیر موثر، کاهش خطا، مسائل ناهمگام و مسیر به مسیر (T2T).
محيط توزيع شده
به لحاظ نظری، تلفیق داده توزیع شده، یک مفهوم نسبتا توسعه یافته در چند دهه گذشته است و در عمق مورد مطالعه قرار گرفته است [102]. با این حال، پیاده سازی عملی این تکنیک ها هنوز یک وظیفه چالش برانگیز در محیط IoTاست. الگوریتمهای توزیع شده هیچ کنترل متمرکزی ندارند. آنها همچنین می توانند به عنوان زیر شاخه های الگوریتم های موازی اشاره شوند. عناصر اصلی یک سیستم تلفیق اطلاعات توزیع شده در IoT سنسورها و پردازنده ها هستند. سنسورها مسئول تولید داده ها با مشاهده محیط عملیاتی هستند. پردازنده ها مسئول تلفیق داده ها هستند. در این بخش، الگوریتم های تلفیق داده توزیع شده را در WSN ها بررسی و طبقه بندی می کنیم که می تواند به عنوان زیرمجموعه های IoT دیده شود. در محیط توزیع شده، الگوریتم تخمین اصلی، الگوریتم Kalman Filter (KF)توزیع شده است و بسیار مقیاس پذیر است. در مسائل کاربردی مختلف، الگوریتم های مبتنی بر KF نقش قابل توجهی ایفا می کنند. KF می تواند یک الگوریتم فیلترینگ تصحیح پیش بینی باشد که توسط تکامل یا انتشار حالت و به روز رسانی داده ها به دست می آید. ما می توانیم KF را به عنوان یک الگوریتم تلفیق Bayesianبپذیریم، همانطور که در [101] ثابت شده است. حوزه های مختلفی که KF توزیع شده پیاده سازی شده است، شامل نظارت بر آب و هوا و محیط زیست، نظارت (مانیتورینگ)، حوزه های ردیابی و پزشکی است.
تحولات تلفیق داده در حال ظهور
تلاش های اخیر تحقیق و توسعه در زمینه تلفیق داده ها، نشان دهنده تکامل آن از حوزه های مرسوم به حوزه های برنامه کاربردی بیشتر اینده مانند سیستم های اطلاعاتی سرگرمی، شناسایی فعالیت های انسان، وسایل نقلیه متصل و مستقل است. در این بخش، ما در ابتدا به تحولات برنامه های کاربردی اخیر که در آن تلفیق داده ها می توانند اعمال شوند و چگونه یادگیری عمیق می تواند تلفیق داده ها را افزایش دهد، تمرکز می کنیم.
وسایل نقلیه مستقل و متصل
یک وسیله نقلیه مستقل به خودی خود هدایت می شود که هوش خود را دارد تا محیط اطرافش را درک کند و به طور پیوسته و ایمن هدایت شود. الگوریتم های یادگیری ماشین مختلفی برای درک محیط رانندگی با پردازش داده ها از یک نوع سنسور (منبع) مورد استفاده قرار می گیرند مانند: دوربین RGB ، LIDAR، GPS و غیره. راه دیگری برای دستیابی به درک محیط رانندگی این است که داده ها از چند سنسور برای انجام یک هدف واحد تلفیق شوند. به عنوان مثال: تلفیق تصاویر GPS و دوربین برای پیش بینی فاصله ایمن یک وسیله نسبت به وسیله نقلیه دیگر رانندگی در جاده. استفاده از تلفیق داده ها در خودروهای خودمختار خیلی قدیمی است. با این حال، قبل از سال 2010 کار زیادی در این زمینه انجام نشده است. در سال های اخیر، کار های تحقیقات و توسعه های خودروهای بدون راننده محبوبیت پیدا کرده و علاقه ی فراوانی به فناوری اطلاعات و تیتان های صنعت خودرو برای توسعه ی هوش در رانندگی نشان داده شده است. این راه را برای توسعه فن آوری های تلفیق داده پیشرفته برای رانندگی خودکار آماده کرد.
نتیجه
اینترنت اشیاء (IoT)قرار است به یکی از پیشرفت های کلیدی فناوری زمان ما تبدیل شود؛ به شرطی که بتوانیم از پتانسیل کامل آن استفاده کنیم. با توجه به جریان عظیمی از اشیاء متنوعی که به تدریج در حال ظهور هستند انتظار می رود که تعداد اشیاء متصل به IoT تا سال 2020 به 50 میلیارد برسد. IoT ازین جهت انتظار میرود یک تولید کننده اصلی داده های بزرگ باشد. به اشتراک گذاری و تعامل داده ها و سایر منابع می تواند کلیدی برای ایجاد محیط های پایدار فراگیر، مانند شهرهای هوشمند و جوامع باشد. تلفیق وتحلیل به موقع داده های بزرگ که از IoT و سایر منابع به دست آمده است، برای ایجاد تصمیم گیری دقیق، قابل اعتماد و مدیریت بسیار کارآمد محیط های فراگیر می تواند یک چالش بزرگ در آینده باشد. هوش محاسباتی در این چالش نقش کلیدی ایفا می کند. تعدادی از مطالعات بر روی تلفیق داده ها وجود دارد. با این حال، این مطالعات عمدتا بر روی حوزه ی برنامه ها یا طبقه بندی های خاصی متمرکز هستند.
در این مقاله ما به بررسی ادبیات تلفیق داده ها برای IoT با تمرکز خاص بر روش های ریاضی و محیط های خاص IoTپرداخته ایم. روش های ریاضی مورد بحث شامل روش های احتمالاتی، هوش مصنوعی و نظریه اعتقاد است. محیط مورد بحث شامل محیط های توزیع شده، ناهمگن، غیر خطی و ردیابی شیء می باشند. فرصت ها و چالش ها برای هر یک از روش های ریاضی و محیط ها مورد بحث قرار گرفت. حوزه های در حال توسعه که به طور ذاتی از تلفیق داده ها و IoT، وسایل نقلیه مستقل، یادگیری عمیق برای تلفیق داده ها و شهرهای هوشمند بهره می برند، مورد بحث قرار گرفت. فرصت ها و چالش های تلفیق داده ها به طور کلی و همچنین مشخص شده برای IoT ارائه شد. به نظر ما، در حال حاضر چنین مطالعه ی وجود ندارد.
این مقاله ISI در سال 2017 در نشریه آی تریپل ای و در مجله دسترسی (IEEE)، توسط گروه علوم کامپیوتر منتشر شده و در سایت ای ترجمه جهت دانلود ارائه شده است. در صورت نیاز به دانلود رایگان اصل مقاله انگلیسی و ترجمه آن می توانید به پست دانلود ترجمه مقاله تلفیق اینترنت اشیا برای محیط های هوشمند در سایت ای ترجمه مراجعه نمایید.