بینایی کامپیوتر و تفاوت آن با بینایی ماشین

بینایی کامپیوتر به مجموعه اقداماتی گفته می‌شود که با هدف ایجاد قابلیت دیدن، درک و توصیف تصاویر دیجیتال برای کامپیوترها، شکل گرفته است. محققان فعال در این حوزه در تلاشند تا مفهوم دیدن را برای کامپیوترها تعریف کنند تا از این طریق بتوانند اطلاعات معنادار را از تصاویر دیجیتال استخراج کنند. به دلیل پیچیدگی و ذات تغییرپذیر جهان پیرامون ما و همچنین شناخت محدود دانشمندان نسبت به سیستم زیستی بینایی انسان، درک بصری و فهم محیط اطراف برای کامپیوترها همواره چالش‌برانگیز بوده است.

بینایی کامپیوتر یک حوزه مطالعاتی چندرشته‌ای (multidisciplinary field) است که آن را می‌توان زیرشاخه‌ای از موضوعات هوش‌مصنوعی و یادگیری ماشین درنظر گرفت. برای فعالیت در این حوزه، باید تکنیک‌های مختلف مربوط به طیف وسیعی از رشته‌های مهندسی و علوم کامپیوتر مورد استفاده قرار گیرد. به عنوان مثال یک مسأله خاص ممکن با یک تحلیل آماری ساده حل شود ولی برای یک مسأله دیگر شاید نیاز به استفاده از الگوریتم‌های پیچیده و فراگیر یادگیری ماشین باشد.

بینایی کامپیوتر، یک حوزه مطالعاتی چندرشته‌ای
بینایی کامپیوتر، یک حوزه مطالعاتی چندرشته‌ای


هدف بینایی کامپیوتر، شناخت و درک محتوای موجود در تصاویر دیجیتال است. برای رسیدن به چنین هدفی در بینایی کامپیوتر، باید روش‌هایی پیاده‌سازی شود که قابلیت سیستم بینایی انسان را داشته باشد. برای درک محتوای موجود در تصاویر دیجیتال، کامپیوتر باید قادر به توصیف صحیح تصویر و استخراج اطلاعات از آن باشد باشد. این اطلاعات می‌تواند شامل هر نوع موجودیت اطلاعاتی نظیر مدل سه‌بعدی، موقعیت دوربین، تشخیص و بازشناسی اشیاء و دسته‌بندی و جستجوی محتویات تصویر باشد.


اهمیت بینایی کامپیوتر

روزانه در سراسر جهان حجم زیادی محتوای تصویری تولید و جابه‌جا می‌شود. اکثر افراد گوشی همراه هوشمند مجهز به دوربین دارند و از طریق آن عکس و ویدئو می‌گیرند و آن‌ها را در شبکه‌های اجتماعی مانند اینستاگرام و یوتیوب به اشتراک می‌گذارند.

محتوای موجود در اینترنت ترکیبی از متن و عکس است. موتورهای جستجو معمولا با پیدا کردن محتوای متنی مشکل چندانی ندارند اما به منظور شناسایی تصاویر نیازمند به الگوریتمی هستند که توانایی درک محتوای موجود در تصاویر و ویدئوها را داشته باشد. برای مدت‌های طولانی، موتورهای جستجو از طریق توضیحاتی که کاربر هنگام آپلود تصویر در اینترنت برای آن می‌نوشت، اقدام به پیدا کردن تصاویر می‌کرد؛ اما امروزه به لطف فناوری بینایی کامپیوتر و پردازش تصویر، موتورهای جستجو قادر خواهند بود تصاویر را از طریق محتوای واقعی موجود در خودشان پیدا کنند.

برای این که کامپیوتر اطلاعات کافی از تصاویر استخراج کند، لازم است که توانایی دیدن و درک تصاویر را داشته باشد. این توانایی باید مشابه با ویژگی‌هایی باشد که انسان‌ها از آن برخوردار هستند. سه ویژگی اصلی انسان‌ها در فرآیند دیدن به شرح زیر است:

  • یک شخص قادر است یک تصویر را ببیند و آن را توصیف کند.
  • یک شخص قادر است یک ویدئو را ببیند و خلاصه آن را بیان کند.
  • یک شخص قادر است صورت کسی را که فقط یک بار دیده است را شناسایی کند.

این سه مورد، اصلی‌ترین ویژگی‌هایی هستند که در فرآیند بینایی کامپیوتر باید لحاظ شود.


تفاوت بینایی کامپیوتر و پردازش تصویر

بینایی کامپیوتر و پردازش تصویر دو مفهوم متفاوت هستند. پردازش تصویر فرآیند خلق یک تصویر جدید از تصویر موجود از طریق حذف برخی از جزئیات یا افزایش کیفیت آن است. این فرآیند نوعی از پردازش سیگنال‌های دیجیتال است و ارتباطی با درک محتوای موجود در تصویر ندارد. بنابراین تمرکز پردازش تصویر صرفاً بر روی آماده‌سازی یک تصویر خام برای یک هدف مشخص است. مثلا فشرده‌سازی عکس با حذف برخی از جزئیات، بهبود کیفیت عکس با تغییر در رنگ و روشنایی آن و برش عکس. تمرکز بینایی کامپیوتر بر روی استخراج اطلاعات مهم از عکس یا ویدئو از طریق درک آن همانند مغز انسان است. فرآیندی که در فناوری بینایی ماشین صورت می‌پذیرد به مراتب پیچیده‌تر است.


بینایی ماشین (Machine Vision)

از طریق فناوری بینایی کامپیوتر می‌توان قابلیت دیدن و تفسیر تصاویر را برای یک ماشین فراهم آورد. برای درک بهتر تفاوت این دو باید به کاربرد آن‌ها توجه کرد. کاربرد بینایی ماشین بیشتر برای مصارف صنعتی است. به بیان دیگر، بینایی ماشین به معنای استفاده از تکنولوژی‌های بینایی کامپیوتر برای حل مساله‌های دنیای واقعی و در صنعت است. مثلا می‌توان از این فناوری در کارخانه‌ها برای مکانیزه ساختن خط تولید محصولات استفاده کرد.

درطی ۲۰ سال اخیر سیستم‌های مبتنی بر بینایی ماشین رشد چشمگیری داشته‌اند و به یکی از مهم‌ترین بخش‌ها در کارخانه‌ها و مراکز صنعتی تبدیل شده‌اند. از طریق فناوری بینایی ماشین می‌توان بازدهی در مراکز صنعتی را بالا برد و بدون شک در سال‌های آینده این فناوری جایگاه بالاتری از امروز کسب و خواهد کرد.


کاربردهای بینایی ماشین

همان‌طور که گفته شد، بینایی ماشین در حال تبدیل به یک تکنولوژی شناخته شده با هدف افزایش کارایی مراکز صنعتی و کارخانه‌ها است. از طریق این سیستم‌ها می‌توان استفاده از نیروهای انسانی در بخش‌های مختلف را به حداقل رساند و درنتیجه بسیاری از خطاهای انسانی قابل حذف است.

به دلیل کاهش خطاهای انسانی، سیستم‌های مبتنی بر بینایی ماشین باعث بهبود کیفیت محصولات می‌شوند و می‌توان با اطمینان زیادی تایید کرد که همه محصولاتی که به دست مشتریان می‌رسید دارای بالاترین میزان کیفیت هستند. این مساله به شدت بر روی کاهش هزینه‌ها تاثیرگذار است.

کاربردهای بینایی ماشین را می‌توان در حالت کلی به چهار بخش تقسیم‌بندی کرد:

۱. هدایت (Guidance)

هدایت اجزاء از طریق بینایی ماشین کاربردهای فراوانی در صنعت دارد. در بیشتر مواقع، این مورد شامل جایگذاری یک قطعه خاص و اطمینان از قرارگیری آن در مکان درست است. درصورت استفاده از بینایی ماشین می‌توان این فرآیند را با کمترین میزان خطا انجام داد. علاوه بر این از تکنیک‌های بینایی ماشین می‌توان برای تعیین مکان و جهت یک قطعه خاص نیز استفاده کرد. این اطلاعات را سپس می‌توان با هدف تولید به ربات‌ها یا ماشین‌های کنترل‌گر منتقل نمود.

قابلیت هدایت قطعات از طریق بینایی ماشین، نسبت به روش‌های دستی توسط نیروهای انسانی دقیق‌تر و دارای بازدهی بالاتری است؛ به خصوص در مونتاژ قطعات در خطوط تولید.


۲. تشخیص (Identification)

تکنیک‌های بینایی ماشین که در برنامه‌های شناسایی استفاده می‌شود بیشتر شامل خواندن بارکد و کدهای ماتریس داده برای شناسایی و دسته‌بندی محصولات مختلف است. این اقدام باعث به حداقل رسیدن خطاهای مرحله تولید و بسته‌بندی محصولات می‌شود. علاوه بر این، سرعت و دقت بسته‌‎بندی محصولات نیز افزایش چشمگیری پیدا می‌کند. با استفاده از فناوری بینایی ماشین بهره‌وری در خط تولید محصولات را می‌توان افزایش داد.

تشخیص بارکد در صنعت، نمونه‌ای از کاربردهای بینایی ماشین
تشخیص بارکد در صنعت، نمونه‌ای از کاربردهای بینایی ماشین



۳. اندازه‌گیری (Gauging)

یکی دیگر از مزایای استفاده از بینایی ماشین در فرآیند تولید محصولات، امکان اندازه‌گیری ابعاد است. معمولا در تولید محصولات صنعتی، ابعاد مقوله بسیار مهمی است؛ زیرا اگر این محصولات دارای ابعاد استانداردی نباشند برای مصارف عملی قابل استفاده نیستند. از طریق بینایی ماشین این مشکل با سرعت و دقت بالایی قابل حل است. در این کاربرد، یک دوربین ثابت در بالای خط تولید تعبیه می‌شود که می‌تواند دو یا چند نقطه بر روی محصولات را تشخیص دهد. درصورتی که فاصله بین این نقاط نسبت به اندازه‌های مجاز متفاوت باشد، محصول از خط تولید خارج می‌شود.

بررسی ابعاد اجسام، از کابردهای بینایی ماشین
بررسی ابعاد اجسام، از کابردهای بینایی ماشین



۴. بازرسی و عیب‌یابی (Inspection)

مشابه با اندازه‌گیری، قابلیت اندازه‌گیری بینایی ماشین عمدتاً جهت عیب‌یابی در فرآیند خط تولید استفاده می‌شود. برخلاف قابلیت اندازه‌گیری، بازرسی در بینایی ماشین انعطاف‌پذیری بیشتری در تشخیص تعداد زیادی از اشیاء در صنایع مختلف دارد؛ شامل فاسد شدن محصولات در محصولات کشاورزی، نقص در محصولات نساجی و ... . بازرسی بینایی ماشین بسیار سریع‌تر و دقیق‌تر از فرآیند بازرسی دستی است.


تفاوت بینایی کامپیوتر و بینایی ماشین

بینایی کامپیوتر و بینایی ماشین هر دو تکنولوژی‌های مبتنی بر پردازش تصویر هستند. این فناوری‌ها با تحلیل تصاویر سعی می‌کنند با دقتی نزدیک به دقت چشم انسان، وظایف موردنظرشان را انجام دهند. از آنجایی که بینایی ماشین و بینایی کامپیوتر از جهات مختلف دارای وجه اشتراک فراوانی هستند، برای درک بهتر تفاوت این دو فناوری لازم است کاربردهای آنها را بیان کنیم.

معمولاً، مؤلفه‌های ابتدایی لازم برای توسعه سیستم‌های بینایی کامپیوتر و بینایی ماشین مشابه یکدیگر هستند:

  • یک دستگاه تصویربرداری یا دریافت تصویر (معمولا یک دوربین که از یک سنسور تصویر و یک لنز تشکیل شده است.)
  • وجود شرایط نوری مناسب برای تعامل با محیط عملیاتی، دریافت تصویر از محیط، تحلیل تصاویر دریافت شده و تولید خروجی‌های متناسب با تحلیل انجام شده
  • یک سیستم کامپیوتری (البته در سیستم‌های تصویربرداری امروز نظیر «دوربین‌های هوشمند (Smart Cameras) به دلیل وجود پردازنده‌های اختصاصی، بسیاری از فرآیندهای پردازش و تحلیل تصویر درون دستگاه تصویربرداری انجام می‌شود.)
  • برنامه پردازش تصویر (برنامه کاربردی کدنویسی‌شده در زبان‌های برنامه‌نویسی نظیر پایتون، متلب و سایر موارد جهت پردازش و تحلیل تصاویر)

با توجه به این توضیحات، تفاوت اصلی بینایی کامپیوتر و بینایی ماشین در چیست؟ منظور از بینایی کامپیوتر خودکارسازی ثبت و پردازش تصویر با تمرکز بر روی تحلیل تصاویر است. به عبارت دیگر هدف بینایی کامپیوتر نه تنها دیدن است، بلکه پردازش و فراهم‌سازی نتایج مناسب مبتنی بر مشاهده تصاویر است. منظور از بینایی ماشین استفاده از تکنیک‌های بینایی کامپیوتر در محیط صنعتی به منظور ارتقاء کیفیت و سرعت تولید محصولات است.


ابزار توسعه

یکی از معروف‌ترین ابزارهای توسعه برنامه‌های بینایی کامپیوتر، بینایی ماشین و پردازش تصویر OpenCV است که در صوت علاقه می‌توانید دوره‌ی ویدیویی آموزشی OpenCV را مشاهده کنید.


نویسنده: بنیامین زارعی

منابع:

https://machinelearningmastery.com/what-is-computer-vision/

https://www.geeksforgeeks.org/difference-between-image-processing-and-computer-vision/

https://www.phase1vision.com/blog/4-principal-machine-vision-applications

https://qualitastech.com/7-applications-of-machine-vision/