بهناز صادقی گل
بهناز صادقی گل
خواندن ۳ دقیقه·۳ سال پیش

تشخیص اشیا با مقایسه‌های شدت پیکسل سازمان‌دهی شده توسط درخت تصمیم

چکیده

ما روشی را برای تشخیص بینایی شی ارائه می­دهیم که بر پایه­ی درختان تصمیم بهینه سازی شده استوار است و متشکل از ریجکتورهای آبشاری است. این درختان از مقایسه­ی شدت پیکسل در نودهای داخلیشان استفاده می­کنند و این مساله آن­ها را قادر می­سازد تا نواحی عکس را تولید کند آنالیز و تحلیل تجربی از طریق مساله آشکارسازی صورت ارائه شده است. نتایج به دست آمده، نشان­دهنده و تاییدکننده این مساله هستند که این روش ارزش عملی و تجربی دارد. به­علاوه، حساسیت آن را نسبت به نویز آنالیز می­کنیم و نشان می­دهیم چگونه چرخش سریع آشکارسازی شیء ثابت انجام می­شود. کد کامل منبع در لینک زیر ارائه شده است:

https://github.com/nenadmarkus/pico.

1- معرفی

در بینایی کامپیوتر، آشکارساز می­تواند مانند فعالیت پیدا کردن مکان و مقیاس تمام اشیاءی که در یک عکس متعلق به کلاس Appearance عمل کند. برای مثال، این اشیاء می­توانند ماشین، عابران پیاده یا صورت افراد باشد. آشکارساز اتوماتیک شیء طیف گسترده­ای از برنامه­های کاربردی را شامل می­شود. بعضی از آن­ها شامل بیومتریک، دستیار راننده، نظارت بینایی و رابط کاربری هوشمند انسان-ماشین. این برنامه­ها یک انگیزه­ی قوی برای پیشرفت سرعت و دقت روش­های آشکارساز شیء می­سازد.

ویولا و جونز [20] آشکارساز اشیا را انجام داده اند که در کاربردهای دنیای واقعی امکان پذیر است. این به دلیل این واقعیت است که سیستم ها بر اساس چارچوب خود می توانند تصاویر را از رویکردهای قبلی بسیار سریعتر پردازش کنند. همچنان، برخی از برنامه ها می توانند از مزایای آشکارسازهای سریعتر بهره مند شوند ، و این انگیزه اصلی ما از پژوهش بود.

ما علاقه مند به حمایت از طیف گسترده ای از رایانه­های شخصی و دستگاه های تلفن همراه با قدرت پردازش محدودهستیم. بنابراین برای اینکه سیستم ما در این برنامه­ها کاربردی باشد، ما آماده هستیم که دقت آشکارسازی را فدای هزینه­ی پردازش هزینه و سادگی بهتر کنیم.

در این مقاله، ما فریمورک آشکارساز شیء را توضیح داده­ایم که قادر به پردازش بسیار سریع تصاویر درعین حفظ رقابت در دقت است. ایده های اساسی در بخش 2 توضیح داده شده است. تجربی تجزیه و تحلیل در بخش 3 ارائه شده است. بخش 4 خلاصه می کند یافته های ما و در مورد جهت گیری های تحقیقاتی آینده بحث می کند.

2- روش

رویکرد ما حالتی از استاندارد چارچوب آشکارساز اشیا Viola-Jones است. ایده اصلی اسکن کردن تصویر با آبشاری از طبقه بندی کننده های باینری در تمام موقعیت ها و مقیاس های معقول است. یک ناحیه تصویر به عنوان یک شی مورد توجه طبقه بندی می شود در صورتی که با موفقیت تمام اعضای آن را پشت سر بگذارد. هر دسته­بندی باینری تشکیل می­شود از یک گروه درختان تصمیم با تراکم پیکسلی که مانند تست باینری در نودهای داخلی مقایسه می­شود. فرایند آموزش از فرایند ساختار درخت رگرسیون حریصانه و الگوریتم کمک کننده تشکیل می­شود .

درخت تصمیم برای رگرسیون مبتنی بر تصویر

برای پرداختن به مساله تصویر، مبتنی بر رگرسیون یک درخت تصمیم گیری باینری بهینه شده با مقایسه شدت پیکسل به عنوان تست های باینری در گره های داخلی آن استفاده می کنیم . این رویکرد توسط آمیت و جمن در [1] معرفی شد و بعداً با موفقیت مورد استفاده سایر محققان و مهندسان قرار گرفت. تست باینری مقایسه شدت پیکسل در تصویرI به اینصورت تعریف شده است.

bintest(I; l1; l2) = {0 I(l1) _ I(l2)

1 otherwise;

جایی که I(li) شدت پیکسل در مکان li است. مکان l1 و l2 در مختصات نرمال شده هستند، یعنی هر دو از آن مجموعه [-1,+1]* [-1,+1]هستند؛ این بدان معنی است که تست های باینری می توانند در صورت نیاز به راحتی قابل تغییر اندازه باشند. هر گره پایانی درخت از یک اسکالر تشکیل می­شود که خروجی را مدل می­کند.

طراحی ساختار درخت، با نظارت است. دیتای آموزشی مجموعه{ f(Is; vs;ws) : s = 1; 2; : : : ; S} هست .

مشاهده بقیه مقاله در: https://translate.google.com/?sl=en&tl=fa&text=where%20vs%20is%20the%20ground%0Atruth%20value%20associated%20with%20image%20Is%20and%20ws%20is%20its%20importance%0Afactor%20(weight).&op=translate






درخت تصمیمبینایی ماشینتشخیص چهره
شاید از این پست‌ها خوشتان بیاید