چکیده
ما روشی را برای تشخیص بینایی شی ارائه میدهیم که بر پایهی درختان تصمیم بهینه سازی شده استوار است و متشکل از ریجکتورهای آبشاری است. این درختان از مقایسهی شدت پیکسل در نودهای داخلیشان استفاده میکنند و این مساله آنها را قادر میسازد تا نواحی عکس را تولید کند آنالیز و تحلیل تجربی از طریق مساله آشکارسازی صورت ارائه شده است. نتایج به دست آمده، نشاندهنده و تاییدکننده این مساله هستند که این روش ارزش عملی و تجربی دارد. بهعلاوه، حساسیت آن را نسبت به نویز آنالیز میکنیم و نشان میدهیم چگونه چرخش سریع آشکارسازی شیء ثابت انجام میشود. کد کامل منبع در لینک زیر ارائه شده است:
https://github.com/nenadmarkus/pico.
1- معرفی
در بینایی کامپیوتر، آشکارساز میتواند مانند فعالیت پیدا کردن مکان و مقیاس تمام اشیاءی که در یک عکس متعلق به کلاس Appearance عمل کند. برای مثال، این اشیاء میتوانند ماشین، عابران پیاده یا صورت افراد باشد. آشکارساز اتوماتیک شیء طیف گستردهای از برنامههای کاربردی را شامل میشود. بعضی از آنها شامل بیومتریک، دستیار راننده، نظارت بینایی و رابط کاربری هوشمند انسان-ماشین. این برنامهها یک انگیزهی قوی برای پیشرفت سرعت و دقت روشهای آشکارساز شیء میسازد.
ویولا و جونز [20] آشکارساز اشیا را انجام داده اند که در کاربردهای دنیای واقعی امکان پذیر است. این به دلیل این واقعیت است که سیستم ها بر اساس چارچوب خود می توانند تصاویر را از رویکردهای قبلی بسیار سریعتر پردازش کنند. همچنان، برخی از برنامه ها می توانند از مزایای آشکارسازهای سریعتر بهره مند شوند ، و این انگیزه اصلی ما از پژوهش بود.
ما علاقه مند به حمایت از طیف گسترده ای از رایانههای شخصی و دستگاه های تلفن همراه با قدرت پردازش محدودهستیم. بنابراین برای اینکه سیستم ما در این برنامهها کاربردی باشد، ما آماده هستیم که دقت آشکارسازی را فدای هزینهی پردازش هزینه و سادگی بهتر کنیم.
در این مقاله، ما فریمورک آشکارساز شیء را توضیح دادهایم که قادر به پردازش بسیار سریع تصاویر درعین حفظ رقابت در دقت است. ایده های اساسی در بخش 2 توضیح داده شده است. تجربی تجزیه و تحلیل در بخش 3 ارائه شده است. بخش 4 خلاصه می کند یافته های ما و در مورد جهت گیری های تحقیقاتی آینده بحث می کند.
2- روش
رویکرد ما حالتی از استاندارد چارچوب آشکارساز اشیا Viola-Jones است. ایده اصلی اسکن کردن تصویر با آبشاری از طبقه بندی کننده های باینری در تمام موقعیت ها و مقیاس های معقول است. یک ناحیه تصویر به عنوان یک شی مورد توجه طبقه بندی می شود در صورتی که با موفقیت تمام اعضای آن را پشت سر بگذارد. هر دستهبندی باینری تشکیل میشود از یک گروه درختان تصمیم با تراکم پیکسلی که مانند تست باینری در نودهای داخلی مقایسه میشود. فرایند آموزش از فرایند ساختار درخت رگرسیون حریصانه و الگوریتم کمک کننده تشکیل میشود .
درخت تصمیم برای رگرسیون مبتنی بر تصویر
برای پرداختن به مساله تصویر، مبتنی بر رگرسیون یک درخت تصمیم گیری باینری بهینه شده با مقایسه شدت پیکسل به عنوان تست های باینری در گره های داخلی آن استفاده می کنیم . این رویکرد توسط آمیت و جمن در [1] معرفی شد و بعداً با موفقیت مورد استفاده سایر محققان و مهندسان قرار گرفت. تست باینری مقایسه شدت پیکسل در تصویرI به اینصورت تعریف شده است.
bintest(I; l1; l2) = {0 I(l1) _ I(l2)
1 otherwise;
جایی که I(li) شدت پیکسل در مکان li است. مکان l1 و l2 در مختصات نرمال شده هستند، یعنی هر دو از آن مجموعه [-1,+1]* [-1,+1]هستند؛ این بدان معنی است که تست های باینری می توانند در صورت نیاز به راحتی قابل تغییر اندازه باشند. هر گره پایانی درخت از یک اسکالر تشکیل میشود که خروجی را مدل میکند.
طراحی ساختار درخت، با نظارت است. دیتای آموزشی مجموعه{ f(Is; vs;ws) : s = 1; 2; : : : ; S} هست .
مشاهده بقیه مقاله در: https://translate.google.com/?sl=en&tl=fa&text=where%20vs%20is%20the%20ground%0Atruth%20value%20associated%20with%20image%20Is%20and%20ws%20is%20its%20importance%0Afactor%20(weight).&op=translate