برنامه نویس/عضو هیيت مدیره شرکت گسنرش رایانه ایپک https://ipekdev.ir
تشخیص چهره و بازشناسی افراد با الگوریتم شبکههای عصبی
ﻓﺮآﯾﻨﺪ ﻧﻈﺎرت ﺧﻮدﮐﺎر ﺑﺮ ﺟﻤﻌﯿﺖﻫﺎی اﻧﺴﺎﻧﯽ ﺗﻮﺳﻂ ﺳﯿﺴﺘﻢﻫﺎی راﯾﺎﻧﻪای ﺑﺎ ﭼﺎﻟﺶﻫﺎی ﻣﺘﻌﺪدی ﻣﻮاﺟﻪ اﺳﺖ ﮐﻪ دﻗﺖ و ﺳﺮﻋﺖ ﺷﻨﺎﺳﺎﯾﯽ اﻓﺮاد دو ﻣﻮﻟﻔﻪ اﺻﻠﯽ آن ﻫﺴﺘﻨﺪ. ﺳﺮﻋﺖ و دﻗﺖ ﻫﺮدو ﺑﻪ ﮐﯿﻔﯿﺖ اﻃﻼﻋﺎت ورودی واﺑﺴﺘﮕﯽ دارﻧﺪ. ﻋﻼوه ﺑﺮ اﯾﻦ، دﻗﺖ اﯾﻦ ﺳﯿﺴﺘﻢﻫﺎ ﺗﺤﺖ ﺗﺎﺛﯿﺮ ﻣﻮارد زﯾﺮ ﻧﯿﺰ واﻗﻊ ﻣﯽﺷﻮد:
وﺿﻌﯿﺖ: ﻧﺤﻮه ﻗﺮارﮔﯿﺮی ﺻﻮرت اﻓﺮاد ﺑﻬﻨﮕﺎم ﺗﺼﻮﯾﺮﺑﺮداری
وﺟﻮد اﺟﺰای ﺳﺎﺧﺘﺎری: ﻣﻤﮑﻦ اﺳﺖ اﺟﺰای دﯾﮕﺮی ﻣﺎﻧﻨﺪ ﺳﺒﯿﻞ، رﯾﺶ و ﯾﺎ ﮐﻼه در ﺗﺼﻮﯾﺮ ﺻﻮرت ﺷﺨﺺ ﻣﻮﺟﻮد ﺑﺎﺷﻨﺪ.
ﺣﺎﻻت ﺻﻮرت: ﻟﺒﺨﻨﺪ زدن، اﺧﻢ ﮐﺮدن و ﺑﯿﺎن ﺳﺎﯾﺮ ﻋﻮاﻃﻒ اﻧﺴﺎﻧﯽ ﻣﯽﺗﻮاﻧﺪ ﭼﻬﺮهﻫﺎ را ﻣﺘﻨﻮعﺗﺮ ﮐﻨد.
ﻫﻢﭘﻮﺷﺎﻧﯽ: ﻣﻤﮑﻦ اﺳﺖ ﺑﺨﺸﯽ از ﺻﻮرت اﻓﺮاد ﺗﻮﺳﻂ ﺳﺎﯾﺮ اﻓﺮاد و ﯾﺎ اﺟﺴﺎم دﯾﮕﺮ ﭘﻮﺷﺎﻧﺪه ﺷﻮد. ﺟﻬﺖ: ﻣﻤﮑﻦ اﺳﺖ ﺑﻪ دﻟﯿﻞ ﭼﺮﺧﺶ دورﺑﯿﻦ و ﯾﺎ ﺣﺎﻻت رﻓﺘﺎری اﻓﺮاد، ﻧﻤﺎی ﭼﻬﺮه دﭼﺎر ﭼﺮﺧﺶ ﺷﺪه ﺑﺎﺷﺪ.
ﺷﺮاﯾﻂ ﺗﺼﻮﯾﺮی: وﯾﮋﮔﯽﻫﺎی دﯾﮕﺮ ﻣﺎﻧﻨﺪ ﺗﺎرﯾﮑﯽ و ﺷﺪت ﻧﻮر ﻣﯽﺗﻮاﻧﻨﺪ در ﮐﯿﻔﯿﺖ ﺗﺼﻮﯾﺮ ﻣﻮﺛﺮ واﻗﻊ ﺷﻮﻧﺪ.
فرآیند کار
سیستمهای تشخیص و بازشناسی افراد حداقل از ۲ بخش تشکیل میشوند. بخش ۱، صرفا چهرههای انسانی را در تصاویر و ویدیوها تشخیص میدهد. بخش ۲، با دریافت چهرههای خروجی مرحله اول، ویژگیهای انحصاری هر چهره را استخراج کرده و آنها را در پایگاه اطلاعاتی ذخیرهسازی میکند. آنگاه سیستم میتواند با مقایسه ویژگیهای هر چهره اقدام به شناسایی هر فرد در تمامی سوابق تصویری و ویدیویی کند.
روشهای پیشین
تاکنون چندین الگوریتم برای تشخیص چهره پیشنهاد شدهاند از جمله
1. تحلیل اجزای اصلی
a. Eigenface
2. تحلیل تفکیک خطی
a. Fisherface
3. الگوریتم مبتنی بر رنگ پوست
a. RGB
b. YCbCr
c. HIS
4. الگوریتم مبتنی بر Wavelet
a. Gabor Wavelet
5. الگوریتمهای مبتنی بر شبکههای عصبی مصنوعی
a. Fast Forward
b. Back Propogation
c. RBF
الگوریتم Eigenfaceیکی از معمولترین الگوریتمهای استفاده شده برای تشخیص چهره است که در بانکهای اطلاعاتی با اندازه نسبتا کوچک سرعت قابل قبولی ارائه میدهد. این الگوریتم در برابر چهرههای کوچک و یا دارای شرایط محیطی مختلف دچار مشکل میشود. الگوریتم دسته ۲ زیرشاخهای از Eigenfaceاست که منحصرا برای شرایط مختلف نور بهینهتر شده است. دسته سوم که مبتنی بر رنگ پوست انسان است به دلیل تحلیل خطی کل تصویر بر اساس رنگ بسیار زمانبر است. الگوریتمهای موجی نیز از ساختارهای فرکانسی فضایی برای تشخیص چهره استفاده میکنند.
جدیدترین نوع این الگوریتمها، شبکههای مصنوعی عصبی هستند که بیشترین دقت ممکن را ارائه دادهاند.
تشخیص چهره انسان به روش ماشینی از طریق تصاویر ویدیویی به یک بخش تحقیقاتی فعال در جوامع پردازش تصویر، تشخیص الگو ، شبکه های عصبی و نگرش و دیدگاه کامپیوتری تبدیل شده است. انگیزه این علاقه از طریق برنامه های کاربردی ، از انطباق ایستایی عکس هایی با فرمت کنترل شده نظیر پاسپورت، کارت های اعتباری، گواهینامه های رانندگی، و عکس های گرفته شده در حین جنایت گرفته تا انطباق واقعی تصاویر ویدیویی نظارت و مراقبت که بازتابی از محدودیت های مختلف بر حسب نیازمندیهای پردازشی می باشند، حاصل شده است. اگرچه محققین در رشته روانشناسی، علوم عصبی و مهندسی، پردازش تصویر و نگرش و دید سیستم تعدادی از مسائل وابسته به تشخیص چهره توسط انسانها و ماشین ها را مورد پژوهش قرار داده اند، اما طراحی یک سیستم اتوماتیک برای این کار هنوز سخت و دشوار است، به ویژه زمانی که نیاز به شناسایی واقعی حتمی می باشد. دلایل این وضعیت سخت و دشوار عبارتنداز: ۱) تصاویر چهره بسیار متنوع بوده و (۲) منابع تغییرپذیری عبارتنداز ظاهر فرد، ژست سه بعدی (۳-D) ، حالت چهره، موی چهره، آرایش ، و غیره که با گذشت زمان تغییر می کنند. به علاوه، روشنایی، پس زمینه، مقیاس و پارامترهای اکتساب نیز همگی در تصاویر چهره بدست آمده تحت سناریوهای واقعی متنوع و متغیر می باشند. بنا به اظهارات ، تغییرات بین تصاویر یک چهره به خاطر روشنایی و جهت دید ، تقریباً همیشه بزرگتر از تغییرات تصویر به خاطر تغییرات صورت گرفته در هویت چهره می باشند. این مسئله تشخیص چهره را به مشکل چالش برانگیزی تبدیل کرده است. به نظر ما، دو مسئله در بطن تشخیص چهره حائز اهمیت می باشد:
۱) از کدام ویژگیها می توان برای نشان دادن چهره تحت شرایط تغییرات زیست محیطی استفاده نمود.
۲) چگونه می توان تصاویر چهره جدید را بر اساس نمایش انتخاب شده، طبقه بندی نمود؟
برای مورد ۱ ، الگوهای زیادی برای تشخیص چهره و استخراج مشخصه توسعه یافته است. کاربردی ترین شیوه ها عبارتنداز: استفاده از مشخصه های هندسی که موقعیت و حالت نسبی و اشکال مشخصه های مختلف اندازه گیری می شود. در این وضعیت، الگوهای زیادی پیشنهاد شده است که از نمایش کلی چهره استفاده می کنند، یعنی کلیه مشخصه های چهره به طور خودکار از یک تصویر چهره ورودی استخراج می شوند. در مرجع ۴ نشان داده شده است که این الگوریتم ها با رمزگذاری کلی چهره در خصوص تشخیص چهره سریع عمل می کنند. در مرجع ۵، از SVD (تجزیه مقدار ویژه) ماتریس برای استخراج مشخصه ها از الگوها استفاده شده است. در این راستا توضیح داده شده است که مقادیر ویژه و منفردیک تصویر ثابت بوده و بازتابی از مشخصه های جبری یک تصویر خواه به صورت ذاتی خواه مرئی و قابل مشاهده می باشند. شیوه چهره مشخصه توصیف مشخصه های چهره، در مرجع ۶ معرفی گردید. ایده کلیدی، محاسبه بهترین سیستم مختصات برای تراکم تصویر می باشد که هر مختصات در واقع تصویری است که یک تصویر مشخصه نامیده می شود. اما الگوی چهره مشخصه که از آنالیز مولفه اصلی (PCA) استفاده می کنند، جهت هایی به تصویر می دهد که پراکندگی کل در میان کلیه طبقات به عبارتی در میان کلیه تصاویر چهره را به حداکثر می رساند.
در جریان انتخاب تصویری که پراکندگی کل را به حداکثر برساند، PCA تغییرات ناخواسته ناشی از نور، حالت چهره و سایر فاکتورها را حفظ می کند. همچنین، مشخصه های حاصله الزاماً مناسب تمایز و تشخیص در میان کلاس ها نمی باشند. در مراجع ۷ و ۸ ، مشخصه های چهره با استفاده از الگوی مشخصه متمایز یا چهره فیشر بدست آمده اند. هدف این الگوغلبه بر مانع الگوی چهره ویژه یا مشخصه از طریق تلفیق معیارهای FLD بوده و در عین حال ایده الگوی چهره ویژه در ترسیم چهره ها از فضای ترسیم با بعد بالا به فضای مشخصه کم بعد تر را حفظ می کند. به جای استفاده از تئوری آماری، استخراج مشخصه بر مبنای شبکه های عصبی اخیراً توسعه یافته است. هدف پردازش چهره با استفاده از شبکه های عصبی، نمایش داخلی فشرده چهره هاست که معادله استخراج مشخصه عمل می کند. بنابراین، تعداد نورون های مخفی کمتر از لایه های ورودی یا خروجی می باشد، این مسئله موجب می گردد ورودی های رمزگذاری شبکه در ابعاد کوچکتری قرار داشته باشند که بیشتر اطلاعات مهم را حفظ می کنند. سپس، واحدهای مخفی شبکه عصبی می تواند به عنوان لایه ورودی شبکه عصبی دیگر و طبقه بندی تصاویر چهره عمل کند. در بسیاری از سیستم های تشخیص الگو، روش مکرراً به کارگرفته شده ، شیوه آماری می باشد که تئوری تصمیم حاصله از آماره های الگوهای ورودی برای طراحی رده بند به کار گرفته شده است. اگرچه از این الگو برای حل مسائل مختلف در زمینه رده بندی الگو استفاده شده است، اما بیان و ارائه اطلاعات ساختاری کار سخت و دشواری می باشد، مگر اینکه ویژگیها و مشخصه های درست انتخاب شده باشند. به علاوه، این شیوه برای طراحی رده بند به اطلاعات کلی نیاز دارد. الگوهای بر مبنای شبکه های عصبی، به عنوان ابزارهای جدید برای اجرای رده بندهای مختلف بر اساس شیوه ساختاری و آماری، مزایای زیادی برای رده بندی دارند، علت این امر توانایی یادگیری آنها و تعمیم مطلوب و بهینه آنها می باشد. عموماً، شبکه های چندلایه (MLN) معمولاً با الگوریتم انتشار معکوس (BP) جفت شده و یکی از کاربردی ترین روشها در تشخیص چهره به شمار می روند. با این وجود، از الگوریتم BPدو انتقاد عمده مطرح شده است: ۱) به خاطر سرعت همگرایی کند ، از لحاظ محاسباتی بسیار سخت و دشوار بوده و ۲) هیچ تضمینی وجود ندارد که کلیه مینیموم های مطلق بدست بیایند. از طرف دیگر، شبکه های عصبی RBF در جوامع شبکه های عصبی به خاطر طیف وسیع کاربردها، علاقه زیاد مسئولین را به خود جلب کرده اند.
مطلبی دیگر از این انتشارات
هوش مصنوعی از تولد تا به امروز
مطلبی دیگر از این انتشارات
تحولات عمده تکنولوژی در 150 سال گذشته
مطلبی دیگر از این انتشارات
تاثیر هوش مصنوعی(AI),بر مهمترین ابزارهای دیجیتال مارکتینگ