یک مورد استفاده یادگیری ماشین: روش‌های طبقه‌بندی ماسک زدن

شکل ۱: مردم در خیابان در طولCOVID19 ماسک به صورت دارند.
شکل ۱: مردم در خیابان در طولCOVID19 ماسک به صورت دارند.
منتشر شده در towardsdatascience به تاریخ ۲۳ جولای ۲۰۲۱
لینک منبع Machine Learning Use Case: Classifying Ways to Wear a Face Mask

چه برای حرفه پزشکی، چه محیط صنعتی و چه به عنوان عضوی از مردم اگر ماسک صورت یا ماسک تنفسی استفاده می‌کنید‌، استفاده و قرارگیری صحیح ماسک برای حداکثر محافظت ضروری است.

اکنون، با گسترش COVID19، در بسیاری از مکان‌ها (به عنوان مثال، فرودگاه‌ها، مکان‌های کاری و غیره) نیاز است که ماسک‌ها پوشیده شوند و به درستی بر روی بینی و دهان قرار گیرند. برای کمک به تشخیص و اجرای این الزامات، ما یک مدل تشخیص تصویر را در آزمایشگاه‌های پرل ایجاد کردیم که می‌توانست روش‌های مختلفی که مردم ماسک می‌زنند را طبقه‌بندی کند. سپس می توان از مدلی مانند این در ایست‌های بازرسی، ورودی‌ها، و مکان‌های دیگر برای کمک به کارکنان یا مقامات در شناسایی افرادی که از قوانین ماسک سازمان خود پیروی نمی‌کنند، استفاده کرد.

مجموعه داده‌ها

برای آموزش مدل خود، ما «روش استفاده از یک ماسک یا پایگاه‌داده رسپیراتور (WWMR-DB)» را که شامل تصاویری از افرادی است که ماسک صورت بر چهره دارند، همانطور که در شکل ۱ نشان‌داده شده‌است، انتخاب کردیم.

شکل ۲: مثال‌هایی از تصاویر پایگاه‌داده-منبع تصویر.
شکل ۲: مثال‌هایی از تصاویر پایگاه‌داده-منبع تصویر.

این مجموعه داده شامل تصاویر.jpg است که به هشت کلاس تقسیم شده و رایج ترین روش‌های استفاده از ماسک‌ها را به تصویر می‌کشد.

مجموعه داده اصلی براساس افرادی که ماسک‌ها را زده بودند، به مجموعه‌ای از زیرشاخه‌ها تقسیم شد. برای هموارتر و سازگار کردن چیزها با PerceptiLabs، ما این کار را با ایجاد هشت زیرشاخه متناظر با هشت طبقه‌بندی ساده کردیم و سپس تصاویر مناسب را به زیرشاخه‌های مربوطه منتقل کردیم. سپس هر تصویر با استفاده از ویژگی تغییر اندازه در «دیتا ویزارد» PerceptiLabs، به ۲۲۴ * ۲۲۴ پیکسل تغییر اندازه داده شد.

برای تطابق طبقه‌بندی بر روی تصاویر، ما یک فایل.csv (mask_log.csv) ایجاد کردیم که هر فایل تصویر را با یک برچسب عددی برای استفاده در بارگیری داده‌ها با استفاده ازPerceptiLabs Data Wizard مرتبط می‌کند:

0: ماسک بالای چانه

1: ماسک درست پوشیده شده

2: ماسک آویزان از گوش استفاده کننده

3: ماسک نزده

4: ماسک روی پیشانی

5: ماسک بر روی نوک بینی

6: ماسک زیر چانه

7: ماسک زیر بینی

در زیر یک مثال جزئی از شکل فایل.csv آورده شده است:

شکل۳: نمونه ای از فایل .csv برای بارگذاری داده‌ها درPerceptiLabs که نقشه‌های تصویر را بر روی برچسب‌های مربوط به آن‌ها تطابق می‌دهد.
شکل۳: نمونه ای از فایل .csv برای بارگذاری داده‌ها درPerceptiLabs که نقشه‌های تصویر را بر روی برچسب‌های مربوط به آن‌ها تطابق می‌دهد.

خلاصه مدل

مدل ما تنها با سه جز ساخته شده‌است:

مولفه ۱: InceptionV3 , include_top=no

مولفه ۲: Dense, Activation= ReLU , Neurons=128

مولفه ۳: Dense, Activation= Softmax , Neurons=8

توجه داشته باشید که اگرچه برایInceptionV3 تصاویر باید 229x229 پیکسل باشند، اما تنظیمات include_top to no، اجازه استفاده از تصاویر با ابعاد دیگر (به عنوان مثال 224x224 پیکسل) را می‌دهد.

شکل ۴: توپولوژی مدل در PerceptiLabs
شکل ۴: توپولوژی مدل در PerceptiLabs

آموزش و نتایج

ما با استفاده از بهینه‌ساز class="el iw" rel="noopener nofollow">ADAM ، میزان یادگیری 0.001 و تابع Cross Entropy loss مدل را با 20 دوره در 32 گروه آموزش دادیم. شکل 3 نمای آماریPerceptiLabs را در حین آموزش نشان می‌دهد.

شکل ۵:  نمایش آمار PerceptiLabs در طول آموزش-
شکل ۵: نمایش آمار PerceptiLabs در طول آموزش-

با زمان آموزش حدود ۳۴ دقیقه و ۲۸ ثانیه، ما توانستیم به دقت آموزش ۹۹.۴٪ و صحت اعتبارسنجی ۷۷.۱٪ دست یابیم. دقت پایین‌تر اعتبار سنجی، دشواری مدل‌های آموزشی بر روی داده‌های مربوط به تشخیص چهره را منعکس می‌کند.

در تصویر زیر از PerceptiLabs، می‌توانید ببینید که چگونه دقت اعتبارسنجی آموزش در طول شش دوره اول افزایش می‌یابد، و پس از آن نسبتا ثابت باقی می‌ماند. آموزش بیشتر در دو دوره اول افزایش می‌یابد و تا حدود ۱۴ دوره قبل از ایجاد ثبات در نوسان است:

شکل ۶: نمودار دقت.
شکل ۶: نمودار دقت.

تصویر زیر تلفات مربوطه در طول آموزش و اعتبار سنجی برای ۱۴ دوره اول را شناسایی می‌کند:

شکل ۷:  نمودار از دست دادن.
شکل ۷: نمودار از دست دادن.

در اینجا می‌توانیم ببینیم که از دست دادن آموزش در طول اولین دوره قبل از تثبیت به طور قابل‌توجهی کاهش یافت، در حالی که از دست دادن اعتبار کم بود و در کل نسبتا پایدار باقی ماند.

کاربردهای جانبی

مدلی مانند این را می توان برای اهداف امنیتی یا بهداشتی و ایمنی به کار برد تا اطمینان حاصل شود که کارگران یا بازدیدکنندگان ماسک دارند و قبل از وارد شدن آن را به درستی می‌پوشند. به عنوان مثال، می توان از این مدل برای تجزیه و تحلیل عکس‌ها یا فریم‌های ویدئویی به‌دست‌آمده از طریق دوربین‌های امنیتی در محل استفاده کرد. خود مدل نیز می‌تواند به عنوان پایه‌ای برای انتقال یادگیری به منظور ایجاد مدل‌های اضافی برای تشخیص حضور و استفاده صحیح از سایر انواع تجهیزات ایمنی و بهداشت مورد استفاده قرار گیرد.

خلاصه

این مورد استفاده مثالی از این است که چگونه می توان از تشخیص تصویر برای اطمینان از سلامت و ایمنی استفاده کرد. اگر می‌خواهید یک مدل یادگیری عمیق شبیه به این ایجاد کنید، PerceptiLabs را اجرا کنید و یک نسخه از فایل .csv ما را از GitHub بگیرید.

این متن با استفاده از ربات ترجمه مقالات علم داده ترجمه شده و به صورت محدود مورد بازبینی انسانی قرار گرفته است.در نتیجه می‌تواند دارای برخی اشکالات ترجمه باشد.
مقالات لینک‌شده در این متن می‌توانند به صورت رایگان با استفاده از مقاله‌خوان ترجمیار به فارسی مطالعه شوند.