مدل YOLO (You Only Look Once) یک مدل شبکه عصبی کانولوشنی (Convolutional Neural Network یا CNN) است که برای تشخیص و مکانیابی اشیاء در تصاویر و ویدئوها استفاده میشود. YOLO از معماری عصبی عمیق تشکیل شده است و به طور معمول از لایههای CNN برای استخراج ویژگیهای تصویر و همچنین از لایههای دیگر برای تشخیص و مکانیابی اشیاء استفاده میکند.
مهمترین ویژگیهای مدل YOLO عبارتند از:
بلادرنگ (Real-time): یکی از ویژگیهای برجسته YOLO، قابلیت اجرای بلادرنگ است. این به معنای این است که مدل YOLO قادر است تشخیص و مکانیابی اشیاء در واقعیت زمانی زنده انجام دهد و با سرعت بالا کار کند. این ویژگی آن را به یک انتخاب مناسب برای برنامهها و سیستمهایی میتواند تبدیل کند که نیاز به پردازش سریع تصاویر دارند، مانند خودروهای خودران.
دقت (Accuracy): YOLO به دلیل معماری عمیقتر خود و استفاده از اطلاعات مکانی برای تشخیص اشیاء، دقت بالایی در تشخیص و مکانیابی اشیاء دارد.
قابلیت تعمیم (Generalization): مدل YOLO قابلیت تعمیم بسیار خوبی دارد، به این معنا که میتواند در مقابل تغییرات مختلف در اشیاء، اندازه تصاویر و شرایط نوری عمل کند.
مدیریت چند کلاس (Multi-class Detection): YOLO قادر است به صورت همزمان چندین شیء از دستههای مختلف را تشخیص دهد. این به آن امکان میدهد که در تصاویر و ویدئوهایی که شامل اشیاء متعدد و متنوعی هستند، کاربرد داشته باشد.
متنبازبودن (Open Source): یکی از مزایای مهم YOLO این است که اکثر نسخههای آن به صورت متنباز منتشر شدهاند، به این ترتیب افراد و تحقیقگران میتوانند آن را برای پروژههای خود تنظیم و توسعه دهند.