یک تکنیک جدید در دید کامپیوتری ممکن است درک سه‌بعدی ما از تصاویر دو بعدی را افزایش دهد.

منتشر شده در analyticsinsight به تاریخ ۲۱ ژوئن ۲۰۲۲
لینک منبع A NEW COMPUTER VISION TECHNIQUE CAN RECOVER 3D INFO FROM 2D IMAGES

در حال حاضر، یک تکنیک جدید در بینایی کامپیوتری ممکن است درک سه‌بعدی ما از تصاویر دو بعدی را افزایش دهد. مدل‌های سه‌بعدی مجموعه‌ای از نقاط در فضای سه‌بعدی هستند، بنابراین طول، عرض و عمق دارند. تصاویر دو بعدی تنها مولفه‌های طول و عرض دارند. این بخش مهمی از مطالعات بینایی کامپیوتری بوده‌است. بینایی کامپیوتری زمینه‌ای از هوش مصنوعی است که کامپیوترها را قادر می‌سازد تا اطلاعات را از تصاویر، فیلم‌ها و سایر ورودی‌ها به دست آورند. مشکل به چند دلیل دشوار است، یکی از این دلایل این است که اطلاعات به ناچار زمانی از دست می‌رود که صحنه‌ای که در ۳ بعد رخ می‌دهد به یک نمایش ۲ بعدی کاهش یابد.

درک سه‌بعدی از تصاویر دو بعدی:

برخی برنامه‌های مدل‌سازی سه‌بعدی وجود دارند که می‌توانند به شما کمک کنند تا مدل‌های سه‌بعدی را از تصاویر دو بعدی ایجاد کنید. آن‌ها به کمی زمان و صبر نیاز دارند. هنوز هیچ نرم‌افزاری وجود ندارد که بتواند یک تصویر دو بعدی را بگیرد و یک مدل سه‌بعدی قوی ایجاد کند. با این حال، استفاده از مجموعه‌ای از تصاویر دو بعدی و ایجاد یک مدل سه‌بعدی از طریق فرآیندی به نام فتوگرامتری امکان‌پذیر است. فتوگرامتری هنر، علم و فن‌آوری به دست آوردن اطلاعات قابل‌اعتماد در مورد اشیا فیزیکی و محیط‌زیست از طریق فرآیندهای ثبت، اندازه‌گیری و تفسیر تصاویر عکاسی و الگوهای انرژی الکترومغناطیسی تابشی ثبت‌شده و دیگر پدیده‌ها است.

چند استراتژی به خوبی تثبیت شده‌ برای بازیابی اطلاعات سه‌بعدی از چندین تصویر دو بعدی وجود دارد، اما هر کدام محدودیت‌هایی دارند. این تطابق‌های مجازی (VCs) هستند. VCs یک جفت پیکسل از دو تصویر هستند که اشعه‌های دوربین آن‌ها در سه‌بعدی تقاطع دارند. مشابه تطابقات کلاسیک، VCها با هندسه اپی قطبی مطابقت دارند. بر خلاف تطابقات کلاسیک، VCها نیازی به قابل مشاهده بودن در بین نماها ندارند.

تطابقات مجازی راهی برای حمل چیزهای بیشتر ارائه می‌دهند، که یک عکس از سمت چپ یک خرگوش گرفته شده‌است و عکس دیگری از سمت راست گرفته شده‌است. محققان می‌خواهند کامپیوترهایی بسازند که بتوانند جهان سه‌بعدی را درست مانند انسان‌ها درک کنند و نیاز دارند کامپیوترهایی را توسعه دهند که نه تنها قادر به تفسیر تصاویر اشیا بی‌جان باشند بلکه بتوانند فیلم‌های کوتاه ویدئویی و در نهایت فیلم‌های تمام طول را نیز درک کنند.

این متن با استفاده از ربات ترجمه مقالات علم داده ترجمه شده و به صورت محدود مورد بازبینی انسانی قرار گرفته است.در نتیجه می‌تواند دارای برخی اشکالات ترجمه باشد.
مقالات لینک‌شده در این متن می‌توانند به صورت رایگان با استفاده از مقاله‌خوان ترجمیار به فارسی مطالعه شوند.