mfta
mfta
خواندن ۴ دقیقه·۵ سال پیش

نقش یادگیری ماشین در ساخت فیلم انتقام‌جویان: پایان بازی

در این مقاله نگاهی داریم به استفاده از علم داده(Data Science) و یکی از مهم‌ترین بخش‌های این علم یعنی یادگیری ماشین(Machine learning) در ساختن پرفروش‌ترین فیلم تمام تاریخ سینما؛ انتقام‌جویان: پایان بازی (Avengers: Endgame).

چگونه یادگیری ماشینی به “تانوس” روح دمید

با تماشای سری فیلم‌های سینمایی کمپانی مارول(Marvel) که یک دهه‌ بر پردۀ سینماها در سراسر جهان درخشید، اشتباه نیست که بگوییم، آخرین فیلم این برند پس از یک دهه سفر طولانی در یک دنیای سینمایی مشترک، از همه انتظارات فراتر رفته است.

گذشته از جذابیت شخصیت‌هایی مانند کاپتان آمِریکا، آیِرِن مَن و بلَک ویدُو که آخرین حضور خود را در این فیلم به نمایش می‌گذارند، بررسی‌های جالب از نظر مخاطبان و منتقدان فیلم به طور یکسان قبل از اتماماکران فیلم انتقام‌جویان: پایان بازی ، پتانسیل آن را برای کسب رکورد پرفروش‌ترین فیلم تاریخ سینما در یک رقابت تنگاتنگ با آواتار جیمز کامرون نشان می‌داد.

در حالی که بدون هیچ شکی کمپانی مارول در ارائۀ دنیای سینمایی خود فوق‌العاده موفق عمل کرده است، عدم وجود شخصیت‌های شروری که قابلیت تهدیدی واقعی و جدی برای به چالش کشیدن انتقام‌جویان را دارا باشند، نکته‌ای بود که سازندگان نمی‌توانستند با موفقیت از پس آن بربیایند. تا اینکه تانوس بالاخره از راه رسید.

هیچ یک از ضدقهرمان‌های دنیای سینمایی مارول نمی‌توانست یک تنه تأثیر مورد انتظار و راضی کننده‌ای بر قلب هواداران داشته باشد. هیچ یک از  22 فیلم قبلی این کمپانی فیلم‌سازی نتوانست چنین ضد قهرمانی را معرفی کند.

تانوس، دشمن دیرینه، بیگانۀ بنفش به لطف هنرنمایی خارق‌العاده جاش برولین که زندگی را به این کاراکتر هم در قسمت انتقام‌جویان: جنگ بی‌نهایت و هم اکنون در انتقام‌جویان: پایان بازی هدیه کرد، با حضور درخشان روی پرده سینما قرار گرفت.

اما آیا این فقط جاش برولین بود که باعث شد این بختک انتقام‌جویان این‌قدر عالی روی پرده سینما برود؟ خیر، استودیوی مارول باید از «یادگیری ماشین» تشکر کند.

جدا از انقلاب در سی‌جی‌آی(تصاویر تولید شده توسط رایانه)، این واقعیت که تانوس قادر به نمایش کامل احساسات بر روی صفحه بود، او را به‌عنوان نیرویی معرفی کرد که همه را وادار به تسلیم نمود. از طریق تانوس بود که ارزش سهام این فیلم نه تنها از بُعد داستان هر دو قسمت، بلکه از نظر بالا بردن اعتبار سازندگان نیز بسیار زیاد بود، زیرا شکاف یک شرور عالی را برای انتقام‌جویان پر کرد.

مهم این بود که احساسات به صورت بسیار ظریف و عمیق بر چهره شخصیت نشانده شود تا مخاطبان را با همذات پنداری هرچه بیشتر با مخاطب وادار کند؛ مهم‌ترین قسمت این کار انتقال بی‌عیب و نقص احساساتِ به نمایش درآمده توسط جاش برولین در چهره این غول دیوانه بود.

برای دستیابی به این هدف، شرکت دیجیتال دومین(Digital Domain)، یکی از شرکت‌های متعدد فراهم کنندۀ جلوه‌های ویژۀ دیجیتال برای فیلم انتقام‌جویان: جنگ بی‌نهایت و انتقام‌جویان: پایان بازی ، از یک نرم‌افزار پیشرفته یادگیری ماشین به نام ماسکِرِید(Masquerade) استفاده کرد تا فراید ضبط حرکات واقعی‌تر و طبیعی‌تر شود.

کل فرآیند با قرار دادن صد تا صد و پنجاه نقطه بر روی تصویر چهرۀ جاش برولین در رایانه آغاز شد که یک برنامه رایانه‌ای آن نقاط را دنبال می‌کرد؛ تصویر توسط چند دوربین فوق‌العاده با کیفیت که به صورت عمود بر چهرۀ بازیگر جهت‎گیری شده بودند ضبط می‌شد.

نیازی نبود که این اسکن اولیه به ارائه نتایج با کیفیت بالا منجر شود، بلکه به دست آوردن یک شمایل کلی کافی بود. سپس این رِندِر اولیه به عنوان ورودی به الگوریتم یادگیری ماشین خورانده شد که از اسکن‌های متعدد صورت با وضوح بالا با انواع گسترده‌ای از حالات چهره استفاده می‌نمود.

نرم‌افزار ماسکِرِید از رندرهای با وضوح پایین به عنوان مواد اولیه استفاده و به‌طور خودکار تصاویر چهره با وضوح بالا را به عنوان راه‌حل مناسب برای نمایش بر روی صفحه معرفی می‌کند. اگر جواب به اندازه کافی دقیق به نظر نرسد، تیم متخصص پس از آن چیزهایی را کمی دست‌کاری می‌کند تا به یک راه‌حل بهتر برسد.

این ترفندها شامل مواردی مانند بالا بردن ابروها یا کمی فشرده‌سازی لب می‌شدند که به دوباره به سیستم بازخورانده می‌شدند و توسط الگوریتم یادگیری ماشین آموخته می‌شدند.

اما همه این‌ها فقط یک مرحله از تمام فرایند بود! مرحله بعدی که با عنوان درایو مستقیم شناخته می‌شود و شامل اجرای قابلیتی در برنامه رایانه‌ای با عنوان پوشش صورت با کیفیت بالا می‌شود.

اگر سیستم یادگیری ماشینی مانند ماسکِرِید وجود نداشت، تیم جلوه‌های باید حالت‌های چهره را به صورت دستی از طریق انیمیشن تغییر می‌دادند که مطمئناً نتایج به دست آمده مانند آن‌هایی که با کمک ماسکرید تولید شدند چشمگیر نبودند. همچنین این می‌توانست یک فرایند بسیار وقت‌گیر باشد.

به نظر می‌رسد هیچ حد و مرزی برای پیشرفت تکنیک‌های پردازش و تولید تصاویر به روش‌های دیجیتالی و رایانه‌ای وجود نداشته باشد. به جرئت می‌توان گفت انگیزۀ اصلی مردم در سراسر جهان از خریدن بلیت و دیدن فیلم انتقام‌جویان: پایان بازی نه دنبال نمودن و پی به بردن به داستان و یا دیدن کاراکترهای محبوبشان بلکه تماشا و لذت بردن از جلوه‌های ویژۀ رایانه‌ای به کار رفته در این فیلم بوده است که حاصل تلاش بی‌وقفه متخصصان یادگیری ماشین و رایانه است. از این زاویه می‌توان به ظرفیت‌های اقتصادی چشمگیر موجود در تکنولوژی پردازش تصاویر از طریق علم پردازش داده و یادگیری ماشین پی بُرد.

در آینده نزدیک تکنولوژی یادگیری ماشین برای چیزهایی بیش از چهره به کار خواهد رفت. منتظر باشید هر زمان صحبت از جلوه‌های ویژه و طراحی شد، یادگیری ماشین در آنجا نقش اساسی داشته باشد.

جهان مسیر خود را به‌سوی هرچه بیشتر تصویری شدن در حوزۀ ارتباطات و رسانه(در مقایسه با استفاده از زبان و کلمات) چند سال است که آغاز نموده است. سرمایه‌گذاری بر روی یادگیری ماشین در حوزۀ تصویر بدون شک برای کشورها و مردم نتایج مطلوبی به بار خواهد آورد. به نظر می‌رسد برای دست‌اندرکاران صنعت سینما و سرگرمی در سراسر جهان، همگام شدن با شدن با قدرت و سرعت روز افزون رایانه‌ها در پردازش داده‌های بصری امری اجتناب‌ناپذیر می‌نماید.

منابع: goodworklabs و vfxvoice

ترجمه اختصاصی از سایت مفتا

تحلیل فیلمavengersهوش مصنوعی
رسانه‌های جهانی، نمیخواهند توجه شما به برخی اخبار خاص دنیای تکنولوژی جلب شود، ما این ناشنیده های تکنولوژی را به شما خواهیم گفت! مفتا؛ مجله فردای تکنولوژی ایران
شاید از این پست‌ها خوشتان بیاید