در این مقاله نگاهی داریم به استفاده از علم داده(Data Science) و یکی از مهمترین بخشهای این علم یعنی یادگیری ماشین(Machine learning) در ساختن پرفروشترین فیلم تمام تاریخ سینما؛ انتقامجویان: پایان بازی (Avengers: Endgame).
با تماشای سری فیلمهای سینمایی کمپانی مارول(Marvel) که یک دهه بر پردۀ سینماها در سراسر جهان درخشید، اشتباه نیست که بگوییم، آخرین فیلم این برند پس از یک دهه سفر طولانی در یک دنیای سینمایی مشترک، از همه انتظارات فراتر رفته است.
گذشته از جذابیت شخصیتهایی مانند کاپتان آمِریکا، آیِرِن مَن و بلَک ویدُو که آخرین حضور خود را در این فیلم به نمایش میگذارند، بررسیهای جالب از نظر مخاطبان و منتقدان فیلم به طور یکسان قبل از اتماماکران فیلم انتقامجویان: پایان بازی ، پتانسیل آن را برای کسب رکورد پرفروشترین فیلم تاریخ سینما در یک رقابت تنگاتنگ با آواتار جیمز کامرون نشان میداد.
در حالی که بدون هیچ شکی کمپانی مارول در ارائۀ دنیای سینمایی خود فوقالعاده موفق عمل کرده است، عدم وجود شخصیتهای شروری که قابلیت تهدیدی واقعی و جدی برای به چالش کشیدن انتقامجویان را دارا باشند، نکتهای بود که سازندگان نمیتوانستند با موفقیت از پس آن بربیایند. تا اینکه تانوس بالاخره از راه رسید.
هیچ یک از ضدقهرمانهای دنیای سینمایی مارول نمیتوانست یک تنه تأثیر مورد انتظار و راضی کنندهای بر قلب هواداران داشته باشد. هیچ یک از 22 فیلم قبلی این کمپانی فیلمسازی نتوانست چنین ضد قهرمانی را معرفی کند.
تانوس، دشمن دیرینه، بیگانۀ بنفش به لطف هنرنمایی خارقالعاده جاش برولین که زندگی را به این کاراکتر هم در قسمت انتقامجویان: جنگ بینهایت و هم اکنون در انتقامجویان: پایان بازی هدیه کرد، با حضور درخشان روی پرده سینما قرار گرفت.
اما آیا این فقط جاش برولین بود که باعث شد این بختک انتقامجویان اینقدر عالی روی پرده سینما برود؟ خیر، استودیوی مارول باید از «یادگیری ماشین» تشکر کند.
جدا از انقلاب در سیجیآی(تصاویر تولید شده توسط رایانه)، این واقعیت که تانوس قادر به نمایش کامل احساسات بر روی صفحه بود، او را بهعنوان نیرویی معرفی کرد که همه را وادار به تسلیم نمود. از طریق تانوس بود که ارزش سهام این فیلم نه تنها از بُعد داستان هر دو قسمت، بلکه از نظر بالا بردن اعتبار سازندگان نیز بسیار زیاد بود، زیرا شکاف یک شرور عالی را برای انتقامجویان پر کرد.
مهم این بود که احساسات به صورت بسیار ظریف و عمیق بر چهره شخصیت نشانده شود تا مخاطبان را با همذات پنداری هرچه بیشتر با مخاطب وادار کند؛ مهمترین قسمت این کار انتقال بیعیب و نقص احساساتِ به نمایش درآمده توسط جاش برولین در چهره این غول دیوانه بود.
برای دستیابی به این هدف، شرکت دیجیتال دومین(Digital Domain)، یکی از شرکتهای متعدد فراهم کنندۀ جلوههای ویژۀ دیجیتال برای فیلم انتقامجویان: جنگ بینهایت و انتقامجویان: پایان بازی ، از یک نرمافزار پیشرفته یادگیری ماشین به نام ماسکِرِید(Masquerade) استفاده کرد تا فراید ضبط حرکات واقعیتر و طبیعیتر شود.
کل فرآیند با قرار دادن صد تا صد و پنجاه نقطه بر روی تصویر چهرۀ جاش برولین در رایانه آغاز شد که یک برنامه رایانهای آن نقاط را دنبال میکرد؛ تصویر توسط چند دوربین فوقالعاده با کیفیت که به صورت عمود بر چهرۀ بازیگر جهتگیری شده بودند ضبط میشد.
نیازی نبود که این اسکن اولیه به ارائه نتایج با کیفیت بالا منجر شود، بلکه به دست آوردن یک شمایل کلی کافی بود. سپس این رِندِر اولیه به عنوان ورودی به الگوریتم یادگیری ماشین خورانده شد که از اسکنهای متعدد صورت با وضوح بالا با انواع گستردهای از حالات چهره استفاده مینمود.
نرمافزار ماسکِرِید از رندرهای با وضوح پایین به عنوان مواد اولیه استفاده و بهطور خودکار تصاویر چهره با وضوح بالا را به عنوان راهحل مناسب برای نمایش بر روی صفحه معرفی میکند. اگر جواب به اندازه کافی دقیق به نظر نرسد، تیم متخصص پس از آن چیزهایی را کمی دستکاری میکند تا به یک راهحل بهتر برسد.
این ترفندها شامل مواردی مانند بالا بردن ابروها یا کمی فشردهسازی لب میشدند که به دوباره به سیستم بازخورانده میشدند و توسط الگوریتم یادگیری ماشین آموخته میشدند.
اما همه اینها فقط یک مرحله از تمام فرایند بود! مرحله بعدی که با عنوان درایو مستقیم شناخته میشود و شامل اجرای قابلیتی در برنامه رایانهای با عنوان پوشش صورت با کیفیت بالا میشود.
اگر سیستم یادگیری ماشینی مانند ماسکِرِید وجود نداشت، تیم جلوههای باید حالتهای چهره را به صورت دستی از طریق انیمیشن تغییر میدادند که مطمئناً نتایج به دست آمده مانند آنهایی که با کمک ماسکرید تولید شدند چشمگیر نبودند. همچنین این میتوانست یک فرایند بسیار وقتگیر باشد.
به نظر میرسد هیچ حد و مرزی برای پیشرفت تکنیکهای پردازش و تولید تصاویر به روشهای دیجیتالی و رایانهای وجود نداشته باشد. به جرئت میتوان گفت انگیزۀ اصلی مردم در سراسر جهان از خریدن بلیت و دیدن فیلم انتقامجویان: پایان بازی نه دنبال نمودن و پی به بردن به داستان و یا دیدن کاراکترهای محبوبشان بلکه تماشا و لذت بردن از جلوههای ویژۀ رایانهای به کار رفته در این فیلم بوده است که حاصل تلاش بیوقفه متخصصان یادگیری ماشین و رایانه است. از این زاویه میتوان به ظرفیتهای اقتصادی چشمگیر موجود در تکنولوژی پردازش تصاویر از طریق علم پردازش داده و یادگیری ماشین پی بُرد.
در آینده نزدیک تکنولوژی یادگیری ماشین برای چیزهایی بیش از چهره به کار خواهد رفت. منتظر باشید هر زمان صحبت از جلوههای ویژه و طراحی شد، یادگیری ماشین در آنجا نقش اساسی داشته باشد.
جهان مسیر خود را بهسوی هرچه بیشتر تصویری شدن در حوزۀ ارتباطات و رسانه(در مقایسه با استفاده از زبان و کلمات) چند سال است که آغاز نموده است. سرمایهگذاری بر روی یادگیری ماشین در حوزۀ تصویر بدون شک برای کشورها و مردم نتایج مطلوبی به بار خواهد آورد. به نظر میرسد برای دستاندرکاران صنعت سینما و سرگرمی در سراسر جهان، همگام شدن با شدن با قدرت و سرعت روز افزون رایانهها در پردازش دادههای بصری امری اجتنابناپذیر مینماید.
منابع: goodworklabs و vfxvoice