
در قرن بیستم، بهرهگیری از کامپیوتر برای ترسیمات دوبعدی—یا آنچه امروزه با عنوان گرافیکهای رایانهای و نرمافزارهای CAD شناخته میشود—تحولی اساسی در شیوهی تولید و ارائهی نقشهها و ترسیمات فنی ایجاد کرد. این تغییر، نهتنها سرعت و دقت ترسیمات را افزایش داد، بلکه زمینهساز ورود ابزارهای دیجیتال به جریان اصلی طراحی در معماری، شهرسازی و طراحی صنعتی شد.
با گذر زمان، این ترسیمات دوبعدی دیجیتال به مدلسازیهای سهبعدی تکامل یافتند. نرمافزارهایی مانند 3ds Max، Blender، Rhino و Revit امکان درک فضایی بهتر، شبیهسازی دقیقتر و ارتباط مؤثرتر میان طراح و ایده را فراهم کردند و به ابزارهای جداییناپذیر معماران، طراحان شهری و طراحان صنعتی تبدیل شدند.
اما نقطهی عطف بعدی، در ابتدای قرن بیستویکم رقم خورد؛ جایی که توسعهدهندگان و طراحان یک گام فراتر رفتند و با معرفی تکنولوژیهای اسکن سهبعدی، امکان تبدیل تصاویر و ویدئوها به مدلهای سهبعدی را فراهم کردند. در این میان، فناوریهایی مانند فتوگرامتری وNeRFs (Neural Radiance Fields) بهعنوان شناختهشدهترین روشها، نقش مهمی در بازنمایی دیجیتال از دنیای واقعی ایفا کردند.

در سوی دیگر، فناوری لایدار (LiDAR)—بهویژه پس از توسعه و یکپارچهسازی آن در گوشیهای آیفون—امکان برداشت دقیقتر، سریعتر و با جزئیات بالاتر از محیطهای واقعی را فراهم ساخت و کیفیت مدلهای سهبعدی حاصل از اسکن را بهطور چشمگیری ارتقا داد.

با این حال، در دو تا سه سال اخیر، این حوزه شاهد جهشی تازه بوده است. ظهور فناوری نوینی به نام Gaussian Splatting یک بار دیگر مرزهای تکنولوژیهای بصری را جابهجا کرده و تحولی جدی در نحوهی بازنمایی واقعیت ایجاد کرده است. تفاوت اصلی این فناوری با روشهایی مانند فتوگرامتری یا سایر تکنیکهای مشابه، در سرعت بسیار بالا و توانایی ارائهی جزئیات غنی از محیط یا آبجکتها نهفته است؛ آن هم با فرآیندی کارآمدتر و سبکتر.
در این مقاله تلاش میکنم بهصورت کاربردی و دقیق به این پرسش بپردازم که Gaussian Splatting دقیقاً چیست، چگونه ساخته میشود و در چه حوزههایی میتوان از آن استفاده کرد.
سازوکار این تکنولوژی بهگونهای است که ابتدا موقعیت دقیق دوربین در لحظهای که تصویر یا ویدئو ثبت شده شناسایی میشود. هر یک از این موقعیتها بهصورت یک نقطه در فضا تعریف میشوند و با کنار هم قرار گرفتن این نقاط، ساختاری به نام Point Cloud شکل میگیرد.

مفهوم پوینتکلاد پیشتر نیز در فناوریهایی مانند فتوگرامتری و لایدار مورد استفاده قرار میگرفت؛ اما تفاوت اصلی Gaussian Splatting با روشهای پیشین در نحوهی نمایش و پردازش این نقاط است. در این فناوری، نقاط صرفاً بهصورت نقاط هندسی ساده باقی نمیمانند، بلکه هر نقطه به یک حجم سهبعدی نرم با فرمی نزدیک به بیضی یا دایره تبدیل میشود. به بیان سادهتر، این نقاط بهگونهای در فضا «پاشیده» میشوند که دارای گستره و حجم هستند، نه فقط یک موقعیت صفربعدی.

با همپوشانی و تطبیق هوشمند این حجمها، ساختار فضایی محیط یا آبجکت اسکنشده با دقت بسیار بالا بازسازی میشود. نتیجهی این فرآیند، مدلی سهبعدی با جزئیات بصری چشمگیر است که آن را با عنوان Gaussian Splatting میشناسیم؛ رویکردی نوین که بازنمایی واقعیت را سریعتر و طبیعیتر از بسیاری از تکنیکهای پیشین ممکن میسازد.

در توصیف گسترهی کاربردهای این تکنولوژی میتوان گفت هر جا که نیاز به مدلسازی سهبعدی وجود داشته باشد، Gaussian Splatting میتواند بهعنوان یک راهکار سریع، دقیق و کارآمد مورد استفاده قرار گیرد. با اسکن سهبعدی محیطهای واقعی و تبدیل آنها به مدلهای سهبعدی، امکان بهرهگیری از این دادهها در حوزههای متنوعی فراهم میشود.
در حوزهی واقعیت افزوده، امکان اسکن آبجکتهای واقعی و تبدیل آنها به مدلهای سهبعدی وجود دارد؛ مدلهایی که میتوان آنها را از طریق هدستهای AR یا حتی موبایل و تبلت وارد فضای واقعی کرد. این قابلیت، کاربردهای گستردهای در آموزش، موزهها، فروش محصولات و نمایش اشیای واقعی در بستر دیجیتال ایجاد میکند.

در واقعیت مجازی، Gaussian Splatting این امکان را فراهم میکند که محیطهای واقعی با دقت بالا اسکن شده و به فضاهای قابل غوطهوری تبدیل شوند. کاربران میتوانند در این محیطها جابهجا شوند و با فضا تعامل برقرار کنند.
در حوزههایی مانند معماری و املاک که ارائهی تصویری دقیق از وضعیت موجود فضا اهمیت زیادی دارد، پیشتر از تصاویر ۳۶۰ درجه و تورهای مجازی استفاده میشد. اما امروزه میتوان با اسکن سهبعدی واحدهای مسکونی یا فضاهای کاری، تجربهای بسیار واقعگرایانهتر را در قالب واقعیت مجازی و حتی بهصورت تحت وب در اختیار مخاطبان و کارفرمایان قرار داد.

یکی از مهمترین و تحولآفرینترین کاربردهای Gaussian Splatting در حوزهی دوقلوی دیجیتال دیده میشود. زمانی که هدف، ساخت یک همزاد دیجیتالی دقیق از یک محیط، سازه یا سیستم واقعی است، میتوان بهجای روشهای سنتی مانند مدلسازی سهبعدی یا فتوگرامتری، از این تکنولوژی استفاده کرد. نتیجه، ارائهای بسیار دقیق، جزئیاتمحور و رئالیستی از نمونهی واقعی است که میتواند در تحلیل، پایش و شبیهسازی مورد استفاده قرار گیرد.
در حوزهی تورهای مجازی نیز، نرمافزار 3D Vista Virtual Tour در بهروزرسانیهای اخیر خود، قابلیت پشتیبانی از این تکنولوژی را اضافه کرده است. بهواسطهی این امکان، میتوان تورهای مجازی پیشرفتهای از فضاهای معماری یا محیطهای شهری ایجاد کرد که تجربهای فراتر از تورهای کلاسیک مبتنی بر تصاویر پانوراما ارائه میدهند.
در صنعت بازیسازی، بهجای مدلسازی دستی و رندر زمانبر محیطها و آبجکتها، میتوان از Gaussian Splatting برای تولید مستقیم محیط بازی استفاده کرد. به این ترتیب، فضاهایی در مقیاس وسیع، با سرعت بالا و درجهی بالایی از رئالیسم خلق میشوند. پس از شکلگیری محیط اصلی، میتوان سایر عناصر گیمپلی مانند مکانیکهای بازی، جمعآوری سلاحها، ابزارهای مبارزه با دشمنان و افکتهایی نظیر برف، باران یا دود را به آن افزود.

1- فیلمبرداری یا عکسبرداری از محیط یا آبجکت
برای ساخت یک مدل مبتنی بر Gaussian Splatting، در گام نخست لازم است مجموعهای از تصاویر یا یک ویدیوی دقیق از آبجکت یا محیط موردنظر تهیه شود. این ثبت تصویری باید از زوایای مختلف انجام شود تا دادههای کافی برای بازسازی سهبعدی در اختیار نرمافزار قرار بگیرد.

2- نرم افزار ساخت
در مرحله بعد، با استفاده از نرمافزارهای مختلفی که امروزه در بازار وجود دارند، میتوان فرایند تبدیل این دادهها به Gaussian Splat را انجام داد. هر یک از این نرمافزارها ویژگیها، محدودیتها و کیفیت خروجی متفاوتی دارند. به همین دلیل، در جدول مقایسهای که در ادامه آمده، این ابزارها بر اساس معیارهای مختلف بررسی و با یکدیگر مقایسه شدهاند.

در نهایت و بر اساس این مقایسه، میتوان گفت نرمافزار Postshot — که بر روی سیستمعامل ویندوز اجرا میشود و بهصورت رایگان و بدون محدودیت در دسترس است — در حال حاضر گزینهای با کیفیتتر و مطلوبتر نسبت به سایر گزینهها محسوب میشود.

3- ادیت و انتشار
یک نکته بسیار مهم وجود دارد: مدل سهبعدی حاصل از Gaussian Splatting از نوع Mesh نیست. به همین دلیل، امکان گرفتن خروجی مستقیم با فرمتهای رایج سهبعدی مانند FBX، GLB، DAE، OBJ و سایر فرمتهای متداول وجود ندارد.
در نتیجه، برای استفاده از این مدلها در نرمافزارها یا موتورهای سهبعدی دیگر، لازم است طی یک سری فرایندهای نرمافزاری در محیط Blender، این Splatها به مدل مش تبدیل شوند. پس از انجام این تبدیل، میتوان خروجی نهایی را با فرمت دلخواه دریافت کرد.

4- مشکل تبدیل splat به mesh
مشکل اصلی در رابزه با تکنولوژی Gaussian Splatting این است مه با ساختار های رایج مدل های سه بعدی متفاوت است و نمیتوان آن را وارد نرم افزار های مدلسازی مختلف کرد یا خروجی هایی با فرمت های رای سه بعدی مانند FBX, OBJ, GLB, DXF و... کرد. بنابراین لازم است تا طی فرآیندی آن را به ساختار استاندارد Mesh تبدیل کرد.
برا یاین تبدیل بهترین راه حل موجود استفاده از add-on مربوط به نرم افزار Blender با نام KIRI Engine 3DGS plugin for Blender هست که از این لینک گیت هاب قابل دانلود است.

آنچه تاکنون درباره آن صحبت شد، عموماً تحت عنوان 3D Gaussian Splatting شناخته میشود؛ روشی که خروجی آن یک مدل سهبعدی ایستا از محیط یا آبجکت است. با این حال، در ماههای اخیر برخی شرکتهای نوآور و پیشرو در سطح جهانی از نسل جدیدی با عنوان 4D Gaussian Splatting (4DGS) رونمایی کردهاند؛ رویکردی که بُعد زمان را نیز وارد این فرایند میکند.
در این حالت، ما دیگر صرفاً با یک مدل سهبعدی ثابت مواجه نیستیم، بلکه نسخهای پویا و انیمیتشده از مدل در اختیار داریم. به بیان سادهتر، تغییرات و حرکات نیز به بخشی از داده سهبعدی تبدیل میشوند و تجربهای بسیار نزدیکتر به واقعیت شکل میگیرد.
در آینده انتظار میرود فرایندهای نرمافزاری مربوط به ویرایش، پردازش و انتشار این فناوری به صورت Real-Time انجام شود. اگر چنین قابلیتی به شکل گسترده محقق شود، میتوان از یک انقلاب عظیم در صنعت فناوریهای بصری در مقیاس جهانی صحبت کرد.
برای درک بهتر این تحول، کافی است تصور کنیم امکان حضور لحظهای در یک فیلم سینمایی وجود داشته باشد؛ بهطوری که بتوان شخصیت اصلی داستان را از زوایای مختلف مشاهده کرد. یا حتی مسابقات جام جهانی فوتبال که در کشوری دیگر در حال برگزاری است، به صورت سهبعدی و همزمان تجربه شود؛ تجربهای که در آن کاربر احساس کند واقعاً در زمین مسابقه حضور دارد، نه صرفاً تماشاگر یک تصویر دوبعدی.
ائلیار محمدزاده
آذر 1404