ویرگول
ورودثبت نام
ائلیار محمدزاده
ائلیار محمدزادهیه دانشجوی دکترای شهرسازی که در مورد شهر هوشمند، واقعیت مجازی و افزوده و چند تا حوزه دیگه که تجربه اندکی داره میگه
ائلیار محمدزاده
ائلیار محمدزاده
خواندن ۷ دقیقه·۱ ماه پیش

فناوری Gaussian Splattingg؛ کاربرد ها، نحوه بکارگیری و چالش ها


منظور از Gaussian Splatting چیست؟

 

در قرن بیستم، بهره‌گیری از کامپیوتر برای ترسیمات دوبعدی—یا آنچه امروزه با عنوان گرافیک‌های رایانه‌ای و نرم‌افزارهای CAD شناخته می‌شود—تحولی اساسی در شیوه‌ی تولید و ارائه‌ی نقشه‌ها و ترسیمات فنی ایجاد کرد. این تغییر، نه‌تنها سرعت و دقت ترسیمات را افزایش داد، بلکه زمینه‌ساز ورود ابزارهای دیجیتال به جریان اصلی طراحی در معماری، شهرسازی و طراحی صنعتی شد.

با گذر زمان، این ترسیمات دوبعدی دیجیتال به مدل‌سازی‌های سه‌بعدی تکامل یافتند. نرم‌افزارهایی مانند 3ds Max، Blender، Rhino و Revit امکان درک فضایی بهتر، شبیه‌سازی دقیق‌تر و ارتباط مؤثرتر میان طراح و ایده را فراهم کردند و به ابزارهای جدایی‌ناپذیر معماران، طراحان شهری و طراحان صنعتی تبدیل شدند.
اما نقطه‌ی عطف بعدی، در ابتدای قرن بیست‌ویکم رقم خورد؛ جایی که توسعه‌دهندگان و طراحان یک گام فراتر رفتند و با معرفی تکنولوژی‌های اسکن سه‌بعدی، امکان تبدیل تصاویر و ویدئوها به مدل‌های سه‌بعدی را فراهم کردند. در این میان، فناوری‌هایی مانند فتوگرامتری وNeRFs (Neural Radiance Fields) به‌عنوان شناخته‌شده‌ترین روش‌ها، نقش مهمی در بازنمایی دیجیتال از دنیای واقعی ایفا کردند.


در سوی دیگر، فناوری لایدار (LiDAR)—به‌ویژه پس از توسعه و یکپارچه‌سازی آن در گوشی‌های آیفون—امکان برداشت دقیق‌تر، سریع‌تر و با جزئیات بالاتر از محیط‌های واقعی را فراهم ساخت و کیفیت مدل‌های سه‌بعدی حاصل از اسکن را به‌طور چشمگیری ارتقا داد.

 

با این حال، در دو تا سه سال اخیر، این حوزه شاهد جهشی تازه بوده است. ظهور فناوری نوینی به نام Gaussian Splatting یک بار دیگر مرزهای تکنولوژی‌های بصری را جابه‌جا کرده و تحولی جدی در نحوه‌ی بازنمایی واقعیت ایجاد کرده است. تفاوت اصلی این فناوری با روش‌هایی مانند فتوگرامتری یا سایر تکنیک‌های مشابه، در سرعت بسیار بالا و توانایی ارائه‌ی جزئیات غنی از محیط یا آبجکت‌ها نهفته است؛ آن هم با فرآیندی کارآمدتر و سبک‌تر.

در این مقاله تلاش می‌کنم به‌صورت کاربردی و دقیق به این پرسش بپردازم که Gaussian Splatting دقیقاً چیست، چگونه ساخته می‌شود و در چه حوزه‌هایی می‌توان از آن استفاده کرد.

ساز و کار Gaussian Splatting


سازوکار این تکنولوژی به‌گونه‌ای است که ابتدا موقعیت دقیق دوربین در لحظه‌ای که تصویر یا ویدئو ثبت شده شناسایی می‌شود. هر یک از این موقعیت‌ها به‌صورت یک نقطه در فضا تعریف می‌شوند و با کنار هم قرار گرفتن این نقاط، ساختاری به نام Point Cloud شکل می‌گیرد.


مفهوم پوینت‌کلاد پیش‌تر نیز در فناوری‌هایی مانند فتوگرامتری و لایدار مورد استفاده قرار می‌گرفت؛ اما تفاوت اصلی Gaussian Splatting با روش‌های پیشین در نحوه‌ی نمایش و پردازش این نقاط است. در این فناوری، نقاط صرفاً به‌صورت نقاط هندسی ساده باقی نمی‌مانند، بلکه هر نقطه به یک حجم سه‌بعدی نرم با فرمی نزدیک به بیضی یا دایره تبدیل می‌شود. به بیان ساده‌تر، این نقاط به‌گونه‌ای در فضا «پاشیده» می‌شوند که دارای گستره و حجم هستند، نه فقط یک موقعیت صفر‌بعدی.


با هم‌پوشانی و تطبیق هوشمند این حجم‌ها، ساختار فضایی محیط یا آبجکت اسکن‌شده با دقت بسیار بالا بازسازی می‌شود. نتیجه‌ی این فرآیند، مدلی سه‌بعدی با جزئیات بصری چشمگیر است که آن را با عنوان Gaussian Splatting می‌شناسیم؛ رویکردی نوین که بازنمایی واقعیت را سریع‌تر و طبیعی‌تر از بسیاری از تکنیک‌های پیشین ممکن می‌سازد.

کاربردهای Gaussian Splatting در حوزه‌های مختلف

در توصیف گستره‌ی کاربردهای این تکنولوژی می‌توان گفت هر جا که نیاز به مدل‌سازی سه‌بعدی وجود داشته باشد، Gaussian Splatting می‌تواند به‌عنوان یک راهکار سریع، دقیق و کارآمد مورد استفاده قرار گیرد. با اسکن سه‌بعدی محیط‌های واقعی و تبدیل آن‌ها به مدل‌های سه‌بعدی، امکان بهره‌گیری از این داده‌ها در حوزه‌های متنوعی فراهم می‌شود.

واقعیت افزوده (Augmented Reality)


در حوزه‌ی واقعیت افزوده، امکان اسکن آبجکت‌های واقعی و تبدیل آن‌ها به مدل‌های سه‌بعدی وجود دارد؛ مدل‌هایی که می‌توان آن‌ها را از طریق هدست‌های AR یا حتی موبایل و تبلت وارد فضای واقعی کرد. این قابلیت، کاربردهای گسترده‌ای در آموزش، موزه‌ها، فروش محصولات و نمایش اشیای واقعی در بستر دیجیتال ایجاد می‌کند.

واقعیت مجازی (Virtual Reality)

در واقعیت مجازی، Gaussian Splatting این امکان را فراهم می‌کند که محیط‌های واقعی با دقت بالا اسکن شده و به فضاهای قابل غوطه‌وری تبدیل شوند. کاربران می‌توانند در این محیط‌ها جابه‌جا شوند و با فضا تعامل برقرار کنند.

در حوزه‌هایی مانند معماری و املاک که ارائه‌ی تصویری دقیق از وضعیت موجود فضا اهمیت زیادی دارد، پیش‌تر از تصاویر ۳۶۰ درجه و تورهای مجازی استفاده می‌شد. اما امروزه می‌توان با اسکن سه‌بعدی واحدهای مسکونی یا فضاهای کاری، تجربه‌ای بسیار واقع‌گرایانه‌تر را در قالب واقعیت مجازی و حتی به‌صورت تحت وب در اختیار مخاطبان و کارفرمایان قرار داد.

دوقلوی دیجیتال (Digital Twin)

یکی از مهم‌ترین و تحول‌آفرین‌ترین کاربردهای Gaussian Splatting در حوزه‌ی دوقلوی دیجیتال دیده می‌شود. زمانی که هدف، ساخت یک همزاد دیجیتالی دقیق از یک محیط، سازه یا سیستم واقعی است، می‌توان به‌جای روش‌های سنتی مانند مدل‌سازی سه‌بعدی یا فتوگرامتری، از این تکنولوژی استفاده کرد. نتیجه، ارائه‌ای بسیار دقیق، جزئیات‌محور و رئالیستی از نمونه‌ی واقعی است که می‌تواند در تحلیل، پایش و شبیه‌سازی مورد استفاده قرار گیرد.

تورهای مجازی


در حوزه‌ی تورهای مجازی نیز، نرم‌افزار 3D Vista Virtual Tour در به‌روزرسانی‌های اخیر خود، قابلیت پشتیبانی از این تکنولوژی را اضافه کرده است. به‌واسطه‌ی این امکان، می‌توان تورهای مجازی پیشرفته‌ای از فضاهای معماری یا محیط‌های شهری ایجاد کرد که تجربه‌ای فراتر از تورهای کلاسیک مبتنی بر تصاویر پانوراما ارائه می‌دهند.

بازی‌سازی


در صنعت بازی‌سازی، به‌جای مدل‌سازی دستی و رندر زمان‌بر محیط‌ها و آبجکت‌ها، می‌توان از Gaussian Splatting برای تولید مستقیم محیط بازی استفاده کرد. به این ترتیب، فضاهایی در مقیاس وسیع، با سرعت بالا و درجه‌ی بالایی از رئالیسم خلق می‌شوند. پس از شکل‌گیری محیط اصلی، می‌توان سایر عناصر گیم‌پلی مانند مکانیک‌های بازی، جمع‌آوری سلاح‌ها، ابزارهای مبارزه با دشمنان و افکت‌هایی نظیر برف، باران یا دود را به آن افزود.

فرآیند ساخت

1-     فیلمبرداری یا عکسبرداری از محیط یا آبجکت


برای ساخت یک مدل مبتنی بر Gaussian Splatting، در گام نخست لازم است مجموعه‌ای از تصاویر یا یک ویدیوی دقیق از آبجکت یا محیط موردنظر تهیه شود. این ثبت تصویری باید از زوایای مختلف انجام شود تا داده‌های کافی برای بازسازی سه‌بعدی در اختیار نرم‌افزار قرار بگیرد.

2-     نرم افزار ساخت


در مرحله بعد، با استفاده از نرم‌افزارهای مختلفی که امروزه در بازار وجود دارند، می‌توان فرایند تبدیل این داده‌ها به Gaussian Splat را انجام داد. هر یک از این نرم‌افزارها ویژگی‌ها، محدودیت‌ها و کیفیت خروجی متفاوتی دارند. به همین دلیل، در جدول مقایسه‌ای که در ادامه آمده، این ابزارها بر اساس معیارهای مختلف بررسی و با یکدیگر مقایسه شده‌اند.


در نهایت و بر اساس این مقایسه، می‌توان گفت نرم‌افزار Postshot — که بر روی سیستم‌عامل ویندوز اجرا می‌شود و به‌صورت رایگان و بدون محدودیت در دسترس است — در حال حاضر گزینه‌ای با کیفیت‌تر و مطلوب‌تر نسبت به سایر گزینه‌ها محسوب می‌شود.

3-     ادیت و انتشار

یک نکته بسیار مهم وجود دارد: مدل سه‌بعدی حاصل از Gaussian Splatting از نوع Mesh نیست. به همین دلیل، امکان گرفتن خروجی مستقیم با فرمت‌های رایج سه‌بعدی مانند FBX، GLB، DAE، OBJ و سایر فرمت‌های متداول وجود ندارد.
در نتیجه، برای استفاده از این مدل‌ها در نرم‌افزارها یا موتورهای سه‌بعدی دیگر، لازم است طی یک سری فرایندهای نرم‌افزاری در محیط Blender، این Splatها به مدل مش تبدیل شوند. پس از انجام این تبدیل، می‌توان خروجی نهایی را با فرمت دلخواه دریافت کرد.

4-     مشکل تبدیل splat به mesh

مشکل اصلی در رابزه با تکنولوژی Gaussian Splatting این است مه با ساختار های رایج مدل های سه بعدی متفاوت است و نمیتوان آن را وارد نرم افزار های مدلسازی مختلف کرد یا خروجی هایی با فرمت های رای سه بعدی مانند FBX, OBJ, GLB, DXF و... کرد. بنابراین لازم است تا طی فرآیندی آن را به ساختار استاندارد Mesh تبدیل کرد.


برا یاین تبدیل بهترین راه حل موجود استفاده از add-on مربوط به نرم افزار Blender با نام KIRI Engine 3DGS plugin for Blender هست که از این لینک گیت هاب قابل دانلود است.

افق های آینده

آنچه تاکنون درباره آن صحبت شد، عموماً تحت عنوان 3D Gaussian Splatting شناخته می‌شود؛ روشی که خروجی آن یک مدل سه‌بعدی ایستا از محیط یا آبجکت است. با این حال، در ماه‌های اخیر برخی شرکت‌های نوآور و پیشرو در سطح جهانی از نسل جدیدی با عنوان 4D Gaussian Splatting (4DGS) رونمایی کرده‌اند؛ رویکردی که بُعد زمان را نیز وارد این فرایند می‌کند.

در این حالت، ما دیگر صرفاً با یک مدل سه‌بعدی ثابت مواجه نیستیم، بلکه نسخه‌ای پویا و انیمیت‌شده از مدل در اختیار داریم. به بیان ساده‌تر، تغییرات و حرکات نیز به بخشی از داده سه‌بعدی تبدیل می‌شوند و تجربه‌ای بسیار نزدیک‌تر به واقعیت شکل می‌گیرد.

در آینده انتظار می‌رود فرایندهای نرم‌افزاری مربوط به ویرایش، پردازش و انتشار این فناوری به صورت Real-Time انجام شود. اگر چنین قابلیتی به شکل گسترده محقق شود، می‌توان از یک انقلاب عظیم در صنعت فناوری‌های بصری در مقیاس جهانی صحبت کرد.

برای درک بهتر این تحول، کافی است تصور کنیم امکان حضور لحظه‌ای در یک فیلم سینمایی وجود داشته باشد؛ به‌طوری که بتوان شخصیت اصلی داستان را از زوایای مختلف مشاهده کرد. یا حتی مسابقات جام جهانی فوتبال که در کشوری دیگر در حال برگزاری است، به صورت سه‌بعدی و هم‌زمان تجربه شود؛ تجربه‌ای که در آن کاربر احساس کند واقعاً در زمین مسابقه حضور دارد، نه صرفاً تماشاگر یک تصویر دوبعدی.


ائلیار محمدزاده

آذر 1404

واقعیت مجازیواقعیت افزوده
۱
۰
ائلیار محمدزاده
ائلیار محمدزاده
یه دانشجوی دکترای شهرسازی که در مورد شهر هوشمند، واقعیت مجازی و افزوده و چند تا حوزه دیگه که تجربه اندکی داره میگه
شاید از این پست‌ها خوشتان بیاید