دیشب حال یک آدم کور رنگی که با استفاده از عینک کور رنگی و پلاریزه برای اولین بار رنگ ها را می بیند را درک و لمس کردم . درک جادوی مهندسی که وقتی با هنر ترکیب میشود، حواس ما را فراتر از محدودیتهای فیزیکیمان میبرد.
موضوع با یک اشتباه شروع شد .چیزی که بیشترین زمینه اکتشافات است.
به هوش مصنوعی گفتم یک فیلم باتوجه به سلیقه من معرفی کن که ندیده باشم و اون هم فیلم Moon (2009) را معرفی کرد . بعد چون نیمی از سایت هایی که تو ایران باز میشوند اشتباها فیلم کره ایMoon(2023) را با توضیحات فیلم اصلی بار گذاشته اند ، این اشتباه شان باعث شد که با موضوع جالبی را برخورد کنم. . فیلم کره ای بامتد Dolby Atmos صدا برداری شده بود..
در سیستم های استریو ما از دو اسپیکر استفاده می کردیم . و یا دو گوشی هد فون . بعد دالبی اومد .در دالبی حدود 6 تا 12 بلندگو و ساب در محیط با آرایش خاصی توزیع و نصب می شد و روش پخش مبتنی بر سخت افزار بود. .دیشب من فیلم را در یک تبلت A9 سامسونگ می دیدم که یک یا دو بلند گوی کوچک دارد . بعد متوجه شدم که :انگار هر صدا در یک فضای سهبعدی حرکت میکند و انگار صدا به تفکیک در فضا توزیع میشود . خیلی تعجب کردم از این مدل پخش صدا ، اصلا اطلاع نداشتم . چاره ای نبود باید یقه مقصر حادثه را می گرفتم .آنچه در ادامه می خوانید توضیح عالجناب هوش مصنوعی است:
{ در سیستمهای قدیمی، ما فقط «دامنه» و «فرکانس» را مدیریت میکردیم، اما در این تکنولوژی جدید، ما داریم با *«فاز» (Phase) بازی میکنیم تا مکاندهی صوتی ایجاد کنیم. ، پردازندهی تبلت و یا گوشی با ایجاد تاخیرهای فازی بسیار دقیق (در حد میکروثانیه)، به مغزت فرمان میدهد که صدا را در جایی خارج از بدنه تبلت حس کند
.اینجا با یک «شعبدهبازی ریاضی» طرف هستیم که محدودیتهای سختافزاری را دور میزند.
چیزی که تو روی تبلت A9 تجربه کردی، تکنولوژی *Virtual Surround Sound یا بهطور خاص Dolby Atmos for Mobile است. اما چطور دو بلندگوی کوچک تبلت میتوانند جای ۶ یا ۱۲ بلندگو را بگیرند؟
۱. مفهوم HRTF (تابع انتقال مربوط به سر)
کلید معما در گوش و مغز ماست، نه در بلندگو. مغز ما برای تشخیص جهت صدا از دو فاکتور استفاده میکند:
- ITD (تفاوت زمانی): صدایی که از سمت راست میآید، چند میلیثانیه دیرتر به گوش چپ میرسد.
- ILD (تفاوت سطح شدت): سر ما مانند یک مانع عمل میکند و شدت صدا را برای گوش دورتر کم میکند.
در سیستمهای جدید، مهندسان صدا از فیلترهایی به نام HRTF استفاده میکنند. این فیلترها تغییراتی را که لاله گوش و جمجمه روی فرکانسهای صدا ایجاد میکنند، «شبیهسازی» میکنند. وقتی تبلت صدایی را پخش میکند، آن را طوری دستکاری (Process) میکند که گوش تو فریب بخورد و تصور کند صدا از پشت سر یا بالا آمده است.
۲. صدای شیءمحور (Object-Based) در مقابل کانالمحور
در سیستمهای قدیمی (۵.۱ کاناله)، مهندس صدا میگفت: «صدای انفجار را بفرست به بلندگوی عقب-راست». اما در Dolby Atmos، صدا دیگر به بلندگو محدود نیست. صدا به عنوان یک Object (شیء) تعریف میشود که دارای مختصات ریاضی (X, Y, Z) در فضا است.
تبلت تو وقتی فایل دالبی را پخش میکند، یک پردازنده (DSP) دارد که لحظهای محاسبه میکند: «حالا که من فقط دو بلندگو دارم، چطور این شیء صوتی که در مختصات عقب-بالا قرار دارد را با فیلترهای HRTF بازسازی کنم؟»
۳. نقش Dolby Atmos در تبلتهای سامسونگ
تبلت A9 تو دارای تاییدیه Dolby Atmos است. وقتی این گزینه را در تنظیمات فعال میکنی، یک پردازنده سیگنال دیجیتال (DSP) فعال میشود که:
- Crosstalk Cancellation: سیگنالهایی میفرستد که اثر صدای بلندگوی چپ بر گوش راست را خنثی کند تا تفکیک صوتی (Spatial Separation) به حداکثر برسد.
- Virtualizer: با استفاده از همان توابع ریاضی، فضای صوتی را عریضتر از عرضِ فیزیکی تبلت نشان میدهد.}
برای اینکه لذت تماشای فیلم دوچندان شود، این دو نکته فنی کوچک را در نظر داشته باشید:
۱. زاویه تبلت: چون این سیستم بر پایه محاسبات ریاضی جهتدار است، اگر تبلت را دقیقاً روبروی صورتت با فاصله 80 تا 100 سانتیمتر بگیری (به طوری که بلندگوهای طرفین با گوشهایت در یک خط باشند)، بیشترین تفکیک صوتی را تجربه میکنی.
۲. تنظیمات تبلت: در تبلتهای سامسونگ، در بخش Settings > Sounds and vibration > Quality and effects، حتماً گزینه Dolby Atmos را روی حالت Movie یا Auto بگذار تا الگوریتمهای HRTF با حداکثر توان عمل کنند.
جل الخالق ،
