پروژه VOICI (پروژه خلبان تعاملی صوتی) که یک پروژه در زمینه پردازش صدا بوده و تحت حمایت اتحادیه اروپا است در آخرین تلاش خود، یک سیستم کنترل صوتی که با پردازش صدا کار میکند را اثبات مفهومی (proof of concept) کرده است. اگر با دستیاران مجازی آشنایی داشته باشید، این سیستم چیزی شبیه به الکسای آمازون (Alexa)، سیری اپل (Siri) یا دستیار گوگل (Google Assistant) است؛ با این تفاوت که برای خلبانان هواپیماها طراحی شده، مفاهیم هوانوردی را میشناسد و قادر است بعضی از مسئولیتهای خدمه را برعهده گرفته و به آنها کمک کند.
چیزی که باعث ایجاد چنین سیستمی شده است این فرضیه است که اگر مسئولیتها و کارهای خدمه و تیم خلبانی کمتر شود، به خصوص در شرایط سخت و استرسزا، میتواند باعث بهبود عملکرد و کارایی آنها شود. این سیستم هوش مصنوعی میتواند بسیاری از کارهای تکراری را که در عین سادگی نیاز به تمرکز بالایی دارد بر عهده بگیرد و فشار کاری خدمه را کمتر کند. برای این کار روش پردازش صدا و فرمان صوتی انتخاب شده است، چیزی که افراد با آن احساس راحتی کرده و در عین حال میتواند عملکرد یکسانی در تمام شرایط داشته باشد.
سیستم VOICI توانایی تشخیص و ضبط گفتار، درک و ترکیب آنها را دارد. در واقع، این سیستم میتواند مکالمه بین خلبانان و برج مراقبت و نیز بین یکدیگر را درک کرده و متوجه میشود که چه زمانی در حال صحبت با او بوده و چه عملی را باید انجام دهد یا چه واکنشی به صحبتها نشان دهد. همان طور که میتوانید انتظار داشته باشید، کابین خلبان محل مناسبی برای چنین سیستم پردازش صدایی نیست؛ کابین خلبان پر از نویزهای ناشی از موتورهای هواپیما و ارتعاشات شدید بدنه آن است. همچنین به دلیل اینکه از این سیستم انتظار میرود تا دادهها را پردازش کرده و واکنش لحظهای نشان دهد، باید دارای بالاترین استانداردهای قابلیت اعتماد باشد. با وجود چند صد سرنشین هواپیما، جای هیچ گونه خطایی وجود نخواهد داشت.
برای برطرف کردن این مشکلات، VOICI از یک کابین مدل نمونه که با دقت زیادی مشابه کابین Dassult Falcon 2000 است استفاده کرده و سپس یک فایل صوتی که حاوی صدای ضبط شده واقعی درون کابین هواپیما بود را در آن پخش کردند. برای دریافت ورودیهای صوتی سیستم پردازش صدا، هم از هدست خلبان و هم از یک آرایه میکروفون که در کابین نصب شدهاند استفاده شده است. این آرایه از تکنیک beamforming که روشی برای ارسال و دریافت امواج در جهات خاص است استفاده میکند.
هر دوی این ورودیها به سیستم مورد نظر وارد میشوند. سپس تمام صوت دریافت شده، وارد یک سیستم پردازشی شده که بعدا باید در مجموعه الکترونیکی هواپیما جاسازی شود. مدل هوش مصنوعی ادراک زبان (Language Model) سیستمِ طراحی شده، در شرایط شبیهسازی شده کروز هواپیما (Cruise) تنها ۵ درصد خطا در تشخیص کلمات داشت. این سیستم عملکرد خوبی در تطبیق با ادبیات هوانوردی و نیز سر و صدای موجود در هواپیما از خود نشان داد.
پیشرفت ایدههایی مثل دستیار صوتی هواپیما انسان را به یاد فیلمهای علمی-تخیلی مثل interstellar یا ادیسه فضایی میاندازد که خلبانها یا سرنشینها با کامپیوترها صحبت میکنند و به آنها فرمان میدهند. به نظر میرسد تا رسیدن به بسیاری از ایدههای چنین فیلمهایی فاصله چندانی نداشته باشیم.