بیاید یکبار از زاویه دید «صداها» به تجربه کاربر نگاه کنیم(VUI/VUX)

در مورد موضوع طراحی فراگیر یا Inclusive Design در متنی دیگر بحث داشتیم که خوب است این موضوع را به عنوان اصل در تمام طراحی­هایمان در نظر بگیریم و همیشه این نکته در پس ذهن خودمون داشته باشیم که همه ی ما با یکدیگر متفاوت هستیم، تجربه ای هم که هرکس در تعامل و ارتباط با هر چیزی، کاری، وسیله‌­ای، تکنولوژی‌­ای و ... دارد نیز متفاوت است. یکم پیچیده و سخت به نظر رسید.

بهتره بگم که خیلی از ویژگی‌­هایی که در طراحی تجربه کاربری امروزه به عنوان خلاقیت و ویژگی منحصر به فرد از اونا یاد میشه، مدیون طراحی برای همین تفاوت­‌هاست. تفاوت‌­هایی مثل ناتوانی، کم توانی، معلولیت و یا نابینایی...

در اغلب تکنولوژی و نرم افزارهای بزرگ ویژگی­‌های منحصر به فردی برای پوشش حداکثری کاربران و جلب رضایت دسته‌­هایی از کاربر که نیازهای خودشان را دارند وجود دارد که برای حس بهتر این موضوع چند مثال باید زد. مثلا Trello قابلیتی با کنتراست بالاتر و تفکیک رنگ بهتر برای افراد کم بینا و یا با کوری رنگ دارد یا در ایران تپسی پیش قدم شده است و برای افراد معلول و ناشنوا ویژگی هایی در نظر گرفته است.

اما صحبت ما طراحی ویژگی، ظاهر، قابلیت یا هر چیزی نیست که مختص افراد خاصی به عنوان مثال نابینایان مد نظر قرار بگیرد. بحث ما فراتر از این است. در واقع بحث ما طراحی­‌ای است که فراگیر و جهان­‌شمولباشد و همه از تجربه کردن آن و حس سهولت کاربرد و استفاده لذت ببرند و در این میان افرادی همانند نابینایان نیز بتوانند از آن استفاده کنند.


برای این موضوع نیز مثال­‌های دیگری میزنم تا درک بهتری شود. شرکت اپل که پیشتاز در طراحی برای دسترسی پذیری بهتر است، برای نابینایان ویژگی هایی در نظر گرفته که تقریبا 90 درصد از افراد می توانند از آن برای تجربه کاربری بهتر و سهولت بیشتر استفاده کنند. این موارد رو در Accessibility تنظیمات موبایل خودتون بیابید.

این موارد همانند:

Voiceover & Speak Screen

(به این صورت است که تمام آنچه در صفحه­نمایش نشان داده می­شود را بیان می­کند، حتی تصویر را نیز تحلیل می­کند و خط بریل را نیز میخواند و دیگر قابلیت­ها)

Audio Description

(فیلم را علاوه بر زیرنویس به صورت جزیی بیان می­کند)

Dark mode

(قابلیتی برای افزایش کنتراست)

Display Accommodations

(تصویر را با کنتراست سیاه سفید برای افرادی با کوررنگی یا دیگران به نمایش می­­گذارد)

Zoom & Magnifier

(بزرگنمایی تصویر با حالات مختلف)

Dictation

(تبدیل گفتار به متن)

AND SIRI

دستیارهای صوتی از بارزترین مثال برای این موضوع است که این‌ها در ابتدا برای نابینایان طراحی شده است و سپس به دلایل زیادی از جمله کاربردی بودن، سهولت استفاده و غیره برای همگان در دسترس قرار گرفته و امروز با نام­های Siri, Google Now, Cortana, Robin, Jarvis و دیگر موارد شناخته شده­‌اند. نمونه‌­ای از هرکدام در همه ی گجت های هوشمند ما به کار گرفته شده‌­اند و حتی برای این ویژگی به­روز و هوشمند، ابزارهایی نیز به عنوان دستیار هوشمند یا اسپیکر هوشمند معرفی شده اند. همانند :

Alexa, Google Assistant, Sonos one, Google home, Amazon Echo, Homepod and etc

Olly
Olly


»»» این موارد همگی باعث شده است تا موضوع جدیدی با عنوان "طراحی تجربه و رابط کاربری صدا" مهم شود.

همین ابتدا بهتره سخت بودن این موضوع رو اینگونه یادآور بشیم که همه­‌ی ما در ارتباط با هم، هرکدوم یک لحن، یک لهجه، یک زبان خاص و یک طرز گفتار متفاوت و منحصر به خودمون داریم که این موضوع بیانگر پیچیده، متنوع و متغیر بودن صداهای ماست. پردازش دستورات صوتی بسیار دلهره آور است حتی بین انسان ها، حالا فکر به این پردازش بین کامپیوترها و کامپیوتر و انسان که احتمال حمله قلبی رو افزایش می­دهد!!!

نحوه چیدمان افکارمان ، نحوه برقراری ارتباط فرهنگی ، نحوه استفاده از زبان عامیانه و استنباط ... همه این تفاوت ها بر تفسیر و درک کلمات ما تأثیر می گذارد.

اینجاست که VUI وارد بازی می شوند...

رابط کاربری صوتی (VUI) رابط های اولیه یا مکملی بصری ، شنوایی و لمسی است که امکان تعامل صوتی بین افراد و دستگاه ها را فراهم می کند. به بیان ساده VUIمیتواند چشمک یک چراغ کوچک زمانی که صدای شما را میشنود باشد تا کنسول سرگرمی درون اتوموبیل. به خاطر داشته باشید که VUI نیازی به داشتن رابط بصری ندارد و میتواند کاملا شنوایی و یا لمسی باشد.

در حالی که طیف وسیعی از VUI حس می­شود، همه ی این طیف ساختار UX مشترکی دارند که زیرمجموعه Usability هستند.

ما این اصول رو بررسی میکنیم که کاربرها این تعامل رو بهتر درک کنن و در روزمره خودشون به دید متفاوتی به آن نگاه کنند.

Garvey Smith
Garvey Smith

محدودیت ها و موارد قابل استفاده VUI

تعامل ما با دنیامون در گرو محدودیت های محیطی، جامعه شناختی و تکنولوژیکه. این محدودیتا مثل سرعتی که ما اطلاعات را پردازش میکنیم یا مثلا زبان و گویش و لحنی که دیتای ذهنمون رو تبادل میکنیم.

قبل از اینکه به طراحی تعاملی بپردازیم باید راه ها و زمینه تعامل صوتی را بیان کنیم.

اولین قدم اینه که وسیله تعاملمون رو مشخص کنیم.

تلفن

  • آیفون ، پیکسل ، سامسونگ
  • اتصال - شبکه های تلفن همراه ، wifi
  • بافت محیطی تأثیر بسزایی در تعامل صدا دارد
  • کاربران عادت دارند از تعامل صوتی استفاده کنند
  • تعامل از طریق بازخورد بصری ، شنوایی و لمسی امکان پذیر است
  • روش های متقابل نسبتاً در بین مدل ها استاندارد شده است

پوشیدنی

  • مانند ساعت ، باند تناسب اندام یا کفش هوشمند
  • اتصال - شبکه های تلفن همراه ، wifi
  • ممکن است کاربران عادت داشته باشند که از تعامل صوتی استفاده کنند ، اما این تعامل در بین دستگاه ها غیر استاندارد است
  • برخی از پوشیدنی ها امکان تعامل از طریق بازخورد دیداری ، شنوایی و لمسی را فراهم می کنند - هرچند برخی غیرفعال هستند و هیچگونه تعامل صریح با کاربر ندارند
  • به طور معمول به دستگاههای متصل برای تعامل کاربر و مصرف داده وابسته است

دستگاه های متصل ثابت

  • رایانه های رومیزی، لوازم خانگی با صفحه نمایش، هاب های خانگی هوشمند ، سیستم های صوتی ، تلویزیون
  • اتصال - شبکه های سیمی ، وای فای
  • کاربران عادت دارند از این دستگاه ها در همان مکان استفاده کنند و به صورت عادی تنظیم شود
  • روشهای شبه استاندارد تعامل صوتی بین ژانرهای دستگاه مشابه (رایانه های رومیزی در مقابل مراکز متصل مانند Google Home / Amazon Alexa در مقابل ترموستات هوشمند).

دستگاه های غیر ثابت (غیر تلفن)

  • لپ تاپ ، تبلت ، ترانسپندر ، سیستم های سرگرمی اتومبیل
  • اتصال - شبکه های بی سیم ، شبکه های سیمی (رایج نیست) ، wifi ، دستگاه های زوجی
  • حالت ورودی اصلی معمولاً صوتی نیست
  • بافت محیطی تأثیر بسزایی در تعامل صدا دارد
  • به طور معمول روشهای متقابل صدا غیر استاندارد در بین ژانرهای دستگاه وجود دارد
TV — Android Voice UI
TV — Android Voice UI

قدم بعدی اینه که ماتریکس موارد قابل استفاده رو بسازیم Use Case Matrix

موارد استفاده اولیه ، ثانویه و سوم برای تعامل صدا چیست؟ آیا دستگاه دارای یک مورد استفاده اصلی (مانند یک ردیاب تناسب اندام) است؟ یا اینکه ترکیبی از موارد استفاده (مانند تلفن هوشمند) از نظر ساختاری دارد؟

ایجاد یک ماتریس مورد استفاده بسیار مهم است که به شما کمک می کند تا چرا کاربران در تعامل با دستگاه هستند را تشخیص دهید. نحوه اصلی تعامل آنها چیست؟ ثانویه چیست؟ حالت تعامل خوب و مناسب چیست و چه چیزی ضروری است؟

هنگامی که برای تعامل صدا استفاده می شود ، ماتریس به شما کمک می کند درک کنید که کاربران شما در حال حاضر از چه چیزی استفاده می کنند یا می خواهند از صدا برای تعامل با محصول استفاده کنند .

از جمله جایی که آنها از دستیار صوتی استفاده می کنند:

قدم بعدی اینه که راه های تعامل رو مرتب و اولویت بندی کنید

اگر از تحقیقات کاربر User Research برای آگاهی از موارد قابل استفاده خود بهره میگیرید و یا به عنوان تحقیقات کمی یا کیفی خام از آن استفاده میکنید ، بنابراین مهم است که با رتبه بندی ترتیب حالت های چشم‌انداز تعامل ، آنالیز خود را واجد شرایط کنید.

اگر کسی به شما بگوید: "OMG اگر می توانستم با تلویزیون صحبت کنم و به او بگویم کانال را تغییر دهد خیلی جالب خواهد بود" ، پس شما واقعاً باید عمیق تر فکر و درک کنید.

آیا آنها واقعاً از آن استفاده می کنند؟ آیا آنها محدودیت ها را درک می کنند؟ آیا آنها واقعاً تمایل خود را برای استفاده از این ویژگی درک می کنند؟

به عنوان یک طراح ، شما باید کاربران خود را بهتر از آنچه خودشان درک می کنند درک کنید.

با توجه به دسترسی آنها به گزینه های دیگر ، باید احتمال استفاده از یک روش خاص از تعامل را زیر سوال ببرید.

قدم بعدی شناخت محدودیت های تکنولوژیه

تبدیل کلمات ما به حرکت و اکشِن، یک چالش تکنولوژیکی بسیار دشوار است. با داشتن زمان نامحدود ، اتصال و آموزش ، یک موتور محاسباتی با تنظیم دقیق می تواند به سرعت متن صحبت ما را بخواند و اقدام مناسب را آغاز کند.

این قسمت در مقالات دانشگاهی بسیاری به چالش کشیده شده است و باید به صورت حرفه‌ای‌تر به آن نگاه شود. مثالی از نحوه تحلیل و پردازش یک کلمه از طریق کامپیوتر میتونه روشن کنه این پیچیدگی رو که بیان شد:

AMI Voice Engine
AMI Voice Engine

در آخر هم باید بدانیم که کاربران رفتار غیر خطی دارند

علاوه بر این ، باید این نکته را نیز در نظر بگیریم که کاربر می تواند به روش غیر خطی با دستگاه ارتباط برقرار کند. به عنوان مثال ، اگر می خواهم بلیط هواپیما را در وب سایت رزرو کنم ، مجبور می شوم جریان اطلاعات پیشرو وب سایت را دنبال کنم: مقصد را انتخاب کنید ، تاریخ را انتخاب کنید ، تعداد بلیط را انتخاب کنید ، گزینه ها را جستجو کنید و غیره ...

اما ، VUI چالش بزرگتری دارد. کاربر می تواند بگوید "ما می خواهیم با بیزینس‌کلاس به سانفرانسیسکو پرواز کنیم." اکنون ، VUI باید تمام اطلاعات مربوطه را از کاربر بیرون بیارد تا بتواند از API های موجود برای پرواز استفاده کند. سفارش منطقی ممکن است پیچیده باشد ، بنابراین این وظیفه VUI است که اطلاعات مربوطه را از طریق مکمل‌ها و راه‌های ارتباطی صوتی یا تصویری از کاربر استخراج کند.

در ادامه راهکمی عمیق تر به درون VUX/VUI شیرجه میزنیم. ما بررسی خواهیم کرد که چگونه دستگاه ها می‌دانند چه موقع به ما گوش می دهند و بازخوردهای موفق رابط صوتی بررسی خواهیم کرد.

Natural AI inside AGI automotive dashboard by Gleb Kuznetsov✈
Natural AI inside AGI automotive dashboard by Gleb Kuznetsov✈

SOURCE: MEDIUM


جامعه طراحان در اینستاگرام و تلگرام 🐼

پست‌ها و استوری‌های روزانه جامعه طراحان را در اینستاگرام و تلگرام دنبال کنید

صفحه اینستاگرام 🖼