دسته‌بندی اطلاعات با تگ‌زنی صحیح

تا به حال به این فکر کردین که چطوری تصمیم می‌گیریم فلان وسیله‌ها رو توی یه قفسه بذاریم در صورتی که بقیه وسایل رو به قفسه دیگه‌ای منتقل می‌کنیم؟ این فرایند که برای خیلی از ما توی خیلی از شرایط درونی شده اسمش دسته‌بندیه. دسته‌بندی یعنی «قرار دادن چیزهای مرتبط در کنار همدیگه» و «ایجاد فاصله بین چیز‌های نامرتبط». خب خیلی واضحه دیگه. نه؟ ... فکر نکنم! یه سوال مهم: چه عاملی یه سری چیز‌ها رو به هم «مرتبط» می‌کنه و چه چیزی باعث می‌شه چیزها رو با هم «نامرتبط» بدونیم؟ سخت شد. نه؟ بیاید با یه مثال پیش بریم. فهرست ۱۰تایی زیر رو ببینید:

گلدون شیشه‌ای آبی ۲۰۰ هزار تومانی

پاک‌کن بنفش ۳۰ هزار تومانی

پلیور پشمی سبز ۴۰۰ هزار تومانی

دفترچه یادداشت قرمز ۵۰ هزار تومانی

لیوان تزيینی شیشه‌ای سبز ۵۰۰ هزار تومانی

ست خودکار آبی ۲۰۰ هزار تومانی

تی‌شرت قرمز ۳۵۰ هزار تومانی

یک کیلو موز زرد ۴۰ هزار تومانی

ماگ سرامیکی زرد ۱۰۰ هزار تومانی

ماشین اسباب‌بازی بنفش ۷۰۰ هزار تومانی

بیاین با هم این فهرست رو دسته‌بندی کنیم. ۲ دقیقه وقت بذاریم، این موارد رو دسته‌بندی کنیم و بعد برگردیم به ادامه مطلب ... تموم شد؟ خب بیاین یه نگاهی به دسته‌بندی‌های احتمالی بندازیم. دو نوع دسته‌بندی‌ای که احتمال داره برای خیلیامون ملموس باشه به این شکل خواهد بود:

دسته‌بندی بر اساس کارکرد:

پلیور و تی‌شرت (پوشیدنی‌ها)
پاک‌کن و دفترچه یادداشت و ست خودکار (لوازم‌التحریر)
گلدان و لیوان تزئینی و ماگ (ظروف)
موز (خوراکی‌ها)
ماشین اسباب‌بازی (سرگرمی)

دسته‌بندی بر اساس رنگ:

موز و ماگ سرامیکی (زرد)
دفترچه یادداشت و تی‌شرت (قرمز)
پاک‌کن و ماشین اسباب‌بازی (بنفش)
گلدان شیشه‌ای و ست خودکار (آبی)
پلیور و لیوان تزئینی شیشه‌ای (سبز)

حالا بیایم به این سوال پاسخ بدیم: کدوم دسته‌بندی، دسته‌بندی بهتریه؟ چرا؟ به این سوال هم یکی دو دقیقه فکر کنیم و بعد ادامه مسیر رو با هم بریم ... تموم شد؟ خب، برگردیم به توضیح اولمون در مورد دسته‌بندی، یعنی: «قرار دادن چیزهای مرتبط در کنار همدیگه» و «ایجاد فاصله بین چیز‌های نامرتبط». همونطوری که در بالا دیدیم چیز‌ها می‌تونن به طرق مختلفی با هم «مرتبط» یا «نامرتبط» باشن. بهتره بگم چیزها می‌تونن با «ویژگی‌های» مختلفی با هم مرتبط یا نامرتبط باشن. مثلا پلیور و تی‌شرت با ویژگی «پوشیدنی» بودن به هم مرتبط می‌شن ولی همین پلیور و لیوان تزئینی به دلیل «رنگ مشابه» هم‌دسته می‌شن. پس، سوال اصلی اینه که کدوم ویژگی رو برای تعیین دسته‌بندی انتخاب کنیم.

جواب این سوال تنها به هدف کسی که داره دسته‌بندی رو انجام می‌ده بستگی داره و حکم کلی برای این شرایط وجود نداره. توی همین مثال بالا، اگه بعد از خونه تکونی بخوایم اشیا رو بر اساس کاربردشون جای‌گذاری کنیم احتمالا روش اول روش درست‌تریه ولی اگه به عنوان یه مربی مهد کودک بخوایم رنگ‌ها رو به بچه‌ها یاد بدیم دسته‌بندی دوم انتخاب عاقلانه‌تری به نظر میاد. بخوام یه جمع‌بندی کنم، خیلی مهمه که بدونیم رفتار ما با هر کدوم از دسته‌هایی که ایجاد می‌کنیم چگونه خواهد بود. تو مثال خونه تکونی، دسته‌بندی‌ها به ما رفتار جای‌گذاریمون رو نشون می‌دن. یعنی می‌دونیم که پوشیدنی‌ها باید به قفسه لباس‌ها منتقل بشن و خوراکی‌ها به آشپزخونه. در دسته‌بندی دوم مربی مهد کودک می‌دونه که برای آموزش رنگ زرد باید سراغ دسته موز و ماگ سرامیکی بره و برای آموزش رنگ آبی سراغ گلدون شیشه‌ای و ست خودکار.

حالا بریم سراغ تگ‌زدن و یه خورده بحث رو به کسب و کار شبیه‌تر کنیم.

تگ‌زنی چیه و کجا به درد می‌خوره؟

تگ‌زنی یعنی تقلیل داده‌ها به ویژگی‌هایی که بر اساس اون‌ها می‌تونیم در مورد دسته‌بندی اطلاعات تصمیم بگیریم. ما با تگ‌زنی به نوعی داده‌های اضافه‌ای رو که به تصمیم‌گیریمون کمک نمی‌کنن حذف می‌کنیم. در مثال مربی مهد کودک، تنها ویژگی‌ موثر در تصمیم‌گیری مربی برای دسته‌بندی داده‌ها، رنگ اشیا است. در نتیجه پلیور تنها به تگ سبز تقلیل پیدا می‌کنه و ویژگی‌هایی مثل جنس، سایز، قیمت، زنانه یا مردانه بودن، که به تصمیم مربی ارتباطی ندارن، حذف می‌شن.

یه خورده بحث رو پژوهشی‌تر کنیم. وقتی یه پژوهشگر سوال باز می‌پرسه، هر کاربری با لحن و جملات خودش و بر اساس چالش‌هایی که با اون‌ها مواجه شده به این نوع سوالات پاسخ می‌ده. اینجاست که تگ زدن پاسخ‌ها با ویژگی‌هایی که به تصمیم‌گیری منجر می‌شن ارزشمنده. اینجاست که پاسخ‌ها رو به ویژگی‌های اصلی‌ای که بر اساسشون می‌تونیم اقدام بعدیمون رو تعیین کنیم تقلیل می‌دیم تا تحلیل سریع‌تر و ساده‌تری داشته باشیم. مثلا فرض کنید که کاربری در جواب به این سوال که «چرا همیشه برای خرید از محصول ما استفاده نمی‌کنید» جواب زیر رو ثبت کرده باشه:

با سلام و روز به خیر، من خیلی محصول شما رو دوست دارم و سعی می‌کنم همیشه برای خرید‌هام این محصول رو هم بررسی کنم. بعضی وقت‌ها سایتتون بالا نمیاد و یه زمان‌هایی هم چون نزدیک به فروشگاه هستم از همونجا می‌خرم. راستش کار با گوشی سختمه و دسته‌بندیاتون یه خورده ریزه ولی در کل هر موقع گیر کردیم کمکمون کرده. پشتیبانیتون هم عالیه و همیشه خیلی خوب پاسخ می‌دن. ممنون.

این پاسخ به این صورت قابل استفاده نیست. این داده خام می‌تونه به تگ‌هایی تبدیل بشه که می‌تونیم بر اساسشون تصمیم‌گیری کنیم. شاید تبدیل این متن به سه تگ زیر بد نباشه. توجه کنیم که این تگ‌ها ترجمه‌ای از نکاتی هستن که ما از خلال پاسخ کاربر به دنبالش بودیم، یعنی «دلایل استفاده نکردن همیشگی از محصول ما»:

۱) مشکلات فنی که سایت را از دسترس خارج می‌کنن

۲) دسترسی به روشی راحت‌تر و سریع‌تر برای خرید محصول مورد نظر

۳) سختی استفاده از محصول به دلیل کوچک بودن فونت دسته‌بندی‌ها

همونطوری که می‌بینیم اون متن بلند تقلیل پیدا کرد به سه تا نکته اصلی و هرچیزی که به فهم مسئله و تصمیم‌گیری ما کمکی نمی‌کرد حذف شد. حالا که به اینجا رسیدیم به نظرم خوبه که در مورد شیوه درست تگ‌زنی صحبت کنیم.

ویژگی‌های یه تگ‌زنی خوب چیه؟

برای جواب به این سوال برگردیم به هدف تگ زدن. هر پژوهشی برای گرفتن یک تصمیم صورت می‌گیره. این رو یادمون نره. وقتی روی داده‌ها تگ می‌زنیم هم باید این نکته توی ذهنمون باشه. این که چه تصمیمی وابسته به تحلیل این تگ‌هاست و چطوری قراره بر اساس تگ‌ها تصمیم‌گیری کنیم چراغ راه ما است برای تگ‌زنی درست. تگ‌زنی به نوعی تلاش برای کمی‌سازی حجم بالایی داده کیفیه (حالا روی درست یا غلط بودن این کار بعدا می‌شه صحبت کرد). پس تگ‌های مناسب تگ‌هایی هستند که:

۱) اگه بر روی داده‌ای زده شدن بدونیم که با اون داده چه کاری می‌خوایم بکنیم

۲) و این که به اصطلاح mutually exclusive یا دو به دو ناسازگار باشند، توضیح می‌دم یعنی چی

در مورد اول باید بگم که مهمه بدونیم که با هر تگ چه کاری می‌خوایم بکنیم. اگر تصمیم ما در ازای یه تگ مشخص نباشه اون تگ، تگ بدیه. برای همین باید تگ‌زنی در ابتدا به همراه همه افرادی که در تصمیم‌گیری موثرن صورت بگیره و سر این‌که هر تگ چه معنایی داره و به چه تصمیمی منجر می‌شه بحث کنیم و به توافق برسیم. اینجوری در ادامه با تگ‌هایی مواجه نمی‌شیم که نیازمند ترجمه باشن. بذارین یه مثال بزنم. فرض کنید بر روی پاسخ به سوالی مثل «شما چه چالشی با محصول ما دارید؟» پاسخ‌ها را تگ‌زنی کردیم. اگر یکی از تگ‌ها چیزی شبیه «کاربر از محصول راضی نیست» باشه، عملا هیچ کمکی به تصمیم‌گیری نکردیم. این عبارت اونقدری گنگ هست که هر کسی در تیم می‌تونه برداشت متفاوتی ازش داشته باشه و تصمیمی نمی‌شه بر اساسش گرفت. در مقابل تگی مثل «ثبت اطلاعات پرسنلی زمان‌بر است» یه تگ خیلی خوب می‌تونه باشه، چرا که به ما می‌گه روی چه بخشی تمرکز کنیم و تصمیم بعدی می‌تونه حذف اطلاعات پرسنلی اضافه یا مثلا فیچری برای خوندن بخشی از اطلاعات شخصی از روی عکس کارت ملی باشه.

مورد دوم اینه که تگ‌های ما باید تا جای ممکن (خیلی دوست داشتم بگم کاملا) اشتراک در معنی نداشته باشن. یعنی چی؟ یعنی مثلا این دوتا تگ «کاربر نمی‌تواند فرم ثبت‌نام را پر کند» و «کاربر در پر کردن بخش اطلاعات شخصی فرم دچار مشکل می‌شود» اشتراک زیادی دارن. طبیعتا کسی که نمی‌تونه بخش اطلاعات شخصی رو پر کنه فرم ثبت نام رو هم نمی‌تونه پر کنه و همه پاسخ‌هایی که تگ دوم رو بگیرن لاجرم تگ اول رو هم خواهند داشت. تگ‌های ما باید به تصمیم‌های متفاوتی منجر بشن. تگ‌های دو به دو ناسازگار، یعنی تگ‌هایی که بر روی یک عبارت نشه از هر دوشون استفاده کرد. البته حواسمون باشه که کاربر احتمال داره توی پاسخی که داده به چندتا مسئله اشاره کنه که خب چندین تگ مختلف رو می‌شه براش در نظر گرفت. توی مثال اول متن، معمولا یک ظرف نمی‌تونه همزمان خوراکی هم باشه (مگر قیف نونی بستنی قیفی) یا هیچ سبزی نمی‌تونه آبی باشه (می‌دونم که رنگ طیفه و می‌شه یه رنگی بین دو رنگ پیدا کنیم و این از اون موارد استثناست که شاید باید اون دیتا رو بسوزونیم، چرا؟ چون هدف ما خود دسته‌بندی نبوده، هدفمون یاد دادن رنگ‌ها به بچه‌هاست و چیزی که قراره گیجشون کنه داده خوبی نیست).

حواسمون باشه که من خیلی از کلمه «تصمیم» استفاده کردم و نه از کلمه «اقدام». چرا؟ چون تصمیم شاید شامل اقدام نکردن هم باشه. یا حتی تصمیم می‌تونه به پژوهش بیشتر اشاره کنه و لزوما قرار نیست که به ارائه راهکار منجر بشه. به طور مثال شاید افراد با هم توافق کنن که در صورت زیاد شدن تگی مثل «قیمت خدمات شما زیاد است»، پژوهشی در باب قیمت مناسب صورت بگیره، اثر قیمت روی کاهش استفاده بررسی بشه یا اصلا بر روی این مسئله هیچ اقدامی صورت نگیره می‌شه گفت که این یه تگ خوب بوده.

در آخر می‌خوام یه تمرین داشته باشیم با خود دیوار. دسته‌بندی‌های ‌دیوار به نوعی تگی هستند که روی آگهی‌ها زده شده. دسته‌‌های دیوار رو باز کنید و ببینید آیا این دو ویژگی رو می‌شه توشون دید؟ یعنی این که آیا می‌شه با عنوان هر دسته محتویاتش رو حدس زد و تصمیم گرفت که برای پیدا کردن هر محصول توی کدوم دسته باید رفت و دو اینکه آیا دو به دو ناسازگار هستن؟ یعنی یه آگهی رو فقط می‌شه توی یه دسته گذاشت و بس.

دسته‌بندی اطلاعات با تگ‌زنی صحیح

تگ‌زنی چیه و کجا به درد می‌خوره؟

ویژگی‌های یه تگ‌زنی خوب چیه؟

داستان دیوار و من

تا باشه از این سقوطا!

مصورسازی داده‌ها