عالی‌جناب گوگل و دستور خط فارسی: کسره روی های ناملفوظ و مشکل جستجو در متن

موضوع چیست؟

احتمالا همگی با دستور خط فارسی و ضرورت وجود آن که نزدیک ده سالی هست فرهنگستان تدوین و منتشر می‌کند آشنا هستیم. یکی از نکات آن نوشتن کسرهٔ اضافه روی های ناملفوظ است.

اول اینکه نوشتن آن چه ضرورتی دارد؟ مگر اصلا کسره می‌گذاریم؟ جواب این است که اینجا با تتابع اضافات سروکار داریم. مثلا «اصولِ اساسیِ دستگاه‌هایِ تهویه‌مطبوع». البته اینجا سه‌تا است ولی ممکن است بیشتر هم بشود که اصلا خوب نیست؛ چون به هر حال خواندن متن را دشوار می‌کند. یک چیزی هست که گمانم به آن «پردازش متن» می‌گویند. یعنی ذهن خواننده چقدر باید انرژی صرف کند یا زور بزند تا آنچه متن می‌گوید بفهمد. پاسخ این است که هرچه کمتر بهتر! چون زبان به‌ویژه در متن‌های آموزشی و علمی وسیلهٔ بیان است. هرچه روان‌تر باشد، تمرکز بیشتر بر روی فهمیدن مفاهیم خواهد بود. یکی از چیزهایی که خواندن و فهمیدن متن را دشوار می‌کند، همین تتابع اضافات است که اگر بیشتر از اندازه باشد دشوار و آزاردهنده می‌شود.

هر گروه از این مضاف و مضاف‌الیه‌های پشت‌سرهم باید روشن و خوانا باشد. گاهی اگر های ناملفوظ آن علامت کسره را نداشته باشد، هرچند برای چند لحظه، متن کژتابی پیدا می‌کند یا نامفهوم می‌شود. برای جلوگیری از این وضعیت که دست‌کم در خواندن وقفه می‌اندازد، در برخی جاها نمایش کسرهٔ اضافه ضروری است.

مسئله با های ناملفوظ

همان‌طور که می‌دانید اگر کسره روی های ملفوظ بیاید، ی خوانده می‌شود. مانند «دوره ی آموزشی». حالا این صدای ی را چطور بنویسیم؟ دو راه هست. یکی با حرف ه با همزه (که در واقع ی کوچک است) روی آن؛ یعنی «ۀ». مانند «دورهٔ آموزشی». دوم ه + نیم‌فاصله + ی. مانند «دوره‌ی آموزشی».

به دلایل بسیار شکل اول در دستور خط فرهنگستان توصیه شده؛ یعنی علامت همزه روی ه. برای دلایل رد نیم‌فاصله با ی به منابع مراجعه کنید. فقط این را بگویم که نوشتن آن سه کاراکتر است (ه + نیم‌فاصله + ی) در حالی که با همزه یک کاراکتر است (ۀ). آن ی بزرگ هم خودش جای یک کاراکتر را می‌گیرد. من حساب کردم اگر این طوری بنویسیم، در کتاب پانصد صفحه‌ای با کاغذ A4، احتمالا نزدیک به ۳ صفحه‌اش فقط همین ی‌ها است.

ه همزه‌دار که در برخی از کیبوردها (نرم‌افزاری) هست نکته‌ای دارد. این کاراکتر با کاراکتر ه بدون همزه فرق می‌کند. یعنی دو نویسهٔ متفاوت هستند.

اشکالی که پیش می‌آید در متن‌های جستجوپذیر است. یعنی ۀ با ه فرق دارد. پس اگر «دورۀ آموزشی» را جستجو کنید، «دوره آموزشی» را پیدا نمی‌کنید؛ در حالی که هر دو در واقع یک کلمه هستند. اگر هم بخواهید هرچه کلمهٔ «دوره» هست را جستجو کنید، اگر ه با همزه را بنویسید، بی‌همزه‌ها را پیدا نمی‌کنید و برعکس.

راه حل مشکل

برای رفع این مشکل کار دیگری کرده‌اند. در کیبورد استاندار فارسی یک علامت همزهٔ روی کاراکتر درست کرده‌اند. یعنی به‌جای اینکه یک نویسه‌ٔ ۀ را بنویسید، می‌نویسید ه + علامت همزهٔ (همان ی کوچک) روی حرف. نکته این است که وقتی در وب جستجو می‌کنیم، حرکت‌ها به‌حساب نمی‌آیند و این همزه هم از جنس حرکت است. بدین ترتیب «دورهٔ آموزشی» و «دوره آموزشی» در جستجو یکی می‌شود. این‌طوری است که هم از مزیت داشتن علامت کسرهٔ‌ اضافه برخوردار می‌شویم که درست بخوانیم، هم جستجوی درست را داریم.

من در این متن از هر دو نوع ه با علامت همزهٔ روی خودش و با حرکت همزه به‌شکل جداگانه استفاده کرده‌ام. از جستجوی روی مرورگرتان برای امتحان آنچه گفتم استفاده کنید.

توجه کنید که این ویژگی فقط روی وب کار می‌کند نه مثلا روی ورد. یعنی روی ورد همان اشکال جستجو را دارد. ولی می‌توانید روی ورد تایپ کنید و همان را هم چاپ کنید و هم در سایت بگذارید.

چه‌کار کنیم؟

برای به‌کاربردن این روش دو چیز لازم دارید. اول کیبورد استاندارد که حرکت همزهٔ آن روی حرف دال است، نیم‌فاصله را با Shift+Space می‌نویسد، با ردیف اعداد هم کاراکترهای عددی فارسی را درج می‌کند که همه‌جا و در هر حالتی فارسی هستند. همچنین علامت جداکنندهٔ هزارهٔ فارسی و ممیز فارسی دارد. این کیببورد روی ویندوز 10 هست که می‌توانید انتخاب کنید. برای ویندوز 7 هم می‌توانید دانلود کنید. دیگر اینکه فونت اصلاح‌شده می‌خواهید. مثلا سری ir یا B اصلاح‌شده که رایگان می‌توانید دانلود کنید. برای دریافت فونت‌ها به اینجا و دربارهٔ کیبورد و دریافت آن به اینجا مراجعه کنید.

حالا با خیال راحت می‌توان نوشت و از این نظر نگران بی‌توجهی عالی‌جناب گوگل نبود.

تصویر کیبورد استاندارد فارسی
تصویر کیبورد استاندارد فارسی