ما در دنیای دیجیتالی زندگی میکنیم که با نوشته های مختلف محصور شده است. من در گذشته افزونه ویراستار را در سیستم خودم نصب داشتم ولی بعد از مدتی به دلیل ناکارآمدی و به روز شدن آفیس مجبور شدم که استفاده از آنرا رها کنم اصلا ویراستار چه چیزی است یا بهتر بگوییم بود ؟
نرمافزار ویراستیار افزونهای برای مایکروسافت وُرد (Microsoft Word) است که قابلیتهای متعددی را برای کاربران فارسی زبان فراهم میکند. نرمافزار ویراستیار امکان پشتیبانی از نسخههای متفاوت مایکروسافت وُرد و ویندوز را دارا است. از قابلیتهای ویراستار میتوان به غلط یاب املایی، اصلاح نویسههای متن، اصلاح نشانهگذاری، تبدیل تقویم و تاریخ، تبدیل پینگلیش، پیش پردازش املایی متن، تبدیل اعداد و... اشاره کرد.
در حقیقت امکاناتی مثل پینگلیش (فینگلیش) یا تبدیل تاریخ هیچ وقت نظر من را جلب نکرد. افراد دیگر شروع به تلاشهایی برای سازگاری با آفیسهای نسخ بالاتر کرده بودند ولی به نظر من جالب نبود. چیزی که من در نظر داشتم به شکل زیر بود
بازبینی املای کلمات یکی از نیازهای روزانه برای نامه ها ایمیل و موارد دیگر محسوب میشود. برای این مورد باید یکی دو الگوریتم توسعه داده میشد. در برخی برنامه ها الگوریتم از فاصله حروف استفاده میکنند. الگوریتمی که استفاده شد(نورویگ) ترکیبات کلمه را بازبینی میکند بنابر این ترکیبات دقیقتری به دست میدهد. من همینطور ساندکس رو برای مشابهت یابی فارسی توسعه دادم. این بخش کلا با برنامه ویراستار قبل متفاوت است. و به نظر من بسیار مهم است. چرا ؟ چون این دو به شکل متن باز کاربرد بسیاری برای همه برنامه هایی که با متن سروکار دارند دارد. برنامه هایی مانند آنالیز نظرات کاربران گرفته تا او سی ار فارسی همه نیاز به این دارند تا دقت خود را بالا ببرند.
بازبینی انشای کلمات به نظر من کارهایی زیادی وجود دارد که باید انجام شود ولی فعلا به دلیل کمبود شدید وقت به قواعد کلیشه ای جملات فارسی اکتفا شده است. همانند ویراستار . احتمالا در نسخه های بعدی شاهد حضور هوش مصنوعی در این بخش خواهید بود.
خلاصه متن یکی از برنامه های پردازش زبان طبیعی (NLP) است که باید تأثیر بسزایی در زندگی ما داشته باشد.چه کسی فرصت دارد کل مقاله ها / اسناد و کتاب ها را طی کند تا تصمیم بگیرد که آنها مفید هستند یا نه؟ خوشبختانه - این فناوری در حال حاضر در اینجا است. جمع بندی خودکار متن یکی از چالش برانگیزترین و جالب ترین مشکلات در زمینه پردازش زبان طبیعی است. این فرآیند تولید خلاصه متن مختصر و معنی دار از متن متن از منابع متن مانند کتاب ، مقالات خبری ، پست های وبلاگ ، مقالات تحقیقاتی ، ایمیل و توییت است. فعلا پردازش خلاصه ساز به مقادیری محدود شده است. توضیح زیادی در این خصوص نیاز هست اگر چه یک دکمه بیشتر نیست. امیدوارم که فرصتی پیش بیاد و به دوستان پاسخ بهتری داده شود.
تا اینجا این امکانات در ذهن من بود و به معرفی اجمالی پرداخته شد. امیدوارم که فرصتی دست دهد و با توضیحات بیشتری در خدمت شما باشم. دانلود از طریق زیر میسر است
https://github.com/ehsan2022002/VirastarE