سرویسهای متنکاوی و پردازش متن فارسییار
ابزارها و فعالان واقعی در حوزه پردازش متن فارسی
هدف از این مقاله ارائه فهرست مراکز و کسبوکارهای فعال در حوزههای مرتبط با متن کاوی و پردازش متن برای زبان فارسی است. در جمعآوری این لیست، تمرکز اصلی ما برروی محصول ایجاد شده و قابل رویت در حوزه تحلیل متن فارسی بوده و به صرف ادعا بسنده نکردیم. همچنین از گردآوری فعالین در حوزه پردازش گفتار و تصویر خوان (OCR) خودداری کردیم.
فعالین حوزه مرتبط با پردازش متن فارسی
در جدول ذیل لیستی از استارتاپها و شرکتها، دانشگاهها، مراکز پژوهشی و ... فعال و همچنین ابزارهای مختلف پیشپردازش و متن کاوی تولید شده آنها جمعآوری کردیم. انشالله بزودی توضیح کاملتری درباره هر کدام از فعالین این حوزه و محصولات آنها مینویسیم.
- دانشگاه امیرکبیر (دکتر ممتازی، دکتر خدیوی، دکتر همایونپور)
- دانشگاه تهران (دکتر فیلی و دکتر شاکری)
- دانشگاه بهشتی (دکتر شمس فرد)
- دانشگاه گیلان (دکتر میرروشن دل)
- دانشگاه شریف (زبانشناسی رایانشی)
- دانشگاه علم و صنعت (دکتر مینایی)
- دانشگاه فردوسی (دکتر کاهانی)
- دانشگاه اوپسالا (دکتر سراجی)
- پژوهشگاه ایرانداک (دکتر نصیری)
- فرهنگستان زبان و ادب فارسی
- پژوهشکده پردازش هوشمند علائم
- مرکز تحقیقات مخابرات
- سازمان فناوری اطلاعات ایران
- مرکز نور
- آرمان رایان شریف
- گروه سبحه (هضم)
- راهبران فناوری نستوه
- عامر اندیش هوشمند
- عصر گویش پرداز (نویسا، آریانا)
- انیگمایند (آوای همراه هوشمند هزاردستان)
- سرزمین هوشمند
- فناوران اطلاعات سخن
- ویراستلایو
- تکسوس
- ویرا افراز آدان (مترجم فرازین)
- ترجمیار
- ترگمان
- دیتامون (هوش داده مهتاب)
- ریکامند
- نظربین
- واکاویک
- دادهکاوی سحاب
- زال (میراث تِک)
- دیالوگ (کانتماینر)
- روتیک
- دیتاک
- کاوان
- متن کاوی فارسییار
پیشاپیش از اینکه جدول مذکور به شکل تصویر هست و شاید خوانایی کافی را نداشته باشد، عذرخواهیم. ولی این محدودیت ویرگول برای درج جدول هست، لطفاً عکس اصلی را دانلود و مشاهده فرمایید.
چنانچه نیاز به جدول با کیفیت داشتید با ما تماس بگیرید.
همچنین اگر شرکت، پژوهشگاه یا مرکز فعال یا ابزاری مرتبط با متن کاوی و تحلیل شبکههای اجتماعی از قلم افتاده، لطفاً با ما در میان بگذارید.
فعالین در تحلیل شبکههای اجتماعی
با توجه به اینکه در سالهای اخیر گردآوری و تحلیل اخبار و نظرات کاربران در شبکههای اجتماعی یکی از اولویتهای تجاری شرکتهای خصوصی برای پردازش متن قرار گرفته است؛ بصورت جداگانه شرکتهای فعال در حوزه تحلیل و تولید داشبوردهای اطلاعاتی شبکههای اجتماعی و اخبار فارسی زبان را معرفی میکنیم:
- دیتاک : تحلیل، گزارشگیری، رصد شبکههای اجتماعی مختلف شامل اکانتهای توئیتر، کانالهای تلگرام و صفحات اینستاگرام و حدود 2000 سایت خبری
- هشتگ : رصد و تحلیل شبکههای اجتماعی شامل بیش از یکمیلیون کانال تلگرام، کاربران اینستاگرام با بیش از 10هزار دنبال کننده، توییتر، بعضی از خبرگزاریها و کامنتهای آنها
- ترندا (رسانه شهر) : سامانه رصد و پایش اخبار، رسانههای مکتوب، صدا و سیما و شبکههای اجتماعی مختلف
- زلکا : رصد اخبار، شبکههای اجتماعی مختلف، برنامههای تلویزیون و رادیویی، تبلیغات/آگهی در روزنامهها و مجلات، بیلبوردها و استربوردها
- کاوان : رصد و تحلیل شبکههای اجتماعی شامل کانالهای تلگرام، اکانتهای توییتر، صفحات اینستاگرام، وبسایتهای فارسی، روزنامهها و مجلات چاپی و کانالهای رادیو و تلویزیون داخلی و خارجی
- لایف وب (فنآفرینان زندگی نو) : رصد اخبار و شبکههای اجتماعی مختلف
- طراحان تاش رسانه : جمعآوری اخبار از منابع مختلف و ایجاد بولتن اخبار بصورت سفارشی
- پرتوتک سامانه : جمعآوری و دستهبندی اخبار و ایجاد بولتن خبری سفارشی
- پیشگام رایان : جمعآوری اخبار از منابع مختلف و ایجاد بولتن اخبار بصورت سفارشی
- خبرفارسی (پرتوتک سامانه) : رصد، گردآوری، دستهبندی و تحلیل اخبار فارسی از خبرگزاریهای مختلف
- سامانه پایش اخبار نیوزویت : رصد و پایش خبرها بر اساس کلمات کلیدی انتخابی از ۱۰۰۰ منبع خبری
- جادوبی : تحلیل دادههای سازمانی، بازدید سایت و شبکههای اجتماعی
- نوینهاب : یکپارچهسازی و تحلیل اکانتهای شخصی در شبکههای اجتماعی و پیامرسانهای مختلف داخلی و خارجی
به نظر میرسد که شرکتهای فعال در زمینه رصد و تحلیل فضای مجازی در کسبوکار خود نسبت به سایر شرکتهای حوزه پردازش متن موفقتر هستند و سازمانهای دولتی و شرکتهای بزرگی در بین لیست بلند مشتریانشان به چشم میخورد. البته نکته جالبی که در بین مشتریان آنها وجود دارد، اشتراک بعضی از این مشتریان (مانند سازمان صدا و سیمای جمهوری اسلامی ایران) در لیست چند شرکت رصدکنندۀ شبکههای اجتماعی با خدمات مشابه است!
استفاده از این مقاله با ذکر منبع (سامانه متن کاوی فارسییار)، بلامانع است.
مطلبی دیگر از این انتشارات
معرفی بهترین کتابخانههای پردازش متن - بخش سوم (Polyglot, Gensim, NLP Curator)
مطلبی دیگر از این انتشارات
فراخوان مشارکت عمومی برای کمک به زبان فارسی
مطلبی دیگر از این انتشارات
معرفی پیکره ویکیپدیا فارسی برای متن کاوی (بصورت اطلاعات تفکیک و پیشپردازش شده) بهمراه مدلهای تعبیه کلمات (یادگیری عمیق)