سلام دوستان حالتون خوبه؟ انشاءالله سلامت باشید.
برخی از کلمات در ظاهر کلمات بد به حساب نمیان ولی برای کاربردهای خاص ممکنه نیاز به فیلتر شدن داشته باشن که هر کس با توجه به نیاز باید شخصی سازی انجام بده و از این دیتاست استفاده کنه
در صورت علاقه، به تکمیل شدن این دیتاست کمک کنید
از این کتابخونه در فیلتر کردن متن ها در پروژه های خود استفاده کنید و متون پاک و سالمی را داشته باشید
منبع اصلی دیتا بیس اینجا است ممنون از ایشون که دیتا بیس فحش ها رو جمع کردن
(? خطر بدآموزی!!!امیدوارم باعث یاد گرفتن فحش های جدید نباشه، پیشنهاد میکنم که فحش ها رو نخونید)
اول متن ورودی رو میخونه بعدش اونا رو از خط فاصله(اسپیس) میشکنه و با فحش ها(!)مقایسه میکنه یه مشکل ایجاد شده با این شکستن از اسپیس که فحش های دو یا چند جزئی سانسور نمیشن که اینم انشاءالله حل میشه.
میتونید با pip نصبش کنید
pip3 install Sansorchi
چطوری ازش استفاده کنیم؟ به راحتی آبخوردن(!) بعد از نصبش به صورت زیر عمل کنید(بجای YOUR_TEXT متن خودتون رو بنویسید):
from Sansorchi import sansor print(sansor("YOUR_TEXT"))
لینک گیتهاب پروژه، اگه دوست داشتید ستاره بدین ممنون ازتون :)