در لینوکس دستور uniq یک ابزار خط فرمان است که قادر به شناسایی یا فیلتر کردن خطوط تکراری در یک فایل است. به زبان ساده، uniq ابزاری است که به شناسایی و حذف خطوط تکراری مجاور کمک می کند. اما باید این را در نظر داشته باشید, uniq فقط خطوط تکراری مجاور را تشخیص می دهد. این بدان معناست که تقریباً از آن در ارتباط با مرتب سازی استفاده خواهید کرد.
برای شروع از دستور زیر استفاده کنید
sort codelogy.txt | uniq
گزینه u- در دستور sort به شما امکان حذف موارد تکراری را می دهد.
sort -u codelogy.txt
با استفاده از گزینه d- می توانید به uniq دستور دهید فقط خطوط تکراری را نمایش دهد.
مثلا:
sort codelogy.txt | uniq -d
اگر می خواهید خطوط غیر تکراری را نمایش دهید، از گزینه u- در uniq استفاده کنید:
sort codelogy.txt | uniq -u
برای شمارش تعداد کلمات تکراری c- استفاده کنید:
sort codelogy.txt | uniq -c
این بسیار مفید است اگر بخواهید موارد را بر اساس بیشترین تعداد کلمات تکراری مرتب کنید، یعنی از بیشترین به کم ترین. از ترکیب ویژه زیر استفاده کنید:
sort codelogy.txt | uniq -c | sort -nr
اگر میخواهید از تعداد کمتر به بیشتر مرتبسازی کنید، گزینه r- را استفاده کنید.
sort codelogy.txt | uniq -c | sort -n