تنظيم وتنظيف البيانات
1. أمر sort
يعيد sort ترتيب سطور الملفات النصية أو المدخلات أبجدياً أو رقمياً أو بناءً على معايير أخرى.
الفرز الأبجدي الأساسي:
bash $ cat data.txt | sort
الفرز الرقمي (-n): ضروري عند فرز الأرقام، حيث يتعامل معها الفرز القياسي أبجدياً (على سبيل المثال، 10 يأتي قبل 2).
bash $ cat numbers.txt | sort -n
الفرز العكسي (-r): يفرز بترتيب تنازلي.
bash $ cat data.txt | sort -r
2. أمر uniq
يزيل uniq أو يبلغ عن الأسطر المتجاورة المكررة في ملف. بشكل حاسم، يجب فرز الملف أولاً لكي يعمل uniq بشكل صحيح.
إزالة التكرارات:
bash $ cat log | sort | uniq
عد التكرارات (-c): مفيد جداً لإنشاء تقارير التردد.
bash $ cat access.log | sort | uniq -c | sort -nr