Diff of UNIX/コマンド/テキスト処理/uniq


TITLE:uniq - 重複行を1つにまとめる
#navi(UNIX/コマンド)
#contentsx

 uniq ユーティリティは、隣接する行を比較しながら入力ファイ ル
 を読み取り、各行の内容を出力します。同じ内容の行が連続してい
 れば、その重複行の内容を 1 回だけ出力します。
 
 内容が同じでも連続していなければ、重複しているとは認識されま
 せん。
だそうです。つまりは重複行を1つにまとめますが、sort されていなければいけません。
ならいっそのこと sort -u (u は unique の意)で処理してしまったほうがよいかもしれません。
uniq コマンドを使用することで、重複行を1つにまとめることができます。

ただし、同じ内容の行が連続している場合のみ、重複していると認識されるため、直前に sort しておくなど事前準備が必要です。
(ならばいっそのこと sort -u で処理してしまったほうが早いかもしれません)。
 aa cc
 aa cc
 bb cc 
 dd ee
という内容のファイル [file] があったとします。
 % uniq [file1]
 aa cc
 bb cc
 dd ee
のようになります。
 % uniq -c [file1]
    2 aa cc
    1 bb cc 
    1 dd ee
オプション -c を使うといくつ重複したかをカウントしてくれます。

#navi(UNIX/コマンド,,footer)
xrea