UNIX/LINUXコマンドラインで文書整形

以下は、UNIX/LINUX初学者への学習支援目的で記述したメモです。

事前に学習済みの項目

  • ターミナルエミュレータ(*1)を経由してsshでのサーバログイン
  • ログアウト終了(exit)
  • shellという言葉は聞いたことがある。
  • pwd,echo,ls,cp,mv,mkdir,rm,cd,cat,less,manコマンドは経験したことがある。
  • shellのメタ記号(?や*)について使った経験がある。
  • rmについてはオプションでディレクトリ削除も経験してことがある。
  • エディタemacsについて、起動と終了、ファイル保存については経験がある。
  • ファイルへのリダイレクト>は経験がある。
  • パイプ|は経験がある。
  • grepは、一応経験がある。
  • (g)awkは、-Fオプションをつけた'{print $?}'文の経験はある。

学習済み項目に関して、とりあえず不足している部分。

  • ファイルやディレクトリの属性について学んでいない。
  • shellが一体なにもので、最低、どのような点を理解しておく必要があるのかについてわからない。特に1.環境変数・シェル変数、2.shell内部組み込みコマンドとUNIX/LINUXの外部コマンドの区別、3.shell命令(制御構造)とスクリプトの存在
  • テキストデータの保存形式として、パソコンも含めてしばしば使われているCSVを使ったことが無い。
  • grep,awk以外のテキスト整形用コマンド(sed,cut,paste,uniq,sort)を使ったことがない。
  • grepやawkなどで用いる初歩の正規表現
  • awkのスクリプトで用いる初歩の変数やその使い方。

本ページでのメモ範囲

上記「不足部分」のうち

  • テキストデータの保存形式として、パソコンも含めてしばしば使われているCSVを使ったことが無い。
  • grep,awk以外のテキスト整形用コマンド(sed,cut,paste,uniq,sort)を使ったことがない。
  • grepやawkなどで用いる初歩の正規表現
  • awkのスクリプトで用いる初歩の変数やその使い方。

以上4点について解説します。

例示用データ

CSVの仕組み

テキストを加工する(sed,cut,paste,uniq,sort)

sedを除いて基本的な使い方はhttp://codezine.jp/article/detail/3643で学習。


awkのレコード、フィールド変数

正規表現














*1: たとえばWINDOWS OSでのTeraTermなど

this file --> last modified:2012-03-31 13:53:03