バックアップ
 APトラブル修復
 ログ管理
 パッチの適用
 電源管理
 リソース管理
 ネットワーク管理

 バックアップ
 ・シングルユーザーモード
 ・fsck
 ・サイズ確認
 ・バックアップ先
 ・ufsdump
 ・マルチユーザーモード
 ・動的バックアップ(RAID:Redundant Array of Independent/Inexpensive Disk)
RAID1
HDDの単体故障に有効
ミラーリングコマンド使用
ミラーリングの自動化(cron)
ミラーサイト構築(rsync)
 ・静的バックアップ
必要パッケージの確認とインストール(RPMなど)
データ保存パーテーションの確保とマウントポイントの作成
ブートとリカバリーに必要なファイルのコピー
デバイスファイル作成に必要なファイルをコピー
復旧時の参照情報作成(/backup/xdr/info/)
バックアップ(圧縮)
リカバリーCDR作成
 ・リカバリCDRからの復旧作業
デバイスファイル作成
リストア準備
リストア
GRUB実行
再起動後のリストア

 APトラブルの修復
 ・ログの確認
# tail -100 /var/log/message
 ・プログラムの動作確認
# ps -aux | grep プログラム名
 ・HUPシグナル
# kill -HUP xxx
 ・停止、再起動
 ・プログラムがオープンするファイルを探す。
# ls -l /proc/xxxx
番号の名前のシンボリックリンクのリンク先がオープンしているファイルの実態
 ・オープンしたファイルやオープンに失敗したファイルを探す。
 ・RPMなどのパッケージの管理


 ログ管理
 ・システム起動中
「/var/adm/messages」
# dmesg
 ・作業ログの保存
 ・「/var/log/httpd」ディレクトリのログファイル
 ・ログファイルのローテーション
 ・SYSLOG:klogd(KernelLogDaemon)、syslogd(SystemLoginDaemon)でログファイルへ記録
 ・「Analog」を用いたApacheのアクセスログの管理
 ・起動時にrcスクリプトから呼び出されるデーモン等のプログラムが画面に出力するメッセージ
 ・エラー時のチェック
カーネルの日付
$ uname -a
$ cat /proc/version
カーネルドライバ
$ cat /proc/devices
正しいメジャー番号とマイナー番号
(CD-ROM デバイスドライバ:ブロックデバイス)
デバイスのパーミッション
サポートされているファイルシステム
$ cat /proc/filesystems
ドライバが使用している I/O ポートアドレス
$ cat /proc/ioports

 パッチの適用
 ・パッチの入手
 ・パッチの適用

 電源管理
 ・UPS
 ・専用ソフト:停電時に自動shutdownを専用ソフトでサポートしているUPS
 ・Network UPS Tools

 リソース管理
 ・プロセスリソース使用状況
$ /usr/bin/top
 ・プロセスが使用するリソースの制限
Bourneシェル
すべてのソフトリミット表示
$ ulimit -Sa
 ・ファイルシステム
ファイルシステムの表示(man df)
df -h
ディレクトリの使用容量
du -sh
クリーンフラグをマークするタイミング
fsck
fsckが自動的に修復する、軽微なファイルシステムの不整合
(ファイルデータの削除を行わない)
参照されないiノード
iノードの中の大きすぎるリンクカウント
フリーマップの中にないフリーマップ
フリーマップとファイル双方にあるフロック
スーパーブロック中のカウント異常
システム起動時
「/etc/fstab」を参照し、パス番号が0以外のファイルシステムで、
かつ、クリーンフラグがマークされていないものをチェック
Ext3ファイルシステム
 ・メモリ使用量
free、top、ps、vmstat、/proc/meminfo
free + buffers + cached、が余裕
メモリーリーク(memory leak):領域の開放がされない
メモリー不足による動作異常
メモリーリークの検出
使用メモリが急速に増大していないか確認(ps、top)
メモリー容量に関係するswap
空きメモリーを増やし、動作を軽くする目的、不活発なコードを追い出す。
長時間動作させると、活動が鈍い部分がswapに吐き出される。
$ vmstat 30
procs memory swap io system cpu
r b w swpd free buff cache si so bi bo in cs us sy id
procsのb項:入出力待ちなどで動作が停滞、一時的に出るのは問題なし。
swapのsi、soの動きを観察
ディスクioのbi、boの動きも考えあわせる。
ネットワークの影響:vmstatでは良く分からない。
 ・ハードウエア情報の表示
すべてのPCIデバイス一覧表示
lspci -v
カーネル内のリング・バッファの情報(接続デバイスもわかる)
dmesg
メモリーリーク(memory leak):領域の開放がされない

 ネットワーク管理
 ・ホストへ接続と遅延
$ ping
 ・インターフェィスの設定
 ・各ネットワークインターフェィスの通信状況
/bin/netstat -r  (ルーティング情報)
 ・ARPテーブルの参照
arp -a
 ・ルートの設定
 ・経路の調査
traceroute
複数のホストから調査を行う。
 ・IPアドレスとホスト名
/etc/hosts
 ・自ホストが使用するDNSサーバの情報
/etc/resolv.conf
 ・IP エイリアス
aliasアドレス
特定のNICにIPアドレス設定後に割当てるIPアドレス
2つ目以降のアドレスはaliasesと呼ぶ