2008年11月8日土曜日

Software Design 2008年11月号に「ZABBIX徹底活用術」を執筆しました

だいぶんと遅くなりましたが、10/18発売のSoftware Design 2008年11月号の第1特集に「ZABBIX徹底活用術」を執筆しました。

今回は表紙を飾らせて頂くことになり、5+1の計6章、約40ページを執筆させていただきました。これまでは導入から基本的な設定までの紹介がほとんどだったのですが、今回は「可視化した情報から何を読み取り、どう対応するか」のサブタイトルが示す通り、導入から設定の解説に加えて、基本的なリソース監視情報の見方や、障害通知/自動対応の設定例も含めています。システム監視の入門として参考にして頂ければと思います。

参考までに、目次構成をご紹介しておきます。

1章 統合監視ツール、使いこなせていますか?

  • はじめに
  • 統合監視とは
  • 統合監視ソフトウェアによるシステム監視の現状
  • 統合監視ソフトウェアZABBIXとは
  • 本特集について

2章 ZABBIX導入クイックスタート 〜テンプレートを使った監視設定〜

  • ZABBIXサーバのインストール
  • ZABBIXエージェントのインストール
  • Webフロントエンドへのログインと操作メニュー
  • ユーザの追加と日本語表示設定
  • 監視対象と監視項目の設定
  • 収集した情報の表示
  • 閾値の設定
  • アラート通知の設定
  • グラフの設定
  • マップの設定
  • 終わりに

3章 テンプレート使いこなしガイド 〜ZABBIXの設定を効率化!〜

  • テンプレートとは
  • テンプレートの作成
  • テンプレートのインポート/エクスポート
  • 終わりに

4章 ZABBIX活用テクニック (障害発生時アクション編) 〜障害発生通知、自動対策〜

  • 障害をいち早く知る/対策することの意味
    • 障害を管理者に通知する
    • 障害に自動的に対応する
  • 障害が発生したら管理者にメールで通知する
    • 関連する設定の解説
    • Case1: 緊急度が高い障害のみ携帯電話にアラートメールを送信する
    • Case2: 障害が発生した場合に復旧手順を記載したメールを送付する
  • 自動対策事例
    • Case1: sshサービスが停止していれば自動的にsshdを再起動する
    • Case2: Webページが表示できなくなったらサーバをシャットダウンする
    • Case3: メモリが不足している場合サーバを再起動させる

5章 ZABBIX活用テクニック (グラフ編) 〜どこに注目し、何を知るか〜

  • システムリソースの注目点
    • ロードアベレージ
    • CPU使用率
    • メモリとスワップ
    • ディスク使用率
    • ネットワーク使用率
  • システムトラブル事例
    • Case1: ロードアベレージの値が高い
    • Case2: ネットワーク使用率が高い
    • Case3: ディスク使用率が急激に高くなった
    • Case4: Webサーバのコネクションの数が多い

Appendix レポート機能の使い方 〜スケールアウト/スケールアップのために〜

  • レポート機能の必要性
  • スクリーン機能の設定
  • スクリーン機能の表示
  • 最後に