自分のシステムやホスティングしている顧客アプリケーションの監視には、長年 Paessler 社の PRTG Monitor を使っています。例えばウェブサイトや DNS サーバー、DHCP、Active Directory、Hyper-V などの可用性チェックに用いています。
最新バージョンでは無料で 100 個のセンサーまで利用できます — これで既にシステムのきわめて多くの側面を監視できます。クラスタ機能、つまり 2 台のシステムへ PRTG をインストールして自動フェイルオーバーを行う構成すら、無償で利用できます。
私の中核となる Hyper-V サーバーは、仮想マシン格納用に通常の SATA ディスク 2 台と SSD 2 台から成るストレージプールを持っていますが、起動ボリュームには Intel Matrix RAID を採用しています。
残念ながら Intel Rapid Storage は認証付きのメール送信に対応していません。以前はローカルの Exchange サーバー経由で認証なしのメールを受け入れることができたのですが、Office 365 への移行後はこれが不可能になり(*)、ディスク障害は(RAID1 のおかげで)たまたま数日後にようやく気付くことになりました — もちろん、これを放置できる状況ではありません!
(*) 動的 IP アドレスでインターネットに接続しており、この IP は少なくとも一時的にブラックリストに載ることがあるためです。例えば「550 5.7.1 Service unavailable; Client host [84.159.238.182] blocked using FBLW15」のように。
ディスク障害と RAID アレイの劣化は、Intel のソフトウェアによってアプリケーションログに記録されていました。
PRTG Monitor のWin Api イベントログセンサーを利用することで、今後はこれを継続的に監視できます。フィルタリングは警告・エラー・特定のイベント ID などで行えます。
PRTG Monitor は素晴らしいソフトウェアで、文句なしにお勧めできます! もちろん習熟には多少時間がかかりますが、使う価値は十分にあります!
