いちいちメールの設定をサーバにするのもつらいので、Slackにまとめる。Slackに魂を売り渡すことが不安という向きもあるかもしれないが、メールで通知するにしたって受けるのもどうせGmailだし、諦めましょう。SlackならデスクトップアプリもAndroidアプリもあってプッシュ通知してくれるから拾える確率が高そう。

死活監視・負荷アラート

MackerelからWebhookでSlackに飛ばせる。任意の値(CPU, memory, disk, network, etc.)を監視して任意の閾値でアラートを出せる。Mackerelに魂をry。とりあえずこれで何かやばそうなときは拾えそう。ただし、前回自宅サーバが死んだときは、Load averageのアラートが出まくったのが最後の通信だった。

さすがにもうすこし早く検出したいので、RAID array異常とSMARTの異常値くらいは監視しておきたい。

RAID (mdadm) array異常検出

実際に動くのかはわからないが、mdadmには異常があったときに任意のプログラムを呼ぶ機能があるらしい。再起動時にも通知がくる。

http://unknownplace.org/archives/software-raid.html

ここに書いてある通りにやる。ただし通知先はkayacでなくslackなので、下記スクリプトで。

https://gist.github.com/naotaco/12227ce54e84361130e1

あと上記サイトにあるように、SMARTに異常があったときも同様にSlackに投げられる。すばらしい。