Nagiosから謎のエラーDISK CRITICAL - /sys/kernel/debug/tracing is not accessible: Permission deniedの対処方法について
nrpeでテストした時は何も問題なかったのですが、Nagiosサーバから当該nrpeを叩くと以下のようなエラーが出ました・・奇怪な・・
- 設定したコマンド(ディスクチェック)
command[check_disk]=/usr/lib64/nagios/plugins/check_disk -w 20% -c 10%
- エラーの内容
DISK CRITICAL - /sys/kernel/debug/tracing is not accessible: Permission denied
Nagiosを再起動してもだめ、サーバ自体を再起動してもだめ、Nrpeクライアントをリスタートしてもダメダメ・・ 他のインスタンスと設定同じなのになー。。唯一の違いは、amazon linuxと amazon linux2くらいか。。
途方にくれていろいろと探していたら、英語のサイトにこんな記述があったので、試してみました
command[check_disk]=/usr/lib64/nagios/plugins/check_disk --exclude-type=tracefs -w 20% -c 10%
--exclude-type=tracefsというパラメタを追加してみました
なんと、あっさり解決!tracefsを除外するっていう設定みたいだけど、tracefsってなんだろ?調べた限りだと、Linuxカーネルのイベントのログ取得みたいなんだけど、これとディスクチェックだけがおかしくなる意味がさっぱりわからん・・Nagiosのバグなのかなあ。と思いつつ、とりあえず改善したので、あまり深く追求しないようにしておく。(調べる時間がもったいない)
2020-08-14
tracefsって何かの前に、これって、dfで表示しているDISKタイプを除外するって指定なんですね(汗)
例えば、df上でtmpfsのチェックを除外したい場合は、--exclude-type=tmpfs を追記するだけみたい。お恥ずかしい。
$ df -h Filesystem Size Used Avail Use% Mounted on devtmpfs 963M 0 963M 0% /dev tmpfs 981M 0 981M 0% /dev/shm tmpfs 981M 516K 981M 1% /run tmpfs 981M 0 981M 0% /sys/fs/cgroup /dev/nvme0n1p1 20G 7.8G 13G 39% / tmpfs 197M 0 197M 0% /run/user/1000