Menu
本日の総務課
2019年12月23日
登場人物
ここは創業80年の中堅プラスチックメーカー。
総務課の安部課長が、数分前からPCのモニターをじっと見つめています。
ちょっと関ちゃん、ファイルサーバーがたまにすごく遅いんだけど、何とかならないの?
広報のファイルですか? 写真のデータが重いんですよ。大量にあるし。
どうやらファイルサーバー上のファイルを開くのに、ものすごく時間がかかっているようです。
Excelでも遅いときあるわよ。どっか壊れてるんじゃないの?
それは関数使いすぎてファイルが重いとかじゃないですかね。調べておくのでファイルパスください。
こうして関さんは、問題のファイルを開くときのファイルサーバーの負荷を、しばらくモニタリングすることになりました。
しかしながら、CPU使用率が不定期に上昇することが気にかかるものの、これと言って異常は見当たりません。
やっぱり課長の使い方に問題があるんじゃないのか? バックグラウンドで重いやつ大量コピーしてたりするからな。
モニタリングをはじめて1ヵ月、やはり時々CPU使用率が上がるだけで、それもしばらくすると元に戻るので、やはりファイルが重かったり、処理が重なっていたりするのだろうと結論づけられました。
そんなある日、関さんがサーバールームで検証機の設置作業をしていると、例のファイルサーバーのハードディスクが音を立てて火花を飛ばしました。
うわっ! 故障か!?
ファイルサーバーは電源ランプが消えており、ネットワークから接続できないどころか起動もできず、どうやら本当にハードディスクが故障した様子です。
安部課長がサーバールームに駆け込んできました。
さっきからファイルサーバーに繋がらないって内線が殺到してるんだけど、どうなってるの?
ハードディスクの故障っぽいです…。
最近たまに遅かったのは寿命だったってこと!?
わかりません…。まずはとにかく復旧しないと。
こうして関さんが設置したばかりの検証機は急きょ、壊れたファイルサーバーの臨時の代替機となり、そこに昨晩の定期バックアップのデータが復元されました。
ちなみにリストア作業に半日以上かかったので、その日関さんが帰宅したのは深夜を通り越して明け方。深夜作業でテンションがおかしくなった関さんのSNSには、何かの歌詞のような謎の投稿が残されていました。
この苦しみを分かち合える人が誰もいない悲しみ。ウォーウォー。
そして安部課長は安部課長で、ファイルサーバーのリプレースに掛かる概算見積もりに頭を悩ませるのでした。
ストレージって安い買い物じゃないのよね…。壊れそうってことが前もってわかってれば、こんなことになる前に上司に掛け合えたのに…。
監視対象機器にエラーログが出ていないか検索します。
エラーの中に、ハードディスクに問題が発生していることを示唆するログが定期的に出力されていれば、故障の可能性があると判断できます。
なんか遅い、で済んでいたのは偶然だったのか。ログを見ていれば気づけたんだな。
ログってこんなことまでわかるのね。ハードディスクが壊れる前に交換できていれば、私も取締役会に呼び出されなくて済んだわ…。
あらかじめ条件を登録しておけば、膨大なログの中から故障の予兆に関連するログをシステムが検知し、即アラートメールを発報することができます。
毎日ログをチェックするなんて、うちの総務の規模じゃとても無理だ! エラーログが検出されたときにアラート通知するように設定しておこう。
LogStare Collector(ログステアコレクター)は、ファイアウォールなどのセキュリティ機器や、ネットワーク接続機器、サーバー、クラウド等、あらゆるITインフラのステータスを可視化し、リスクや障害をいち早く検知することができるセキュリティ運用支援ソフトウェアです。
2001年からSOCを提供し続けるセキュアヴェイルのノウハウを集約し、従来の監視ツールの課題を解決する機能を提供します。
導入が
大変
エージェントレスで機器を自動認識。
ネットワーク図も自動生成され、スムーズに導入できます。
設定が
高難度
SOC事業者の実績と経験に基づく監視項目をテンプレート化。
プロのノウハウを即利用できます。
運用が
煩雑
すべての監視対象機器を一画面に集約し、問題をいち早く発見できます。
アラートメールの発報も可能です。