課題別利用シーン 本日の総務課

本日の総務課

ハードウェア故障をログから予測し、壊れる前に対策

2020.08.18

登場人物

関さん
総務課の情報システム担当。25歳草食系男子。
公衆電話からSMSが送れることを課長に教えたら、さして重要ではない内容の全部カタカナのSMSが頻繁に届くようになって困っている。
安部課長
総務課の課長。若い頃はそこそこバブってた。
ポケベルが恋しい世代。自宅に眠る大量のテレカを持て余していたところ、公衆電話からスマホにSMSが送れると知って嬉しい。メッセージを打つのが早い。

このお話の動画版はこちら

ある日、唐突に壊れるハードディスク。故障を予測して緊急対応を回避せよ!


ここは創業80年の中堅プラスチックメーカー。
総務課の安部課長が、数分前からPCのモニターをじっと見つめています。

ちょっと関ちゃん、ファイルサーバーがたまにすごく遅いんだけど、何とかならないの?

広報のファイルですか? 写真のデータが重いんですよ。大量にあるし。

どうやらファイルサーバー上のファイルを開くのに、ものすごく時間がかかっているようです。

Excelでも遅いときあるわよ。どっか壊れてるんじゃないの?

それは関数使いすぎてファイルが重いとかじゃないですかね。調べておくのでファイルパスください。

こうして関さんは、問題のファイルを開くときのファイルサーバーの負荷を、しばらくモニタリングすることになりました。

しかしながら、CPU使用率が不定期に上昇することが気にかかるものの、これと言って異常は見当たりません。

やっぱり課長の使い方に問題があるんじゃないのか? バックグラウンドで重いやつ大量コピーしてたりするからな。

モニタリングをはじめて1ヵ月、やはり時々CPU使用率が上がるだけで、それもしばらくすると元に戻るので、ファイルが重かったり、処理が重なっていたりするだけだろうと結論づけられました。

そんなある日、関さんがサーバールームで検証機の設置作業をしていると、例のファイルサーバーのハードディスクが音を立てて火花を飛ばしました。

うわっ! 故障か!?

ファイルサーバーは電源ランプが消えており、ネットワークから接続できないどころか起動もできず、どうやら本当にハードディスクが故障した様子です。
安部課長がサーバールームに駆け込んできました。

さっきからファイルサーバーに繋がらないって内線が殺到してるんだけど、どうなってるの?

ハードディスクの故障っぽいです…。

最近たまに遅かったのは寿命だったってこと!?

わかりません…。まずはとにかく復旧しないと。

こうして関さんが設置したばかりの検証機は急きょ、壊れたファイルサーバーの臨時の代替機となり、昨晩の定期バックアップのデータが復元されました。

ちなみにリストア作業に半日以上かかったので、その日関さんが帰宅したのは深夜を通り越して明け方。深夜作業でテンションがおかしくなった関さんのSNSには、何かの歌詞のような謎の投稿が残されていました。

この苦しみを分かち合える人が誰もいない悲しみ。ウォーウォー。

ストレージって安い買い物じゃないのよね…。壊れそうってことが前もってわかってれば、こんなことになる前に上司に掛け合えたのに…。

LogStareなら、監視だけでは気づけない故障の予兆をログから発見できます。

◎ログ検索でハードディスクのログをチェック

監視対象機器にエラーログが出ていないか検索します。
エラーの中に、ハードディスクに問題が発生していることを示唆するログが定期的に出力されていれば、故障の可能性があると判断できます。

なんか遅い、で済んでいたのは偶然だったのか。ログを見ていれば気づけたんだな。

ログってこんなことまでわかるのね。ハードディスクが壊れる前に交換できていれば、私も取締役会に呼び出されなくて済んだわ…。

◎アラート機能を使えば異常発生時点で検知できます

あらかじめ条件を登録しておけば、膨大なログの中から故障の予兆に関連するログをシステムが検知し、即アラートメールを送ることができます。

毎日ログをチェックするなんて、うちの総務の規模じゃとても無理だ! エラーログが検出されたときにアラートメールが来るように設定しておこう。


LogStareは、あらゆるITインフラのログやステータス情報を収集し、可視化することで、リスクや障害をいち早く検知するセキュリティ運用プラットフォームです。

2001年からSOCサービスを提供し続けるセキュアヴェイルグループのノウハウを標準化して実装し、セキュリティ運用の自動化・効率化を支援します。

導入が
簡単

エージェントレスでスピード導入

監視対象にはモジュールのインストール等は不要です。既存環境に影響を与えず、スムーズに導入できます。

設定が
簡単

レポート・アラートテンプレートを標準搭載

SOC事業者の実績と経験に基づく監視項目をテンプレート化。プロのノウハウを即利用できます。

運用が
簡単

日本語・日本時間で安心のサポート

純国産のソフトウェアなので、画面、マニュアル、サポート、すべて日本語。不慣れな方でも安心して運用できます。