構築中。

名古屋のITインフラ屋さんです。ITイベントへの参加記録などを残していきます。

障害対応訓練実施 (9/22)

先に書いた障害対応訓練を実施しました。

午前中は座学、午後は実践として、

・インフラとアプリケーション開発の両方がわかる担当者がリーダーになり

・3人ずつ2チームに分かれて

・システムメンテナンスの中で、計画ミスや作業ミスを原因として発生した障害を

発見・修正していく形で訓練を行いました。

チーム編成は、

・チームA:30代中堅(リーダー)+20代若手+20代新卒新人

・チームB:20代若手(リーダー)+20代若手+30代中途新人

でした。

結果

ミスによる減点はあったものの、チームBが、必須対応項目をすべてクリアする形で勝ちました。

途中の様子を見ていたところ、チームAは経験豊富なリーダーがほぼ全ての問題を解決しようとしていたのに対し、チームBは最初からリーダーともう1人の若手が調査・対応範囲をインフラとアプリケーションで分担し、出題者への「対応報告」を中途新人に任せる形で進めていました。

多くの項目をチームBが先に見つけて高得点をゲットし、チームAも途中から分業体制に入って、中盤で少し点差を詰めたのですが、その後、対応内容を正確に把握しないまま報告を行うことを数回繰り返すことで時間をロスし、終盤はかえってチームBが差をひろげる形になりました。

事前準備の段階では、チームAは「先生(リーダー)と2人の生徒」のような関係で勉強を進めていたのに対し、チームBはそれぞれ対等の関係で話し合って、後は各自自習、としたそうです。

一番能力が高いメンバーがいても、1人ですべての調査・対応を行うのには限界があります。また、その人が「先生」になってしまうと、「生徒」は受動的になってしまい、「先生」のレベルを超えるどころか近づくのもなかなか難しいです。

飛びぬけて能力が高い「スーパー担当者」がいれば別ですが、やはりチームワークで解決していくほうが強いのでしょう。

分業制が進みすぎるとセクショナリズムの問題が出てくるので、バランスが難しいところですが、ある意味、事前の予想通りになった、障害対応訓練でした。

 余談ですが

去年の訓練では、「ストレージのスナップショットを取るタイミングを間違え、その後作業ミスをした結果、作業ミスの前の状態に戻すことができなくなって詰んだ」という形でタイムアップしてしまいました。

そのため、今回は、実践編の前に「去年と同じ轍は踏まないように」と伝えておいたのですが、すでに去年の記憶はなく…両チームとも、ストレージのスナップショットを取ることもなく、調査・対応を開始していました。

他にも、去年と同じトラップ(=一部のメンバーがログインできない状態になっている)を仕込んでいて、全く去年と同じ引っかかり方をしていたので…やはり、1年間隔での実施は、間を空けすぎなのかもしれません。