2023年10月10日に発生した、全銀ネットのシステム障害。
銀行振込できない事象が発生し、利用者にも大きな影響が発生しました。
少しずつ原因が見えていましたので、今回、内容を振り返ってみます。
全銀ネットのシステム障害
いわゆる基盤更改(古いシステム基盤を新しくする対応)により、うまく動作しない事象が発生。
原因の特定や対処に時間を要し、2日間で約506万件の影響が出ました。
影響を受けた方も多いのではないでしょうか。
以下のまとめ記事が分かりやすいため、詳細はそちらをご参考ください。
結局、原因は?
情報が色々と飛び交って混乱しましたが、システム的な原因は「64bit化に伴い、プログラムが利用する領域拡張が必要であったが実施せず。結果、金融機関名テーブルが破損した状態での稼働となり、エラーが多発した」とのことです。
流出原因(なぜそれが事前に検知できなかったのか)については、個人的には記事などを見ても「う〜ん?」という感じですので、まだコメントは控えます。
障害をいかに極小化、迅速に対応できるか
まず、全銀システムとして顧客に影響を与えるトラブルは50年間で初、ということで、その点に衝撃を覚えました。
しかし今回の事象だけ見るに、やるべきことを怠ったと感じた点が2つあります。
内情は様々なことがあるかと思いますので、現実的にできるかどうかはさておき、ですが。
1つ目は、有事が発生したにも関わらず、前のシステムに戻せなかったこと。
基盤更改系は、どれほどテストをしても、最後の最後は何が起きるか分かりません。(リスクをゼロにすることはできません)
そうした時、元の状態に戻せる(実効性のある)プランを用意しておくのは常套手段です。
正常稼働している金融機関にも影響が出る、などもあり戻せなかったようですが、それは事前の計画準備の問題です。
2つ目は、比較的処理が多くなる10日をリリース日としてしまった点です。
当然、そうした認識はあった上でリリースしたものとは想定されますが、結果的に10日であったことが被害を拡大してしまったという点は否めないでしょう。
いずれも、最悪の事態を想定した上で、万が一トラブルが発生した場合でもいかに業務影響を極小化できるかを計画することが大切です。
正直、障害をゼロにすることなんてできませんし、テストをすればするほどコスト高になっていきます。
最終的には、費用対効果をどこかで判断する必要があります。
こうしたお話を拙著「情シスの定石」にて解説しています。
特に、6章「運用」や7章「廃止」が該当します。
ぜひ、お役立てください。
メルマガ『Professional's eye』
"意見が持てる"デジタルコラム
週1回配信、3分で楽しめます。
送信いただいた時点で「Privacy Policy」に同意したとみなします。
広告を含むご案内のメールをお送りする場合があります。