KDDI クラウド障害発生

1月28日午前4時ごろから障害が発生しているKDDIのクラウドサービス「KDDI クラウドプラットフォームサービス」。原因はハードウェアではなくソフトウェアの問題という。

2023/2/1現在の各報道をお知らせします

ITmedia NEWS より

KDDIのIaaS「KDDI クラウドプラットフォームサービス」で、1月28日午前4時ごろから障害が発生している。「jp2-east05」ゾーン(リージョンを構成するサーバ群の単位)の一部サーバでストレージが故障しており、ユーザーがサービスを使えない状態という。解決のめどについては「復旧には相当なお時間を要する見込み」(同社)としている。

今後の復旧見通しを更新

KDDIは1月31日、今後の復旧見通しについて発表した。完全復旧には2週間以上かかる可能性があるとしている。

Yahooニュースより

1月28日午前4時ごろから約80時間にわたって障害が発生しているKDDIのクラウドサービス「KDDI クラウドプラットフォームサービス」。同社は31日、完全復旧に2週間以上かかる可能性があると明らかにした。  KDDIは現在、故障したストレージからのデータ移行に向け作業中。新規ストレージの構築は済んでおり、今後は(1)故障したストレージ内のデータを読み取り可能な状態で起動する、(2)データを新規ストレージに移行する、(3)新規ストレージ上で仮想サーバを立ち上げる──という手順を復旧を進める。  (1)は2月1日から7日に完了予定。(2)は(1)の完了後、最長6日間かけて行う。(3)は(2)の完了後、順次実施する。(3)の完了により問題が解決する見込みだが、復旧するタイミングはユーザーごとに異なるとしている。  障害は「jp2-east05」ゾーン(リージョンを構成するサーバ群の単位)の一部サーバでストレージが故障したことで発生した。ただし、原因はハードウェアではなくソフトウェアの問題という。

日経クロステックより

KDDIのIaaS障害は4日目に突入、復旧には「相当な時間を要する」

 今回の障害により、東京都葛飾区立図書館のWebサイトが閲覧できず、電子書籍サービスと図書館メール配信サービスが利用できなくなっている。

 

クラウドが優れているとは限らないのでは?目的を間違えないすすめ

クラウドが優れているとは言い切れなく、目的に応じて使い分けをお勧めしています。

オンプレミス(専用サーバー) 安全性・柔軟性が高い
クラウド(共用サーバーの延長) コストが抑えられ、導入までがスムーズ

企業によってはセキュリティー面やカスタマイズ性を求めて、クラウドからオンプレミスに回帰するケースもありえます。また、どちらか一方を選択するという考え方ではなく、新しい発想としてハイブリッドクラウドやマルチクラウドを利用した運用も主流となっています。

クラウドの最大の欠点は、大容量の記憶装置障害の影響がおおきく、ひとたび障害が起きると数十テラ単位での復旧を余儀なくされるので、いくら技術が進化しても、物理的復旧コピー時間は変わりません。このため復旧まで時間がかかることなります。
オンプレミス(専用サーバー)の場合、自分のサーバー範囲で収束するため復旧まで最短となり、物理的コピーも直接👍を加えることができます。クラウドの場合、仮想サーバーとして動作しているため、仮想システム上で復旧を行わないといけないため、再構築まで複雑な復旧作業になります。

たしか数年前(2012年)に大障害をおこした「ファーストサーバー事件」を思い出します。これも大容量仮想ディスクをあやまって削除してしまったことが原因であり、あまりの大量データーのため物理的コピー復旧時間に大半の時間を要したことは明白となりました。

やはり、コストがある程度かかっても、障害損失を考えると同じ仮想化オンプレミス分散サーバー(専用サーバー)が理想なのかもしれません。