AWS障害もめにもめたけどamazonがそもそも障害おこすなっていう話

AWS障害もめにもめたけどamazonがそもそも障害おこすなっていう話

 

可用性向上のためにどこまでコストと手間をかけるか
 今回の障害で、Multi-AZ配置になっていないアプリケーションがかなり多いことが明らかになった。これについて城氏は「オンプレミスからそのままリフト(移行)してaws

アマゾン・ドット・コム(AMZN)Amazon.com Inc. - 米国株銘柄紹介 | 米国株を知る場所 nasdaqchart(ナスダックチャート)

に載せた場合は、Single-AZで動かしているものがかなりある。これをMulti-AZ配置に対応させるには、設計変更を行いアプリケーションに手を入れ入ることになりハードルが高い」と説明する。

 またデータウェアハウスのようなシステムでは、1つのAZにリソースを寄せ、シンプルな構成にしてコストパフォーマンスの良い環境を用意することもある。もちろんMulti-AZ配置にすればコストが上がるので、継続性を重視しなければSingle-AZで運用するという判断もある。

 ところで、今回のような障害が発生しても、障害が取り除かれればシステムは障害発生前の状態に復旧される。そのためユーザーは、障害が取り除かれるのを基本的にはただ待っていれば良い。しかし場合によってはデータ破損も起こり得る。また復旧を待っていられないサービスは、早い段階で判断し障害発生したAZを切り離して他のAZで復旧させる措置も必要だ。