Kubernetesのマルチリージョン化ってどうやるの!?教えて楽天のエンジニアさん!

現在私たちが運用しているサービスは最大でもマルチデータセンターレベルの冗長化となっており、リージョン障害が発生した場合復旧に2時間もの時間を要しておりました。また、Kubernetesのupgrade作業も実際にリクエストが来ている状態でnodeの入れ替えを行なっており、リスキーな作業となっていました。 そこで私たちは下記を目的にKubernetesクラスタのマルチリージョン化を行いました。 ・リージョン障害時30分以内に復旧できること ・Kubernetesのupgradeをリクエストが来ない状態で安全に行えること 本公演では、Kubernetesクラスタのマルチリージョン化を行なった経験を元に下記内容をお話します。 ・Kubernetesのマルチリージョン構成をどのように実現したか ・Kubernetesクラスタをどのタイミングでどのように切り替えるべきか ・Kubernetesをマルチリージョン化したことによって、開発者、運用者にどのようなメリットがもたらされたか

Takumi Sato

登壇者プロフィール

Takumi Sato

楽天グループ株式会社

Software Engineer

takumis28705484

TakumiSato0613


2020年新卒で楽天グループ株式会社に入社。楽天グループ内のサービスが横断的に利用するアプリケーションの開発運用や、Operation ZEROのミッションの元、既存システムの改善と自動化に貢献。直近ではKubernetesの専門知識を活かして、Operator Patternを利用した運用の自動化や、Kubernetes Clusterのマルチリージョン化、そしてVaultをKubernetesのマルチクラスタ環境に構築するプロジェクトなどで活躍。