背景
オンプレミス環境で稼働させていたITシステムをクラウドへ移行(クラウドリフト)する案件は数多くあります。クラウドで実装されたITシステムは、容易に変更することが可能であるため、ビジネスに則して”迅速”に変更できるというメリットがあります。
このメリットは、”業務アプリケーションの変更”といったアプリケーションレイヤの話に留まらず、むしろ、”機材の調達~設置”に至る時間的/物理的な制約に縛られていたインフラレイヤに大きな恩恵をもたらします。
特に、インフラレイヤは、IaC(Infrastructure as Code)を活用することによって、インフラにまつわる工数面/品質面/管理面でその恩恵はさらに大きくなります。クラウドを使うからには、この恩恵をぜひとも享受したいものです。
ただ、ITシステムの開発や運用/保守を他社に任せっきりでは、この恩恵は十分に享受できません。
他社と協業しつつも、自分たちが積極的にITシステムの運営に携わっていく必要があります。
この記事では、オンプレミス環境のITシステムをパブリッククラウドへこれからクラウドリフトさせるケースを題材として、インフラレイヤにスポットライトを当てつつ、自分たちでITシステムを使いこなしていくために大切なポイントを紹介いたします。
オンプレ脳が陥りやすいワナ
オンプレミス環境のITシステムをパブリッククラウド上に初めて実装する場合、当然ではありますが「オンプレミス環境のITシステムの開発経験をあてにしすぎない」ということが大切な考え方になります。
パブリッククラウド特有の、オンプレミス環境のITシステムとは異なる様々なポイントが存在しますので、それらを前提として予め予算的/組織的な措置を織り込んでおくことが肝要です。
オンプレミス環境のITシステムの開発経験をあてにして進んでいくとハマる思わぬ落とし穴を、ケーススタディで説明します。
ケーススタディ
①パブリッククラウドのモニタリングと改善
キャパシティを中心としたシステムの稼働状況を網羅的/定期的にモニタリングし、それをシステムにフィードバックするような役割/仕組みを考慮できていますか?

説明
パブリッククラウドでは、”インスタンスタイプによって”あるいは”インスタンスの起動時間によって”、毎月の請求額が変わってきます。
オンプレミス環境のITシステムとは異なり、逐次必要十分なリソースを選択し続けることによって、パブリッククラウドの費用を最適化することができるわけです。そのため、網羅的かつ定期的に、システムの稼働状況をモニタリングしながら、必要十分なリソースとなるようシステムをメンテナンスしていく取り組みが必要です。
初期構築時の選択に固執することなく、自社システムが最適な姿であり続けるよう、日々見直すことが重要です。
②最新のパブリッククラウドのサービス仕様への追従
日々アップデートされていくパブリッククラウドのサービス仕様を、調査/把握し、継続的な改善を検討できるような役割/仕組みを考慮できていますか?

説明
オンプレミス環境のITシステムとは比較にならないスピード/内容で、パブリッククラウドのサービスは日々新しいものがリリースされていきます。
新しくリリースされるサービスを能動的にチェックし、自分たちのシステムに活用できないか定期的にチェックしましょう。活用することで、システム構成の簡素化や運用作業の低減といった効果につながる場合があります。
筆者の経験では、違ったパターンで追従できていなかった経験があります。ストレージのサービス仕様に追従できておらず、いつのまにか知らないパラメータが増えていて、当該パラメータについてプロジェクトとしてあるべき設定が見極められておらず、セキュリティホールになりかけた、というものです。
③開発工程で実装したデプロイの仕組みの状態
IaC、DevOps、CI/CDといったキーワードで開発工程で使ったデプロイのための仕組みは、初回のサービス開始以降も活用できるようになっていますか?

説明
初期開発で一生懸命に実装した自動化の仕組みが、サービス開始以降に活用されない例が散見されます。
活用されない理由としては、”初期開発でキーマンが離任してしまってツールの使用ノウハウが失われた”あるいは”インフラレイヤの変更パターンにIaCの仕組みがフィットしておらず、実用に耐えられなかった”などがあります。
すべてのインフラレイヤの実装を完全に自動化することは難しいものですが、”IaCの仕組みで自動化する部分”と”手動で構築する部分”といった具合にリソース毎の実装方法を整理し、IaCの仕組みを継続・発展させていくことでアジリティの高いシステムの実現に繋がっていきます。
④パブリッククラウド特有の不定期なイベントへの対応
パブリッククラウド特有の不定期なイベントについて、対応できるよう作業分担ができていますか?

説明
AWSで例を挙げると、Personal Health Dashboardの通知の対応、リタイアメントの対応、上限緩和申請、強制バージョンアップ対応など、オンプレミス環境のITシステムでは発生しないパブリッククラウドならではの対応が必要です。中には、期限までに対応しないと、パブリッククラウド側で強制的に措置が取られてしまうようなものもあり、不測の障害に繋がることもあり得ます。
パブリッククラウド特有の不定期に発生するイベントについて、誰がどのように対応するか作業分担を整理しておきましょう。
まとめ
オンプレミス環境のITシステムをパブリッククラウド上に初めて実装する場合は特に、パブリッククラウド特有のポイントを理解することが重要です。
上記のような4つのポイント(①モニタリングと改善②最新サービスのチェック③開発時のデプロイの仕組みの維持④不定期イベントへの対応)を押さえて、サービスイン後も継続的にITシステムがビジネス価値を発揮しつづけられるよう、インフラレイヤも含めてパブリッククラウドを使いこなしましょう!