フード&リテールデリバリーサービス市場をリードする高品質なユーザー体験の追求
利用用途
急成長するデリバリーサービスの高品質化と、グローバルスタンダードのプロダクト/サービス基盤の実現に向けてNew Relicを活用
New Relicの選定理由と成果
- オンプレミスとクラウドが連携するシステムにおけるフルスタックオブザーバビリティの実現
- コンテナアプリケーションによる複雑なサービス連携を詳細にトレーシング
- システムの健康状態がひと目でわかるSLI/SLOの可視化
株式会社出前館は、日本最大級のデリバリーサービス『出前館』を運営する業界リーダーである。1999年の設立以来、外食チェーンを中心に全国規模でフードデリバリーサービスを展開し、幅広い顧客層から支持を獲得してきた。近年は、コンビニなどと連携した日用品・食品の即時配達へとビジネス領域を拡大。2020年にLINEグループと資本業務提携を結び、2021年よりZホールディングスグループの一員として成長戦略を加速させている。プロダクト本部インフラ部 部長の小泉卓也氏は次のように話す。
「出前館では『テクロジーで時間価値を高める』というミッションを掲げ、デリバリーサービスの進化とお客様価値の向上に取り組んでいます。地域に根づいたサービスを展開し、地域の人々を支える『ライフインフラ』を担うことで、単に食事やモノをお届けするだけでなく、地域経済の活性化にも貢献しています」
出前館のユーザー向けアプリでは、日本全国を網羅する10万以上の店舗へ、あらゆるジャンルの料理の『出前』を注文できる。加盟店は、自社の配達員を拡充することなく、コロナ禍で急増するデリバリーへのニーズに柔軟に応えられるメリットが大きい。出前館の2022年第2四半期の流通取引総額は610億円に達し、前年同期比152%という高成長を記録した。
「プロダクト本部では、最新のテクノロジーを活用し、出前館のサービス全体を支えるバックエンドの基盤システムから、ユーザー・加盟店・配達員が使うスマホアプリまで、多様なプロダクト/アプリケーションを開発・運用しています。長年使い続けてきたシステムのモダナイゼーションを通じて、お客様ニーズと市場拡大に応えることにより強固な体制を作り上げていきます」と話すのは同社 インフラグループ SREの岡田将氏である。
LINE社でSREを担当してきた岡田将氏は、出前館のシステム環境のモダナイゼーションを加速させるために、2021年8月に出前館のプロダクト本部へ参画した。業務範囲は、オブザーバビリティ環境やCI/CD環境の整備と活用推進、SLI/SLO制定に向けたメトリクスの設計など多岐にわたる。
「出前館のサービス基盤は、オンプレミスとクラウド上でそれぞれ稼働するシステムが連携するハイブリッド環境です。AWSへの全面移行を急ピッチで進めていますが、現時点ではシステムの中核とも言えるOracleデータベースをオンプレミスに残している状態です。このハイブリッド環境全体のアプリケーションプロセスを可視化し、トラブルシューティングの迅速化とサービスのより安定的な提供を実現するためにNew Relicを採用しました」(岡田将氏)
ハイブリッドクラウドのオブザーバビリティを実現
New Relicは業界を代表するオブザーバビリティ(可観測性)プラットフォームであり、デジタルサービスにおけるあらゆる重要指標の「観測」を可能にする。アプリケーション、インフラ、ユーザー体験の観測を通して、障害やサービスレベルの低下、潜在的な問題・ボトルネックを可視化する機能は業界随一との評価を得ている。
出前館にNew Relicが導入されたのは2021年5月である。岡田将氏は、出前館のシステムにおけるオブザーバビリティ(可観測性)ツールの有効性、中でもAPM(Application Performance Monitoring)の重要性に早くから気づいていた。
「オンプレミスのレガシーなJavaアプリケーションからAWS上のコンテナアプリケーションまで、サービス基盤全体にオブザーバビリティを適用できることがNew Relic採用の決め手になりました。アプリケーションで何らかの不具合が発生したとき、原因を詳細に分析にかなりの時間を要していたことがこれまでの大きな課題でしたが、現在は、プロダクト本部のエンジニア150名以上がNew Relicを使用し、トラブルシューティングの迅速化やアプリケーションの品質向上に役立てています」(岡田将氏)
New Relic APMは、Webアプリケーションのレスポンスタイム、スループット、エラー率、トランザクションなどを可視化するとともに、ユーザー体験に影響するコードやコード間の依存関係をリアルタイムで特定できる。
「AWSへの移行と同時にモダンなコンテナアプリケーションへの再構築を進めています。マイクロサービスアーキテクチャーを採用し、多数の機能コンポーネントを連携させるアプリケーションに生まれ変わります。コンテナならではの可搬性を活かして、AWSではない他のクラウドでも、あるいはプライベートクラウドでも、インフラを選ばず稼働できることが特徴です。複雑なサービス間連携の可視化に『分散トレーシング』を適用できることも、New Relicの大きなメリットと考えています」と岡田将氏は話す。
図:ハイブリッド環境での複雑なサービス間連携の可視化にNew Relicを活用している出前館
SLI/SLOの制定と開発チームのパフォーマンス向上
岡田将氏は、全社共通プラットフォームとしてのNew Relicの導入をリードするとともに、開発チーム/エンジニアによるNew Relicの活用推進をサポートしている。導入から1年、APM、Logs、Infrastructure、Syntheticsなど主要な機能群の活用はすっかり定着した。
「現在取り組んでいるテーマは、ソフトウェア開発チームのパフォーマンス向上です。『Four Keys』として知られる、デプロイの頻度、変更リードタイム、変更失敗率、サービス復元時間の4つを指標として、サービス機能ごとにスコアを可視化することで、担当する開発チームが注力すべきテーマを具体化していきます」(岡田将氏)
New Relic Service Level Management を利用すれば、サービスレベル指標(SLI)とサービスレベル目標(SLO)の定義から、それぞれの順守・達成状況のダッシュボードでの可視化、レポーティングまでを容易に行える。たとえば、SLOを達成できないチームには、機能開発よりも信頼性向上に向けた改善を優先させるような意思決定も可能になる。
「また、よりきめ細やかなモニタリングができれば、スコアの改善により深く切り込むことができるのではないかと考えています。単純に『閾値の範囲内に収まっていればOK』ということでなく、『瞬間的に値が上昇するような不自然な挙動』まで検知したいという意味です。New RelicのAIOpsを活用すれば、私たちがまだ気づいていないメトリクスの揺れまで検知できるようになると期待しています」(岡田将氏)
「開発チームのパフォーマンス」も可視化
出前館のハイブリッドクラウド環境では、Cloud Watch、Prometheus、Grafana、Zabbixといった様々なツールを使い分けているが、「今後はNew Relicに集約していく」(岡田将氏)方針が決まっており、順次移行を進めていくという。
「ハイブリッド環境全体のアプリケーションプロセスを可視化し、トラブルシューティングの迅速化とサービスのより安定的な提供に役立てる、という当初の目標は達成されつつあります。特に、APMによるパフォーマンスボトルネックの発見と原因分析、分散トレーシングによるサービス間のリクエストの問題特定、エラーログの分析を通じた詳細な原因調査が可能になったことは期待通りの成果です」と岡田将氏は話す。
開発チーム/エンジニアからは、「パフォーマンス低下の原因調査が格段に容易になった」「数日を要していた問題解決が、数時間で可能になった」という声もあがっているという。定期的に開催されているNew Relic技術チームによる勉強会は、50名を超えるエンジニアが参加する人気ぶりだ。
インフラグループの岡田泰弘氏は、「主要サービスごとに開発チームが編成されていますが、New Relicを標準オブザーバビリティツールとしてチーム横断的に活用できることは大きなメリットです。また、様々な環境を可視化できることは、アプリケーション開発を含め新しいチャレンジのスピード感を高めていくことに貢献してくれるでしょう」と話す。
「New Relicのダッシュボードから、出前館のすべてのサービスの健康状態をひと目で把握できるようにしたい」と話しつつ、岡田将氏は次のように結んだ。
「SREとしての私の最大のミッションは、出前館のサービスの信頼性向上と、開発チームのパフォーマンス強化に結びつく施策を着実に推進し、スピード感をもって成果を出していくことにあります。そのために、システムのパフォーマンス可視化が可能で、開発チームのパフォーマンスまで可視化できるNew Relicを徹底的に活用していきたいと考えています。New Relic社には、私たちのビジネス成長を支えるプラットフォームとして、優れたオブザーバビリティ環境を提供し続けてもらえることを期待します」