백서

옵저버빌리티 향상을 위한 tool 통합 방법

혁신을 주도하는 현대 소프트웨어

오늘날 대부분의 SaaS 기업은 소프트웨어를 구축하고 제공하기에 가장 적합한 시기라고 말할 것입니다. 클라우드, 마이크로서비스 및 컨테이너와 같은 새로운 기술은 더 큰 규모와 효율성을 제공합니다. DevOps, CI/CD 및 자동화는 모두 개발자의 속도와 민첩성을 높여주므로 그 어느 때보다 빠른 혁신 속도를 자랑합니다.

이게 정해진 약속이었습니다.
그러나 현실은 좀 다릅니다. IT 팀이 클라우드 현대화, 구현 속도 및 확장을 추구함에 따라 IT 스택이 점점 더

복잡해지게 되면서, 다음과 같이 모니터링 및 주의할 사항이 훨씬 더 많아졌습니다.

  • 여러 클라우드 공급업체의 하이브리드 환경

  • 다양한 유형의 텔레메트리 데이터를 제공하는 광범위한 기술 영역

  • 잦아진 소프트웨어 변경—주당 십여 차례 이상을 배포하는 기업들의 증가

  • 배포및혁신속도가스택의다른부분,심지어개발및구현을하지 않은 부분에 대한 가시성에 달려 있는 분산형 팀

  • 끊임없이 확장되는 모니터링 tool중 일부는 새로운 개발자가 들어오면서 추가된 것으로, 각 개발자는 자신의 tool을 고수하려고 함.

  • 이 모든 것은 에코시스템이 계속 확장되고 점점 복잡해짐에 따라, 완전한 문맥(context)과 데이터 상관관계를 통해 전체 소프트웨어 시스템에 대한 가시성을 확보하는 것이 그 어느 때보다 중요하다는 것을 의미합니다. 그렇지 않을 경우 "소프트웨어를 구축하고 제공하기에 이보다 더 좋은 시기는 없었다"고 말하는 모든 소프트웨어 회사를 원망할 가능성이 높기 때문입니다.

    이 화이트 페이퍼를 통하여 무분별한 tool 확장으로 인해 발생하는 문제를 간단하게 살펴보고, 모니터링과 완전한 전체 관찰성에 대한 현대적인 접근 방식이 어떻게 복잡성을 완화하고, 모든 것을 명확하게 유지시켜 주는지 알아보도록 하겠습니다. 

현실화된 무분별한 tool 확장

  1. 팀은 IT 복잡성에 대처하기 위해 새로운 독점 및 오픈소스 모니터링 tool을 신속하게 도입하고 있습니다.

    한 조직에서 분산된 팀들이 평균 수십 개의 tool을 사용해 스택의 여러 부분을 모니터링합니다.1 역설적이지만, 이러한 tool 확산은 혁신을 가속화하고 평균탐지시간(MTTD) 및 평균장애복시간(MTTR)을 개선하는 대신, 수많은 새로운 문제를 야기합니다.

  • 사각지대를 야기하는 데이터 사일로

  • 팀이문제해결압력을받는동안tool전환으로인한작업증가

  • 분리된 tool들간의 데이터 상관관계 부족

  • MTTD 및 MTTR 증가

  • 포인트솔루션확장성및안정성결여

  • 상용 tool과 관련된 높은 비용 및 라이선스 부담으로 인해 포괄적인 배포와 시스템 가시성이 제한됨.

  • 오픈소스 모니터링 tool 관리와 관련된 숨겨진 비용

    처음부터 이렇게 될 것을 예상하고 설계하지는 않았겠지만, 시간과 타협을 통해 아래 그림과 같은 상황이 만들어집니다. 단편적인 접근 방식은 고객 요구를 충족시킬 수 없으며, tool의 무질서한 확장으로 인해 관찰성을 확보할 수 없습니다.

    이 문제는 기술의 영향을 훨씬 뛰어넘습니다. 새로운 기술 및 모니터링 tool을 채택한 이유는, 개발자가 더 빠르게 개발, 배포 및 혁신을 하는 데 필요한 tool이 비즈니스 요구 사항을 지원하고 경쟁력을 유지하는 데 도움이 되기 때문입니다. 그러나 모니터링에 대한 이러한 단편적인 접근 방식은 비즈니스 목표와 직접적으로 상충됩니다. tool 통합, 혹은 보다 현실적인 의미의 ‘tool 합리화’는 이러한 문제에 해결책이 될 수 있습니다. 중요한 것은 비즈니스 목표를 지원할 수 있도록 관찰성을 확보하는 것이기 때문입니다. 

.

모니터링에 대한 접근 방식 현대화

데브옵스를 도입하고 워터폴 개발 방식이 아닌 애자일(agile)을 수용하면, 소프트웨어 팀은 그 어느 때보다 더 많은 소프트웨어를 더 빨리 출시할 수 있습니다. 마찬가지로, 레거시 운영 모델은 온프레미스 인프라에 여러 개의 모노리스(monolis)를 배포하는 것을 의미하지만, 클라우드 도입이 증가함에 따라 기업들은 하이브리드 환경 전반에 걸쳐 컨테이너에 배포된 마이크로서비스를 구축함으로써 더 많은 혁신과 더 나은 고객 환경을 구현할 수 있게 되었습니다. 소프트웨어 구축 방식을 업데이트한 것처럼, 이제 소프트웨어를 모니터링하는 방식도 현대화해야 합니다.

흩어져 있는 수많은 ‘동급 최고’의 포인트 솔루션을 관리하는 레거시 모델에 갇히면, 복잡성이 야기됩니다. 비효율적이고, 생산성을 저하시키고, 다운타임을 증가시키며, 문맥(context) 없는 데이터 사일로가 발생하여 결과적으로 경쟁에서 뒤쳐지게 만드는 열악한 고객 환경을 만들게 됩니다.

451Research와 S&P Global Market Intelligence가 “모니터링: 변화가 필요한 시기” 분석 보고서에서 밝힌 것처럼, 이렇게 동적 시스템을 모니터링하는 방법을 재고할 필요가 있습니다. 뉴렐릭이 후원한 이 연구는 700 명의 IT 의사 결정권자를 대상으로 설문 조사를 실시했으며, 그 중 11%만이 현재 모니터링 플랫폼에 만족한다고 대답했습니다. 83%에 달하는 응답자들은 새로운 모니터링 tool을 적극적으로 찾고 있거나, 모니터링 접근 방식을 확장 또는 개선할 계획을 가지고 있었습니다. 바로 이 부분에서 관찰성(Observability)이 필요해집니다.

소프트웨어의 상태가 더 나은 고객 경험과 더 건강한 비즈니스 성과를 의미하는 현실에서, 관찰성을 통해 개발자는 신속하게 이동할 수 있고 전체 시스템의 상태를 한 곳에서 파악할 수 있습니다. 옵저버빌리티, 즉 관찰성을 통한 혜택은 다음과 같습니다.

• 데이터를 모니터을 위한 단일 데이터 소스
• 데이터사일로제거및문제해결가속화
• 생산성향상을위해문제가발생하는이유에대한명확한이해 • 데이터에기반해비즈니스의사결정을내릴수있는역량제공 

한 곳에서 모든 것을 필요로 하는 옵저버빌리티(관찰성)

관찰성을 위해 필요한 것은 무엇일까요? 무엇보다도, 모든 소스, 심지어 오픈소스 tool에서 모든 텔레메트리 데이터를 한 곳에서 수집, 확인, 쿼리하며 인사이트를 확보할 수 있는 가시성이 필요합니다. 관찰 플랫폼을 통해 다음을 수행할 수 있습니다.

• 모든소스의지표,이벤트,로그및트레이스를한곳에서수집및분석하고알림을확인할수있습니다.

  • 연결된 단일 환경에서 전체 소프트웨어 스택을 손쉽게 시각화하고 문제를 해결할 수 있습니다.

  • IT 운영(AIOps)을 위한 인공 지능으로 인시던트를 더 빠르게 감지, 이해 및 해결할 수 있습니다.

    다른 데이터와 마찬가지로, 데이터를 수집하는 능력뿐만 아니라, 데이터를 교차 상관하여 통찰력을 얻을 수 있는 능력도 중요합니다. 관찰 플랫폼은 텔레메트리 유형이나 데이터가 스택의 어디에서 생성되는지에 관계없이, 모든 데이터의 연관 관계를 자동으로 표출해주어야 합니다. 팀원들이 개발한 애플리케이션이 컨테이너 상태에 어떤 영향을 미치는지 볼 수 있으면 문제를 더 빠르게 파악하고, 문제의 원인과 이유를 이해하는 데 필요한 인사이트를 얻을 수 있기 때문에, 디지털 비즈니스를 사전에 최적화할 수 있습니다. 

tool 통합 로드맵

관찰성은 데이터를 한 곳에서 수집, 분석 및 상호 연관시킬 필요가 있기 때문에, 그 다음 단계는 기존 tool 세트를 평가하고 합리화하는 것입니다. 보유하고 있는 tool, tool의 사용자, tool이 제공하는 혜택을 기록한 다음, 현대화 프로세스를 준비 및 실행합니다.

검증되고 반복 가능한 방법론을 도출해 현대화를 달성하려면, 여러 사업부가 협력해 모니터링 tool을 통합하고 합리화를 할 필요가 있습니다. 그래야만 비용을 절감하고, MTTD 및 MTTR을 개선하고 지식 공유를 활성화하여 비즈니스 속도를 높일 수 있습니다. 

.

1단계: 계획

계획 단계에서는 다음에 대한 명확한 개요와 이해가 필요합니다. 

  • 조직에서 사용되는 모든 tool
  • 달성하고자 하는 목표의 예를 들어보겠습니다. 

           - tool 통합을 통해 팀 생산성 및 협업 향상

           - tool 복잡성을 줄여 문제를 찾고 해결하는 데 걸리는 시간 단축

           - tool 라이선스, 교육 및 유지관리 비용 절감

  • 명확하고 이해하기 쉬운 아키텍처 설계
  • 마이그레이션의 전 과정에서 KPI 추적

이 단계의 주요 결과는 아래와 같습니다. 

  • 마이그레이션의 개괄적인 일정 및 범위
  •  관련된 팀과 사업부의 이해 및 협조
  • 사용중인 tool 리스트, 이해관계자와 예산 결정자 포함
  • 현재 및 미래 환경에 대해 합의된 아키텍처

발견 단계에서는 각 사업부에 이루려는 목표와 필요한 업무를 공지해야 합니다. 

조직 내에서 사용되는 각 tool 의 맵에 포함되어야 하는 사항 : 

  • 침이 어떤 tool 을 사용하며, 사용 수준과 지식 요구사항은 어떻게 되는가?
  • 각 tool 이 어떻게 사용되며, 어떤 핵심적인 KPI가 필요한가?
  • 각 tool 이 인시던트 관리 절차에 어떻게 통합되는가?
  • tool들이 서로 어덯게 연결되어 있고, 이벤트나 인시던트가 환경 전반에서 어떻게 확산되는가?
  • 각 tool 의 비용은 어떻게 되며, 다음 갱신 주기는 언제인가? 
  • 어떤 KPI가 중요하고, 또 이들이 모니터링되는 서비스에 어떻게 연결되어 있는가?

각 사업부가 사용하는 tool과 고급 요구사항을 연결한 후, 회의를 통해 다뤄야 하는 주제는 다음과 같습니다. 

  • 모니터링되는 주요 KPI 및 서비스는 무엇인가?

  • 각 tool이 핵심적인가? 교체하거나 다른 방식으로 모니터링할 수 있는가?

  • 각 tool의 교체가 필요한가, 아니면 toolset들 간에 중복이 되는가 (큰 영향을 주지 않고 즉각적인 통합이 가능한가)?
  • 나머지 tool에 대한 주요 기능 및 통합 세부 계획이 있는가?

이러한 데이터를 초기에 수집하면 조직간 팀이 우선순위를 조정하고, 새로운 솔루션이 지원할 주요 사용 사례를 선택하는데 도움이 됩니다. 

이와 동시에 환경의 아키텍처를 생성하고, 이상적인 미래 상태를 정의하는 것이 중요합니다. 

  • 현재 사용 중인 인시던트 관리 tool은 무엇이며 요구사항을 충족하는가?

  • 현재 환경에서 인시던트와 알림이 어떻게 전달되고 있는가?

  • tool이 팀과 사업부 간에 공유되고 있는가?

  • 어떤팀또는사업부가어떤유형의인시던트에대한공지를받을필요가있는가?

  • 서포트 조직에서 제기하는 주요 불만 사항이나 개선 요청은 무엇인가?

  • MTTD와 MTTR를 최적화하려면 무엇을 변경해야 하는가?

이상적인 미래의 상황이 정의되면, 이를 시각화한 아키텍처 다이어그램을 생성할 수 있습니다. 

.

2단계: 준비

준비 단계에서는 포괄적인 사용 사례를 구축하고 가능한 솔루션을 요약한 다음, 필요에 따라 중요한 시나리오를 테스트하여 합리화 작업을 실행할 준비를 합니다. 이 단계에서는 기술적 능력이 아닌, 높은 수준의 목표들을 연결시키는 것이 중요합니다.

예를 들어, "초당 메트릭 CPU, 메모리, 연결 및 쿼리가 필요합니다."라는 요구사항은 기존 솔루션의 범위로 제한되기 때문에, 개방형 사례가 아닙니다. 사용 사례를 "데이터베이스 인스턴스의 상태와 성능에 대한 가시성이 필요합니다."로 바꾸면, 다른 솔루션을 도입할 수 있는 방식으로 필요성이 설명됩니다. 

.

다음 단계 :

  1.  각 기능 요구사항을 주요 사용 사례로 연결합니다. 기능을 그룹화하여 각 그룹을 중심으로 사용 사례를 생성합니다. 
  2. 사용 사례와 이를 지원하는 tool이 포함된 통합 목록을 구축합니다. 
  3. 솔루션들로 특정 사용 사례를 테스트해 검증합니다. 

이 연습의 결과는 특정 tool에 의해 활성화되는 사용 사례를 파악하는 것입니다. 여기에서부터 마이그레이션 계획을 만들 수 있습니다.

계획에는 마이그레이션하기 쉬운 환경에서 시작하여 현재 설정에 대한 완전한 가시성이 존재하지 않을 수 있는 더 까다로운 환경으로 여러 사이클에 걸친 목표가 포함됩니다.

초기 주기는 관찰성 센터 엑설런스를 구축하고, 회사 표준을 작성하는 데 초점을 맞춥니다. 관찰성 센터 엑설런스의 샘플은 이러한 형태를 띕니다. 

3단계: 실행

실행 단계에서는 준비 단계에서 합의된 결정 사항을 적용합니다. tool을 통합하는 데 필요한 모든 변경 사항을

구현하는데, 이는 다음을 의미합니다.

  • 변경사항 구현, 테스트 및 스테이징하여 궁극적으로 최종 운영 환경에 배포합니다.

  • 팀에게 새로운 플랫폼에 대한 교육을 제공하고, 팀원들이 일상적인 작업에 대한 올바른 지식을 갖추도록 합니다.

  • 계획 단계에서 설명된 알림 및 이벤트 관리 전략을 구현합니다.

  • 추가 단계에서 유용할 수있는 모든 경험을 문서화하고 공유합니다.

실행 단계 자체가 합의된 일정에 따라 완료될 수 있다면, 팀은 각자 선호하는 방법을 사용해 마이그레이션 작업을 계획할 수 있습니다.

실행이 완료되거나 제한 시간에 도달하면, 팀이 함께 모여 진행 상황을 살펴보고, 개선 사항 및 다음 단계를 논의합니다. 이러한 정보를 수집해 반복적인 마이그레이션 절차에서 다시 사용합니다. 

.

이러한 주기는 환경이 완전히 마이그레이션되고 합의된 목표를 달성할 때까지 계속됩니다. 

결론

뉴렐릭으로 tool을 통합하면 시간을 절약하고 비용을 절감하며 생산성을 높이고, 자본 지출을 줄일 수 있습니다. 뉴렐릭의 방법을 통해 팀은 통합된 가시성을 확보하고, 간단하고 예측 가능한 요금제를 활용하며, 진행 과정을 안내하는 전문가 서비스 팀의 지원을 받을 수 있습니다.

뉴렐릭과 협력하면 tool 통합 이니셔티브에서 복잡성을 감소하고 협업을 향상시킬 수 있습니다. 또한 다양한 절감 효과를 누리고 효율성을 향상하여, 팀들이 혁신과 고객 가치를 극대화하는 데 집중할 수 있습니다. 다른 기업이 어떻게 성공을 거두었는지 보다 자세한 내용을 확인해보십시오

tool 통합 프로젝트를 고려하고 계신다면, 전체 과정에서 단계별로 안내를 제공하는 뉴렐릭의 전문가에게 지금 연락하시기 바랍니다.