OpenTelemetry란 무엇인가?
OpenTelemetry 정의
OpenTelemetry(OTel)는 개발 팀이 단일 통합 형식으로 원격 측정 데이터를 생성, 처리 및 전송할 수 있는 오픈 소스 Observability 프레임워크입니다. Cloud Native Computing Foundation(CNCF)은 모니터링 플랫폼에 메트릭, 로그 및 추적을 수집하고 라우팅하기 위한 표준화된 프로토콜과 도구를 제공하기 위해 개발되었습니다.
OpenTelemetry는 벤더 중립적인 SDK, API 및 도구를 제공하므로 데이터를 원하는 통합 가시성 백엔드로 전송하여 분석할 수 있습니다.
OpenTelemetry는 클라우드 네이티브 애플리케이션에서 지배적인 통합 가시성 텔레메트리 표준으로 빠르게 자리잡고 있습니다. 특정 벤더나 기존 기술의 한계에 얽매이지 않고 미래의 데이터 수요에 대비하고자 하는 조직에는 OpenTelemetry를 채택하는 것이 매우 중요하다고 생각됩니다.
원격 측정 데이터란 무엇인가?
원격 측정 데이터는 분산 시스템에서 수집된 로그, 메트릭 및 추적으로 구성됩니다. "Observability의 기둥"으로 알려진 이 세 가지 범주의 데이터는 개발자, DevOps 및 IT 팀이 시스템의 동작과 성능을 이해하는 데 도움이 됩니다.
로그: 로그는 특정 시점에 시스템에서 발생한 개별 이벤트에 대한 텍스트 레코드입니다. 로그 항목은 코드 블록이 실행될 때마다 생성됩니다. 일반적으로 컨텍스트 페이로드와 함께 이벤트가 발생한 시간을 보여주는 타임스탬프가 포함됩니다. 로그 데이터는 일반 텍스트, 정형 및 비정형 등 다양한 형식으로 제공됩니다. 로그는 특히 코드 문제 해결, 디버깅 및 확인에 유용합니다.
메트릭: 메트릭은 시간 간격에 따라 측정되는 숫자 값으로, 종종 시계열 데이터라고 합니다. 여기에는 타임스탬프, 이벤트 이름 및 이벤트 값과 같은 속성이 포함됩니다. 최신 시스템에서 메트릭을 사용하면 문제를 모니터링, 분석 및 대응하고 경보를 촉진할 수 있습니다. 시스템 오류율, CPU 활용률 또는 서비스에 대한 요청률과 같은 인프라 또는 애플리케이션에 대한 정보를 제공할 수 있습니다.
추적: 추적은 분산 시스템을 통과하는 요청의 경로를 나타냅니다. OpenTelemetry의 추적은 해당 범위에 따라 정의됩니다. 스팬 그룹이 추적을 구성합니다. 추적은 팀이 다양한 서비스 및 구성요소를 통해 요청의 종단 간 이동 및 동작을 이해하는 데 도움이 됩니다. 분산 추적을 통해 전체 실행 경로를 추적하고 문제를 일으키는 코드를 식별할 수 있습니다. 추적은 애플리케이션의 전반적인 상태에 대한 가시성을 제공하지만 기본 인프라에 대한 가시성은 제한됩니다. 환경을 전체적으로 파악하려면 통합 가시성의 다른 두 기둥인 로그와 메트릭이 필요합니다.
OpenTelemetry의 간략한 역사
OpenTracing과 OpenCensus는 표준화된 데이터 형식의 부족을 해결하기 위해 독립적으로 개발된 중복 분산 추적 프로젝트였습니다. OpenTelemetry는 OpenTracing 및 OpenCensus 프로젝트의 코드베이스를 통합하여 각각의 장점을 Cloud Native Computing Foundation에서 호스팅하는 단일 프로젝트로 결합하기 위해 만들어졌습니다.
OpenTracing은 백엔드로 데이터를 전송하기 위한 벤더 중립적인 API를 제공합니다. OpenCensus는 코드를 계측하고 백엔드로 데이터를 전송하는 데 사용되는 언어별 라이브러리 개발자의 모음이었습니다. 둘 다 오픈 소스였습니다. 즉, 소프트웨어의 소스 코드가 공동으로 개발되어 누구나 사용, 수정 및 배포할 수 있습니다.
OpenTelemetry를 사용하면 개발자는 더 이상 OpenTracing과 OpenCensus 중 하나를 선택할 필요가 없습니다. OpenTelemetry는 데이터를 수집하고 전송하기 위한 통합 라이브러리, API, 에이전트 및 수집기 서비스 세트를 제공합니다.
OpenTelemetry의 작동 방식
OpenTelemetry는 원격 측정 데이터를 수집하여 선택한 Observability 백엔드로 내보낼 수 있는 공통 프레임워크를 제공합니다. 벤더에 구애받지 않는 표준화된 일련의 API, SDK 및 도구를 사용하여 데이터를 수집, 변환 및 전송합니다.
언어별 OpenTelemetry API는 시스템 전체에서 텔레메트리 데이터 수집을 조정하고 코드를 계측합니다. OpenTelemetry SDK는 데이터 수집, 처리 및 내보내기를 지원하는 라이브러리를 통해 API를 구현하고 지원합니다. 또한 OpenTelemetry는 서비스의 자동 계측 기능을 제공하고 사용자 정의 계측 기능을 지원합니다. 벤더에서 제공하는 내보내기 또는 OpenTelemetry 프로토콜(OTLP)을 사용하여 텔레메트리 데이터를 내보낼 수 있습니다.
OpenTelemetry의 핵심 구성 요소
OpenTelemetry의 핵심 구성 요소는 다음과 같습니다.
Collector
OpenTelemetry Collector는 원격 측정 데이터를 수신, 처리 및 내보내는 벤더에 구애받지 않는 프록시입니다. 여러 형식의 원격 측정 데이터 수신은 물론 내보내기 전 원격 측정 데이터 처리 및 필터링도 지원합니다.
언어 SDK
OpenTelemetry 언어 SDK를 사용하면 OpenTelemetry API를 통해 언어가 있는 원격 측정 데이터를 생성하고 백엔드로 내보낼 수 있습니다.
계측 라이브러리
OpenTelemetry는 널리 사용되는 라이브러리와 지원되는 언어의 프레임워크에서 관련 원격 측정 데이터를 생성하는 광범위한 구성 요소를 지원합니다.
자동 계측
OpenTelemetry의 언어별 구현을 사용하면 소스 코드를 변경하지 않고도 애플리케이션을 계측할 수 있습니다.
내보내기
내보내기 도구는 계측기를 백엔드 구성에서 분리하여 계측기를 변경하지 않고 백엔드를 쉽게 변경할 수 있도록 합니다. 또한 원격 측정을 둘 이상의 백엔드에 업로드할 수 있습니다.
OpenTelemetry의 이점
OpenTelemetry의 이점은 데이터 표준화와 미래에 대비한 유연성으로, 이를 통해 Observability가 향상되고 효율성이 향상되며 비용이 절감된다는 것입니다.
데이터 수집 표준화
OpenTelemetry는 계측을 변경하지 않고도 Splunk, New Relic, Dynatrace 및 Datadog와 같은 백엔드에 원격 측정 데이터를 수집하고 내보낼 수 있는 일관된 방법을 찾는 DevOps 팀을 위한 솔루션을 제공합니다. 개방형 표준과 표준화된 데이터 수집을 통해 OpenTelemetry는 가시성을 높이고 Observability를 단순화합니다. 보다 쉽게 설정할 수 있는 Observability 기능을 통해 팀은 시스템 상태를 더 잘 이해하고 성능 문제를 식별하며 서비스 중단이 발생하기 전에 근본 원인을 해결하는 데 필요한 시간을 단축할 수 있습니다. OpenTelemetry를 사용하는 조직은 사내 솔루션을 개발하거나 여러 애플리케이션을 위한 개별 도구를 조사하는 데 시간을 낭비할 필요가 없습니다. OpenTelemetry는 노이즈, 비용 및 구성 변경의 필요성을 줄임으로써 조직이 데이터를 수집하는 방식이 아니라 데이터를 활용하는 데 집중할 수 있도록 지원합니다. 또한 가장 합리적인 도구나 형식을 사용하여 팀에 인사이트를 제공하여 협업을 개선할 수 있습니다.
벤더에 종속되지 않음
OpenTelemetry를 사용하면 특정 벤더에 구애받지 않고 원하는 백엔드를 선택할 수 있으므로, 미래에 대비해 투자할 수 있습니다. 시스템, 백엔드 및 프로세스의 변경사항을 수용할 수 있으며 따라서 단일 플랫폼이나 솔루션, 계약에 묶이는 일이 없으므로 조직은 기술 요구 사항이 진화함에 따라 확장하고 적응할 수 있습니다. 이러한 독립성과 유연성은 기술의 한계가 아니라 수익과 고객에게 가장 적합한 것이 무엇인가를 기준으로 비즈니스 의사 결정을 내릴 수 있음을 의미합니다.
OpenTelemetry를 사용하면 성장을 위한 확장성, 플랫폼 간 호환성, 기존 모니터링 및 통합 가시성 도구와의 손쉬운 통합이 가능합니다.
Elastic을 이용한 OpenTelemetry
OpenTelemetry는 애플리케이션에 통합 원격 측정 형식을 제공하는 표준 방법을 제공하지만 백엔드 또는 분석 구성 요소는 제공하지 않습니다. Elastic Observability는 OpenTelemetry 데이터를 확장 가능한 개방형 ElasticSearch 플랫폼에 원활하게 통합합니다.
Elastic은 기본적으로 OpenTelemetry 프로토콜을 지원하므로 여러 언어에 걸쳐 로그, 메트릭 및 추적을 가져올 수 있습니다. 따라서 Elastic의 강력한 분석 및 시각화 기능을 훨씬 쉽게 대규모로 활용할 수 있습니다.
2023년 4월, Elastic은 공통 텔레메트리 데이터 스키마를 위해 시맨틱 규칙을 ECS와 융합한다는 장기적인 목표를 가지고 OpenTelemetry에 Elastic Common Schema(ECS)를 기여했습니다. Elastic은 데이터 아키텍처를 OpenTelemetry로 표준화할 계획이며, 앞으로 OpenTelemetry 프로젝트에 대한 투자와 협업을 늘릴 예정입니다.
Elastic은 OpenTelemetry 프로젝트의 강력한 기여자이기도 합니다. 관리자가 CI/CD 플랫폼을 모니터링하고 문제를 해결하며 개발자가 CI/CD 파이프라인의 속도와 안정성을 높일 수 있도록 Elastic Observability는 CI/CD 프로세스에 대한 가시성을 제공합니다. Elastic은 파이프라인에 대한 모니터링 대시보드, 경고 및 근본 원인 분석 기능을 제공하기 위해 Jenkins, Ansible, Maven을 비롯한 가장 널리 사용되는 CI/CD 플랫폼 커뮤니티와 협력하여 OpenTelemetry 도구를 계측합니다.
Elastic Observability는 조직이 OpenTelemetry 계측을 통해 수집한 데이터를 Elastic 배포 환경으로 직접 전송할 수 있도록 지원하는 엔터프라이즈급 솔루션입니다. 하이브리드 클라우드 애플리케이션에 대한 완벽한 가시성과 이를 모두 저장, 분석 및 시각화할 수 있는 기능을 제공합니다. 또한 Elastic의 강력한 머신 러닝 기능을 사용하여 분석 및 복구 시간을 단축할 수 있습니다.
OpenTelemetry FAQ
OpenTelemetry가 표준인가요?
예. 예. OpenTelemetry는 오픈 소스 프로젝트이며 로그, 추적 및 메트릭에 대한 통합 표준입니다.
원격 측정의 예는 무엇인가요?
원격 측정 데이터의 예로는 시스템 모니터링 및 Observability에 사용되는 로그, 메트릭 및 추적이 있습니다.
OpenTelemetry 와 Jaeger의 차이점은 무엇인가요?
OpenTelemetry는 다양한 오픈 소스 및 상업용 백엔드로 데이터를 처리하고 내보낼 수 있도록 도와주지만, Jaeger와 같은 Observability 백엔드는 아닙니다. OpenTelemetry는 원격 측정 데이터를 생성하고 관리하는 데 도움이 되는 일련의 API, SDK 및 도구를 제공하지만, Jaeger는 오픈 소스 분산 추적 도구입니다. IT 팀은 Jaeger를 사용하여 마이크로서비스 아키텍처를 기반으로 애플리케이션을 모니터링하고 문제를 해결합니다. Jaeger는 로그 및 메트릭을 지원하지 않습니다.
OpenTelemetry API와 SDK의 차이점은 무엇인가요?
OpenTelemetry API, 즉, 애플리케이션 프로그래밍 인터페이스는 시스템 전체에서 원격 측정 데이터 수집을 조정하고 코드를 계측합니다. API는 언어별로 다르므로 코드의 언어와 일치해야 합니다. OpenTelemetry SDK 또는 소프트웨어 개발 키트는 데이터 수집, 처리 및 Observability 백엔드로 내보내기를 지원하는 라이브러리를 통해 API를 구현하고 지원합니다.