Logstash
데이터 집계, 변환, 저장
오픈 소스 서버의 데이터 처리 파이프라인인 Logstash는 다양한 소스에서 데이터를 수집하여 변환한 후 자주 사용하는 저장소로 전달합니다.
수집 그 이상의 작업
입력, 필터, 출력
Logstash는 형식이나 복잡성과 관계 없이 데이터를 동적으로 수집, 전환, 전송합니다. grok을 이용해 비구조적 데이터에서 구조를 도출하여 IP 주소에서 위치 정보 좌표를 해독하고, 민감한 필드를 익명화하거나 제외시키며, 전반적인 처리를 손쉽게 해줍니다.
입력
모든 형태, 크기, 소스의 데이터 수집
데이터는 여러 시스템에 다양한 형태로 보관된 경우가 많습니다. Logstash는 일반적인 다수의 소스에서 동시에 이벤트를 가져오는 다양한 입력을 지원합니다. 로그, 메트릭, 웹 애플리케이션, 데이터 저장소 및 다양한 AWS 서비스에서 모두 지속적으로 스트리밍되는 방식으로 손쉽게 수집할 수 있습니다.
필터
데이터 이동 과정에서의 구문 분석 및 변환
Logstash 필터는 데이터가 소스에서 저장소로 이동하는 과정에서 각 이벤트를 구문 분석하고 명명된 필드를 식별하여 구조를 구축하며, 이를 공통 형식으로 변환 통합하여 분석을 더욱 강력하게 만드는 동시에 비즈니스 가치를 높여줍니다.
Logstash는 형식이나 복잡성에 관계없이 다음과 같이 데이터를 동적으로 변환하고 준비합니다.
- grok을 통해 비정형 데이터에서 구조 도출
- IP 주소에서 위치 좌표 해독
- PII 데이터의 익명화, 민감한 정보 필드 완전 제외
- 데이터 소스나 형태, 스키마의 용이한 처리
풍부한 필터 라이브러리와 다재다능한 Elastic Common Schema를 갖추고 있어 가능성이 무궁무진합니다.
출력
스태시를 선택하여 데이터 전송
Elasticsearch는 검색과 분석의 새로운 세계를 열어주는 시스템이지만, 그것만이 유일한 선택지는 아닙니다.
Logstash는 원하는 곳으로 데이터를 라우팅할 수 있는 다양한 출력을 지원하기 때문에 여러 저장소로 데이터를 다운스트림하는 유연성을 확보할 수 있습니다.
모니터링
배포 시스템에 대한 완벽한 가시성 확보
Logstash 파이프라인은 종종 다양한 목적으로 활용되며 금세 복잡해지기 때문에 파이프라인의 성능과 가용성, 병목현상의 파악이 어려울 수 있습니다. 하지만 모니터링과 파이프라인 탐색기를 활용하면 실행 중인 Logstash 노드를 손쉽게 파악하고 배포할 수 있습니다.
관리 및 오케스트레이션
단일 UI로 전체 배포 통합 관리
하나의 파이프라인 관리 UI를 통해 Logstash 배포를 통합적으로 관리하고 조율하거나 실행할 수 있습니다. Logstash 관리 도구는 의도치 않은 연결을 방지하기 위해 Security 기능과 완벽하게 연동됩니다.