5 Gründe, warum Beobachtbarkeit und Sicherheit gut zusammen funktionieren
Site Reliability Engineers (SREs) und Sicherheitsanalysten haben trotz ihrer sehr unterschiedlichen Aufgaben viel gemeinsam. Beide setzen proaktive Monitoring- und Incident-Response-Strategien ein, um potenzielle Probleme zu erkennen und zu beheben, bevor sich diese negativ auf den Service auswirken können. Außerdem legen beide großen Wert auf organisatorische Stabilität und Belastbarkeit, um Betriebsausfallzeiten und Unterbrechungen zu minimieren.
Doch erst wenn in beiden Fällen die Bedeutung der Zusammenarbeit und Kommunikation nicht nur innerhalb, sondern auch zwischen den jeweiligen Teams erfolgt, kann ein höheres Maß an operativer Belastbarkeit erreicht und proaktiv auf potenzielle Bedrohungen für das Geschäft reagiert werden, als wenn dies unabhängig voneinander geschehen würde.
Im Folgenden sind fünf Möglichkeiten aufgeführt, wie Teams in den Bereichen Sicherheit und Beobachtbarkeit durch Zusammenarbeit mehr erreichen können:
1. Verbesserte Zusammenarbeit im Team
Wenn es um Anbieter und Technologiepartner geht, ist die Rechnung ganz einfach: Mehr Tools = mehr Bürostühle und mehr Zeit für die Lösung von Problemen. Einmalige, isolierte Technologien erschweren die Zusammenarbeit und den Erkenntnisgewinn der Teams, was den Arbeitsaufwand erhöht und sie anfälliger für Fehler macht. Die zusätzlichen Tools erhöhen auch den Aufwand für die Verwaltung, Aktualisierung und Wartung der Software. Die Vereinheitlichung von Technologien reduziert nicht nur diesen manuellen Arbeitsaufwand, sondern verringert auch die Angriffsfläche eines Unternehmens, indem der Zugriff von Tools auf die Unternehmenssysteme eingeschränkt wird.
Zusammenarbeit in Aktion
Das auf Werbeeinnahmen spezialisierte Unternehmen von DISH Media erfasst und verarbeitet täglich 10 Milliarden Datensätze von 25 Millionen Geräte-Endpoints – einschließlich Betriebs-, Geschäfts- und Sicherheitsdaten. Mit einer einheitlichen Lösung und einem einzigen Agenten über Elastic sind Dashboards und Daten jetzt in einer einzigen Oberfläche für alle Teams verfügbar, um eine schnelle Analyse zu ermöglichen.
Dadurch wurden die Vorfallerkennung und MTTR erheblich reduziert, was zu einer Verbesserung des Kundenerlebnisses führt. Dank des einzelnen Agenten von Elastic werden Anomalien in Millionen von Systemen und Kundengeräten viel schneller erkannt und so die Ursachenanalyse und Behebung beschleunigt. Und da das Team von einem einzigen Agenten aus operiert, fallen keine zusätzlichen Implementierungskosten an.
„Mit Elastic verfügen wir jetzt über eine einheitliche Ansicht der Daten, die wir miteinander abgleichen können, um Muster und Anomalien zu erkennen“, sagt John Haskell, technischer Leiter bei DISH Media. „Früher dauerte die Ursachenanalyse und Behebung manchmal Wochen. Jetzt sind es nur ein paar Stunden.“
Sehen Sie sich die vollständige DISH Media-Story an.
2. Vollständige Transparenz mit einer einheitlichen Datenplattform
Teams in den Bereichen Beobachtbarkeit und Sicherheit werden mit Daten überschwemmt, während die Komplexität der Infrastruktur und Anwendungen immer weiter zunimmt. Oft sind es dieselben Daten, die allerdings von den beiden Teams unterschiedlich verwendet werden. Die Aufteilung der Daten in einzelne Tools schafft künstliche Grenzen, was die Erkennung und Lösung von Problemen sowohl aus Sicht der Leistung als auch der Bedrohungserkennung verlangsamt. Hinzu kommt, dass die von den verschiedenen Systemen generierten Daten wahrscheinlich in unterschiedlichen Formaten vorliegen, was zusätzliche Probleme bei der Transparenz im gesamten Unternehmen mit sich bringt. Die Möglichkeit, über eine einheitliche Platform zu verfügen, die auf einem gemeinsamen Schema der erfassten und gespeicherten Daten basiert, erleichtert die Suche und Korrelation relevanter Informationen und verbessert so die Transparenz im gesamten Unternehmen.
Zusammenarbeit in Aktion
OpenTelemetry, eines der schnellsten Projekte im Ökosystem der Cloud Native Computing Foundation (CNCF), gilt als De-facto-Standard für Telemetriedaten und ist ein weit verbreitetes Framework sowohl für SRE- als auch für Sicherheitsteams. Das OTel Semantic Conventions Framework hilft Benutzern, den Zeit- und Arbeitsaufwand zu reduzieren, der für die Abfrage und Abstimmung verschiedener Daten, die Erstellung von Visualisierungen und die Analyse von Features für Machine Learning Anwendungen erforderlich ist.
Die Normalisierung von Sicherheits- und Beobachtbarkeitsdaten mit den semantischen Konventionen von OTel ist ein leistungsstarkes Tool, das die Komplexität drastisch reduziert, die so oft eine effiziente Analyse von Software-, Leistungs- und Sicherheitsproblemen behindert. SRE- und Sicherheitsteams sowie Technologieanbieter nutzen offene Datenstandards, um eine ganzheitliche Analyse vielfältiger und heterogener Daten zu ermöglichen.
3. Erkennung von Anomalien und Bedrohungen
Das exponentielle Wachstum der Datenmenge und die rasante Entwicklung von Codes und Infrastruktur stellen Unternehmen vor die Herausforderung, Anomalien zu finden und Bedrohungen zu erkennen, bevor diese sich negativ auf den Service auswirken. Mithilfe von sofort einsatzbereiten und anpassbaren Machine Learning (ML) Modellen helfen AIOps-Funktionen bei der automatischen Erkennung von Anomalien und bieten Unterstützung bei der Ursachenanalyse und Abhilfe. Die Fähigkeit von Beobachtbarkeitslösungen zur Reduzierung von Rauschen hängt von den Telemetriedaten ab, einschließlich Metriken, Logs, Traces und Profildaten.
Logs, verteiltes Tracing und Metriken bieten Einblicke in den Anfragenfluss, die Menge und Art der Anfragen sowie in andere Leistungsmerkmale. Diese zusammengefassten und kontextbezogenen Daten für verteilte Systeme bieten einen umfassenden Überblick über das Anwendungsverhalten, der auch für die Untersuchung von Sicherheitsvorfällen genutzt werden kann. Die Möglichkeit, die Daten zu analysieren und Abweichungen auf Grundlage etablierter historischer Basiswerte zu erkennen, beschleunigt Sicherheitsuntersuchungen.
Die Entwicklung von generativer KI und Retrieval Augmented Generation (RAG) ermöglicht es SRE- und Sicherheitsteams, weitere Untersuchungen und Analysen mit interaktiven Assistenten durchzuführen, die natürliche Sprache verstehen und allen Ebenen der Betriebs- und Sicherheitsteams schnelle Antworten liefern können, wodurch sich die Zeit bis zur Problemlösung verkürzt.
Zusammenarbeit in Aktion
SIEM-Lösungen und andere Sicherheitstechnologien, die in Beobachtungsplattformen integriert sind, nutzen Einblicke aus Logs, Metriken und Traces. Dieser einheitliche Ansatz ermöglicht die proaktive Identifizierung von abnormalen Mustern, verdächtigen Aktivitäten und potenziellen Sicherheitsvorfällen.
Durch die Korrelation abnormaler Log-Spitzen im Netzwerkverkehr mit Leistungsmesswerten der Server können Unternehmen schnell zwischen legitimen Traffic-Spitzenzeiten und potenziellen DDoS-Angriffen unterscheiden. Ungewöhnliche Muster, wie z.B. wiederholte Login-Fehler oder Zugriff von ungewöhnlichen Orten, werden schnell aufgedeckt - was die Wahrscheinlichkeit erfolgreicher Angriffe deutlich verringert.
4. Tool-Konsolidierung und Kostensenkung
Neben der erhöhten Sichtbarkeit und proaktiven Identifizierung von Problemen führt die Konsolidierung der Beobachtbarkeits- und Sicherheitsfunktionen auf einer einheitlichen Plattform auch zu einer Tool-Konsolidierung, die den zusätzlichen Vorteil von Kosteneinsparungen bietet. Eine einheitliche Platform bedeutet eine Reduzierung der Gesamtbetriebskosten durch die Bündelung der damit verbundenen Betriebsgebühren, Dienste, Datenspeicherung und des Personals, das zur Verwaltung beider Praktiken erforderlich ist.
Zusammenarbeit in Aktion
Der führende Anbieter von Enterprise-Cloud-Datenmanagement,Informatica, hat seine komplexen Beobachtbarkeits- und SIEM-Lösungen durch die einheitliche Platform von Elastic ersetzt. Dadurch wurde die Anwendungsleistung gesteigert und gleichzeitig die Systeme vor externen Bedrohungen geschützt – was enorm viel Geld einsparen konnte.
„Mit Elastic haben wir nur noch einen Anbieter für Beobachtbarkeit und SIEM. „Das bedeutet für ein Unternehmen unserer Größe eine Kostenersparnis von 50 % im Vergleich zu anderen Lösungen“, sagt Amreth Chandrasehar, Director of ML Engineering, Observability und Site Reliability Engineering bei Informatica.
Und die Leistung wird durch die Konsolidierung nicht beeinträchtigt. Tatsächlich stellte Informatica fest, dass das Gegenteil der Fall ist. „Die Suchfunktionalität von Elastic ist unglaublich schnell“, erklärt Chandrasehar. „Trotz der Billionen von Dokumenten, die wir speichern, liefert eine Suchanfrage in etwas mehr als 10 Sekunden präzise Ergebnisse.“
Sehen Sie sich die vollständige Informatica-Story an.
5. Einhaltung regulatorischer Vorschriften für den Umgang mit Daten
Die Stärkung der Sicherheitspraktiken hilft Unternehmen bei der Einhaltung von Branchenvorschriften, die den Umgang mit Beobachtbarkeitsdaten regeln. Indem sie Initiativen zur Beobachtbarkeit mit strengen Compliance-Anforderungen in Einklang bringen, vermeiden Unternehmen nicht nur rechtliche Konsequenzen, sondern schaffen auch Vertrauen bei den Stakeholdern.
Diese Ausrichtung erleichtert die nahtlose Integration von Beobachtungstools in einer regulierten Umgebung. Es zeigt auch das Potenzial für eine symbiotische Beziehung zwischen Sicherheit und Beobachtbarkeit bei der Erfüllung dieser Compliance-Standards.
Zusammenarbeit in Aktion
Keine Branche kennt sich so gut mit Compliance-Anforderungen aus wie der Finanzsektor. Emirates NBD, eine der nach Vermögenswerten größten Bankengruppen im Nahen Osten, hat ein zentrales Logging-System etabliert, das täglich mehrere Terabyte an Daten aus einer Vielzahl von Datenquellen verarbeitet. Mit Elastic als Kernstück bietet diese neue Umgebung das, was Ali Rey, Vice President of Cloud and Data Platforms bei Emirates NBD, als Grundlage einer einzigen Quelle der Wahrheit bezeichnet.
Das zentralisierte Logging bietet der Bank die Möglichkeit, die Sicherheit zu erhöhen und die von den Governance-Stakeholdern geforderten Audit-Logs zu speichern und abzurufen. „Sollte es einmal zu Streitfällen oder Fragen oder anderen Dingen aus interner oder externer Sicht kommen, können wir auf diese Audit-Logs zurückgreifen, die von niemandem manipuliert worden sind“, so Rey.
Dank der Umstellung auf das zentralisierte Logging mit Elastic hat die Bank ihre ursprüngliche Investitionen in die Beobachtbarkeit auf die Sicherheit ausgeweitet, was ihr dabei hilft, sowohl externe als auch interne Bedrohungen zu erkennen.
Sehen Sie sich die vollständige Emirates NBD-Story an.
Machen Sie den ersten Schritt zur einheitlichen Datentransparenz
Wenn Observability- und Sicherheitsfunktionen harmonisch zusammenarbeiten, gewährleisten sie eine sicherere und zuverlässigere Betriebsumgebung. Eine verstärkte Sicherheitspraxis ist nicht nur eine wesentliche Verteidigungsmaßnahme für den Erfolg von Unternehmen und Reputation, sondern auch ein Katalysator für die Wirksamkeit von Beobachtungstools. Und in einem sich selbst verstärkenden Zyklus wird die Sicherheitslage durch Diskrepanzen, die durch die Überwachung der Beobachtbarkeit aufgedeckt werden, weiter gestärkt.
Sich auf eine einheitliche Datenplattform zu verlassen, die auf offenen Standards sowohl für Sicherheit als auch Beobachtbarkeitspraktiken basiert, mag wie ein weit entferntes Ziel erscheinen, aber wenn Sie heute die ersten Schritte unternehmen, wird Ihr Unternehmen auf lange Sicht vorbereitet sein.
Lesen Sie den SANS-Bericht Shining a light in the dark: Observability + Security, oder schauen Sie sich das Webinar an, um mehr über diese neue Strategie und das Ergreifen von Maßnahmen zu erfahren, um die Beobachtbarkeits- und Sicherheitsfunktionen Ihres Unternehmens zu vereinheitlichen.
Die Entscheidung über die Veröffentlichung der in diesem Blogeintrag beschriebenen Leistungsmerkmale und Features sowie deren Zeitpunkt liegt allein bei Elastic. Es ist möglich, dass noch nicht verfügbare Leistungsmerkmale oder Features nicht rechtzeitig oder überhaupt nicht veröffentlicht werden.