Panoramica del monitoraggio della rete

Cos’è il monitoraggio della rete?

Monitoraggio della rete tiene traccia dello stato di una rete attraverso i suoi livelli hardware e software. Gli ingegneri utilizzano il monitoraggio della rete per prevenire e risolvere interruzioni e guasti della rete. In questo articolo, descriveremo come funziona il monitoraggio della rete, i suoi casi d’uso principali, le sfide tipiche relative al monitoraggio della rete efficace e le caratteristiche principali da cercare in uno strumento di monitoraggio della rete.

I dati inviati su una rete passano attraverso ogni livello dell'SI.
I dati inviati su una rete passano attraverso ogni livello dell’SI.

Come funziona il monitoraggio della rete?

Le reti consentono il trasferimento di informazioni tra due sistemi, anche tra due computer o applicazioni. Il modello Open Systems Interconnection (Open) suddivide diverse funzioni su cui si basano i sistemi informatici per inviare e ricevere dati. Affinché i dati vengano inviati attraverso una rete, passeranno attraverso ogni componente dell’SI, utilizzando protocolli diversi, iniziando dal livello fisico e terminando al livello dell’applicazione. Il monitoraggio della rete fornisce visibilità sui vari componenti che compongono una rete, assicurando che gli ingegneri possano risolvere i problemi di rete a qualsiasi livello in cui si verificano.

Monitoraggio dell’hardware di rete

Le aziende che eseguono carichi di lavoro on-prem o gestiscono data center devono garantire che l’hardware fisico attraverso il quale viaggia il traffico di rete sia sano e operativo. Questo in genere comprende i livelli fisici, datalink e di rete nel modelloSI (livelli 1, 2 e 3). In questo approccio al monitoraggio incentrato sui dispositivi, le aziende monitorano i componenti per la trasmissione di dati, come il cablaggio, e i dispositivi di rete come router, switch e firewall. Un dispositivo di rete può avere più interfacce che lo collegano con altri dispositivi e possono verificarsi errori di rete in qualsiasi interfaccia.

Come monitorare l’hardware di rete

La maggior parte dei dispositivi di rete è dotata del supporto per lo standard SNMP (Simple Network Management Protocol). Tramite SNMP, è possibile monitorare il traffico di rete in entrata e in uscita e altri importanti dati di telemetria di rete critici per garantire lo stato e le prestazioni delle apparecchiature on-premise.

Il protocollo Internet (IP) è uno standard utilizzato su quasi tutte le reti per fornire un sistema di indirizzi e routing per i dispositivi. Questo protocollo consente di instradare le informazioni alla destinazione corretta su reti di grandi dimensioni, inclusa l’Internet pubblico.

Gli ingegneri e gli amministratori di rete in genere utilizzano strumenti di monitoraggio della rete per raccogliere i seguenti tipi di metriche dai dispositivi di rete:

  • Uptime

    La quantità di tempo in cui un dispositivo di rete invia e riceve correttamente i dati.

  • Utilizzo della CPU

    La misura in cui un dispositivo di rete ha utilizzato la sua capacità computazionale per elaborare input, memorizzare dati e creare output.

  • Utilizzo della larghezza di banda

    La quantità di dati, in byte, che viene attualmente inviata o ricevuta da una specifica interfaccia di rete. Gli ingegneri tengono traccia sia del volume di traffico inviato, sia della percentuale di larghezza di banda totale utilizzata.

  • Throughput

    Il tasso di traffico, in byte al secondo, che passa attraverso un’interfaccia su un dispositivo durante un periodo di tempo specifico. Gli ingegneri in genere tengono traccia del throughput di una singola interfaccia e della somma del throughput di tutte le interfacce su un singolo dispositivo.

  • Errori di interfaccia / scarti

    Si tratta di errori sul dispositivo ricevente che causano il rilascio di un pacchetto di dati da parte di un’interfaccia di rete. Gli errori di interfaccia e gli scarti possono derivare da errori di configurazione, problemi di larghezza di banda o altri motivi.

  • Metriche IP

    Le metriche IP, come il ritardo temporale e il numero di hop, possono misurare la velocità e l’efficienza delle connessioni tra dispositivi.

Si noti che negli ambienti cloud, le aziende acquistano risorse di elaborazione e di rete da fornitori cloud che gestiscono l’infrastruttura fisica che eseguirà i loro servizi o applicazioni. Il cloud hosting sposta quindi la responsabilità della gestione dell’hardware fisico sul fornitore del cloud.

Monitoraggio del traffico di rete in tempo reale

Al di sopra dei livelli hardware della rete, vengono coinvolti anche i livelli software dello stack di rete ogni volta che i dati vengono inviati su una rete. Ciò riguarda principalmente i livelli di trasporto e applicazione del modelloSI (layer 4 e layer 7). Il monitoraggio di questi livelli consente ai team di monitorare lo stato di servizi, applicazioni e dipendenze di rete sottostanti mentre comunicano su una rete. I seguenti protocolli di rete sono particolarmente importanti da monitorare perché sono il fondamento per la maggior parte delle comunicazioni di rete:

Strato di applicazione (Strato 7)

  • Hypertext Transfer Protocol (HTTP)

    Il protocollo utilizzato dai client (tipicamente browser web) per comunicare con i server web. Le metriche HTTP primarie includono il volume delle richieste, gli errori e la latenza. HTTPS è una versione più sicura e crittografata di HTTP.

  • Domain Name System (DNS)

    Il protocollo che traduce i nomi dei computer (ad esempio “server1.example.com”) agli indirizzi IP attraverso l’uso di vari name server. Le metriche DNS includono volume delle richieste, errori, tempo di risposta e timeout.

Strato di trasporto (Strato 4)

  • Internet Protocol (IP) – Transmission Control Protocol (TCP)

    Un protocollo che sequenzia i pacchetti nell’ordine corretto e consegna i pacchetti all’indirizzo IP di destinazione. Le metriche TCP da monitorare possono includere pacchetti consegnati, velocità di trasmissione, latenza, ritrasmissioni e jitter.

  • User Datagram Protocol (UDP)

    UDP è un altro protocollo per il trasporto di dati. Offre velocità di trasmissione più elevate, ma senza funzionalità avanzate come la consegna garantita o il sequenziamento dei pacchetti.

Come monitorare il traffico di rete in tempo reale

Applicazioni di monitoraggio della rete possono contare su una varietà di metodi per monitorare questi protocolli di comunicazione, comprese le tecnologie più recenti come esteso Berkeley Packet Filter (eBPF). Con un sovraccarico minimo, eBPF tiene traccia dei pacchetti di dati di rete mentre fluiscono tra le dipendenze nell’ambiente e traduce i dati in un formato leggibile dall’uomo.

Network Monitoring vs. Network Management

Network monitoring tiene traccia dello stato di una rete attraverso i suoi livelli hardware e software. Gli ingegneri utilizzano il monitoraggio della rete per prevenire e risolvere interruzioni e guasti della rete. In questo articolo, descriveremo come funziona il monitoraggio della rete, i suoi casi d’uso principali, le sfide tipiche relative al monitoraggio della rete efficace e le caratteristiche principali da cercare in uno strumento di monitoraggio della rete.

Visibilità end-to-end nella rete cloud On-Prem &

Vantaggi del monitoraggio della rete

Gli errori di rete possono causare gravi interruzioni aziendali e, in reti complesse e distribuite, è fondamentale avere una visibilità completa per comprendere e risolvere i problemi. Ad esempio, un problema di connettività in una sola regione o zona di disponibilità può avere un impatto di vasta portata su un intero servizio se le query interregionali vengono eliminate.

Un vantaggio comune del monitoraggio dei dispositivi di rete è che aiuta a prevenire o ridurre al minimo le interruzioni di business. Gli strumenti di monitoraggio della rete possono raccogliere periodicamente informazioni dai dispositivi per garantire che siano disponibili e funzionino come previsto e possono avvisare l’utente in caso contrario. Se si verifica un problema su un dispositivo, ad esempio un’elevata saturazione su un’interfaccia specifica, gli ingegneri di rete possono agire rapidamente per prevenire un’interruzione o qualsiasi impatto rivolto all’utente. Ad esempio, i team possono implementare il bilanciamento del carico per distribuire il traffico su più server se il monitoraggio rivela che un host non è sufficiente per servire il volume delle richieste.

Un altro vantaggio del monitoraggio della rete è che può aiutare le aziende a migliorare le prestazioni delle applicazioni. Ad esempio, la perdita di pacchetti di rete può manifestarsi come latenza dell’applicazione rivolta all’utente. Con il monitoraggio della rete, gli ingegneri possono identificare esattamente dove si verifica la perdita di pacchetti e risolvere il problema. Il monitoraggio dei dati di rete aiuta inoltre le aziende a ridurre i costi di traffico legati alla rete, evidenziando modelli di traffico interregionali inefficienti. Infine, gli ingegneri possono anche utilizzare il monitoraggio della rete per verificare se le loro applicazioni possono raggiungere i server DNS, senza i quali i siti Web non verranno caricati correttamente per gli utenti.

I moderni strumenti di monitoraggio possono unificare i dati di rete con metriche dell’infrastruttura, metriche dell’applicazione e altre metriche, consentendo a tutti gli ingegneri di un’organizzazione di accedere alle stesse informazioni durante la diagnosi e la risoluzione dei problemi. Questa capacità di consolidare i dati di monitoraggio consente ai team di determinare facilmente se la latenza o gli errori derivano dalla rete, dal codice, da un problema a livello di host o da un’altra fonte.

Casi di Utilizzo Principale per il Monitoraggio della Rete

Alcuni specifici casi d’uso per il monitoraggio della rete includono i seguenti:

  • Datacenter di Monitoraggio

    gli ingegneri di Rete possono utilizzare la rete di monitoraggio per raccogliere dati in tempo reale da loro datacenter e impostare avvisi quando un problema viene visualizzato, ad esempio un errore di periferica, temperatura spike, interruzione di corrente, o la capacità di rete problema.

  • Monitoraggio della rete cloud

    Le aziende che ospitano servizi su reti cloud possono utilizzare uno strumento di monitoraggio della rete per garantire che le dipendenze delle applicazioni stiano comunicando bene tra loro. Gli ingegneri possono anche utilizzare il monitoraggio della rete per aiutare a capire i costi della rete cloud, analizzando quanto traffico passa tra le regioni o quanto traffico viene gestito da diversi fornitori di cloud.

  • Monitoraggio della rete per applicazioni containerizzate

    I container consentono ai team di confezionare e distribuire applicazioni su più sistemi operativi. Spesso, gli ingegneri utilizzano sistemi di orchestrazione container come Kubernetes per creare applicazioni distribuite scalabili. Sia che le loro applicazioni containerizzate vengano eseguite on-prem o nel cloud, i team possono utilizzare il monitoraggio della rete per garantire che i diversi componenti dell’app comunichino correttamente tra loro.

Le aziende che abbracciano un approccio ibrido nell’ospitare i propri servizi possono utilizzare il monitoraggio della rete in ciascuno di questi modi. In un approccio ibrido, alcuni carichi di lavoro dipendono da datacenter gestiti internamente, mentre altri sono esternalizzati al cloud. In questo caso, uno strumento di monitoraggio della rete può essere utilizzato per ottenere una visione unificata delle metriche di rete on-premise e cloud, nonché lo stato dei dati che scorrono tra entrambi gli ambienti. È comune utilizzare un approccio ibrido quando un’organizzazione è in fase di migrazione al cloud.

I team utilizzano il monitoraggio della rete per raccogliere dati dalle risorse on-premise e cloud.
I team utilizzano il monitoraggio della rete per raccogliere dati da risorse on-premise e cloud.

Sfide del monitoraggio della rete

Le reti moderne sono incredibilmente grandi e complesse, trasmettendo milioni di pacchetti ogni secondo. Per risolvere i problemi di una rete, gli ingegneri utilizzano tradizionalmente i registri di flusso per esaminare il traffico tra due indirizzi IP, accedere manualmente ai server tramite Secure Shell Access (SSH) o accedere in remoto alle apparecchiature di rete per eseguire la diagnostica. Nessuno di questi processi funziona bene su larga scala, fornisce euristiche di integrità della rete limitate e mancano di dati contestuali da applicazioni e infrastrutture che potrebbero far luce sulla causa principale di potenziali problemi di rete.

Gli ingegneri affrontano anche sfide nel monitoraggio della rete quando le aziende passano al cloud. La complessità della rete aumenta perché i carichi di lavoro cloud e la loro infrastruttura sottostante sono di natura dinamica ed effimera. Le istanze cloud di breve durata possono apparire e scomparire in base ai cambiamenti nella domanda degli utenti. Mentre queste istanze cloud girano su e giù, anche i loro indirizzi IP cambiano, rendendo difficile tracciare le connessioni di rete utilizzando solo i dati di connessione IP-to-IP. Molti strumenti di monitoraggio non consentono di monitorare le connessioni di rete tra entità significative come servizi o pod. Inoltre, poiché il provider cloud effettua il provisioning dell’infrastruttura di rete, i problemi di rete sono spesso fuori dal controllo del cliente, costringendo i carichi di lavoro a spostarsi in un’area di disponibilità o in un’area diversa per evitare problemi fino a quando non vengono risolti.

Strumenti di monitoraggio della rete

Le soluzioni basate su Software-as-a-service (SaaS), come Datadog, abbattono i silos tra i team di progettazione e apportano un approccio olistico al monitoraggio della rete. I prodotti di monitoraggio della rete di Datadog unificano i dati di rete con i dati di infrastruttura, applicazione e esperienza utente in un unico pannello di vetro.

Network Device Monitoring (NDM) individua automaticamente i dispositivi di un’ampia gamma di fornitori e consente di eseguire il drill-down per monitorare lo stato dei singoli dispositivi. Puoi anche monitorare in modo proattivo lo stato del dispositivo con i monitor di rilevamento delle anomalie per l’utilizzo della larghezza di banda e altre metriche.

Network Performance Monitoring (NPM) fornisce visibilità sul resto dello stack di rete e analizza il traffico in tempo reale mentre scorre attraverso l’ambiente. I team possono monitorare la comunicazione tra servizi, host, pod Kubernetes e qualsiasi altro endpoint significativo, non solo i dati di connessione IP. Inoltre, associando le metriche di rete ad altre metriche e dati di telemetria, i team dispongono di un contesto ricco per identificare e risolvere qualsiasi problema di prestazioni in qualsiasi punto del proprio stack.

Datadog fornisce il monitoraggio end-to-end della rete in ambienti cloud, on-premise e ibridi.
Datadog fornisce il monitoraggio end-to-end della rete in ambienti cloud, on-premise e ibridi.

Per ulteriori approfondimenti dal punto di vista degli utenti finali, è possibile utilizzare Datadog Synthetic Monitoring. I test sintetici consentono di determinare il rendimento delle API e delle pagine Web a vari livelli di rete (DNS, HTTP, ICMP, SSL, TCP). Datadog avvisa l’utente di un comportamento difettoso, ad esempio un tempo di risposta elevato, un codice di stato imprevisto o una funzionalità non funzionante.

Lascia un commento

Il tuo indirizzo email non sarà pubblicato.