네트워크 모니터링이란 무엇인가?
네트워크 모니터링은 하드웨어 및 소프트웨어 계층에서 네트워크의 상태를 추적합니다. 엔지니어는 네트워크 모니터링을 사용하여 네트워크 중단 및 오류를 방지하고 문제를 해결합니다. 이 문서에서는 네트워크 모니터링의 작동 방식,주요 사용 사례,효과적인 네트워크 모니터링과 관련된 일반적인 문제 및 네트워크 모니터링 도구에서 찾아야 할 주요 기능에 대해 설명합니다.
네트워크 모니터링은 어떻게 작동합니까?
네트워크는 두 컴퓨터 또는 응용 프로그램 사이를 포함하여 두 시스템 간의 정보 전송을 가능하게합니다. 개방형 시스템 상호 연결 모델은 컴퓨터 시스템이 데이터를 보내고 받기 위해 의존하는 여러 기능을 분해합니다. 데이터를 네트워크를 통해 전송하려면 물리적 계층에서 시작하여 응용 프로그램 계층에서 끝나는 서로 다른 프로토콜을 사용하여 각 구성 요소를 통과합니다. 네트워크 모니터링은 네트워크를 구성하는 다양한 구성 요소에 대한 가시성을 제공하여 엔지니어가 발생하는 모든 계층에서 네트워크 문제를 해결할 수 있도록 보장합니다.
네트워크 하드웨어 모니터링
온프레미스 워크로드를 실행하거나 데이터 센터를 관리하는 회사는 네트워크 트래픽이 이동하는 물리적 하드웨어가 정상 및 작동 상태인지 확인해야 합니다. 이 계층은 데이터 링크,데이터 링크 및 네트워크 계층을 포함합니다. 이 장치 중심의 모니터링 방식에서 회사는 케이블 링과 같은 데이터 전송 구성 요소와 라우터,스위치 및 방화벽과 같은 네트워크 장치를 모니터링합니다. 네트워크 장치에는 다른 장치와 연결하는 여러 인터페이스가 있을 수 있으며 모든 인터페이스에서 네트워크 오류가 발생할 수 있습니다.
네트워크 하드웨어 모니터링 방법
대부분의 네트워크 장치는 간단한 네트워크 관리 프로토콜을 지원합니다. 인바운드 및 아웃바운드 네트워크 트래픽과 온프레미스 장비의 상태 및 성능을 보장하는 데 중요한 기타 중요한 네트워크 원격 분석을 모니터링할 수 있습니다.
인터넷 프로토콜은 장치의 주소 및 라우팅 시스템을 제공하기 위해 거의 모든 네트워크에서 사용되는 표준입니다. 이 프로토콜을 사용하면 공용 인터넷을 포함한 대규모 네트워크를 통해 정보를 올바른 대상으로 라우팅 할 수 있습니다.
네트워크 엔지니어와 관리자는 일반적으로 네트워크 모니터링 도구를 사용하여 네트워크 장치에서 다음과 같은 유형의 메트릭을 수집합니다:
-
가동 시간
네트워크 장치가 데이터를 성공적으로 보내고 받는 시간입니다.
-
네트워크 장치가 입력 처리,데이터 저장 및 출력 생성을 위해 계산 용량을 사용한 범위입니다.
-
대역폭 사용량
특정 네트워크 인터페이스에서 현재 보내거나 받고 있는 데이터(바이트)양입니다. 엔지니어는 전송되는 트래픽 양과 사용 중인 총 대역폭의 비율을 모두 추적합니다.
-
처리량
특정 기간 동안 장치의 인터페이스를 통과하는 트래픽 속도(초당 바이트)입니다. 엔지니어는 일반적으로 단일 인터페이스의 처리량과 단일 장치에 있는 모든 인터페이스의 처리량 합계를 추적합니다.
-
인터페이스 오류/삭제
네트워크 인터페이스가 데이터 패킷을 삭제하게 하는 수신 장치의 오류입니다. 인터페이스 오류 및 폐기는 구성 오류,대역폭 문제 또는 기타 이유로 인해 발생할 수 있습니다.
-
시간 지연 및 홉 수와 같은 아이피 메트릭은 디바이스 간의 연결 속도와 효율성을 측정할 수 있다.
클라우드 환경에서 회사는 서비스 또는 응용 프로그램을 실행할 물리적 인프라를 유지 관리하는 클라우드 공급업체로부터 컴퓨팅 및 네트워크 리소스를 구매합니다. 따라서 클라우드 호스팅은 물리적 하드웨어를 관리하는 책임을 클라우드 벤더로 전환시킵니다.
실시간 네트워크 트래픽 모니터링
네트워크의 하드웨어 계층 위에 데이터가 네트워크를 통해 전송될 때마다 네트워크 스택의 소프트웨어 계층도 관련됩니다. 이 계층에는 주로 전송 및 응용 프로그램 계층(레이어 4 및 레이어 7)이 포함됩니다. 이러한 계층을 모니터링하면 팀이 네트워크를 통해 통신할 때 서비스,응용 프로그램 및 기본 네트워크 종속성의 상태를 추적하는 데 도움이 됩니다. 다음 네트워크 프로토콜은 대부분의 네트워크 통신을 위한 기반이기 때문에 모니터링하는 데 특히 중요합니다:
응용 계층(계층 7)
-
클라이언트(일반적으로 웹 브라우저)가 웹 서버와 통신하는 데 사용하는 프로토콜입니다. 기본
메트릭에는 요청 볼륨,오류 및 대기 시간이 포함됩니다. 이 버전은 더 많은 기능과 더 나은 성능을 도입합니다. -
도메인 이름 시스템
컴퓨터 이름을 변환하는 프로토콜(예:””)server1.example.com”)다양한 이름 서버의 사용을 통해. 이 지표에는 요청 볼륨,오류,응답 시간 및 시간 초과가 포함됩니다.
전송 레이어(레이어 4)
-
패킷을 올바른 순서로 시퀀싱하고 대상 주소에 패킷을 전달하는 프로토콜입니다. 전송된 패킷,전송 속도,대기 시간,재전송 및 지터를 포함할 수 있습니다.
-
사용자 데이터그램 프로토콜(9077>
)은 데이터를 전송하기 위한 또 다른 프로토콜이다. 빠른 전송 속도를 제공하지만 보장 된 전달 또는 패킷 시퀀싱과 같은 고급 기능은 없습니다.
실시간 네트워크 트래픽을 모니터링하는 방법
네트워크 모니터링 애플리케이션은 이러한 통신 프로토콜을 모니터링하는 다양한 방법에 의존할 수 있다. 네트워크 데이터 패킷이 사용자 환경의 종속성 간에 흐를 때 이를 추적하고 데이터를 사람이 읽을 수 있는 형식으로 변환합니다.
네트워크 모니터링 대 네트워크 관리
네트워크 모니터링은 하드웨어 및 소프트웨어 계층에서 네트워크의 상태를 추적합니다. 엔지니어는 네트워크 모니터링을 사용하여 네트워크 중단 및 오류를 방지하고 문제를 해결합니다. 이 문서에서는 네트워크 모니터링의 작동 방식,주요 사용 사례,효과적인 네트워크 모니터링과 관련된 일반적인 문제 및 네트워크 모니터링 도구에서 찾아야 할 주요 기능에 대해 설명합니다.
온프레미스&클라우드 네트워크에 대한 엔드 투 엔드 가시성
네트워크 모니터링의 이점
네트워크 장애는 주요 비즈니스 중단을 유발할 수 있으며,복잡한 분산 네트워크에서는 문제를 이해하고 해결하기 위해 완벽한 가시성을 확보하는 것이 중요합니다. 예를 들어 한 지역 또는 가용 영역의 연결 문제로 인해 지역 간 쿼리가 삭제되는 경우 전체 서비스에 광범위한 영향을 미칠 수 있습니다.
네트워크 장치 모니터링의 일반적인 이점 중 하나는 비즈니스에 영향을 미치는 중단을 방지하거나 최소화하는 데 도움이 된다는 것입니다. 네트워크 모니터링 도구는 정기적으로 장치에서 정보를 수집하여 예상대로 사용할 수 있고 성능을 발휘할 수 있도록 할 수 있으며 그렇지 않은 경우 경고할 수 있습니다. 특정 인터페이스에서 높은 포화도와 같은 문제가 장치에서 발생하는 경우 네트워크 엔지니어는 중단 또는 사용자가 직면하는 영향을 방지하기 위해 신속하게 작동 할 수 있습니다. 예를 들어 모니터링 결과 하나의 호스트가 요청 볼륨을 처리하기에 충분하지 않은 경우 팀은 부하 분산을 구현하여 여러 서버에 트래픽을 분산할 수 있습니다.
네트워크 모니터링의 또 다른 이점은 기업이 애플리케이션 성능을 개선하는 데 도움이 될 수 있다는 것입니다. 예를 들어 네트워크 패킷 손실은 사용자 대면 응용 프로그램 대기 시간으로 나타날 수 있습니다. 네트워크 모니터링을 통해 엔지니어는 패킷 손실이 발생하는 위치를 정확히 파악하고 문제를 해결할 수 있습니다. 또한 네트워크 데이터를 모니터링하면 비효율적인 지역 간 트래픽 패턴을 파악하여 네트워크 관련 트래픽 비용을 절감할 수 있습니다. 마지막으로 엔지니어는 네트워크 모니터링을 사용하여 애플리케이션이 서버에 도달할 수 있는지 확인할 수 있습니다.
최신 모니터링 도구는 네트워크 데이터를 인프라 메트릭,애플리케이션 메트릭 및 기타 메트릭과 통합하여 조직의 모든 엔지니어가 문제를 진단하고 해결할 때 동일한 정보에 액세스할 수 있도록 합니다. 모니터링 데이터를 통합하는 이러한 기능을 통해 팀은 네트워크,코드,호스트 수준 문제 또는 다른 소스에서 대기 시간 또는 오류가 발생하는지 여부를 쉽게 확인할 수 있습니다.
네트워크 모니터링을 위한 기본 사용 사례
네트워크 모니터링을 위한 일부 특정 사용 사례에는 다음이 포함됩니다:
-
데이터 센터 모니터링
네트워크 엔지니어는 네트워크 모니터링을 사용하여 데이터 센터에서 실시간 데이터를 수집하고 장치 오류,온도 급증,정전 또는 네트워크 용량 문제와 같은 문제가 나타날 때 경고를 설정할 수 있습니다.
-
클라우드 네트워크 모니터링
클라우드 네트워크에서 서비스를 호스팅하는 회사는 네트워크 모니터링 도구를 사용하여 응용 프로그램 종속성이 서로 잘 통신하는지 확인할 수 있습니다. 또한 엔지니어는 네트워크 모니터링을 사용하여 지역 간에 얼마나 많은 트래픽이 전달되는지 또는 여러 클라우드 공급자가 얼마나 많은 트래픽을 처리하는지 분석하여 클라우드 네트워크 비용을 이해할 수 있습니다.
-
컨테이너화된 애플리케이션에 대한 네트워크 모니터링
컨테이너를 통해 팀은 여러 운영 체제에서 애플리케이션을 패키지화하고 제공할 수 있습니다. 종종 엔지니어들은 쿠버네티스와 같은 컨테이너 오케스트레이션 시스템을 사용하여 확장 가능한 분산 애플리케이션을 구축합니다. 컨테이너화된 애플리케이션이 온프레미스 또는 클라우드에서 실행되는지 여부에 관계없이 팀은 네트워크 모니터링을 사용하여 앱의 여러 구성 요소가 서로 제대로 통신하고 있는지 확인할 수 있습니다.
서비스 호스팅에 하이브리드 접근 방식을 수용하는 회사는 이러한 각 방법으로 네트워크 모니터링을 사용할 수 있습니다. 하이브리드 방식에서는 일부 워크로드가 내부적으로 관리되는 데이터 센터에 의존하는 반면 다른 워크로드는 클라우드로 아웃소싱됩니다. 이 경우 네트워크 모니터링 도구를 사용하여 온프레미스 및 클라우드 네트워크 메트릭에 대한 통합 뷰와 두 환경 간에 흐르는 데이터의 상태를 확인할 수 있습니다. 조직이 클라우드로 마이그레이션하는 과정에서 하이브리드 방식을 사용하는 것이 일반적입니다.
네트워크 모니터링의 과제
최신 네트워크는 엄청나게 크고 복잡하여 초당 수백만 개의 패킷을 전송합니다. 네트워크 문제를 해결하기 위해 엔지니어는 일반적으로 흐름 로그를 사용하여 두 주소 간의 트래픽을 조사하거나 보안 셸 액세스를 통해 서버에 수동으로 로그인하거나 네트워크 장비에 원격으로 액세스하여 진단을 실행합니다. 이러한 프로세스 중 어느 것도 규모에서 잘 작동하지 않으며 제한된 네트워크 상태 휴리스틱을 제공하며 잠재적 인 네트워크 문제의 근본 원인을 밝힐 수있는 응용 프로그램 및 인프라의 상황 별 데이터가 부족합니다.
엔지니어들은 기업이 클라우드로 이동할 때 네트워크 모니터링에 어려움을 겪고 있습니다. 클라우드 워크로드와 그 기본 인프라가 역동적이고 임시적이기 때문에 네트워크 복잡성이 증가합니다. 수명이 짧은 클라우드 인스턴스는 사용자 요구의 변화에 따라 나타나고 사라질 수 있습니다. 이러한 클라우드 인스턴스가 위아래로 회전함에 따라 아이피 주소도 변경되므로 아이피 대 아이피 연결 데이터만 사용하여 네트워크 연결을 추적하기가 어렵습니다. 많은 모니터링 도구를 사용하면 서비스 또는 파드와 같은 의미있는 엔터티 간의 네트워크 연결을 모니터링 할 수 없습니다. 또한 클라우드 공급자가 네트워크 인프라를 프로비저닝하기 때문에 네트워크 문제는 종종 클라이언트의 제어에서 벗어나 문제를 해결할 때까지 문제를 피하기 위해 다른 가용 영역 또는 지역으로 워크로드를 이동해야 합니다.데이터독과 같은 서비스로서의 소프트웨어 기반 솔루션은 엔지니어링 팀 간의 사일로를 분해하고 네트워크 모니터링에 대한 전체적인 접근 방식을 제공합니다. 데이터독의 네트워크 모니터링 제품은 네트워크 데이터를 인프라,애플리케이션 및 사용자 경험 데이터와 단일 창에 통합합니다.
네트워크 장치 모니터링 광범위한 공급업체의 장치를 자동 검색하고 드릴다운하여 개별 장치의 상태를 모니터링할 수 있습니다. 대역폭 사용률 및 기타 메트릭에 대한 이상 탐지 모니터를 사용하여 장치 상태를 사전에 모니터링할 수도 있습니다.
네트워크 성능 모니터링은 네트워크 스택의 나머지 부분에 대한 가시성을 제공하고 사용자 환경에서 트래픽이 흐를 때 실시간으로 트래픽을 분석합니다. 팀은 서비스,호스트,쿠버네티스 포드 및 기타 의미 있는 엔드포인트 간의 통신을 모니터링할 수 있습니다. 또한 네트워크 메트릭을 다른 메트릭 및 원격 분석 데이터와 함께 연결함으로써 팀은 스택의 어느 곳에서나 성능 문제를 식별하고 해결할 수있는 풍부한 컨텍스트를 갖추고 있습니다.
최종 사용자의 관점에서 추가 통찰력을 위해,당신은 데이터 독 합성 모니터링을 사용할 수 있습니다. 이 테스트를 통해 다양한 네트워크 수준에서 웹 페이지의 성능을 확인할 수 있습니다. 데이터 독은 높은 응답 시간,예기치 않은 상태 코드 또는 깨진 기능과 같은 잘못된 동작을 알려줍니다.