장애예측 시스템

어떻게 하면 장애를 최소화 할수 있을까요?
장애 발생시 빠른 시간안에 장애를 복구하는 것도 중요하지만, 이에 한단계 더 나아가 능동적으로 미리 장애를 예측하고,
해당 장애가 발생하지 않도록 조치한다면 안정적이고 믿을 수 있는 서비스를 제공하실수가 있습니다.
이를 위해, (주)넷팜에서는 NF-DEFCON 이라는 장애 예측/경보 시스템을 운영하고 있습니다.

서비스 특징

NF-DEFCON(이하 '장애예측/경보시스템')은 NF-RTM과의 연동을 통해, 일정 기간의 범위 내에서 수집된 시스템의 최근정보
(30여개 부문에 걸쳐 총 60,000여개의 표본 데이타)를 이용해, 시스템 각 상태의 '예상 변화값' 통계화하여 산출해 냅니다.
산출된 '예상 변화 임계값'과 현재 상태를 365매니지드만의 '장애예측알고리즘'을 이용해 비교/분석하여 [부분적]/[종합적] '경고수준(Defcon Level)'을 결정합니다.
시스템별로 용도와 부하에 따른 '변동폭'이 제각각인 고유의 특성이 반영되므로,
이는 단순히 현재의 상태만을 기반으로, 천편 일률적인 단순 임계값 방식의 모니터링 체계들에 비해 '장애에 대한 완벽한 예방조치'가 가능하도록 지원합니다.
즉, 현재 상태의 데이타에만 의존하는 단순 모니터링방식이 아닌,
해당 장비가 어떻게 운영되어 왔는지, 어떻게 변화되어 왔는지의 '운영내역(History)'을 통해,
현재 또는 앞으로의 서버의 변화 추이를 목표화(예측값)한 결과를 기반으로 하는 '장애 예측 시스템'입니다.