내결함성이란 특정 구성 요소에 오류가 발생하거나 오작동하는 경우에도 시스템이 정상적인 작동을 유지하는 능력을 말합니다. 이 기능은 고가용성, 미션 크리티컬, 심지어 생명에 중요한 시스템에 필수적입니다. 내결함성은 특히 오류 발생 시 성능 저하나 가동 중지 시간이 발생하지 않는 시스템을 의미합니다. 오류가 발생하면 최종 사용자는 어떤 문제도 인식하지 못합니다. 이와 대조적으로, 오류가 발생했지만 여전히 서비스가 실행 중인 시스템을 "복원력 있는 시스템"이라고 합니다. 이러한 시스템은 오류 발생에 적응하고 서비스를 유지할 수 있지만 특정 성능 영향을 나타냅니다.
내결함성은 하드웨어나 소프트웨어 문제가 발생하더라도 전체 시스템이 계속 작동하도록 보장하는 컴퓨터 시스템을 설명하는 데 특히 사용됩니다.
컴퓨터 개발 역사상 최초의 내결함성 컴퓨터는 1951년 체코슬로바키아의 Antonín Svoboda가 만든 SAPO였습니다. 컴퓨터의 기본 설계는 권선형 자기 드럼으로 구현되었으며 삼중 모듈 중복성이라고 알려진 기술인 메모리 오류 감지를 위한 투표 방법을 사용했습니다. 시간이 지남에 따라 대부분 군사 목적으로 다른 유사한 장치가 개발되었으며 나중에 세 가지 유형의 옵션이 등장했습니다. NAASA의 우주 탐사 컴퓨터 및 위성 컴퓨터와 같이 유지 관리가 필요하지 않고 오랫동안 작동할 수 있는 컴퓨터입니다. 원자력 발전소나 초전도체 실험을 모니터링하고 제어하는 데 사용되는 컴퓨터, 보험 회사의 확률적 모니터링에 사용되는 많은 슈퍼컴퓨터와 같이 매우 안정적이지만 지속적인 모니터링이 필요한 컴퓨터입니다.
1960년대 NASA에서 수행한 소위 LLNM(장수명, 유지 관리 없음) 컴퓨터에 대한 많은 연구는 미래 우주 임무를 위한 길을 열었습니다. 이러한 컴퓨터는 오류를 자체 감지 및 복구하거나 중복 모듈을 활성화할 수 있는 JSTAR 컴퓨터와 같은 백업 메모리 어레이를 사용하여 메모리 복구 방법을 지원합니다. 이 컴퓨터는 오늘날에도 계속 작동합니다.
과거 디자인은 전문가가 결함을 발견하고 교체할 수 있는 내부 진단에 초점을 맞추는 경향이 있었습니다.
그러나 이후의 설계에서는 시스템이 자가 치유 및 진단 기능을 갖추고 오류 격리가 가능하며 오류 발생 시 중복 백업을 수행할 수 있어야 한다는 사실이 입증되었습니다. 이는 고가용성 컴퓨팅 시스템을 구현하는 데 중요합니다.
예를 들어, 일부 하드웨어 내결함성 시스템에서는 시스템이 실행되는 동안 손상된 구성 요소를 제거하고 교체해야 하는데, 이를 '핫 스와핑'이라고 합니다. 이러한 시스템에는 일반적으로 단일 허용 지점이라고 하는 단일 백업이 있으며 대부분의 오류 허용 시스템이 이 범주에 속합니다. 내결함성 기술은 컴퓨터 응용 프로그램에서 놀라운 성공을 거두었습니다.
탠덤컴퓨터는 이를 기반으로 연간 런닝타임 계산을 위한 NonStop 시스템을 구축했다.
하드웨어 외에도 프로세스 복제 및 데이터 형식의 완벽한 설계 등 컴퓨터 소프트웨어에도 내결함성이 반영되어 우아하게 저하될 수 있습니다. HTML은 일반적인 예이며, 웹 브라우저는 전체 문서의 유용성에 영향을 주지 않고 새로운 HTML 엔터티와 지원되지 않는 HTML 엔터티를 무시할 수 있습니다. 광범위한 접근성을 유지하기 위해 Deepin에서 가벼운 인터페이스를 제공하는 많은 인기 웹사이트에도 비슷한 디자인이 나타납니다.
관련 중복으로 인해 무게, 비용, 설계 시간 증가 등의 문제가 발생하므로 내결함성 설계를 구현하는 것이 항상 실용적인 옵션은 아닙니다. 따라서 설계자는 내결함성 기능이 필요한 구성 요소를 신중하게 고려해야 합니다.
각 구성요소는 실패 가능성, 심각도, 비용을 신중하게 평가해야 합니다.
예를 들어, 자동차의 라디오는 중요한 구성 요소는 아니지만 상대적으로 중요성이 낮은 반면, 탑승자 보호 시스템(예: 안전 벨트)은 사고 시 안전을 제공하는 중요한 기능 때문에 필요한 것으로 간주됩니다. 설계.
내결함성 시스템의 기본 특성에는 단일 장애 지점이 없음, 결함이 있는 구성 요소를 격리하는 기능, 일반적으로 시스템 결함의 분류 및 정의가 필요한 결함 복구의 필요성이 포함됩니다.
점점 더 복잡해지는 기술 세계에 직면하여 내결함성 설계를 통해 일상 생활의 다양한 시스템을 진정으로 보호하고 미래의 첨단 기술 생활에서 불필요한 위험을 피할 수 있습니까?