RAID는 언제 문제의 가치가 있습니까? RAID 컨트롤러로 인해 간접 적으로 스택 오버플로

우리 가게에서는 모든 워크 스테이션에서 RAID를 충실히 사용하고 있습니다. 아마도 그것이 완료되어야하는 방식 인 것 같습니다. 온보드 RAID 칩을 사용하여 과학 시뮬레이션을위한 워크 스테이션에 대해 이야기하고 있습니다.

그러나 많은 RAID 공포 이야기를 들었습니다. RAID 컨트롤러로 인해 간접 적으로 스택 오버플로 자체가 중단되었습니다 .

RAID는 매우 좁은 유형의 장애 (물리적 디스크 장애)로부터 사용자를 보호하지만 동시에 추가 장애 지점이 발생합니다. RAID 컨트롤러에 문제가있을 수 있으며 종종 있습니다. 우리 가게에서는 최소한 RAID 컨트롤러가 디스크만큼 자주 실패하는 것 같습니다. 결함이있는 드라이브를 교체하는 과정으로 쉽게 엉망이 될 수 있습니다.

RAID는 언제 문제의 가치가 있습니까? 백업 솔루션에 중복성을 추가하여 더 나은 투자 수익을 얻지 않습니까? 이와 관련하여 어떤 유형의 RAID가 더 좋거나 나쁩니 까?

편집 : 제목을 원래 “RAID가 문제가 있습니까?”에서 변경 했으므로 음이 덜 들립니다.



답변

걱정하지 마십시오. 그룹 생각 때문에 비즈니스 세계에서 RAID가 사용되지 않습니다! 적절한 RAID 컨트롤러 고장 가능성은 디스크 고장 가능성보다 훨씬 낮습니다. 사무실과 데이터 센터 모두에서 많은 디스크 다이를 보았지만 실제로는 RAID 컨트롤러가 고장난 것을 본 적이 없습니다.

추신 : 태그가 보입니다. RAID는 백업이 아닙니다! 🙂


답변

SUN의 ZFS (OpenSolaris의 일부; Apples OSX-현재 읽기 전용)는 다양한 수준으로 공격 할뿐만 아니라 디스크에 기록 된 데이터가 실제로 있는지 확인합니다. 일관성 이 핵심입니다! 무결성에 의존 할 수 없다면 RAID는 쓸모가 없습니다 . 알맞은 RAID 컨트롤러를 선택하고 (HP를 선호합니다) 주기적으로 오류를 찾기 위해 RAID를 문지릅니다.

반면에 Softwareraid (ZFS)는 RAID 컨트롤러가 죽어 정확한 교체를 할 수없는 경우 더 많은 하드웨어 독립성을 요구합니다.


답변

항상. 디스크는 저렴하지만 정보는 그렇지 않습니다. 그러나 소프트웨어 RAID를 사용하면 차후에 하드웨어를 변경하거나 하드웨어를 변경할 수 있습니다 (신뢰할 수 있습니다). 또한 ZFS와 같은 체크섬 파일 시스템을 사용하여 자동 데이터 손상 (오늘날 디스크가 큰 경우)으로부터 보호합니다.


답변

컨트롤러에 오류가 발생하고 나사를 완전히 교체 할 수 없다면 잘못된 방법으로 하드웨어 RAID를 사용하지 않는다고 말하는 사람들에게.

  1. 가동 시간이 중요한 경우 저렴한 하드웨어를 구매해서는 안됩니다. 이전에 말했듯이, 좋은 RAID 컨트롤러, HP, LSI, Dell 등을 사용하십시오.

  2. 컨트롤러를 컴퓨터 제조업체, 즉 Dell RAID 컨트롤러가 장착 된 Dell 서버에서 구입 한 경우, Dell은 일반적으로 해당 서버의 EOL에서 4 년이 지나서 부품을 얼마나 오래 보관할 것인지 알려줍니다.

  3. 누군가 빨리 재가동하는 것이 배달을 기다릴 수 없다는 것을 의미한다면, 누가 그것을 만들 었는지에 상관없이 보조 예비 컨트롤러를 구입해야합니다.

  4. RAID 1로 설정 한 경우 해당 드라이브 중 하나를 가져와 일반 컨트롤러에 놓아 데이터를 복구 할 수 있습니다. 이것이 중요한 경우, 치명적인 상황에 처하기 전에 컨트롤러에서이를 확인 / 테스트하십시오.

하드웨어 RAID가 엉덩이 2 배를 절약했습니다. 이메일 서버에서 드라이브 중 하나가 고장 나면 해당 시스템의 raid 모니터링 소프트웨어에서 dell을 호출하고 다음 날 새 드라이브를 가져 와서 전자 메일 알림을 수신하여 자체적으로 재구성합니다. 그 중 하나의 ZERO 다운 타임

두 번째는 오래된 파일 서버에서 6 개월 안에 교체가 예정된 드라이브에 오류가 발생했습니다. 컨트롤러는 컨트롤러를 계속 작동 시켰고 서버 교체를 그 주까지 옮겼습니다. 새 드라이브 구매 (보증 기간이 지났으므로)와 ZERO 가동 중지 시간을 다시 절약했습니다.

나는 이전에 소프트웨어 공격을 사용해 왔으며 하드웨어 기반의 공격만큼 훌륭하게 복구하지 못합니다. 설정, 소프트웨어 또는 하드웨어가 제대로 작동하는지 확인하고 갈색 물체가 팬에 닿을 때 수행 할 작업을 알아야합니다.


답변

하드 드라이브 오류는 데스크탑 워크 스테이션보다 서버에서 발생할 가능성이 훨씬 높습니다 …

실패 가능성을 고려하지 않고 “실패 지점 추가”라고 말할 수는 없습니다. 특히 이러한 오류 가능성이 적은 지점은 특히 하드 디스크 드라이브 충돌 가능성을 크게 낮추기위한 것입니다. 당신이 넣어, 당신은 기본적으로 파스칼의 Wager 와 같은 오류를 .

데스크탑 마더 보드의 대부분의 RAID 시스템은 소프트웨어 드라이버에서 대부분의 작업을 수행하는 저렴한 소프트웨어 / 하드웨어 하이브리드입니다. IMHO 그들은 파워 유저에게 판매하는 데 사용되는 쓰레기 조각입니다.

반면에, 실제 실제 하드웨어 RAID는 매우 안정적이며 운영 체제 없이도 할 수있는 하드웨어가 있습니다. 그러나 실제 하드웨어에는 일반적으로 배터리 백업과 체크섬 등을 계산하기위한 완전한 XOR 배열이 있기 때문에 비용이 많이 듭니다. SCSI를 사용하면 훨씬 비쌉니다.

요약 : 마더 보드 기반 RAID 시스템을 실행하는 경우에는 문제가되지 않습니다.


답변

백업과 RAID는 서로 다른 문제에 대한 해결책이지만 대부분의 “RAID 문제”는 가장 일반적인 백업 문제 (예 : 아무도 복원을 테스트하지 않음)와 매우 유사합니다. 아무도 시스템 복구를 테스트하지 않습니다. 다른 RAID 문제는 사람들이 자신이하는 일과하지 않는 일을 이해하지 못하는 직접적인 결과입니다. 예를 들어, 많은 사람들은 RAID가 데이터의 무결성을 보장한다고 생각하지만 그렇지 않습니다.

워크 스테이션의 경우 RAID 바인딩을 사용하여 IO 바운드 응용 프로그램의 성능을 향상 시키거나 RAID-1 / 5 / 6을 사용하여 80 달러짜리 하드 디스크에 장애가 발생했을 때 과학자가 시간당 $ 100를 유지하도록하는 경우 RAID를 적절하게 사용하는 것입니다. 디스크 중복성백업을 혼동하지 말고 IT 담당자가 복구를 처리 할 수 ​​있도록 절차를 테스트했습니다.


답변

RAID에는 두 가지 유형이 있습니다

  • 저렴한 통합 제품. 이것은 실제 작업이 소프트웨어에 의해 수행되는 실제 습격이 아닙니다 (특별한 드라이버는 레이드 계산을 수행합니다). 이것을 피해야합니다.
  • 다른 하나는 비싸지 만 실제로 얻는 것은 습격입니다. 당신이 이것을 감당할 수 있다면 그것은 돈의 가치가 있습니다.

일부 운영 체제에는 소프트웨어 급습 솔루션이 우수합니다 (위에서 언급 한 크 래피 카드와 관련이 없음). 리눅스 소프트웨어 습격은 특히 좋으며 성능은 정말 좋습니다.

Raid는 백업 솔루션이 아닌 안정성 만 향상시킬 수 있습니다. 실수로 파일을 삭제하거나 결함이있는 디스크가 RAID 배열의 다른 디스크에 불량 데이터를 반환 (및 복제) 할 수 있으므로 실제 백업 솔루션이 여전히 필요했습니다.