태그 보관물: error-handling

error-handling

syslog에“mce : [하드웨어 오류] : 컴퓨터 검사 이벤트가 기록되었습니다 “가 나타납니다. 어떻게해야합니까? 알림을 많이 받고 있습니다. OSSEC HIDS Notification. 2015

최신 버전의 OSSEC (2.8.1) 을 설치했으며 전자 메일 알림도 활성화했습니다. 그리고 나는 하드웨어 오류와 mce에 관한 무언가가 있다고 말하는 이런 종류의 알림을 많이 받고 있습니다.

OSSEC HIDS Notification.
2015 Apr 04 20:09:22

Received From: Bath-Towel->/var/log/syslog
Rule: 1002 fired (level 2) -> "Unknown problem somewhere in the system."
Portion of the log(s):

Apr  4 20:09:21 Bath-Towel kernel: [ 1873.680872] mce: [Hardware Error]: Machine check events logged



 --END OF NOTIFICATION

이것이 정확히 무엇을 의미합니까? MCE는 무엇을 의미합니까? 그리고이 명백한 하드웨어 오류는 내가 걱정해야 할 것이 있습니까?


OS 정보 :

Description:    Ubuntu 14.10
Release:    14.10


답변

기계 점검 예외 :

기계 체크 예외 (MCE)는 컴퓨터의 중앙 처리 장치가 하드웨어 문제를 감지 할 때 발생 컴퓨터 하드웨어 오류의 유형입니다.

컴퓨터에 하드웨어 오류가 발생했으며 커널이 이벤트를 버퍼에 기록했습니다. mcelog기계 점검 이벤트를 기록하고 보는 데 사용할 수 있습니다 . 에서 mcelog :

X86 CPU는 CPU에서 머신 체크 이벤트 (MCE)로 감지 된 오류를보고합니다. CPU 캐시, 내장 메모리 컨트롤러에 의해 주 메모리, 전면 버스 또는 CPU 상호 연결의 데이터 전송 오류 또는 기타 내부 오류에서 데이터 손상이 감지 될 수 있습니다. 가능한 원인은 우주 방사선, 불안정한 전원 공급 장치, 냉각 문제, 하드웨어 고장, 시스템 실행 사양 미달 또는 불운 일 수 있습니다.

대부분의 오류는 내부 오류 수정 메커니즘을 통해 CPU에서 수정할 수 있습니다. 수정되지 않은 오류로 인해 시스템 검사 예외가 발생하여 프로세스가 종료되거나 시스템 패닉이 발생할 수 있습니다. 적은 수의 수정 된 오류는 일반적으로 걱정할만한 원인이 아니지만 많은 수는 향후 실패를 나타낼 수 있습니다.

수정되거나 복구 된 오류가 발생하면 x86 커널은 MCE를 설명하는 레코드를 / dev / mcelog 장치를 통해 사용 가능한 내부 링 버퍼에 기록합니다. mcelog는 / dev / mcelog에서 오류를 검색하여 사람이 읽을 수있는 형식으로 디코딩하여 표준 출력 또는 선택적으로 시스템 로그에 인쇄합니다.

충돌이 발견되지 않으면 오류가 성공적으로 수정 된 것입니다. 여전히 mcelog이러한 이벤트를 추적 하려면 설치 하는 것이 좋습니다.

sudo apt-get install mcelog

이벤트가에 기록됩니다 /var/log/mcelog. 다음을 실행할 수도 있습니다.

sudo mcelog --client

mcelog데몬에 오류가 있는지 쿼리합니다 .


답변