오류 측정을 해석하는 방법?

특정 데이터 세트에 대해 Weka에서 분류를 실행 중이며 공칭 ​​값을 예측하려고하면 출력에 정확하고 잘못 예측 된 값이 구체적으로 표시됩니다. 그러나 이제 숫자 속성으로 실행하고 출력은 다음과 같습니다.

Correlation coefficient                 0.3305
Mean absolute error                     11.6268
Root mean squared error                 46.8547
Relative absolute error                 89.2645 %
Root relative squared error             94.3886 %
Total Number of Instances               36441

이것을 어떻게 해석합니까? 나는 각 개념을 인터넷 검색을 시도했지만 통계가 내 전문 분야에 전혀 없기 때문에 많이 이해하지 못합니다. 통계 측면에서 ELI5 유형의 답변에 크게 감사드립니다.



답변

의이 같은 관심의 진정한 가치를 나타내는하자 와 같은 일부 알고리즘을 사용하여 추정 된 값 θ를 .

θ

θ^

상관 관계는 많은 방법 알려 θ가 관련이 있습니다. 그 사이 값 범 11 , 0는 전혀 관련이 없다를, 1은 매우 강한 선형 관계이고, 1 관계 선형 역수 (IE는 더 큰 값 θ는 작은 값을 나타낸다 θ 마찬가지 또는 그 참조). 아래에는 그림의 상관 관계가 나와 있습니다.

θ

θ^

−1

1

0

1

−1

θ

θ^

(출처 : http://www.mathsisfun.com/data/correlation.html )

평균 절대 오차는 다음과 같습니다.

MAE=1N∑i=1N|θ^i−θi|

루트 평균 제곱 오차가 있습니다 :

RMSE=1N∑i=1N(θ^i−θi)2

상대 절대 오차 :

RAE=∑i=1N|θ^i−θi|∑i=1N|θ¯−θi|

θ¯

θ

루트 상대 제곱 오류 :

RRSE=∑i=1N(θ^i−θi)2∑i=1N(θ¯−θi)2

θ

MAE

RMSE

MSE

θ

θ^

θ

RAE

RRSE

θ

∑(θ¯−θi)2

∑|θ¯−θi|

θ

θ

θ

슬라이드 도 확인하십시오 .