태그 보관물: regression

regression

회귀 분석과 분산 분석의 차이점은 무엇입니까?

회귀 분석과 분산 분석에 대해 지금 배우고 있습니다.

회귀 분석에서는 하나의 변수가 고정되어 있으며 변수가 다른 변수와 어떻게 진행되는지 알고 싶습니다.

분산 분석에서 예를 들어 :이 특정 동물성 식품이 동물의 무게에 영향을 미치는 경우 … 하나의 고정 변수와 다른 변수에 미치는 영향 …

옳고 그름입니까, pls 도와주세요 …



답변

데이터 세트가 세트로 구성되어 가정 에 대한 = 1 , , n은 당신이의 의존성보고 싶지 YX .

(xi,yi)

i=1,…,n

y

x

사용자가 값을 찾을 가정 αβαβ 그 제곱의 합을 최소화 잔류
N Σ를= 1 ( Y I( α + β X I ) ) 2 .
그럼 당신은

α^

β^

α

β

∑i=1n(yi−(α+βxi))2.

예상되는y를어떤을위한 – 값이 (반드시 이미 관찰되지)X– 값. 그것은 선형 회귀입니다.

y^=α^+β^x

y

x

이제 총 제곱합을 분해하는 것을 고려하십시오

N1 개자유도, “설명”및 “불명”부분으로 :
N Σ= 1 ( ( α + β X I ) ˉ Y ) 2 설명+ N Σ= 1 ( Y I( α + β X I ) ) 2 불명.
1

∑i=1n(yi−y¯)2where y¯=y1+⋯+ynn

n−1

∑i=1n((α^+β^xi)−y¯)2⏟explained + ∑i=1n(yi−(α^+β^xi))2⏟unexplained.

1

. 각각 자유도의 분산 분석, 하나는 F-통계 같은 것을 간주하는
F를

n−2

F- 통계량은 귀무 가설β=0을검정합니다.

F=∑i=1n((α^+β^xi)−y¯)2/1∑i=1n(yi−(α^+β^xi))2/(n−2).


β=0

예측 변수가 범주 형일 때 종종 “분산 분석”이라는 용어를 만나므로 모형 적합합니다.

y=α+βi

i

k

k−1

n−k

몇 가지 추가 사항 :

  • 일부 수학자들에게 위의 설명은 전체 분야가 위에서 본 것만으로 보이게 할 수 있으므로 회귀 분석과 분산 분석이 활발한 연구 분야라는 것이 신비 로울 수 있습니다. 여기에 게시하기에 적합한 답변에 맞지 않는 것이 많이 있습니다.

  • y=α+βx


답변

주요 차이점은 반응 변수입니다. 로지스틱 회귀 분석은 선형 회귀 분석 및 비선형 회귀 분석에서 이항 반응을 다루지 만 반응 변수는 연속적입니다. 연속 반응 변수와 기능적 관계가있는 변수 (일명 공변량)가 있습니다. 분산 분석에서 반응은 연속적이지만 몇 가지 다른 범주 (예 : 처리 그룹 및 제어 그룹)에 속합니다. 분산 분석에서 그룹 간 평균 반응의 차이를 찾습니다. 선형 회귀 분석에서는 공변량이 변함에 따라 반응이 어떻게 변하는 지 살펴 봅니다. 차이를 보는 또 다른 방법은 회귀 분석에서 공변량은 연속적이지만 분산 분석에서는 불연속 그룹이라는 것입니다.


답변

분산 분석 (ANOVA)은 구조로 간주되는 관측치를 분석하는 통계적 방법의 본문입니다.

와이나는=β1엑스나는1+β2엑스나는2+⋯+β피엑스나는피+이자형나는, 나는=1(1)엔

의 선형 조합으로 구성됩니다.

알 수없는 수량

β1,β2,…,β피

더하기 오류

이자형1,이자형2,…,이자형엔

그리고 {

엑스나는j

}는 rv의 {

이자형나는

}는 서로 관련이 없으며 동일한 평균을 가짐

0

그리고 분산

σ2

(알 수 없는).

이자형(와이엔×1)=엑스β,디(와이)=σ2나는엔


여기서 D 는 분산 행렬 또는 분산 공분산 행렬입니다.

, 여기서 계수 {

엑스나는j

}는 효과의 유무를 나타내는 카운터 변수 또는 지표 변수 의 값입니다.

βj

} 관찰 조건에서 : {

엑스나는j

} 횟수입니다

βj

i 번째 관찰 에서 발생하며 일반적으로

0

또는

1

. 일반적으로 분산 분석에서 모든 요소는 정 성적으로 처리됩니다.

{

엑스나는j

}는 카운터 변수가 아니라 다음과 같은 연속 변수에 의해 관측 값에서 얻은 값입니다.

= time,

= 온도,

티2,이자형−티

등, 우리는 회귀 분석의 경우가 있습니다. 일반적으로, 회귀 분석에서 모든 요소는 정량적이며 정량적으로 처리됩니다.

주로이 두 종류는 분석의 두 종류입니다 .


답변

회귀 분석에서는 하나의 변수가 고정되어 있으며 변수가 다른 변수와 어떻게 진행되는지 알고 싶습니다.

분산 분석에서 예를 들어 :이 특정 동물성 식품이 동물의 체중에 영향을 미치는 경우 … 하나의 고정 변수와 다른 변수에 대한 영향.


답변