회귀 분석과 분산 분석에 대해 지금 배우고 있습니다.
회귀 분석에서는 하나의 변수가 고정되어 있으며 변수가 다른 변수와 어떻게 진행되는지 알고 싶습니다.
분산 분석에서 예를 들어 :이 특정 동물성 식품이 동물의 무게에 영향을 미치는 경우 … 하나의 고정 변수와 다른 변수에 미치는 영향 …
옳고 그름입니까, pls 도와주세요 …
답변
데이터 세트가 세트로 구성되어 가정 에 대한 전 = 1 , … , n은 당신이의 의존성보고 싶지 Y 에 X .
사용자가 값을 찾을 가정 α 와 β 의 α 및 β 그 제곱의 합을 최소화 잔류
N Σ를 난 = 1 ( Y I – ( α + β X I ) ) 2 .
그럼 당신은
예상되는y를어떤을위한 – 값이 (반드시 이미 관찰되지)X– 값. 그것은 선형 회귀입니다.
이제 총 제곱합을 분해하는 것을 고려하십시오
과N–1 개자유도, “설명”및 “불명”부분으로 :
N Σ 난 = 1 ( ( α + β X I ) – ˉ Y ) 2 ⏟ 설명+ N Σ 난 = 1 ( Y I – ( α + β X I ) ) 2 ⏟ 불명.
와1
와 . 각각 자유도의 분산 분석, 하나는 F-통계 같은 것을 간주하는
F를
이F- 통계량은 귀무 가설β=0을검정합니다.
예측 변수가 범주 형일 때 종종 “분산 분석”이라는 용어를 만나므로 모형 적합합니다.
몇 가지 추가 사항 :
답변
주요 차이점은 반응 변수입니다. 로지스틱 회귀 분석은 선형 회귀 분석 및 비선형 회귀 분석에서 이항 반응을 다루지 만 반응 변수는 연속적입니다. 연속 반응 변수와 기능적 관계가있는 변수 (일명 공변량)가 있습니다. 분산 분석에서 반응은 연속적이지만 몇 가지 다른 범주 (예 : 처리 그룹 및 제어 그룹)에 속합니다. 분산 분석에서 그룹 간 평균 반응의 차이를 찾습니다. 선형 회귀 분석에서는 공변량이 변함에 따라 반응이 어떻게 변하는 지 살펴 봅니다. 차이를 보는 또 다른 방법은 회귀 분석에서 공변량은 연속적이지만 분산 분석에서는 불연속 그룹이라는 것입니다.
답변
분산 분석 (ANOVA)은 구조로 간주되는 관측치를 분석하는 통계적 방법의 본문입니다.
의 선형 조합으로 구성됩니다.
알 수없는 수량
더하기 오류
그리고 {
}는 rv의 {
}는 서로 관련이 없으며 동일한 평균을 가짐
그리고 분산
(알 수 없는).
즉
여기서 D 는 분산 행렬 또는 분산 공분산 행렬입니다.
, 여기서 계수 {
}는 효과의 유무를 나타내는 카운터 변수 또는 지표 변수 의 값입니다.
} 관찰 조건에서 : {
} 횟수입니다
i 번째 관찰 에서 발생하며 일반적으로
또는
. 일반적으로 분산 분석에서 모든 요소는 정 성적으로 처리됩니다.
{
}는 카운터 변수가 아니라 다음과 같은 연속 변수에 의해 관측 값에서 얻은 값입니다.
= time,
= 온도,
등, 우리는 회귀 분석의 경우가 있습니다. 일반적으로, 회귀 분석에서 모든 요소는 정량적이며 정량적으로 처리됩니다.
주로이 두 종류는 분석의 두 종류입니다 .
답변
회귀 분석에서는 하나의 변수가 고정되어 있으며 변수가 다른 변수와 어떻게 진행되는지 알고 싶습니다.
분산 분석에서 예를 들어 :이 특정 동물성 식품이 동물의 체중에 영향을 미치는 경우 … 하나의 고정 변수와 다른 변수에 대한 영향.