두 변수 간의 관계를 모델링하는 데 어떤 방법을 사용해야하는지 잘 모르겠습니다 (
x과
y)는 다음과 같이 실험에서 설명됩니다.
- 3 가지 변수가 있습니다 :
xaim , x 과 y . - 의 가치
xaim 실험을 수행 할 때 설정됩니다. 하나, x 과 xaim 항상 같은 것은 아닙니다. - 피어슨의 상관 계수
xaim 과 x 약 0.9입니다. - 피어슨의 상관 계수
x 과 y 훨씬 적습니다 : 약 0.5.
y 가능한 최대 값 ( ymax )를 초과 할 수 없습니다.- 각 데이터 포인트는 설정 후 획득
xaim 그리고 독서 x 과 y .
피어슨의 상관 계수는
x과
y대단하지 않습니다.
y와 함께 증가하는 경향이
x.
간단한 선형 회귀를 한 후
y=f(x)과
x=g(y)(그리고 후자를
g−1와 같은 그래프에 표시되도록
f예를 들어, 두 경사는 모두 양이지만 경사는
g−1~보다 크다
f.
말하는 것이 이치에 맞습니까?
xmax=f−1(ymax)또는
xmax=g(ymax)? (
xmax두 번째 경우 더 일찍 도달 할 것입니다.)
고려해 보면
y에 묶여있다
ymax가능한 최대 값에 대해 말할 수있는 것
x도달 할 수 있습니까?
내가 이해하는 한, 형태의 선형 회귀를 수행하는 것이 합리적입니다.
y=f(x)언제
x독립 변수이며
y종속 변수입니다. 그러나이 맥락에서, 나는 그것을 고려하는 것이 의미가 있는지 확실하지 않습니다.
x독립적이며
y의존적입니다.
총 최소 제곱 회귀가 더 적절할까요? 어떤 값을 결정하는 다른 방법이 있습니까?
xmax(그리고 어떤 가능성으로) 도달 할 수 있습니까?
(이것이 중요하다면
x과
y더 높은 값에 도달하려고 더 많은 시도가 있었으므로 정규 분포를 따르지 않는 것 같습니다.
x.)
답변
@King의 요점을 말하고 싶습니다. 회귀가 의심되는 것은 매우 직관적입니다.
y위에
x( ‘직접 회귀’) 및 회귀
x위에
y( ‘역 회귀’)는 같아야합니다. 그러나 이것은 수학적으로나 회귀가 분석중인 상황과 어떤 관련이 있는지에 대해서는 사실이 아닙니다. 플롯하면
y그래프의 세로축에
x가로축에서 무슨 일이 일어나고 있는지 볼 수 있습니다. 직접 회귀는 데이터 점과 선 사이의 수직 거리를 최소화하는 선을 찾는 반면, 역 회귀는 수평 거리를 최소화합니다. 하나를 최소화하는 선은 다른 경우에만 다른 것을 최소화합니다
rxy=1.0. 설명 할 내용과 설명 할 내용을 결정해야합니다. 그 질문에 대한 답은 어떤 변수가
y과
x모델을 지정합니다. 또한 (@King에 이어), 나는 말하기 위해 동의하지 않습니다.
xmax=f−1(ymax)같은 이유로.
경계 변수의 문제와 관련하여 일반적으로 ‘실제’양이 더 높아질 수 있지만 측정 할 수는 없습니다. 예를 들어, 창문 밖으로 나가는 외부 온도계는 120 개까지 올라갈 수 있지만, 어떤 곳에서는 140 개 밖에 나가지 않을 수 있습니다. 따라서 변수에는 상한이 있지만 실제로 생각하고 싶은 것은 그렇지 않습니다. 이 경우, 그러한 상황에 대한 토비트 모델이 존재합니다.
다른 접근 방식은 황토와 같은보다 견고한 것을 사용하는 것이며, 이는 귀하의 요구에 완벽하게 적합 할 수 있습니다.
답변
첫째로, 나는 그것이 말하는 것이 의미가 없다고 생각합니다
xmax=f−1(ymax)여기서는 일대일 기능이라는 것을 암시하는 것과 같습니다.
xmax다른 관찰되지 않은 변수에 의해 설명됩니다.
둘째, 그것은 실제로 독립 또는 종속 변수로 취급 할 수있는 상황에 달려 있습니다. 이론이 한 가지 방법을 강하게 제안하지 않는 한 내 경험으로는; 어느 쪽이든 괜찮습니다. 10 월 7 일에 대한 귀하의 의견에서
x의존하는 동안
y독립적입니다.
가능하면 잔차를보고 무엇이든 짜낼 수 있는지 확인하십시오. 잊어 버린 또 다른 변수가있을 수 있습니다. 또는 변수를 변환하는 데 도움이 될 수 있습니다.