태그 보관물: categorical-data

categorical-data

다단계 요인이있는 모형에 적합하려면 왜 R이 오래 걸립니까? 모든 플레이어의 각 국적에 대한 요인 예측

여러 수준의 요인이있는 모델에 적합하며 해당 모델에 적합하려면 R이 실제로 오랜 시간이 걸립니다. 왜 이런거야?

예를 들어, 플레이어의 급여를 예측하기 위해 회귀 분석을 적용하고 모든 플레이어의 각 국적에 대한 요인 예측 변수를 포함시키는 경우 플레이어의 급여에 대한 모델을 플레이어의 연속 예측 변수와 맞추는 것보다 시간이 오래 걸립니다. 높이.



답변

R은 일반적입니다. 대부분의 통계 패키지와 마찬가지로 회귀에 QR 분해를 사용합니다.

고정 들어 , 여기서 바로 분해 자체를 효과적으로 계산에 차 함수 (4) 주위로 예측기의 수 것 곱셈 연산 배가 시간 -.

피<<엔

따라서 (선형 회귀)에서 으로 이동하면 600 배 더 긴 영역 (실제로는 여러 가지 이유로 다소 적을 것)의 영역에서 무언가를 취할 것으로 기대합니다.

피=2

피=50

따라서 예측 변수를 많이 추가하면 대기 시간이 훨씬 길어집니다.


답변

이는 수준을 갖는 요인으로 R은 지표 변수를 생성 하기 때문입니다 . 따라서 국적 이 있다고 가정 하고, 연속 선형으로 처리하지 않는 경우 간단한 선형 회귀 분석과 비교하여 예측 변수가 있는 다중 회귀 모형을 적합 하게 만듭니다. 아마도 대륙을 구성하는 새로운 요소 나 국적을 더 거칠게 묶는 새로운 요소를 만들어서 속도를 높이고보다 교묘 한 모델을 만들 수도 있습니다.

케이

케이−1

케이=50

49

답변