machine-learning Archives

나는 많은 진보없이 1 년 이상이 문제를 해결하려고 노력해 왔습니다. 그것은 내가하고있는 연구 프로젝트의 일부이지만 문제의 실제 영역은 약간 혼란 스럽기 때문에 내가 만든 이야기 예제로 설명 할 것입니다 (눈 추적).

당신은 대양을 가로 질러 이동하는 적의 함선을 추적하는 비행기이므로, 당신은 그 함선의 일련의 (x, y, time) 좌표를 수집했습니다. 당신은 숨겨진 잠수함이 배를 보호하기 위해 배와 함께 여행한다는 것을 알고 있지만, 그들의 위치 사이에 상관 관계가 있지만 잠수함은 종종 배에서 빠져 나옵니다. 따라서 종종 근처에 있으면서도 때때로 세상. 잠수함의 경로를 예측하고 싶지만 불행히도 숨겨져 있습니다.

그러나 4 월 한 달에 잠수함이 숨기는 것을 잊어 버렸으므로 1,000 번의 여행에서 잠수함과 선박에 대한 일련의 좌표가 있습니다. 이 데이터를 사용하여 선박의 움직임만으로 숨겨진 잠수함의 경로를 예측하는 모델을 만들고 싶습니다. 순진한 기준선은 “잠수함 위치 추측 =”선박의 현재 위치 “라고 말하지만 잠수함이 보이는 4 월 데이터에서 잠수함이 약간 앞서는 경향이 있으므로”잠수함 위치 ” 추측 = 1 분 후의 선박 위치 “는 더 나은 추정치입니다. 또한, 4 월 데이터에 따르면 선박이 오랫동안 물에서 정지하면 잠수함이 해안을 순찰하고있을 가능성이 높습니다. 물론이야.

4 월 데이터를 훈련 데이터로 제공하여 잠수함의 경로를 예측하기 위해이 모델을 어떻게 구축 하시겠습니까? 내 현재 솔루션은 요인이 “여행 시간”, “선박의 x 좌표”, “1 일 동안 선박이 유휴 상태였습니다”등의 임시 선형 회귀 분석입니다. . 그러나 4 월 데이터에서 이러한 요소를 자동으로 생성하는 방법을 정말 좋아합니다. 또한 선형 회귀는 그렇지 않으며 관련이 있다고 생각하기 때문에 시퀀스 또는 시간을 사용하는 모델이 좋습니다.

이 모든 것을 읽어 주셔서 감사하며 나는 무엇이든 분명히 기뻐할 것입니다.

답변

여기에는 “컨텍스트”정보를 사용하지 않는 접근 방식이 있습니다. 즉, “서브가 선박을 따라 가고있다”는 사실을 고려하지 않습니다. 반면에 다음과 같이 시작하는 것이 쉽습니다.

에 의해 표시

$x_{s u b} (t), y_{s u b} (t)$

x_{s u b} (t), y_{s u b} (t)

$x_{sub}(t), y_{sub}(t)$

$x_{s h i p} (t), y_{s h i p} (t)$

x_{s h i p} (t), y_{s h i p} (t)

$x_{ship}(t), y_{ship}(t)$

시각 에서의 잠수함과 선박의 좌표 , 그리고 “거리 시리즈”를 $t$

t

$t$

$x_{d i s t} (t) = x_{s h i p} (t) - x_{s u b} (t)$

x_{d i s t} (t) = x_{s h i p} (t) - x_{s u b} (t)

$x_{dist} (t) = x_{ship} (t) - x_{sub} (t)$

$y_{d i s t} (t) = y_{s h i p} (t) - y_{s u b} (t)$

y_{d i s t} (t) = y_{s h i p} (t) - y_{s u b} (t)

$y_{dist} (t) = y_{ship} (t) - y_{sub} (t)$

내 제안은 이들 각각을 개별적으로 예측한다는 것입니다 (나중에 함께 묶을 수 있음).

이것들이 어떻게 보이는지 잠시 생각해 봅시다 좌표 에 초점을 맞추고 배가 뒤에있는 서브와 함께 오른쪽으로 움직이고 있다고 가정 해 봅시다. 잠수함이 배 뒤 약 100 미터, 편차가 10 미터라고 가정합니다. $x$

x

$x$

그때

$x_{d i s t} (t) = 100 \pm 10 \cdot w i g g l e (t)$

x_{d i s t} (t) = 100 \pm 10 \cdot w i g g l e (t)

$x_{dist} (t) = 100 \pm 10 \cdot wiggle(t)$

$w i g g l e$

w i g g l e

$wiggle$

$x$

x

$x$ $y$

y

$y$ $w i g g l e$

w i g g l e

$wiggle$ $μ$

μ

$\mu$ $σ$

σ

$\sigma$ $x_{d i s t}$

x_{d i s t}

$x_{dist}$

$x_{d i s t} (t) = μ + σ \cdot W_{x} (t)$

x_{d i s t} (t) = μ + σ \cdot W_{x} (t)

$x_{dist}(t) = \mu + \sigma \cdot W_x(t)$

$W_{x} (t)$

W_{x} (t)

$W_x(t)$ $x_{d i s t}$

x_{d i s t}

$x_{dist}$

사람들이 사용하는 또 다른 전략 (당신을 위해 일할 것이라고 생각합니다)은 시리즈를

Polynomial base + Cyclic pattern + Bounded randomness

잠수함과 선박의 경우, 다항식 부분은 아마도 일정하고 순환 부분은 (바다의 파도에서) 사인과 코사인의 합일 것입니다. 시선 추적에는 해당되지 않을 수 있습니다.

이를 파악할 수있는 도구가 있습니다. 내가 아는 두 가지는 다음과 같습니다.

DTREG (30 일 평가판 라이센스)
SQL Server 제품의 일부인 Microsoft 시계열 알고리즘 . 현재 180 일 평가판을 사용하고 있습니다. 사용하기 쉽습니다.

다음은 SQL Server 도구의 스크린 샷입니다 (점선 부분은 예측입니다).

여기에 이미지 설명을 입력하십시오

그들이 사용하는 한 가지 알고리즘을 ARIMA라고합니다. 그것이 어떻게 작동하는지 배우고 싶을 때, 나는 인터넷 검색을 하고이 책을 발견했습니다 : Time Series의 First Course (그리고 걱정할 필요는 없습니다. 따라서 SAS를 따를 필요가 없습니다. 매우 읽기 쉽습니다.

ARIMA가 이러한 도구를 사용하는 방법을 알 필요는 없지만 “모델 매개 변수”등을 설정해야하므로 컨텍스트가 있으면 항상 더 쉽다고 생각합니다.

How IT

언제든지 물어보세요.

태그 보관물: machine-learning

관련된 다른 시계열에서 하나의 시계열을 예측하는 방법 여행한다는 것을 알고 있지만, 그들의

답변

답변