νƒœκ·Έ 보관물: correlation

correlation

두 μ‹œκ³„μ—΄μ„ 간격과 λ‹€λ₯Έ νƒ€μž„λ² μ΄μŠ€μ™€ μ—°κ΄€μ‹œν‚€λŠ” 방법? 에 StackOverflow에 걸쳐,

λ‚΄κ°€ λ¬Όμ—ˆλ‹€ 이 질문 에 StackOverflow에 걸쳐, μ—¬κΈ°λ₯Ό λ¬Όμ–΄ μΆ”μ²œλ˜μ—ˆλ‹€.


λ‚˜λŠ” μ„œλ‘œ λ‹€λ₯Έ νƒ€μž„λ² μ΄μŠ€ (μƒ˜ν”Œλ§ μ‹œκ°„ λ™μ•ˆ μ•½κ°„μ˜ 크리프와 ν•¨κ»˜ λ‹€λ₯Έ μ‹œκ°„μ— μ‹œμž‘λœ 클럭)λ₯Ό 가지고 있으며 λ‹€λ₯Έ 크기의 λ§Žμ€ 간격을 ν¬ν•¨ν•˜κ³  (뢄리에 λŒ€ν•œ 쓰기와 κ΄€λ ¨λœ μ§€μ—°μœΌλ‘œ 인해) 두 개의 3D 가속도계 데이터 μ‹œλ¦¬μ¦ˆκ°€ μžˆμŠ΅λ‹ˆλ‹€. ν”Œλž˜μ‹œ μž₯치).

λ‚΄κ°€ μ‚¬μš©ν•˜λŠ” κ°€μ†λ„κ³„λŠ” μ €λ ΄ν•œ GCDC X250-2 μž…λ‹ˆλ‹€. 가속도계λ₯Ό μ΅œλŒ€ 게인으둜 μ‹€ν–‰ν•˜κ³  μžˆμœΌλ―€λ‘œ λ°μ΄ν„°μ˜ λ…Έμ΄μ¦ˆ ν”Œλ‘œμ–΄κ°€ μƒλ‹Ήνžˆ λ†’μŠ΅λ‹ˆλ‹€.

μ‹œκ³„μ—΄μ€ 각각 μ•½ 2 백만 개의 데이터 포인트 (512 μƒ˜ν”Œ / μ΄ˆμ—μ„œ 1 μ‹œκ°„ 이상)λ₯Ό 가지며 μ•½ 500 개의 관심 이벀트λ₯Ό ν¬ν•¨ν•˜λ©°, μ—¬κΈ°μ„œ 일반적인 μ΄λ²€νŠΈλŠ” 100-150 μƒ˜ν”Œ (각 200-300ms)에 μ΄λ¦…λ‹ˆλ‹€. μ΄λŸ¬ν•œ λ§Žμ€ μ΄λ²€νŠΈλŠ” ν”Œλž˜μ‹œ μ“°κΈ° 쀑 데이터 μ€‘λ‹¨μ˜ 영ν–₯μ„λ°›μŠ΅λ‹ˆλ‹€.

λ”°λΌμ„œ λ°μ΄ν„°λŠ” κΉ¨λ—ν•˜μ§€ μ•ŠμœΌλ©° 맀우 μ˜ˆμ˜μ§€ μ•ŠμŠ΅λ‹ˆλ‹€. κ·ΈλŸ¬λ‚˜ λ‚΄ μ‹œμ„  κ²€μ‚¬μ—λŠ” κ΄€μ‹¬μžˆλŠ” 정보가 λͺ…ν™•ν•˜κ²Œ ν¬ν•¨λ˜μ–΄ μžˆμŠ΅λ‹ˆλ‹€. ν•„μš”ν•œ 경우 ν”Œλ‘―μ„ κ²Œμ‹œ ν•  수 μžˆμŠ΅λ‹ˆλ‹€.

κ°€μ†λ„κ³„λŠ” λΉ„μŠ·ν•œ ν™˜κ²½μ— μžˆμ§€λ§Œ μ λ‹Ήνžˆ κ²°ν•©λ˜μ–΄μžˆμ–΄ 각 κ°€μ†λ„κ³„μ—μ„œ μ–΄λ–€ μ΄λ²€νŠΈκ°€ μΌμΉ˜ν•˜λŠ”μ§€ 눈으둜 μ•Œ 수 μžˆμ§€λ§Œ μ†Œν”„νŠΈμ›¨μ–΄μ—μ„œ μ§€κΈˆκΉŒμ§€ μ‹€νŒ¨ν–ˆμŠ΅λ‹ˆλ‹€. 물리적 ν•œκ³„λ‘œ 인해 μž₯μΉ˜κ°€ μ„œλ‘œ λ‹€λ₯Έ λ°©ν–₯으둜 μž₯μ°©λ˜μ–΄ 좕이 μΌμΉ˜ν•˜μ§€ μ•Šμ§€λ§Œ κ°€λŠ₯ν•œ ν•œ 직각에 κ°€κΉμŠ΅λ‹ˆλ‹€. 예λ₯Ό λ“€μ–΄, 3 μΆ• 가속도계 A 및 B의 경우 + AxλŠ” -By (μœ„μͺ½ μ•„λž˜)에, + AzλŠ” -Bx (μ™Όμͺ½ 였λ₯Έμͺ½)에, + AyλŠ” -Bz (μ•žλ’€)에 λ§€ν•‘λ©λ‹ˆλ‹€. .

λ‚˜μ˜ 첫 번째 λͺ©ν‘œλŠ” μ„Έλ‘œ μΆ•μ˜ 좩격 이벀트λ₯Ό μƒκ΄€μ‹œν‚€λŠ” κ²ƒμ΄μ§€λ§Œ κ²°κ΅­ a) μΆ• 맀핑을 μžλ™μœΌλ‘œ κ°μ§€ν•˜κ³  b) 맀핑 된 μ—μ΄μŠ€μ˜ ν™œλ™μ„ 상관 μ‹œν‚€λ©° c) 두 가속도계 κ°„μ˜ λ™μž‘ 차이 (예 : λΉ„ν‹€λ¦Ό)λ₯Ό μΆ”μΆœν•˜λ €κ³ ν•©λ‹ˆλ‹€. λ˜λŠ” ꡬ뢀림).

μ‹œκ³„μ—΄ λ°μ΄ν„°μ˜ νŠΉμ„±μƒ 파이썬의 numpy.correlate ()λ₯Ό μ‚¬μš©ν•  수 μ—†μŠ΅λ‹ˆλ‹€. λ‚˜λŠ” λ˜ν•œ R β€˜s Zoo νŒ¨ν‚€μ§€λ₯Ό λ³΄μ•˜μ§€λ§Œ 그것에 μ§„μ „ν•˜μ§€ μ•Šμ•˜μŠ΅λ‹ˆλ‹€. 도움을 μ–»κΈ° μœ„ν•΄ μ—¬λŸ¬ 가지 μ‹ ν˜Έ 뢄석 λΆ„μ•Όλ₯Ό μ‚΄νŽ΄ λ΄€μ§€λ§Œ 진전이 μ—†μ—ˆμŠ΅λ‹ˆλ‹€.

λˆ„κ΅¬λ‚˜ λ‚΄κ°€ ν•  μˆ˜μžˆλŠ” μΌμ΄λ‚˜ 연ꡬ해야 ν•  접근법에 λŒ€ν•œ λ‹¨μ„œκ°€ μžˆμŠ΅λ‹ˆκΉŒ?

2011 λ…„ 2 μ›” 28 일 μ—…λ°μ΄νŠΈ : μ—¬κΈ° 에 λ°μ΄ν„°μ˜ 예λ₯Ό λ³΄μ—¬μ£ΌλŠ” ν”Œλ‘―μ΄ μΆ”κ°€λ˜μ—ˆμŠ΅λ‹ˆλ‹€ .



λ‹΅λ³€

λ¬Έμ œλŠ” λΆˆκ·œμΉ™μ μœΌλ‘œ μƒ˜ν”Œλ§ 된 2 개의 μ‹œκ³„μ—΄ (1 차원 ν™•λ₯  둠적 ν”„λ‘œμ„ΈμŠ€) μ‚¬μ΄μ˜ 상관 관계λ₯Ό κ³„μ‚°ν•˜κ³  이λ₯Ό μ΅œλŒ€ 상관 된 μ‹œκ°„ μ˜€ν”„μ…‹ ( β€œμœ„μƒμ°¨β€)을 μ°ΎλŠ” 데 μ‚¬μš©ν•˜λŠ” κ²ƒμž…λ‹ˆλ‹€.

μ‹œκ³„μ—΄ λ°μ΄ν„°λŠ” μ²΄κ³„μ μœΌλ‘œ (μ •κΈ° μ‹œκ°„ κ°„κ²©μœΌλ‘œ) μˆ˜μ§‘λ˜λŠ” κ²ƒμœΌλ‘œ κ°€μ •λ˜κΈ° λ•Œλ¬Έμ—μ΄ λ¬Έμ œλŠ” 일반적으둜 μ‹œκ³„μ—΄ λΆ„μ„μ—μ„œ ν•΄κ²°λ˜μ§€ μ•ŠμŠ΅λ‹ˆλ‹€. 였히렀 μ‹œκ³„μ—΄μ˜ 닀차원 μΌλ°˜ν™”μ™€ κ΄€λ ¨λœ μ§€ν˜• 톡계학 의 μ£Όμž…λ‹ˆλ‹€ . μ „ν˜•μ μΈ μ§€μ§ˆ 톡계 데이터 μ„ΈνŠΈλŠ” λΆˆκ·œμΉ™ν•œ κ°„κ²©μœΌλ‘œ μ§€μ§ˆ μƒ˜ν”Œμ„ μΈ‘μ •ν•˜λŠ” κ²ƒμœΌλ‘œ κ΅¬μ„±λ©λ‹ˆλ‹€.

간격이 λΆˆκ·œμΉ™ν•˜λ©΄ ν•œ 쌍의 μœ„μΉ˜ μ‚¬μ΄μ˜ 거리가 λ‹¬λΌμ§‘λ‹ˆλ‹€. 두 거리가 같을 μˆ˜λŠ” μ—†μŠ΅λ‹ˆλ‹€. 지리 톡계학은 κ²½ν—˜μ  variogram으둜 이것을 κ·Ήλ³΅ν•©λ‹ˆλ‹€ . μ΄κ²ƒμ˜ β€œμ „ν˜•μ μΈβ€(μ’…μ’… 평균 λ˜λŠ” 쀑앙값) 값을 κ³„μ‚°ν•œλ‹€ κ³ λ§ˆμ› λ‹€ β€œsemivariance”- μ—¬κΈ°μ„œ Z ( P은 ) μ§€μ μ—μ„œμ˜ μΈ‘μ • 값을 λ‚˜νƒ€λ‚΄κ³ , P 및 p 와 q μ‚¬μ΄μ˜ κ±°λ¦¬λŠ” β€œlag”라 λΆˆλ¦¬λŠ” 간격 내에 놓 이도둝 μ œν•œλ©λ‹ˆλ‹€. μš°λ¦¬κ°€ ν”„λ‘œμ„ΈμŠ€ Z 라고 κ°€μ •ν•˜λ©΄

(z(p)βˆ’z(q))2/2

z(p)

p

p

q

Z

정지 및 곡뢄산을 가지고 λ‹€μŒ semivariance의 κΈ°λŒ€ (λ™μΌν•œ μ΅œλŒ€ 곡뢄산 동일 μž„μ˜ λŒ€ν•œ P ) λ§ˆμ΄λ„ˆμŠ€μ˜ 곡뢄산 Z ( P ) 및 Z ( μ§ˆλ¬Έμ„ ) . 이 μ§€μ—°μœΌλ‘œ μΈν•œ 비닝은 λΆˆκ·œμΉ™ν•œ 간격 λ¬Έμ œμ— λŒ€μ²˜ν•©λ‹ˆλ‹€.

Var(Z(p))

p

Z(p)

Z(q)

(z(p),w(p))

z

w

2 백만 점을 μ‚¬μš©ν•˜λ©΄ 정상 μ„±κ³Όμ˜ μž‘μ€ 편차λ₯Ό 감지 ν•  수 μžˆμŠ΅λ‹ˆλ‹€. 두 μ‹œκ³„μ—΄μ˜ μœ„μƒμ°¨λ„ μ‹œκ°„μ— 따라 λ‹¬λΌμ§ˆ 수 μžˆμŠ΅λ‹ˆλ‹€. 이 κΈ°κ°„ λ™μ•ˆ μ„œλ‘œ λ‹€λ₯Έ 창에 λŒ€ν•΄ ꡐ차 Variogram을 λ³„λ„λ‘œ κ³„μ‚°ν•˜μ—¬ 이에 λŒ€μ²˜ν•˜μ‹­μ‹œμ˜€.

O(nk)

O(n2)

k

λ‹΅λ³€