0 값이 많은 시계열 분석 현상은 산발적이며 매우 가변적입니다. 따라서 시계열은

이 문제는 실제로 화재 감지에 관한 것이지만 일부 방사성 붕괴 감지 문제와 매우 유사합니다. 관찰되는 현상은 산발적이며 매우 가변적입니다. 따라서 시계열은 변수 값에 의해 중단 된 긴 문자열 0으로 구성됩니다.

목적은 단순히 이벤트를 캡처하는 것 (0으로 나누기)이 아니라 이벤트 자체의 정량적 특성입니다. 그러나 센서는 제한되어 있으므로 “실제”가 0이 아닌 경우에도 0을 기록합니다. 이러한 이유로 센서를 비교할 때 0이 포함되어야합니다.

센서 B가 센서 A보다 더 민감 할 수 있으며이를 통계적으로 설명하고 싶습니다. 이 분석에는 “진실”이 없지만 센서 A & B와 독립적 인 센서 C가 있습니다. 따라서 A / B와 C 사이의 더 나은 합의는 “진실”과 더 나은 합의를 나타냅니다. (이것은 흔들리는 것처럼 보일 수 있지만, 당신은 나를 믿어야 할 것입니다. 저는 센서에 대한 다른 연구에서 알려진 것을 바탕으로 여기에 탄탄합니다.)

그러므로 문제는 “시계열의 더 나은 합의”를 정량화하는 방법입니다. 상관 관계는 분명한 선택이지만 모든 0에 영향을 미치며 (제외 할 수 없음) 물론 최대 값에 의해 불균형하게 영향을받습니다. RMSE도 계산할 수 있지만 거의 제로인 경우 센서의 동작에 대한 가중치가 높습니다.

Q1 : 0이 아닌 값에 로그 스케일링을 적용하고 시계열 분석에서 0과 결합하는 가장 좋은 방법은 무엇입니까?

Q2 :이 유형의 시계열 분석에 어떤 “모범 사례”를 추천 할 수 있습니까? 0이 아닌 값의 동작이 초점이지만 0의 값이 지배적이며 제외 할 수없는 경우는 무엇입니까?



답변

“분석가는 특정한 패턴을 따르지 않는 오랜 기간 동안의 수요를 어떻게 처리합니까?”

귀하의 질문에 대한 답변은 간헐적 수요 분석 또는 스파 스 데이터 분석입니다. 이것은 0이 아닌 수에 비해 “0의 제비”가있을 때 일반적으로 발생합니다. 문제는 두 개의 임의 변수가 있다는 것입니다. 이벤트와 예상되는 이벤트 크기 사이의 시간 당신이 말했듯이 전체 판독 값 세트의 자기 상관 (acf)은 acf를 잘못 향상시키는 0의 시퀀스로 인해 의미가 없습니다. 데이터 기반 프로 시저가 아닌 모델 기반 프로 시저 인 “Croston ‘s method”와 같은 스레드를 추구 할 수 있습니다 .Croston의 방법은 요구 비율, 즉 수요를 보다 엄격한 접근 방식은 “스파 스 데이터-동일하지 않은 데이터”또는 이와 유사한 검색을 추구하는 것일 수 있습니다. OSU의 Ramesh Sharda 교수는 다소 독창적 인 솔루션을 제안했으며 컨설팅 업무에서 여러 해 동안 사용해 왔습니다. 시리즈에 판매가 발생하는 시점과 판매가 발생하지 않는 기간이있는 경우 관측 된 판매를 판매가없는 기간으로 나누어 판매율을 구할 수 있습니다. 그러면 요율과 예상 요율로 끝나는 판매 간 간격 사이의 모델을 식별 할 수 있습니다. autobox.com 및 Google “간헐적 수요”에서 이에 대한 자세한 내용을 확인할 수 있습니다. 시리즈에 판매가 발생하는 시점과 판매가 발생하지 않는 기간이있는 경우 관측 된 판매를 판매가없는 기간으로 나누어 판매율을 구할 수 있습니다. 그러면 요율과 예상 요율로 끝나는 판매 간 간격 사이의 모델을 식별 할 수 있습니다. autobox.com 및 Google “간헐적 수요”에서 이에 대한 자세한 내용을 확인할 수 있습니다. 시리즈에 판매가 발생하는 시점과 판매가 발생하지 않는 기간이있는 경우 관측 된 판매를 판매가없는 기간으로 나누어 판매율을 구할 수 있습니다. 그러면 요율과 예상 요율로 끝나는 판매 간 간격 사이의 모델을 식별 할 수 있습니다. autobox.com 및 Google “간헐적 수요”에서 이에 대한 자세한 내용을 확인할 수 있습니다.