따라서 다음과 같은 백분율 데이터 세트가 있습니다.
100 / 10000 = 1% (0.01)
2 / 5 = 40% (0.4)
4 / 3 = 133% (1.3)
1000 / 2000 = 50% (0.5)
백분율의 표준 편차를 찾고 싶지만 데이터 볼륨에 가중치를 둡니다. 즉, 첫 번째 및 마지막 데이터 포인트가 계산을 지배해야합니다.
어떻게합니까? 그리고 Excel에서 간단한 방법이 있습니까?
답변
어디에
은 관측치의 수입니다.
은 0이 아닌 가중치의 수입니다.
는 가중치입니다
는 관측치입니다.
는 가중 평균입니다.
가중 평균의 공식은 다음과 같습니다.
원하는 결과를 얻으려면 적절한 가중치를 사용하십시오. 귀하의 경우 를 사용하는 것이 좋습니다 .
Excel에서이를 수행하려면 먼저 가중 평균을 계산해야합니다. 그런 다음 별도의 열에서 를 계산하십시오 . 나머지는 매우 쉬워야합니다.
답변
공식은 Wikipedia를 포함한 다양한 곳에서 사용할 수 있습니다 .
열쇠는 그것이 무게의 의미에 달려 있다는 것을 알아 차리는 것입니다 . 특히, 가중치가 주파수 인 경우 (즉, 전체 합계를 합산하지 않으려는 경우) 가중치가 실제로 각 측정 값의 편차이거나 외부 값인 경우 다른 답변을 얻을 수 있습니다. 데이터를 부과하십시오.
귀하의 경우 가중치는 주파수 인 것처럼 보이지만 그렇지 않습니다 . 주파수에서 데이터를 생성하지만 데이터 세트에 3 개 45 개 레코드와 4 개 15 개 레코드를 갖는 것은 간단하지 않습니다. 대신 마지막 방법을 사용해야합니다. (사실,이 모든 쓰레기 – 당신은 정말 ! 당신은 분명히 않는이 숫자를 생성하는 프로세스의보다 정교한 모델을 사용할 필요가 없습니다 일반적으로 분산 번호를 내뿜으며, 그래서 표준 편차와 시스템을 특성화하는 것이 뭔가를 올바른 일이 아닙니다.)
어쨌든 “신뢰도”가중치를 갖는 분산 공식 (일반적인 방법으로 표준 편차를 계산하는 공식)은 다음과 같습니다.
여기서 는 가중 평균입니다.
당신은 무게에 대한 추정치를 가지고 있지 않습니다, 나는 당신이 신뢰성에 비례하기를 원한다고 가정합니다. Bernoulli 프로세스에 의해 생성 된 경우에도 백분율을 사용하면 분석이 까다로워집니다. 점수가 20과 0이면 무한한 백분율이 있기 때문입니다. SEM의 역으로 가중치를 적용하는 것이 일반적이며 때로는 최적의 방법입니다. Bayesian 추정값 또는 Wilson 점수 간격을 사용해야 합니다 .
답변
=SQRT(SUM(G7:G16*(H7:H16-(SUMPRODUCT(G7:G16,H7:H16)/SUM(G7:G16)))^2)/
((COUNTIFS(G7:G16,"<>0")-1)/COUNTIFS(G7:G16,"<>0")*SUM(G7:G16)))
열 G
은 가중치, 열 H
은 값
답변
: 우리는 확률과 같은 가중치를 취급한다면, 우리는 그들로 다음 구축
어디 – 데이터 볼륨.
다음으로, 가중 평균은
분산은
답변
Option Explicit
Function wsdv(vals As Range, wates As Range)
Dim i, xV, xW, y As Integer
Dim wi, xi, WgtAvg, N
Dim sumProd, SUMwi
sumProd = 0
SUMwi = 0
N = vals.Count ' number of values to determine W Standard Deviation
xV = vals.Column ' Column number of first value element
xW = wates.Column ' Column number of first weight element
y = vals.Row - 1 ' Row number of the values and weights
WgtAvg = WorksheetFunction.SumProduct(vals, wates) / WorksheetFunction.Sum(wates)
For i = 1 To N ' step through the elements, calculating the sum of values and the sumproduct
wi = ActiveSheet.Cells(i + y, xW).Value ' (i+y, xW) is the cell containing the weight element
SUMwi = SUMwi + wi
xi = ActiveSheet.Cells(i + y, xV).Value ' (i+y, xV) is the cell containing the value element
sumProd = sumProd + wi * (xi - WgtAvg) ^ 2
Next i
wsdv = (sumProd / SUMwi * N / (N - 1)) ^ (1 / 2) ' output of weighted standard deviation
End Function