표본 평균을 고려한 표본 중앙값의 예상 값 수 있습니까?E(Y|X¯=x¯)=x¯E(Y|X¯=x¯)=x¯E(Y|\bar{X}=\bar{x})=\bar{x} 저의

하자 평균을 나타내며하자 크기의 임의의 샘플의 평균을 나타내며 인 분포 . 는 어떻게 계산할 수 있습니까?

Y

n=2k+1

N(μ,σ2)

E(Y|X¯=x¯)

직관적으로, 정규성 가정으로 인해 이며 실제로 정답 이라고 주장하는 것이 합리적 입니다. 그래도 엄격하게 보여줄 수 있습니까?

E(Y|X¯=x¯)=x¯

저의 초기 생각은 일반적으로 알려진 결과 인 조건부 정규 분포를 사용하여이 문제에 접근하는 것이 었습니다. 문제는 예상 값과 결과적으로 중앙값의 분산을 모르기 때문에 차 통계량을 사용하여 계산해야한다는 것 입니다. 그러나 그것은 매우 복잡하며 절대적으로 필요하지 않으면 오히려 거기에 가지 않을 것입니다.

k+1


답변

하자 나타낸다 원래의 샘플 및 Z는 엔트리에 임의의 벡터 Z의 K = X Kˉ X를 . 그런 다음 Z 는 정규 중심입니다 (그러나 완전 확률로 합계가 0이라는 사실에서 알 수 있듯이 항목은 독립적이지 않습니다). 선형 기능으로서 X , 벡터 ( Z는 , ˉ X는 ) 것을 표시하기 때문에, 그 공분산 행렬의 계산 접미사 정상 Z는 독립적 ˉ X .

X

Z

Zk=Xk−X¯

Z

X

(Z,X¯)

Z

선회 , 하나의 볼이 Y = ˉ X + T T가 의 중간 인 Z . 특히, TZ 에만 의존 하므로 Tˉ X 와 무관 하며 Z 의 분포 는 대칭이므로 T 는 중심이됩니다.

Y

Y=X¯+T

T

Z

T

Z

T

Z

T

마지막으로,

E(Y∣X¯)=X¯+E(T∣X¯)=X¯+E(T)=X¯.


답변

표본 중앙값은 주문 통계량이며 비정규 분포를 가지므로 표본 중앙값과 표본 평균 (정규 분포가 있음)의 유한 유한 표본 분포는 이변 량 정규가 아닙니다. 근사치에 의지하여 다음과 같은 증상이 나타납니다 ( 여기에서 내 대답 참조 ).

n[(X¯nYn)−(μv)]→LN[(00),Σ]

Σ=(σ2E(|X−v|)[2f(v)]−1E(|X−v|)[2f(v)]−1[2f(v)]−2)

여기서 은 표본 평균이고 μ 모집단 평균, Y n 은 표본 중앙값 및 v 모집단 중앙값, f ( ) 는 임의의 변수의 확률 밀도이고 σ 2 는 분산입니다.

X¯n

μ

Yn

v

f()

σ2

대략 큰 표본의 경우, 공동 분포는 이변 량 정규입니다.

E(Yn∣X¯n=x¯)=v+ρσvσX¯(x¯−μ)

여기서 는 상관 계수입니다.

ρ

표본 평균과 표본 중앙값 (표준화 된 양이 아님)의 대략적인 대표 본 공동 분포가되도록 점근 분포를 조작하면

ρ=1nE(|X−v|)[2f(v)]−11nσ[2f(v)]−1=E(|X−v|)σ

So

E(Yn∣X¯n=x¯)=v+E(|X−v|)σ[2f(v)]−1σ(x¯−μ)

We have that

2f(v)=2/σ2π

due to the symmetry of the normal density so we arrive at

E(Yn∣X¯n=x¯)=v+π2E(|X−μσ|)(x¯−μ)

where we have used

v=μ

. Now the standardized variable is a standard normal, so its absolute value is a half-normal distribution with expected value equal to

2/π

(since the underlying variance is unity). So

E(Yn∣X¯n=x¯)=v+π22π(x¯−μ)=v+x¯−μ=x¯


답변

The answer is

.

Let

x=(x1,x2,…,xn)

have a multivariate distribution

F

for which all the marginals are symmetric about a common value

μ

. (It does not matter whether they are independent or even are identically distributed.) Define

to be the arithmetic mean of the

xi,

x¯=(x1+x2+⋯+xn)/n

and write

x−x¯=(x1−x¯,x2−x¯,…,xn−x¯)

for the vector of residuals. The symmetry assumption on

F

implies the distribution of

x−x¯

is symmetric about

0

; that is, when

E⊂Rn

is any event,

PrF(x−x¯∈E)=PrF(x−x¯∈−E).

Applying the generalized result at /stats//a/83887 shows that the median of

x−x¯

has a symmetric distribution about

0

. Assuming its expectation exists (which is certainly the case when the marginal distributions of the

xi

are Normal), that expectation has to be

0

(because the symmetry implies it equals its own negative).

Now since subtracting the same value

from each of a set of values does not change their order,

Y

(the median of the

xi

) equals

plus the median of

x−x¯

. Consequently its expectation conditional on

equals the expectation of

x−x¯

conditional on

, plus

E(x¯ | x¯)

. The latter obviously is

whereas the former is

0

because the unconditional expectation is

0

. Their sum is

x¯,

QED.


답변

This is simpler than the above answers make it. The sample mean is a complete and sufficient statistic (when the variance is known, but our results do not depend on the variance, hence will be valid also in the situation when the variance is unknown). Then the Rao-Blackwell together with the Lehmann-Scheffe theorems (see wikipedia …) will imply that the conditional expectation of the median, given the arithmetic mean, is the unique minimum variance unbiased estimator of the expectation

μ

. But we know that is the arithmetic mean, hence the result follows.

We did also use that the median is an unbiased estimator, which follows from symmetry.