“중간 트릭”을 더 높은 차원으로 일반화합니까? 또는 충분히 좋고 구조화 된 세트)입니까? 즉,

실제 값을 취하는 랜덤 알고리즘 경우, “중간 트릭”은 곱하기 의 비용으로 실패 확률을 임계 값 으로 줄이는 간단한 방법입니다. 오버 헤드. 즉, 의 출력이 (적어도) 인 확률 로 “좋은 범위” 하면 독립적 인 사본 이고 출력 의 중앙값을 취하면 Chernoff / Hoeffding 경계에 의해 최소 확률로 의 값이 떨어 집니다. $A$

A

$\mathcal{A}$ $δ > 0$

δ > 0

$\delta > 0$ $t = O (\log \frac{1}{δ})$

t = O (\log \frac{1}{δ})

$t=O(\log\frac{1}{\delta})$ $A$

A

$\mathcal{A}$ $I = [a, b]$

I = [a, b]

$I=[a,b]$ $2 / 3$

2 / 3

$2/3$ $A_{1}, \dots, A_{t}$

A_{1}, \dots, A_{t}

$\mathcal{A}_1,\dots,\mathcal{A}_t$ $a_{1}, \dots, a_{t}$

a_{1}, \dots, a_{t}

$a_1,\dots,a_t$ $I$

I

$I$ $1 - δ$

1 - δ

$1-\delta$

와 “트릭”을 더 높은 차원으로 일반화 했습니까? 좋은 범위는 이제 볼록한 세트 (또는 공 또는 충분히 좋고 구조화 된 세트)입니까? 즉, 주어진 무작위 알고리즘 의 값을 출력 , 및 “좋은 세트 ‘ 되도록 모든 에 대해 , 의 대수 비용만으로 성공 확률을 로 높일 수있는 방법은 무엇입니까? $R^{d}$

R^{d}

$\mathbb{R}^d$ $A$

A

$\mathcal{A}$ $R^{d}$

R^{d}

$\mathbb{R}^d$ $S \subseteq R^{d}$

S \subseteq R^{d}

$S\subseteq \mathbb{R}^d$ $P_{r} {A (x, r) \in S} \geq 2 / 3$

P_{r} {A (x, r) \in S} \geq 2 / 3

$\mathbb{P}_r\{ \mathcal{A}(x,r) \in S \} \geq 2/3$ $x$

x

$x$ $1 - δ$

1 - δ

$1-\delta$ $1 / δ$

1 / δ

$1/\delta$

(표현한 다르게 : 고정 arbirary 주어진 보증, 적어도 함께 의 ‘에 속하는 s의 , 절차가 에서 값을 출력 합니까? 그렇다면 효율적인 값 이 있습니까?) $a_{1}, \dots, a_{t} \in R^{d}$

a_{1}, \dots, a_{t} \in R^{d}

$a_1,\dots, a_t\in \mathbb{R}^d$ $\frac{2 t}{3}$

\frac{2 t}{3}

$\frac{2t}{3}$ $a_{i}$

a_{i}

$a_i$ $S$

S

$S$ $S$

S

$S$

그리고 위의 목표를 달성하기 위해 $S$

S

$S$ 에 필요한 최소한의 가정은 무엇 입니까?

이것이 사소한 것으로 판명되면 죄송합니다.이 질문에 대한 참조를 찾을 수 없습니다 …

답변

당신이 찾고있는 것은 강력한 중심 경향 과 거의 같습니다. 데이터 포인트 클라우드를 단일 포인트로 줄이는 방법은 많은 데이터 포인트가 일부 “지상 진실”에 가깝지만 나머지는 임의로 멀리 떨어져 있다면 출력물도 실제와 가깝습니다. 이러한 방법의 “고 장점”은 허용 할 수있는 임의로 나쁜 이상치의 비율입니다. 차이점은 귀하의 경우 “가까운”을 “볼록 껍질 안에”로 바꾸려는 것입니다.

이를 포착하는 한 가지 방법은 Tukey 깊이 개념입니다. 주어진 점을 포함하는 모든 반 공간에 최소한 데이터 점이 포함 된 경우 점은 Tukey 깊이 (주어진 데이터 점 세트와 관련하여 )를 갖습니다 . 내부에 원하는 볼록한 부분 공간이있는 경우, 내부 에 데이터 포인트가 이상 있는 한 Tukey 깊이 를 가진 점이 그 안에 있습니다. 따라서이 방법의 분석 지점은 달성 할 수 있는 가장 큰 값입니다 . $p$

p

$p$ $n$

n

$n$ $p n$

p n

$pn$ $p$

p

$p$ $(1 - p) n$

(1 - p) n

$(1-p)n$ $p$

p

$p$

불행히도이 고 장점은 이며 1/2에 가깝지 않으며 Tukey 깊이와 문제 모두에 해당합니다. 그 이유는 다음과 같습니다. 데이터가 심플 렉스 의 정점 근처에 군집 되어 있으면 그 중 미만 이 특이 치 (그러나 어느 것을 모르는지)이면 단순은 항상 비 이상치의 볼록 껍질 안에 있으므로 선택하기에 안전합니다. 그러나 점의 이상이 특이 치가 될 수있는 경우 선택하기에 안전한 곳은 없습니다. 선택한 심플 렉스의 어느 점이든 가장 가까운 심플 렉스 정점의 모든 점이 될 수 있습니다. 당신은 이상치 않은 사람들의 선체 밖에있을 것입니다. $1 / (d + 1)$

1 / (d + 1)

$1/(d+1)$ $d + 1$

d + 1

$d+1$ $1 / (d + 1)$

1 / (d + 1)

$1/(d+1)$ $1 / (d + 1)$

1 / (d + 1)

$1/(d+1)$

와 같은 더 나쁜 고 장점을 기꺼이 감내하려면 과 모두에서 다항식의 깊은 점을 찾는 무작위 방법이 있습니다. 내 논문을 참조하십시오 $O (1 / d^{2})$

O (1 / d^{2})

$O(1/d^2)$ $n$

n

$n$ $d$

d

$d$

반복 라돈 점, K. Clarkson, D. Eppstein, GL Miller, C. Sturtivant 및 S.-H를 사용한 대략적인 중심점. 텡,
제 9 회 ACM 증상 Comp. 기하 , San Diego, 1993, 91–98,
Int. J. Comp. 기하 & Appl. 6 (3) : 357–377, 1996,
http://kenclarkson.org/center/p.pdf

답변

이것은 깔끔한 질문이며 이전에 생각했습니다. 우리가 생각 해낸 것은 다음과 같습니다.

출력 output 를 얻기 위해 알고리즘을 번 실행 하면 많은 확률의 가 좋은 세트 는 것을 알 수 있습니다. 당신은 가 무엇인지 모릅니다 . 단지 그것이 볼록하다는 것입니다. 좋은 소식은 에 대해 더 이상의 정보 를 얻지 못하는 방법이 있다는 것입니다 . 이 포인트 콜 . $n$

n

$n$ $x_{1}, \dots, x_{n} \in R^{d}$

x_{1}, \dots, x_{n} \in R^{d}

$x_1, \cdots, x_n \in \mathbb{R}^d$ $x_{i}$

x_{i}

$x_i$ $G$

G

$G$ $G$

G

$G$ $G$

G

$G$ $f (x_{1}, \dots, x_{n})$

f (x_{1}, \dots, x_{n})

$f(x_1, \cdots, x_n)$

정리. 모든 자연수를 들어 과 , 함수가 존재 이하가되도록 유지. 보자 및 가 만족하는 볼록한 세트가되도록하십시오. $n$
$n$
$n$ $d$
$d$
$d$ $f : (R^{d})^{n} \to R^{d}$
$f : (R^{d})^{n} \to R^{d}$
$f : (\mathbb{R}^d)^n \to \mathbb{R}^d$ $x_{1} . . . x_{n} \in R^{d}$
$x_{1} . . . x_{n} \in R^{d}$
$x_1 ... x_n \in \mathbb{R}^d$ $G \subset R^{d}$
$G \subset R^{d}$
$G \subset \mathbb{R}^d$ 이어서. 또한,는시간 다항식으로 계산할 수있습니다.
$\frac{1}{n} | {i \in [n] : x_{i} \in G} | > \frac{d}{d + 1} .$
$\frac{1}{n}\left|\left\{ i \in [n] : x_i \in G \right\}\right| > \frac{d}{d+1}.$ $f (x_{1}, . . ., x_{n}) \in G$
$f (x_{1}, . . ., x_{n}) \in G$
$f(x_1, ..., x_n) \in G$ $f$
$f$
$f$ $n^{d}$
$n^{d}$
$n^d$

은 해당주의 , 우리는 설정할 수 평균한다. 따라서 이것은 의 중앙값을 일반화하는 방법을 보여줍니다 . $d = 1$

d = 1

$d=1$ $f$

f

$f$ $d > 1$

d > 1

$d>1$

이 결과를 증명하기 전에 다음과 같이 조이십시오. 이고 표준 기본 요소로하고 . 점들 중 의 임의의 부분 집합은 차원 의 아핀 공간 ( 에 포함된다 (이 점들에 의해 고유하게 정의 됨). 그러나 그 모든 작은 공간에는 아무런 의미가 없습니다. 따라서 를 포함 하는 볼록한 가 있습니다. $n = d + 1$

n = d + 1

$n=d+1$ $x_{1}, \dots, x_{d}$

x_{1}, \dots, x_{d}

$x_1, \cdots, x_d$ $x_{d + 1} = 0$

x_{d + 1} = 0

$x_{d+1}=0$ $d$

d

$d$ $G$

G

$G$ $d - 1$

d - 1

$d-1$ $G$

G

$G$ 점이지만값이 무엇이든 포함하지 않습니다. $n \cdot d / (d + 1) = d$

n \cdot d / (d + 1) = d

$n\cdot d/(d+1)=d$ $f (x_{1}, \dots, x_{n})$

f (x_{1}, \dots, x_{n})

$f(x_1, \cdots, x_n)$

증명. 다음 결과를 사용합니다.

헬리 정리. 보자 볼록 부분 집합 일 수 . 의 교점 이 비어 있지 않은 것으로 가정하십시오 . 그리고 모두의 교차 S를 비어 있지 않은 것입니다. $K_{1} . . . K_{m}$
$K_{1} . . . K_{m}$
$K_1 ... K_m$ $R^{d}$
$R^{d}$
$\mathbb{R}^d$ $d + 1$
$d + 1$
$d+1$ $K_{i}$
$K_{i}$
$K_i$ $K_{i}$
$K_{i}$
$K_i$

Helly의 정리 증명을 보려면 여기를 클릭하십시오.

이제 우리의 정리를 증명하기 위해 :

하자 상부에없는 점의 수에 바인딩 된 . 모든 닫힌 반 공백 고려하십시오 적어도 함유 그 자신의 경계는 최대 랭크의 포인트들의 세트를 함유하는 점 (이 각각 같은 halfspaces 한정된 개수 에 의해 정의되는 의 경계 지점). $k < n / (d + 1)$
$k < n / (d + 1)$
$k<n/(d+1)$ $G$
$G$
$G$ $K_{1} . . . K_{m} \subset R^{d}$
$K_{1} . . . K_{m} \subset R^{d}$
$K_1 ... K_m \subset \mathbb{R}^d$ $n - k$
$n - k$
$n-k$ $K_{i}$
$K_{i}$
$K_i$ $d + 1$
$d + 1$
$d+1$

각각의 보완 가장에 포함 점. 합집합에 의해, 임의의 의 교점 은 적어도 > 0 포인트를 포함한다. (halfspaces 볼록 때문에) HELLY 정리함으로써, 모든 교차점에 포인트가 . 우리가 할 수 의 교차점에있는 임의의 점 계산 함수일 들. $K_{i}$
$K_{i}$
$K_i$ $k$
$k$
$k$ $d + 1$
$d + 1$
$d+1$ $K_{i}$
$K_{i}$
$K_i$ $n - k (d + 1)$
$n - k (d + 1)$
$n-k(d+1)$ $K_{i} s$
$K_{i} s$
$K_is$ $f$
$f$
$f$ $K_{i}$
$K_{i}$
$K_i$

모든 그 유적의 교차점 있음을 보여주는 것입니다 의가에 포함되어 . $K_{i}$
$K_{i}$
$K_i$ $G$
$G$
$G$

일반성을 잃지 않으면 서 는 전체 순위를 가진 포인트의 하위 집합의 볼록 껍질입니다. 즉, 를 포함하는 점의 볼록 껍질로 를 대체 할 수 있습니다. 이것이 전체 순위를 갖지 않는다면, 단순히 우리의 정리를 더 낮은 차원으로 적용 할 수 있습니다. $G$
$G$
$G$ $G$
$G$
$G$

각 얼굴 halfspace 정의 이들 halfspaces의 교차점이다. 이 반 공간 각각에는 가 포함 되므로 개 이상의 점이 포함됩니다. 이 절반 공간 중 하나의 경계는 의면을 포함하므로 최대 순위의 점 세트를 포함합니다. 따라서 이러한 halfspaces 각각은 인 . 따라서 모든 교차점 들에 포함되는 필요한. $G$
$G$
$G$ $G$
$G$
$G$ $G$
$G$
$G$ $n - k$
$n - k$
$n-k$ $G$
$G$
$G$ $K_{i}$
$K_{i}$
$K_i$ $K_{i}$
$K_{i}$
$K_i$ $G$
$G$
$G$

계산할 선형 제약 조건에 대응하는 선형 프로그램 설정 모든 교차점에 포인트들 및 대응 가능한 솔루션 들.
QED $f$
$f$
$f$ $K_{i}$
$K_{i}$
$K_i$ $K_{i}$
$K_{i}$
$K_i$

불행히도,이 결과는 고차원적인 환경에서는 그리 실용적이지 않습니다. 좋은 질문은 우리가 더 효율적으로 계산할 수 있는지 여부입니다 . $f$

f

$f$

열린 문제. 가 과 시간 다항식으로 계산 될 수 있다는 추가 결론으로 위의 정리를 증명하십시오 .
$f$
$f$
$f$ $n$
$n$
$n$ $d$
$d$
$d$

따로 : 우리는 또한 효율적인 해결책을 얻기 위해 문제를 바꿀 수 있습니다 : 이 절반 이상이 공 있는 성질을 가지고 있다면 , 우리는 점 찾을 수 있습니다 점이다 시간 다항식의 및 . 특히 임의의 대해 를 설정 하여 점의 절반 이상이 $x_{1}, \dots, x_{n}$

x_{1}, \dots, x_{n}

$x_1, \cdots, x_n$ $B (y, ε)$

B (y, ε)

$B(y,\varepsilon)$ $z$

z

$z$ $B (y, 3 ε)$

B (y, 3 ε)

$B(y,3\varepsilon)$ $n$

n

$n$ $d$

d

$d$ $z = x_{i}$

z = x_{i}

$z=x_i$ $i$

i

$i$ . $B (z, 2 ε)$

B (z, 2 ε)

$B(z,2\varepsilon)$

답변

다양한 이름으로 알려진 고차원 및 일반 규범에서 일련의 포인트의 중앙값에 대한 개념이 있습니다. 세트의 모든 점까지의 거리의 합을 최소화하는 점입니다. 거리가 조금씩 증가하는 일반적인 중앙값과 유사한 신뢰 증폭 특성을 갖는 것으로 알려져 있습니다. 이 백서의 정리 3.1에서 자세한 내용을 확인할 수 있습니다. http://arxiv.org/pdf/1308.1334.pdf

이 백서에서 알 수있는 한 가지 좋은 점은 거리를 늘리는 요소가 임의로 높은 (그러나 일정한 <1) 신뢰도에서 증폭 될 수 있으면> 1을 일정하게 유지할 수 있다는 것입니다.

편집 : 슈하여 주제에 대한 또 다른 최근의 용지가와 사바토 http://arxiv.org/pdf/1307.1827v6.pdf
그것은 주로 분석하고 절차를 적용하는 나머지 작은 중간 거리 세트의 점 포인트 중 하나가 사용됩니다. 이 절차는 모든 메트릭과 함께 사용할 수 있지만 근사 계수는 3입니다.

How IT

언제든지 물어보세요.

“중간 트릭”을 더 높은 차원으로 일반화합니까? 또는 충분히 좋고 구조화 된 세트)입니까? 즉,

답변

답변

답변

답변