매우 작은 가능성 값을 확률로 변환 (정규화) 각 가능성에 대해 정규화해야합니다. 따라서

모델이 주어지면 데이터 세트 목록에 대한 가능성을 계산 한 다음 각 가능성에 대해 정규화해야합니다. 따라서 [0.00043, 0.00004, 0.00321]과 같은 것은 [0.2, 0.03, 0.77]과 같은 것으로 변환 될 수 있습니다.

내 문제는 내가 작업하고있는 로그 가능성이 매우 작다는 것입니다 (예를 들어, 로그 공간에서 값은 -269647.432, -231444.981 등입니다). 내 C ++ 코드에서 (두 개의 지수를 사용하여) 두 개를 추가하려고하면 “Inf”라는 대답이 나타납니다. 로그 공간 ( 로그 요약 / 뺄셈)에 추가하려고했지만 동일한 문제가 다시 발생했습니다.

아무도 이것에 대한 전문가의 의견을 공유 할 수 있습니까?

답변

모든 로그에서 최대 로그를 뺍니다. 음수 인 모든 결과를 버리면 지수가 넘치게됩니다. (그들의 가능성은 모든 실제적인 목적을 위해 0입니다.)

당신의 상대 정밀도를 원하는 경우 사실, (예 : 에 대한 정밀도 자리)와 당신이 우도의 대수보다 적은 어떤 결과를 버리지 . 그런 다음 평소대로 진행하여 결과 값을 지수화하고 각 지수를 모든 지수의 합으로 나눕니다. $ϵ$

ϵ

$\epsilon$ $ϵ = 10^{- d}$

ϵ = 10^{- d}

$\epsilon = 10^{-d}$ $d$

d

$d$ $n$

n

$n$ $ϵ / n$

ϵ / n

$\epsilon/n$

공식을 좋아하는 사람들을 위해 로그 는 으로하십시오 . 밑수 대한 로그의 경우 다음을 정의하십시오. $λ_{1}, λ_{2}, \dots, λ_{n}$

λ_{1}, λ_{2}, \dots, λ_{n}

$\lambda_1, \lambda_2, \ldots, \lambda_n$ $λ_{n} = max (λ_{i})$

λ_{n} = max (λ_{i})

$\lambda_n = \max(\lambda_i)$ $b > 1$

b > 1

$b\gt 1$

α_{나는} = {\begin{cases} 비^{λ_{나는} - λ_{엔}}, λ_{나는} - λ_{엔} \geq 로그 (ϵ) - 로그 (엔) \\ 0 그렇지 않으면 . \end{cases}

$\alpha_i = \cases{ b^{\lambda_i - \lambda_n}, \lambda_i - \lambda_n \ge \log(\epsilon)-\log(n) \\ 0\quad \text{otherwise}.}$

정규화 된 가능성은 , 그렇지 않으면 언더 플로가되는 모든 를 0으로 대체 하면 최대 의 총 오차가 발생 하지만 이기 때문에 작동합니다. $α_{i} / \sum_{j = 1}^{n} α_{j}$

α_{나는} / \sum_{j = 1}^{엔} α_{j}

$\alpha_i / \sum_{j=1}^n \alpha_j$ $i = 1, 2, \dots, n .$

나는 = 1, 2, \dots, 엔 .

$i = 1, 2, \ldots, n.$ $α_{i}$

α_{나는}

$\alpha_i$ $(n - 1) ϵ / n < ϵ$

(엔 - 1) ϵ / 엔 < ϵ

$(n-1)\epsilon/n\lt \epsilon$ 이고 모든 는 음수가 아니고 분모 이며,제로 교체 규칙으로 인한총상대오차가 로서 원하는. $α_{n} = b^{λ_{n} - λ_{n}} = b^{0} = 1$

α_{엔} = 비^{λ_{엔} - λ_{엔}} = 비^{0} = 1

$\alpha_n=b^{\lambda_n-\lambda_n}=b^0=1$ $α_{i}$

α_{나는}

$\alpha_i$ $A = \sum_{j} α_{j} \geq 1$

에이 = \sum_{j} α_{j} \geq 1

$A = \sum_j \alpha_j \ge 1$ $((n - 1) ϵ / n) / A < ϵ$

((n - 1) ϵ / n) / A < ϵ

$\left((n-1)\epsilon/n \right) / A \lt \epsilon$

반올림 오류를 너무 많이 피하려면 의 가장 작은 값으로 시작하는 합계를 계산하십시오 . 이것은 가 처음으로 오름차순으로 정렬 될 때 자동으로 수행됩니다 . 이것은 매우 큰 대해서만 고려할 사항 입니다. $α_{i}$

α_{i}

$\alpha_i$ $λ_{i}$

λ_{i}

$\lambda_i$ $n$

n

$n$

BTW,이 처방전은 로그의 기초가 보다 크다고 가정했습니다 . 염기 미만 염기가 동일 것처럼 그리고 제 부정 모든 로그 진행할 . $1$

1

$1$ $b$

b

$b$ $1$

1

$1$ $1 / b$

1 / b

$1/b$

예

와 같은 로그 (자연 로그 등)를 갖는 세 개의 값이 있습니다 마지막이 가장 큽니다. 각각의 값에서 감산하는 범 및 $- 269647.432,$

- 269647.432,

$-269647.432,$ $- 231444.981,$

- 231444.981,

$-231444.981,$ $- 231444.699.$

- 231444.699.

$-231444.699.$ $- 38202.733,$

- 38202.733,

$-38202.733,$ $- 0.282,$

- 0.282,

$-0.282,$ $0.$

0.

$0.$

당신은 IEEE의 두 배 (약 16 진수)에 비해 정밀도를 싶습니다 그래서 가정 와 . (당신은 실제로 때문에,이 정밀도를 달성 할 수없는 우리는 당신이 원하는 정밀도와 정확도 실제로 당신의 더 나은 영향을 미치지 않도록 보장 값을 버리고있어 : 단지 세 개의 유효 숫자가 주어집니다,하지만 괜찮아요 계산 = = $ϵ = 10^{- 16}$

ϵ = 10^{- 16}

$\epsilon=10^{-16}$ $n = 3$

엔 = 삼

$n=3$ $- 0.282$

- 0.282

$-0.282$ $\log (ϵ / n)$

로그 (ϵ / 엔)

$\log(\epsilon/n)$ $\log (10^{- 16}) - \log (3)$

로그 (10^{- 16}) - 로그 (삼)

$\log(10^{-16}) - \log(3)$ 세 차이의 첫 번째는, 그래서 그냥 떠나 멀리 던져 덜이보다 와 그들이 제공 제곱 승 및 (물론). 버린값의 순서는 , 및 $- 37.93997.$

- 37.93997.

$-37.93997.$ $- 38202.733,$

- 38202.733,

$-38202.733,$ $- 0.282$

- 0.282

$-0.282$ $0.$

0.

$0.$ $\exp (- 0.282) = 0.754$

특급 (- 0.282) = 0.754

$\exp(-0.282) = 0.754$ $\exp (0) = 1$

특급 (0) = 1

$\exp(0)=1$ $0$

0

$0$ $0.754 / (1 + 0.754) = 0.430$

0.754 / (1 + 0.754) = 0.430

$0.754 / (1 + 0.754) = 0.430$ 이다. $1 / (1 + 0.754) = 0.570$

1 / (1 + 0.754) = 0.570

$1/(1+0.754)=0.570$

How IT

언제든지 물어보세요.

매우 작은 가능성 값을 확률로 변환 (정규화) 각 가능성에 대해 정규화해야합니다. 따라서

답변

예

답변