μΉ΄ν…Œκ³ λ¦¬ 보관물: stats

stats

데이터λ₯Ό λŒ€μΉ˜ν•˜κ±°λ‚˜ μ£Όλ³€ 데이터λ₯Ό μ°ΎλŠ” 데 인접 정보 μ‚¬μš© (R) 12 NA

κ°€μž₯ κ°€κΉŒμš΄ 이웃이 κ°€μž₯ 쒋은 예츑 λ³€μˆ˜λΌλŠ” κ°€μ •ν•˜μ— 데이터 μ„ΈνŠΈκ°€ μžˆμŠ΅λ‹ˆλ‹€. μ–‘λ°©ν–₯ κ·Έλž˜λ””μ–ΈνŠΈμ˜ μ™„λ²½ν•œ 예

여기에 이미지 μ„€λͺ…을 μž…λ ₯ν•˜μ‹­μ‹œμ˜€

값이 κ±°μ˜μ—†λŠ” κ²½μš°κ°€ μžˆλ‹€κ³  κ°€μ •ν•˜κ³  이웃과 μΆ”μ„Έλ₯Ό 기반으둜 μ‰½κ²Œ μ˜ˆμΈ‘ν•  수 μžˆμŠ΅λ‹ˆλ‹€.

R의 ν•΄λ‹Ή 데이터 맀트릭슀 (μš΄λ™μ˜ 더미 예) :

miss.mat <- matrix (c(5:11, 6:10, NA,12, 7:13, 8:14, 9:12, NA, 14:15, 10:16),ncol=7, byrow = TRUE)
miss.mat 
    [,1] [,2] [,3] [,4] [,5] [,6] [,7]
[1,]    5    6    7    8    9   10   11
[2,]    6    7    8    9   10   NA   12
[3,]    7    8    9   10   11   12   13
[4,]    8    9   10   11   12   13   14
[5,]    9   10   11   12   NA   14   15
[6,]   10   11   12   13   14   15   16

μ°Έκ³  : (1) κ²° μΈ‘κ°’ 의 속성은 μž„μ˜μ  인 κ²ƒμœΌλ‘œ κ°€μ •λ˜λ©° μ–΄λ””μ—μ„œλ‚˜ λ°œμƒν•  수 μžˆμŠ΅λ‹ˆλ‹€.

(2) λͺ¨λ“  데이터 ν¬μΈνŠΈλŠ” 단일 λ³€μˆ˜μ˜ κ°’μ΄μ§€λ§Œ ν•΄λ‹Ή 값은 neighborsμΈμ ‘ν•œ ν–‰ 및 μ—΄μ˜ 영ν–₯μ„λ°›λŠ” κ²ƒμœΌλ‘œ κ°€μ • ν•©λ‹ˆλ‹€. λ”°λΌμ„œ ν–‰λ ¬μ˜ μœ„μΉ˜κ°€ μ€‘μš” ν•˜λ©° λ‹€λ₯Έ λ³€μˆ˜λ‘œ κ°„μ£Ό 될 수 μžˆμŠ΅λ‹ˆλ‹€.

일뢀 μƒν™©μ—μ„œ λ‚˜λŠ” 희망을 κ°€μ§ˆ μˆ˜μžˆλŠ” 일뢀 κ°€μΉ˜ (예 : μ‹€μˆ˜ 일 수 있음)와 μ˜¬λ°”λ₯Έ 편견 (예 : 더미 λ°μ΄ν„°μ—μ„œ μ΄λŸ¬ν•œ 였λ₯˜λ₯Ό 생성 ν•  수 있음)을 μ˜ˆμΈ‘ν•  수 μžˆμŠ΅λ‹ˆλ‹€.

> mat2 <- matrix (c(4:10, 5, 16, 7, 11, 9:11, 6:12, 7:13, 8:14, 9:13, 4,15, 10:11, 2, 13:16),ncol=7, byrow = TRUE)
> mat2

    [,1] [,2] [,3] [,4] [,5] [,6] [,7]
[1,]    4    5    6    7    8    9   10
[2,]    5   16    7   11    9   10   11
[3,]    6    7    8    9   10   11   12
[4,]    7    8    9   10   11   12   13
[5,]    8    9   10   11   12   13   14
[6,]    9   10   11   12   13    4   15
[7,]   10   11    2   13   14   15   16

μœ„μ˜ μ˜ˆλŠ” μ˜ˆμ‹œ 일 뿐이며 (μ‹œκ°μ μœΌλ‘œ λŒ€λ‹΅ ν•  수 있음) μ‹€μ œ μ˜ˆλŠ” 더 ν˜Όλž€ 슀러울 수 μžˆμŠ΅λ‹ˆλ‹€. κ·ΈλŸ¬ν•œ 뢄석을 μˆ˜ν–‰ν•˜λŠ” κ°•λ ₯ν•œ 방법이 μžˆλŠ”μ§€ μ°Ύκ³  μžˆμŠ΅λ‹ˆλ‹€. 이것이 κ°€λŠ₯ν•΄μ•Όν•œλ‹€κ³  μƒκ°ν•©λ‹ˆλ‹€. 이 μœ ν˜•μ˜ 뢄석을 μˆ˜ν–‰ν•˜λŠ” 데 μ ν•©ν•œ 방법은 λ¬΄μ—‡μž…λ‹ˆκΉŒ? 이 μœ ν˜•μ˜ 뢄석을 μˆ˜ν–‰ν•˜λŠ” R ν”„λ‘œκ·Έλž¨ / νŒ¨ν‚€μ§€ μ œμ•ˆ?



λ‹΅λ³€

이 μ§ˆλ¬Έμ€ ν˜„μ§€ν™” 된 특이 치λ₯Ό μ‹λ³„ν•˜κ³  μˆ˜μ • ν•˜κΈ° μœ„ν•΄ κ°€μž₯ κ°€κΉŒμš΄ 이웃 을 κ°•λ ₯ ν•˜κ²Œ μ‚¬μš©ν•˜λŠ” 방법을 λ¬»μŠ΅λ‹ˆλ‹€ . μ™œ κ·Έλ ‡κ²Œν•˜μ§€ μ•ŠμŠ΅λ‹ˆκΉŒ?

μ ˆμ°¨λŠ” κ°•λ ₯ν•œ 둜컬 슀무슀λ₯Ό κ³„μ‚°ν•˜κ³  μž”μ°¨λ₯Ό ν‰κ°€ν•˜κ³  λ„ˆλ¬΄ 큰 값을 μ œκ±°ν•˜λŠ” κ²ƒμž…λ‹ˆλ‹€. 이 κΈ°λŠ₯은 λͺ¨λ“  μš”κ΅¬ 사항을 직접 μΆ©μ‘± μ‹œν‚€λ©° 둜컬 μ΄μ›ƒμ˜ 크기와 특이 치λ₯Ό μ‹λ³„ν•˜κΈ°μœ„ν•œ μž„κ³„ 값을 λ³€κ²½ν•  수 μžˆμœΌλ―€λ‘œ λ‹€λ₯Έ μ‘μš© ν”„λ‘œκ·Έλž¨μ— 맞게 μ‘°μ •ν•  μˆ˜μžˆμ„λ§ŒνΌ μœ μ—°ν•©λ‹ˆλ‹€.

(μœ μ—°μ„±μ΄ μ€‘μš”ν•œ μ΄μœ λŠ” λ¬΄μ—‡μž…λ‹ˆκΉŒ? κ·ΈλŸ¬ν•œ μ ˆμ°¨λŠ” νŠΉμ • μ§€μ—­ν™” 된 행동을 β€œμ™ΈλΆ€μ μΈβ€κ²ƒμœΌλ‘œ 식별 ν•  κ°€λŠ₯성이 λ†’κΈ° λ•Œλ¬Έμ— κ·ΈλŸ¬ν•œ μ ˆμ°¨λŠ” λͺ¨λ‘ λ§€λ„λŸ½κ²Œ κ°„μ£Ό 될 수 μžˆμŠ΅λ‹ˆλ‹€ . μ„ΈλΆ€ 사항을 μœ μ§€ν•˜λŠ” 것과 둜컬 특이 치λ₯Ό νƒμ§€ν•˜μ§€ λͺ»ν•˜λŠ” μ‚¬μ΄μ˜ νŠΈλ ˆμ΄λ“œ μ˜€ν”„λ₯Ό μ•½κ°„ μ œμ–΄ν•΄μ•Όν•©λ‹ˆλ‹€.)

이 절차의 또 λ‹€λ₯Έ μž₯점은 μ‚¬κ°ν˜•μ˜ ν–‰λ ¬ 행렬이 ν•„μš”ν•˜μ§€ μ•Šλ‹€λŠ” κ²ƒμž…λ‹ˆλ‹€. μ‹€μ œλ‘œ μ΄λŸ¬ν•œ 데이터에 μ ν•©ν•œ 둜컬 슀무슀λ₯Ό μ‚¬μš©ν•˜μ—¬ λΆˆκ·œμΉ™ 데이터 에도 적용 ν•  수 μžˆμŠ΅λ‹ˆλ‹€ .

R, 및 λͺ¨λ“  κΈ°λŠ₯을 κ°–μΆ˜ 톡계 νŒ¨ν‚€μ§€λΏλ§Œ μ•„λ‹ˆλΌμ™€ 같은 κ°•λ ₯ν•œ 둜컬 μŠ€λ¬΄λ”κ°€ λ‚΄μž₯λ˜μ–΄ μžˆμŠ΅λ‹ˆλ‹€ loess. λ‹€μŒ μ˜ˆμ œλŠ”μ΄λ₯Ό μ‚¬μš©ν•˜μ—¬ μ²˜λ¦¬λ˜μ—ˆμŠ΅λ‹ˆλ‹€. 이 ν–‰λ ¬μ—λŠ” 개의 ν–‰κ³Ό 개의 μ—΄ 이 있으며 μ•½ ν•­λͺ©μ΄ μžˆμŠ΅λ‹ˆλ‹€. 이것은 μ—¬λŸ¬ 개의 κ·Ήν•œ κ·Ήλ‹¨λΏλ§Œ μ•„λ‹ˆλΌ ꡬ별 ν•  μˆ˜μ—†λŠ” 전체 지점 ( β€œμ£Όλ¦„β€)을 κ°–λŠ” λ³΅μž‘ν•œ κΈ°λŠ₯을 λ‚˜νƒ€λƒ…λ‹ˆλ‹€. β€œoutlyingβ€μœΌλ‘œ κ°„μ£Όλ˜λŠ” λΉ„μœ¨μ˜ 이상을 μ•½κ°„ 초과 ν•˜μ—¬ ν‘œμ€€ νŽΈμ°¨κ°€ 원본 λ°μ΄ν„°μ˜ ν‘œμ€€ 편차의 에 λΆˆκ³Όν•œ κ°€μš°μ‹œμ•ˆ μ˜€μ°¨κ°€ μΆ”κ°€λ˜μ—ˆμŠ΅λ‹ˆλ‹€ . 이 ν•©μ„± 데이터 μ„ΈνŠΈλŠ” μ‹€μ œ λ°μ΄ν„°μ˜ μ—¬λŸ¬ κ°€μ§€ κΉŒλ‹€λ‘œμš΄ κΈ°λŠ₯을 μ œκ³΅ν•©λ‹ˆλ‹€.

79

49

4000

5%

1/20

(λ‹Ή 것을 유의 R맀트릭슀 행은 수직 μŠ€νŠΈλ¦½μœΌλ‘œμ„œ κ·Έλ € κ·œμΉ™). μž”μ°¨λ₯Ό μ œμ™Έν•œ λͺ¨λ“  μ΄λ―Έμ§€λŠ” μ•½κ°„μ˜ μ°¨μ΄κ°€μžˆλŠ” 값을 ν‘œμ‹œν•˜λŠ” 데 λ„μ›€μ΄λ©λ‹ˆλ‹€. 이것이 μ—†μœΌλ©΄ 거의 λͺ¨λ“  μ§€μ—­ 특이 μΉ˜κ°€ 보이지 μ•Šμ„ κ²ƒμž…λ‹ˆλ‹€!

β€œImputed”(κ³ μ •)와 β€œReal”(μ›λž˜μ˜ μ˜€μ—Όλ˜μ§€ μ•Šμ€) 이미지λ₯Ό λΉ„κ΅ν•˜μ—¬ μ΄μƒμΉ˜ (outlier)λ₯Ό μ œκ±°ν•˜λ©΄ μ—μ„œ λ°œμƒν•˜λŠ” μ£Όλ¦„μ˜ 일뢀가 μ „λΆ€λŠ” μ•„λ‹ˆ 을 μ•Œ 수 μžˆμŠ΅λ‹ˆλ‹€. 둜 , 라이트 μ‹œμ•ˆ)λŠ” β€œμž”μ°¨β€ν”Œλ‘― μŠ€νŠΈλΌμ΄ν”„ κ°λ„λ‘œ λͺ…λ°±ν•˜λ‹€.

(0,79)

(49,30)

β€œμž”μ—¬ λ¬Όβ€κ·Έλ¦Όμ˜ 얼룩은 λͺ…λ°±ν•œ 고립 된 μ§€μ—­ 특이 치λ₯Ό λ‚˜νƒ€λƒ…λ‹ˆλ‹€. 이 κ·Έλ¦Όμ—λŠ” κΈ°λ³Έ 데이터에 기인 ν•œ λ‹€λ₯Έ ꡬ쑰 (예 : λŒ€κ°μ„  μ€„λ¬΄λŠ¬)도 ν‘œμ‹œλ©λ‹ˆλ‹€. 지리 톡계적 방법을 톡해 λ°μ΄ν„°μ˜ 곡간 λͺ¨λΈμ„ μ‚¬μš©ν•˜μ—¬μ΄ 절차λ₯Ό κ°œμ„  ν•  수 μžˆμ§€λ§Œ,이λ₯Ό μ„€λͺ…ν•˜κ³  μ„€λͺ…ν•˜λ©΄ 여기에 λ„ˆλ¬΄ λ©€μ–΄ 질 수 μžˆμŠ΅λ‹ˆλ‹€.

BTW,이 μ½”λ“œλŠ” 찾아보고 의 λ„μž… μ΄μƒμΉ˜. 이것은 절차의 μ‹€νŒ¨κ°€ μ•„λ‹™λ‹ˆλ‹€. 특이 μΉ˜κ°€ μ •κ·œ λΆ„ν¬λ‘œ 뢄포 λ˜μ—ˆκΈ° λ•Œλ¬Έμ— κ·Έ 쀑 μ ˆλ°˜μ€ 크기가 이상인 κΈ°λ³Έ κ°’κ³Ό λΉ„κ΅ν•˜μ—¬ 크기 κ°€ 0μ—μ„œ 가깝 κ±°λ‚˜ λ„ˆλ¬΄ μž‘μ•„μ„œ ν‘œλ©΄μ—μ„œ 감지 ν•  μˆ˜μžˆλŠ” λ³€ν™”κ°€ μ—†μ—ˆμŠ΅λ‹ˆλ‹€.

102

200

3

600
#
# Create data.
#
set.seed(17)
rows <- 2:80; cols <- 2:50
y <- outer(rows, cols, 
           function(x,y) 100 * exp((abs(x-y)/50)^(0.9)) * sin(x/10) * cos(y/20))
y.real <- y
#
# Contaminate with iid noise.
#
n.out <- 200
cat(round(100 * n.out / (length(rows)*length(cols)), 2), "% errors\n", sep="")
i.out <- sample.int(length(rows)*length(cols), n.out)
y[i.out] <- y[i.out] + rnorm(n.out, sd=0.05 * sd(y))
#
# Process the data into a data frame for loess.
#
d <- expand.grid(i=1:length(rows), j=1:length(cols))
d$y <- as.vector(y)
#
# Compute the robust local smooth.
# (Adjusting `span` changes the neighborhood size.)
#
fit <- with(d, loess(y ~ i + j, span=min(1/2, 125/(length(rows)*length(cols)))))
#
# Display what happened.
#
require(raster)
show <- function(y, nrows, ncols, hillshade=TRUE, ...) {
  x <- raster(y, xmn=0, xmx=ncols, ymn=0, ymx=nrows)
  crs(x) <- "+proj=lcc +ellps=WGS84"
  if (hillshade) {
    slope <- terrain(x, opt='slope')
    aspect <- terrain(x, opt='aspect')
    hill <- hillShade(slope, aspect, 10, 60)
    plot(hill, col=grey(0:100/100), legend=FALSE, ...)
    alpha <- 0.5; add <- TRUE
  } else {
    alpha <- 1; add <- FALSE
  }
  plot(x, col=rainbow(127, alpha=alpha), add=add, ...)
}

par(mfrow=c(1,4))
show(y, length(rows), length(cols), main="Data")

y.res <- matrix(residuals(fit), nrow=length(rows))
show(y.res, length(rows), length(cols), hillshade=FALSE, main="Residuals")
#hist(y.res, main="Histogram of Residuals", ylab="", xlab="Value")

# Increase the `8` to find fewer local outliers; decrease it to find more.
sigma <- 8 * diff(quantile(y.res, c(1/4, 3/4)))
mu <- median(y.res)
outlier <- abs(y.res - mu) > sigma
cat(sum(outlier), "outliers found.\n")

# Fix up the data (impute the values at the outlying locations).
y.imp <- matrix(predict(fit), nrow=length(rows))
y.imp[outlier] <- y[outlier] - y.res[outlier]

show(y.imp, length(rows), length(cols), main="Imputed")
show(y.real, length(rows), length(cols), main="Real")

λ‹΅λ³€

이 기사λ₯Ό μ‚΄νŽ΄ λ³΄λŠ” 것이 μ’‹μŠ΅λ‹ˆλ‹€ [0]. ν•΄κ²°ν•˜λ €λŠ” λ¬Έμ œλŠ” μ €μžκ°€ μ œμ•ˆν•œ 방법이 NN μž…λ ₯보닀 μ•½κ°„ 더 μ •κ΅ν•˜λ‹€λŠ” 점을 μ œμ™Έν•˜κ³ λŠ” κ·€ν•˜μ˜ μ„€λͺ…에 잘 λ§žλŠ” 것 κ°™μŠ΅λ‹ˆλ‹€ (μ‹œμž‘μ κ³Ό λΉ„μŠ·ν•œ 것을 μ‚¬μš©ν•˜λ”λΌλ„).

( , by 데이터 행렬이 ν‘œμ€€ν™” λ˜μ—ˆλ‹€κ³  κ°€μ •ν•©λ‹ˆλ‹€ . λΆ„μ„μ˜ μ „μ²˜λ¦¬ λ‹¨κ³„μ—μ„œ 각 열이 미친 μ‚¬λžŒμœΌλ‘œ λ‚˜λ‰˜ )

XX

n

p

이 λ°©λ²•μ˜ μ•„μ΄λ””μ–΄λŠ” 랭크 νšλ“ν•˜λŠ” (κ°’ 및 λˆ„λ½ (μ΄λŠ” PCA 성뢄을 μΆ”μ • ν•œμ •λœ 손싀 ν•¨μˆ˜λ₯Ό μ‚¬μš©ν•˜μ—¬ μˆ˜ν–‰λœλ‹€) 특이점의 쑴재 κ°€λŠ₯성에 μ €ν•­ν•˜λŠ” λ°©μ‹μœΌλ‘œ 데이터 맀트릭슀의 κ²¬κ³ ν•œ PCA λΆ„ν•΄ EM μœ ν˜• λŒ€μΉ˜ 방법을 μ‚¬μš©ν•˜μ—¬ μˆ˜ν–‰λ©λ‹ˆλ‹€. μ•„λž˜μ—μ„œ μ„€λͺ…ν•˜λŠ” κ²ƒμ²˜λŸΌ 데이터 μ„ΈνŠΈμ˜ PCA λΆ„ν•΄κ°€ λ°œμƒν•˜λ©΄ λˆ„λ½ 된 μš”μ†Œλ₯Ό μ±„μš°κ³  μ΄λŸ¬ν•œ μΆ”μ •μΉ˜μ— λŒ€ν•œ λΆˆν™•μ‹€μ„±μ„ ν‰κ°€ν•˜λŠ” 것은 맀우 κ°„λ‹¨ν•©λ‹ˆλ‹€.

k

각 반볡의 첫 번째 λ‹¨κ³„λŠ” 데이터 λŒ€μΉ˜ λ‹¨κ³„μž…λ‹ˆλ‹€. 이것은 EM μ•Œκ³ λ¦¬μ¦˜μ—μ„œμ™€ 같이 μˆ˜ν–‰λ©λ‹ˆλ‹€. λˆ„λ½ 된 셀은 μ˜ˆμƒ ν•œ κ°’μœΌλ‘œ μ±„μ›Œμ§‘λ‹ˆλ‹€ (μ΄λŠ” E- 단계).

2 단계 반볡 절차의 두 번째 λΆ€λΆ„μ—μ„œλŠ” 이전 λ‹¨κ³„μ—μ„œ 얻은 증강 데이터에 (κ°•ν•œ) PCAλ₯Ό 맞 μΆ₯λ‹ˆ λ‹€. μ΄λŠ” 의 μŠ€νŽ™νŠΈλŸΌ λΆ„ν•΄ λ₯Ό (μ€‘μ‹¬μ˜ μΆ”μ •μΉ˜), by 직ꡐ ν–‰λ ¬ 및 by λŒ€κ°μ„  ν–‰λ ¬ ( 와 robustified, PCA 기반 M λ‹¨κ³„μ˜ 일쒅이닀).

XX

tt∈Rp

p

k

LL

k

k

DD

k≀p

논문을 μš”μ•½ν•˜λ©΄ λ‹€μŒκ³Ό 같이 μ œμ•ˆν•˜λŠ” 일반적인 μ•Œκ³ λ¦¬μ¦˜μ΄ μžˆμŠ΅λ‹ˆλ‹€.

  • μ„€μ •ν•˜μ‹­μ‹œμ˜€ . λˆ„λ½ 된 μš”μ†Œκ°€ 초기 μΆ”μ •κ°’μœΌλ‘œ μ±„μ›Œμ§€ λŠ” μΆ”μ •κ°’ 을 κ΅¬ν•˜μ‹­μ‹œμ˜€. λˆ„λ½ 된 각 셀에 λŒ€ν•΄ μ΄λŸ¬ν•œ 초기 좔정값은 (μ›λž˜ 데이터 ν–‰λ ¬) 의 λˆ„λ½λ˜μ§€ μ•Šμ€ μš”μ†Œμ˜ ν–‰ λ‹¨μœ„ 및 μ—΄ λ‹¨μœ„ ν‰κ· μ˜ ν‰κ· μž…λ‹ˆλ‹€ .

    l=0

    WW0

    XX
  • 그런 λ‹€μŒ 수렴 될 λ•ŒκΉŒμ§€ μˆ˜ν–‰ν•˜μ‹­μ‹œμ˜€.

    ㅏ. μ—μ„œ κ°•λ ₯ν•œ PCAλ₯Ό μˆ˜ν–‰ν•˜κ³  좔정값을 μ–»μŠ΅λ‹ˆλ‹€

    WWl

    (ttl,LLl,DDl)

    λΉ„. μ„ΈνŠΈ

    l=l+1

    씨. μ‚¬μš©

    YYl=LLlβˆ’1(WWlβˆ’1βˆ’ttlβˆ’1)(LLlβˆ’1)β€²

    λ””. 의 λˆ„λ½ 된 μš”μ†Œλ₯Ό λͺ¨λΈ (EM μ•Œκ³ λ¦¬μ¦˜μ˜ E λ‹¨κ³„μ—μ„œμ™€ 같이) 및 ν•΄λ‹Ή ν•­λͺ©μ— μ˜ν•΄ λˆ„λ½λ˜μ§€ μ•Šμ€ μš”μ†Œ .

    WWl

    WWl∼N(ttlβˆ’1,LLlβˆ’1DDlβˆ’1(LLlβˆ’1)β€²)

    YYl

κ°€ 일뢀 μž„κ³„ 값보닀 μž‘μ„ λ•ŒκΉŒμ§€ (a-> c)λ₯Ό λ°˜λ³΅ν•˜μ‹­μ‹œμ˜€ . μ΅œμ’… λ°˜λ³΅μ—μ„œ 얻은 μΆ”μ • 된 맀개 λ³€μˆ˜μ˜ λ²‘ν„°λŠ” λ©λ‹ˆλ‹€. ( t

||WWlβˆ’1βˆ’WWl||F

(tt,LL,DD)

μ•„μ΄λ””μ–΄λŠ” 각 λ°˜λ³΅μ—μ„œ 데이터 λͺ¨λΈ 이 점점 더 λ©€μ–΄μ§€κ³  μžˆλ‹€λŠ” κ²ƒμž…λ‹ˆλ‹€. μˆœμ§„ν•œ 초기 μΆ”μ •μΉ˜ 및 κ°•λ ₯ν•œ M λ‹¨κ³„λŠ” 특이 μΉ˜κ°€ μ ν•©μΉ˜μ— 영ν–₯을 λ―ΈμΉ˜μ§€ μ•Šλ„λ‘ν•©λ‹ˆλ‹€.

(ttlβˆ’1,LLlβˆ’1DDlβˆ’1)

이 μ ‘κ·Ό 방식은 λ˜ν•œ λŒ€μΉ˜μ˜ ν’ˆμ§ˆμ„ ν™•μΈν•˜κΈ°μœ„ν•œ λ‹€μ–‘ν•œ 진단 도ꡬλ₯Ό μ œκ³΅ν•©λ‹ˆλ‹€. 예λ₯Ό λ“€μ–΄, μ—μ„œ 닀쀑 λ“œλ‘œμš°λ₯Ό 생성 ν•  수 μžˆμ§€λ§Œ μ΄λ²ˆμ—λŠ” λ°μ΄ν„°μ˜ λˆ„λ½λ˜μ§€ μ•Šμ€ μš”μ†Œμ— λŒ€ν•΄ -맀트릭슀λ₯Ό μƒμ„±ν•˜κ³  생성 된 (λ°˜μƒ 수) λ°μ΄ν„°μ˜ 뢄포가 λˆ„λ½λ˜μ§€ μ•Šμ€ 각 μ…€μ˜ κ΄€μ°° 된 κ°’κ³Ό μ–Όλ§ˆλ‚˜ μΌμΉ˜ν•˜λŠ”μ§€ ν™•μΈν•˜μ‹­μ‹œμ˜€.

N(ttlβˆ’1,LLDD(LL)β€²)

이 접근법에 λŒ€ν•œ κΈ°μ„±ν’ˆ R κ΅¬ν˜„μ— λŒ€ν•΄μ„œλŠ” 잘 λͺ¨λ₯΄μ§€λ§Œ ν•˜μœ„ ꡬ성 μš”μ†Œ (주둜 κ°•λ ₯ν•œ PCA μ•Œκ³ λ¦¬μ¦˜)μ—μ„œ μ‰½κ²Œ 생성 ν•  수 있으며 R둜 잘 κ΅¬ν˜„λ©λ‹ˆλ‹€ .rrcov νŒ¨ν‚€μ§€λ₯Ό μ°Έμ‘°ν•˜μ‹­μ‹œμ˜€ (논문은 이 μ£Όμ œμ— λŒ€ν•œ μ‘°μš©ν•œ 정보).

  • Serneels S. and Verdonck, T. (2008). 특이 치 및 λˆ„λ½ 된 μš”μ†Œκ°€ 포함 된 λ°μ΄ν„°μ˜ μ£Όμš” ꡬ성 μš”μ†Œ 뢄석 계산 톡계 및 데이터 뢄석 vol : 52 호 : 3 νŽ˜μ΄μ§€ : 1712-1727.

λ‹΅λ³€