๊ธฐ๊ณ ํ์ต์์ ๋ณธ ์ผ๋ถ ์๋ฃ๋ ํ๊ท๋ฅผ ํตํด ๋ถ๋ฅ ๋ฌธ์ ์ ์ ๊ทผํ๋ ๊ฒ์ด ์ข์ง ์๋ค๊ณ ๋งํ์ต๋๋ค. ๊ทธ๋ฌ๋ ๋ฐ์ดํฐ๋ฅผ ๋ง์ถ๊ธฐ ์ํด ์ฐ์ ํ๊ท ๋ถ์์ ์ํํ๊ณ ์ฐ์ ์์ธก์ ์๋ผ ๋ถ์ฐ์ ๋ถ๋ฅ๋ฅผ ์์ฑํ๋ ๊ฒ์ด ํญ์ ๊ฐ๋ฅํ๋ค๊ณ ์๊ฐํฉ๋๋ค. ์ ๋์ ์๊ฐ์ ๋๊น?
๋ต๋ณ
โํ๊ทโ๋ฅผ ํตํ โ .. ์ ๊ทผ ๋ถ๋ฅ ๋ฌธ์ โ . โํ๊ทโ์ ์๋ฏธ ์ ํ ํ๊ท๋ฅผ ์๋ฏธํ๋ค๊ณ ๊ฐ์ ํ๊ณ ์ด ๋ฐฉ๋ฒ์ ๋ก์ง์คํฑ ํ๊ท ๋ชจ๋ธ์ ์ ํฉ ํํ๋ โ๋ถ๋ฅโ๋ฐฉ์๊ณผ ๋น๊ตํฉ๋๋ค.
์ด๋ฅผ ์ํํ๊ธฐ ์ ์ ํ๊ท ๋ชจ๋ธ๊ณผ ๋ถ๋ฅ ๋ชจ๋ธ์ ์ฐจ์ด์ ์ ๋ช ํํํ๋ ๊ฒ์ด ์ค์ํฉ๋๋ค. ํ๊ท ๋ชจ๋ธ์ ๊ฐ์ฐ๋ ๋๋ ํ๋น ๊ฐ๋์ ๊ฐ์ ์ฐ์ ๋ณ์๋ฅผ ์์ธกํฉ๋๋ค. ๋ํ ์ด๋ฏธ์ง์ ๊ณ ์์ด๊ฐ ํฌํจ๋ ํ๋ฅ ๊ณผ ๊ฐ์ ํ๋ฅ ์ ์์ธกํ ์ ์์ต๋๋ค. ํ๋ฅ ์์ธก ํ๊ท ๋ชจ๋ธ์ ๊ฒฐ์ ๊ท์น์ ์ ์ฉํ์ฌ ๋ถ๋ฅ๊ธฐ์ ์ผ๋ถ๋ก ์ฌ์ฉํ ์ ์์ต๋๋ค. ์๋ฅผ ๋ค์ด ํ๋ฅ ์ด 50 % ์ด์์ธ ๊ฒฝ์ฐ ๊ณ ์์ด์ธ์ง ๊ฒฐ์ ํ์ญ์์ค.
๋ก์ง์คํฑ ํ๊ท ๋ถ์์ ํ๋ฅ ์ ์์ธกํ๋ฏ๋ก ํ๊ท ์๊ณ ๋ฆฌ์ฆ์ ๋๋ค. ๊ทธ๋ฌ๋, ์ด๊ฒ์ ์ผ๋ฐ์ ์ผ๋ก ๊ธฐ๊ณ ํ์ต ๋ฌธํ์์ ๋ถ๋ฅ ๋ฐฉ๋ฒ์ผ๋ก ์ค๋ช ๋๋๋ฐ, ๋ถ๋ฅ๊ธฐ๋ฅผ ๋ง๋๋ ๋ฐ ์ฌ์ฉ๋ ์ ์๊ณ ์ข ์ข ์ฌ์ฉ๋๊ธฐ ๋๋ฌธ์ ๋๋ค. ๊ฒฐ๊ณผ ๋ง ์์ธกํ๊ณ ํ๋ฅ ์ ์ ๊ณตํ์ง ์๋ SVM๊ณผ ๊ฐ์ โ์ง์ ํโ๋ถ๋ฅ ์๊ณ ๋ฆฌ์ฆ๋ ์์ต๋๋ค. ์ฌ๊ธฐ์๋ ์ด๋ฐ ์ข ๋ฅ์ ์๊ณ ๋ฆฌ์ฆ์ ๋ํด ๋ ผ์ํ์ง ์์ ๊ฒ์ ๋๋ค.
๋ถ๋ฅ ๋ฌธ์ ์ ๋ํ ์ ํ ๋ ๋ก์ง์คํฑ ํ๊ท
Andrew Ng๊ฐ ์ค๋ช ํ๋ฏ ์ด ์ ํ ํ๊ท๋ฅผ ์ฌ์ฉํ๋ฉด ๋ฐ์ดํฐ๋ฅผ ํตํด ๋คํญ์์ ๋ง์ต๋๋ค. ์๋ฅผ ๋ค์ด ์๋ ์์ ๊ฐ์ด {tumor size, tumor type} ์ํ ์ธํธ๋ฅผ ํตํด ์ง์ ์ ๋ง ์ถฅ๋ ๋ค .
์์ ์ ์ฑ ์ข ์์ ์ ์ป์๊ณ ๋น ์ ์ฑ ์ข ์์ ์ป์๊ณ ๋ น์ ์ ์ ์ฐ๋ฆฌ์ ๊ฐ์ค ์ ๋๋ค. ์์ธกํ๊ธฐ ์ํด ์ฃผ์ด์ง ์ข ์ ํฌ๊ธฐ ์ ๋ํด ๊ฐ ๋ณด๋ค ์ปค์ง๋ฉด ์ ์ฑ ์ข ์์ ์์ธกํ๊ณ ๊ทธ๋ ์ง ์์ผ๋ฉด ์์ฑ์ ์์ธกํ๋ค๊ณ ๋งํ ์ ์์ต๋๋ค.
10
h(x)
x
h(x)
0.5
์ด๋ฐ ์์ผ๋ก ๋ชจ๋ ๋จ์ผ ํธ๋ ์ด๋ ์ธํธ ์ํ์ ์ ํํ๊ฒ ์์ธกํ ์ ์์ง๋ง ์ด์ ์์ ์ ์กฐ๊ธ ๋ณ๊ฒฝํ๊ฒ ์ต๋๋ค.
์ง๊ด์ ์ผ๋ก ํน์ ์๊ณ ๊ฐ๋ณด๋ค ํฐ ๋ชจ๋ ์ข ์์ด ์ ์ฑ์์ ๋ถ๋ช ํ ์ ์ ์์ต๋๋ค. ์ข ์ ํฌ๊ธฐ๊ฐ ํฐ ๋ค๋ฅธ ์ํ์ ์ถ๊ฐํ๊ณ ์ ํ ํ๊ท ๋ถ์์ ๋ค์ ์คํ ํด ๋ณด๊ฒ ์ต๋๋ค.
์ด์ ์ฐ๋ฆฌ์ ์ด ๋ ์ด์ ์๋ํ์ง ์์ต๋๋ค. ์ฌ๋ฐ๋ฅธ ์์ธก์ ๊ณ์ํ๋ ค๋ฉด ๋๋ ๋ค๋ฅธ ๊ฒ์ผ๋ก ๋ณ๊ฒฝํด์ผ ํ์ง๋ง ์๊ณ ๋ฆฌ์ฆ์ ์๋ ๋ฐฉ์์ ์๋๋๋ค.
h(x)>0.5โmalignanth(x)>0.2
์ ์ํ์ด ๋์ฐฉํ ๋๋ง๋ค ๊ฐ์ค์ ๋ณ๊ฒฝํ ์ ์์ต๋๋ค. ๋์ ํ๋ จ ์ธํธ ๋ฐ์ดํฐ๋ฅผ ํตํด ํ์ต ํ ๋ค์ (์ฐ๋ฆฌ๊ฐ ๋ฐฐ์ด ๊ฐ์ค์ ์ฌ์ฉํ์ฌ) ์ด์ ์๋ ๋ณด์ง ๋ชปํ ๋ฐ์ดํฐ๋ฅผ ์ ํํ๊ฒ ์์ธกํด์ผํฉ๋๋ค.
์ด๊ฒ์ด ์ ํ ํ๊ท๊ฐ ๋ถ๋ฅ ๋ฌธ์ ์ ๊ฐ์ฅ ์ ํฉํ์ง ์์ ์ด์ ๋ฅผ ์ค๋ช ํ๊ธฐ๋ฅผ ๋ฐ๋๋๋ค. ๋ํ VI ๋ฅผ๋ณด๊ณ ์ถ์ ์๋ ์์ต๋๋ค . ๋ก์ง์คํฑ ํ๊ท. ์์ด๋์ด๋ฅผ ๋ ์์ธํ ์ค๋ช ํ๋ ml-class.org์ ๋ถ๋ฅ ๋น๋์ค .
ํธ์งํ๋ค
chanceislogic ์ ์ข์ ๋ถ๋ฅ์๊ฐ ๋ฌด์์ ํ ๊ฒ์ธ์ง ๋ฌผ์์ต๋๋ค. ์ด ํน์ ์์์๋ ์๋ง๋ ๋ก์ง์คํฑ ํ๊ท๋ฅผ ์ฌ์ฉํ์ฌ ๋ค์๊ณผ ๊ฐ์ ๊ฐ์ค์ ๋ฐฐ์ธ ์ ์์ต๋๋ค (๋จ์ง ์์ฑ ์ค์ ๋๋ค).
๋ชจ๋ ์ฐธ๊ณ ์ ํ ํ๊ท ์ ๋ก์ง์คํฑ ํ๊ท๋ ๋น์ ์๊ฒ ์ง์ (๋๋ ๊ณ ์ฐจ ๋คํญ์)์ ์ ๊ณตํ์ง๋ง, ๊ทธ ์ ์ ๋ค๋ฅธ ์๋ฏธ๋ฅผ ๊ฐ์ง๊ณ :
h(x) ์ ํ ํ๊ท์ ๋ํ ๋ ์ถ๋ ฅ์ ๋ณด๊ฐํ๊ฑฐ๋ ์ธ์ฝํ์ฌ ๋ณด์ง ๋ชปํ ์ ๊ฐ์ ์์ธกํฉ๋๋ค . ๊ทธ๊ฒ์ ๋จ์ํ ์๋ก์ด ๊ฝ๊ณ ์ซ์๋ฅผ ์ป๋ ๊ฒ๊ณผ ๊ฐ์ผ๋ฉฐ {car size, car age} ๋ฑ์ ๊ธฐ์ดํ ์๋์ฐจ ๊ฐ๊ฒฉ๊ณผ ๊ฐ์ ์์ธก๊ณผ ๊ฐ์ ์์ ์ ๋ ์ ํฉํฉ๋๋ค . x x
h(x) ๋ก์ง์คํฑ ํ๊ท ๋ถ์์ ๋ ๊ฐ โpositiveโํด๋์ค์ ์ํ ํ๋ฅ ์ ์๋ ค์ค๋๋ค . ์ด๊ฒ์ด ํ๊ท ์๊ณ ๋ฆฌ์ฆ์ด๋ผ๊ณ ๋ถ๋ฆฌ๋ ์ด์ ์ ๋๋ค. ์ฐ์์ ์ธ ์, ํ๋ฅ ์ ์ถ์ ํฉ๋๋ค. ๊ทธ๋ฌ๋ ํ๋ฅ ์ ์๊ณ ๊ฐ์ ์ค์ ํ๋ฉด ์ : ๋ถ๋ฅ๊ธฐ๋ฅผ ์ป์ ์ ์์ผ๋ฉฐ ๋๋ถ๋ถ์ ๊ฒฝ์ฐ ๋ก์ง์คํฑ ํ๊ท ๋ชจ๋ธ์ ์ถ๋ ฅ์ผ๋ก ์ํ๋ฉ๋๋ค. ์ด๊ฒ์ ์ค๊ฑฐ๋ฆฌ์ ์ ์ ๋๋ ๊ฒ๊ณผ ๊ฐ์ต๋๋ค. ๋ถ๋ฅ ์ ์์์๋ ๋ชจ๋ ์ ์ ํ ํด๋์ค์ ์ํ๊ณ ์๋ ์ ์ ๋ค๋ฅธ ํด๋์ค์ ์ํฉ๋๋ค. x h(x)>0.5
๊ทธ๋์, ๊ฒฐ๋ก ์ ๋ถ๋ฅ ์๋๋ฆฌ์ค์์ ์ฐ๋ฆฌ๊ฐ ์ฌ์ฉํ๋ ๊ฒ์ ๋๋ค ์์ ํ ๋ค๋ฅธ ์ถ๋ก ๊ณผ ์์ ํ ๋ค๋ฅธ ํ๊ท ์๋๋ฆฌ์ค์ ๋นํด ์๊ณ ๋ฆฌ์ฆ์.
๋ต๋ณ
๋ถ๋ฅ๊ฐ ์ค์ ๋ก ๊ถ๊ทน์ ์ธ ๋ชฉํ ์ธ ์๋ฅผ ์๊ฐํ ์ ์์ต๋๋ค. ๊ฑฐ์ ํญ์ ์ค์ ๋ชฉํ๋ ํ๋ฅ ๊ณผ ๊ฐ์ ์ ํํ ์์ธก์ํ๋ ๊ฒ์ ๋๋ค. ๊ทธ ์ ์ ์์ (๋ฌผ๋ฅ) ํ๊ท๋ ๋น์ ์ ์น๊ตฌ์ ๋๋ค.
๋ต๋ณ
์ ์ฆ๊ฑฐ๋ฅผ ๋ณด์ง ์๊ฒ ์ต๋๊น? ๋ง์ ์ฌ๋๋ค์ด ์ ํ ํ๊ท๊ฐ ๋ถ๋ฅ์ ์ ํฉ ํ์ง ์๋ค๊ณ ์ฃผ์ฅํ์ง๋ง ์ฌ์ ํ ํจ๊ณผ๊ฐ์์ ์ ์์ต๋๋ค. ์ง๊ด์ ์ป๊ธฐ ์ํด scikit-learn์ ๋ถ๋ฅ ์ ๋น๊ต์ ์ ํ ํ๊ท (๋ถ๋ฅ๊ธฐ๋ก ์ฌ์ฉ)๋ฅผ ํฌํจ ์์ผฐ์ต๋๋ค . ๋ค์๊ณผ ๊ฐ์ ์ผ์ด ๋ฐ์ํฉ๋๋ค.
์์ฌ ๊ฒฐ์ ๊ฒฝ๊ณ๋ ๋ค๋ฅธ ๋ถ๋ฅ ์๋ณด๋ค ์ข์ง ๋ง ์ ํ๋๋ ๋์ผํฉ๋๋ค. ์ ํ ์ง์ ๋ฒกํฐ ๋ถ๋ฅ๊ธฐ์ ๋ง์ฐฌ๊ฐ์ง๋ก ํ๊ท ๋ชจ๋ธ์ ํผ์ณ ๊ณต๊ฐ์์ ํด๋์ค๋ฅผ ๋ถ๋ฆฌํ๋ ํ์ดํผ ํ๋ ์ธ์ ์ ๊ณตํฉ๋๋ค.
๋ณด์๋ค์ํผ, ๋ถ๋ฅ ์๋ก ์ ํ ํ๊ท๋ฅผ ์ฌ์ฉํ๋ฉด ํจ๊ณผ๊ฐ ์์ง๋ง ํญ์ ์์ธก์ ๊ต์ฐจ ๊ฒ์ฆํฉ๋๋ค.
๋ ์ฝ๋์ ๊ฒฝ์ฐ ๋ถ๋ฅ๊ธฐ ์ฝ๋๋ ๋ค์๊ณผ ๊ฐ์ต๋๋ค.
class LinearRegressionClassifier():
def __init__(self):
self.reg = LinearRegression()
def fit(self, X, y):
self.reg.fit(X, y)
def predict(self, X):
return np.clip(self.reg.predict(X),0,1)
def decision_function(self, X):
return np.clip(self.reg.predict(X),0,1)
def score(self, X, y):
return accuracy_score(y,np.round(self.predict(X)))
๋ต๋ณ
๋ํ ์ด๋ณ ๋ ๋ถ๋ฅ๋ฅผ ๋์ด์ ๋ถ๋ฅ ์์ ์ ๋ํด ์ด๋ฏธ ์ข์ ๋ต๋ณ์ ํ์ฅํ๋ ค๋ฉด ํ๊ท๋ฅผ ์ฌ์ฉํ์ฌ ํด๋์ค ์ฌ์ด์ ๊ฑฐ๋ฆฌ์ ์์๋ฅผ ๋ถ๊ณผํด์ผํฉ๋๋ค. ์ฆ, ์ฐ๋ฆฌ๋ ๋จ์ง ํด๋์ค์ ๋ผ๋ฒจ์ ์ ํ ๋๋ ํ ๋น ๋ ์ซ์ ๊ฐ์ ๊ท๋ชจ๋ฅผ ๋ณ๊ฒฝํ์ฌ ๋ค๋ฅธ ๊ฒฐ๊ณผ๋ฅผ ์ป์ ์ ์์ต๋๋ค (์๋ฅผ ๋ค์ด ํด๋์ค ํ์ ๋ฑ ๋ ) ๋ถ๋ฅ ๋ฌธ์ ์ ๋ชฉ์ ์ ๋ฌดํจํํฉ๋๋ค.
1,10,100,...1,2,3,...