κΈ°κ³ νμ΅μμ λ³Έ μΌλΆ μλ£λ νκ·λ₯Ό ν΅ν΄ λΆλ₯ λ¬Έμ μ μ κ·Όνλ κ²μ΄ μ’μ§ μλ€κ³ λ§νμ΅λλ€. κ·Έλ¬λ λ°μ΄ν°λ₯Ό λ§μΆκΈ° μν΄ μ°μ νκ· λΆμμ μννκ³ μ°μ μμΈ‘μ μλΌ λΆμ°μ λΆλ₯λ₯Ό μμ±νλ κ²μ΄ νμ κ°λ₯νλ€κ³ μκ°ν©λλ€. μ λμ μκ°μ λκΉ?
λ΅λ³
βνκ·βλ₯Ό ν΅ν β .. μ κ·Ό λΆλ₯ λ¬Έμ β . βνκ·βμ μλ―Έ μ ν νκ·λ₯Ό μλ―Ένλ€κ³ κ°μ νκ³ μ΄ λ°©λ²μ λ‘μ§μ€ν± νκ· λͺ¨λΈμ μ ν© ννλ βλΆλ₯βλ°©μκ³Ό λΉκ΅ν©λλ€.
μ΄λ₯Ό μννκΈ° μ μ νκ· λͺ¨λΈκ³Ό λΆλ₯ λͺ¨λΈμ μ°¨μ΄μ μ λͺ νννλ κ²μ΄ μ€μν©λλ€. νκ· λͺ¨λΈμ κ°μ°λ λλ νλΉ κ°λμ κ°μ μ°μ λ³μλ₯Ό μμΈ‘ν©λλ€. λν μ΄λ―Έμ§μ κ³ μμ΄κ° ν¬ν¨λ νλ₯ κ³Ό κ°μ νλ₯ μ μμΈ‘ν μ μμ΅λλ€. νλ₯ μμΈ‘ νκ· λͺ¨λΈμ κ²°μ κ·μΉμ μ μ©νμ¬ λΆλ₯κΈ°μ μΌλΆλ‘ μ¬μ©ν μ μμ΅λλ€. μλ₯Ό λ€μ΄ νλ₯ μ΄ 50 % μ΄μμΈ κ²½μ° κ³ μμ΄μΈμ§ κ²°μ νμμμ€.
λ‘μ§μ€ν± νκ· λΆμμ νλ₯ μ μμΈ‘νλ―λ‘ νκ· μκ³ λ¦¬μ¦μ λλ€. κ·Έλ¬λ, μ΄κ²μ μΌλ°μ μΌλ‘ κΈ°κ³ νμ΅ λ¬Ένμμ λΆλ₯ λ°©λ²μΌλ‘ μ€λͺ λλλ°, λΆλ₯κΈ°λ₯Ό λ§λλ λ° μ¬μ©λ μ μκ³ μ’ μ’ μ¬μ©λκΈ° λλ¬Έμ λλ€. κ²°κ³Ό λ§ μμΈ‘νκ³ νλ₯ μ μ 곡νμ§ μλ SVMκ³Ό κ°μ βμ§μ νβλΆλ₯ μκ³ λ¦¬μ¦λ μμ΅λλ€. μ¬κΈ°μλ μ΄λ° μ’ λ₯μ μκ³ λ¦¬μ¦μ λν΄ λ Όμνμ§ μμ κ²μ λλ€.
λΆλ₯ λ¬Έμ μ λν μ ν λ λ‘μ§μ€ν± νκ·
Andrew Ngκ° μ€λͺ νλ― μ΄ μ ν νκ·λ₯Ό μ¬μ©νλ©΄ λ°μ΄ν°λ₯Ό ν΅ν΄ λ€νμμ λ§μ΅λλ€. μλ₯Ό λ€μ΄ μλ μμ κ°μ΄ {tumor size, tumor type} μν μΈνΈλ₯Ό ν΅ν΄ μ§μ μ λ§ μΆ₯λ λ€ .
μμ μ μ± μ’ μμ μ μ»μκ³ λΉ μ μ± μ’ μμ μ»μκ³ λ Ήμ μ μ μ°λ¦¬μ κ°μ€ μ λλ€. μμΈ‘νκΈ° μν΄ μ£Όμ΄μ§ μ’ μ ν¬κΈ° μ λν΄ κ° λ³΄λ€ μ»€μ§λ©΄ μ μ± μ’ μμ μμΈ‘νκ³ κ·Έλ μ§ μμΌλ©΄ μμ±μ μμΈ‘νλ€κ³ λ§ν μ μμ΅λλ€.
10
h(x)
x
h(x)
0.5
μ΄λ° μμΌλ‘ λͺ¨λ λ¨μΌ νΈλ μ΄λ μΈνΈ μνμ μ ννκ² μμΈ‘ν μ μμ§λ§ μ΄μ μμ μ μ‘°κΈ λ³κ²½νκ² μ΅λλ€.
μ§κ΄μ μΌλ‘ νΉμ μκ³ κ°λ³΄λ€ ν° λͺ¨λ μ’ μμ΄ μ μ±μμ λΆλͺ ν μ μ μμ΅λλ€. μ’ μ ν¬κΈ°κ° ν° λ€λ₯Έ μνμ μΆκ°νκ³ μ ν νκ· λΆμμ λ€μ μ€ν ν΄ λ³΄κ² μ΅λλ€.
μ΄μ μ°λ¦¬μ μ΄ λ μ΄μ μλνμ§ μμ΅λλ€. μ¬λ°λ₯Έ μμΈ‘μ κ³μνλ €λ©΄ λλ λ€λ₯Έ κ²μΌλ‘ λ³κ²½ν΄μΌ νμ§λ§ μκ³ λ¦¬μ¦μ μλ λ°©μμ μλλλ€.
h(x)>0.5βmalignanth(x)>0.2
μ μνμ΄ λμ°©ν λλ§λ€ κ°μ€μ λ³κ²½ν μ μμ΅λλ€. λμ νλ ¨ μΈνΈ λ°μ΄ν°λ₯Ό ν΅ν΄ νμ΅ ν λ€μ (μ°λ¦¬κ° λ°°μ΄ κ°μ€μ μ¬μ©νμ¬) μ΄μ μλ λ³΄μ§ λͺ»ν λ°μ΄ν°λ₯Ό μ ννκ² μμΈ‘ν΄μΌν©λλ€.
μ΄κ²μ΄ μ ν νκ·κ° λΆλ₯ λ¬Έμ μ κ°μ₯ μ ν©νμ§ μμ μ΄μ λ₯Ό μ€λͺ νκΈ°λ₯Ό λ°λλλ€. λν VI λ₯Όλ³΄κ³ μΆμ μλ μμ΅λλ€ . λ‘μ§μ€ν± νκ·. μμ΄λμ΄λ₯Ό λ μμΈν μ€λͺ νλ ml-class.orgμ λΆλ₯ λΉλμ€ .
νΈμ§νλ€
chanceislogic μ μ’μ λΆλ₯μκ° λ¬΄μμ ν κ²μΈμ§ λ¬Όμμ΅λλ€. μ΄ νΉμ μμμλ μλ§λ λ‘μ§μ€ν± νκ·λ₯Ό μ¬μ©νμ¬ λ€μκ³Ό κ°μ κ°μ€μ λ°°μΈ μ μμ΅λλ€ (λ¨μ§ μμ± μ€μ λλ€).
λͺ¨λ μ°Έκ³ μ ν νκ· μ λ‘μ§μ€ν± νκ·λ λΉμ μκ² μ§μ (λλ κ³ μ°¨ λ€νμ)μ μ 곡νμ§λ§, κ·Έ μ μ λ€λ₯Έ μλ―Έλ₯Ό κ°μ§κ³ :
h(x) μ ν νκ·μ λν λ μΆλ ₯μ 보κ°νκ±°λ μΈμ½νμ¬ λ³΄μ§ λͺ»ν μ κ°μ μμΈ‘ν©λλ€ . κ·Έκ²μ λ¨μν μλ‘μ΄ κ½κ³ μ«μλ₯Ό μ»λ κ²κ³Ό κ°μΌλ©° {car size, car age} λ±μ κΈ°μ΄ν μλμ°¨ κ°κ²©κ³Ό κ°μ μμΈ‘κ³Ό κ°μ μμ μ λ μ ν©ν©λλ€ . x x
h(x) λ‘μ§μ€ν± νκ· λΆμμ λ κ° βpositiveβν΄λμ€μ μν νλ₯ μ μλ €μ€λλ€ . μ΄κ²μ΄ νκ· μκ³ λ¦¬μ¦μ΄λΌκ³ λΆλ¦¬λ μ΄μ μ λλ€. μ°μμ μΈ μ, νλ₯ μ μΆμ ν©λλ€. κ·Έλ¬λ νλ₯ μ μκ³ κ°μ μ€μ νλ©΄ μ : λΆλ₯κΈ°λ₯Ό μ»μ μ μμΌλ©° λλΆλΆμ κ²½μ° λ‘μ§μ€ν± νκ· λͺ¨λΈμ μΆλ ₯μΌλ‘ μνλ©λλ€. μ΄κ²μ μ€κ±°λ¦¬μ μ μ λλ κ²κ³Ό κ°μ΅λλ€. λΆλ₯ μ μμμλ λͺ¨λ μ μ ν ν΄λμ€μ μνκ³ μλ μ μ λ€λ₯Έ ν΄λμ€μ μν©λλ€. x h(x)>0.5
κ·Έλμ, κ²°λ‘ μ λΆλ₯ μλ리μ€μμ μ°λ¦¬κ° μ¬μ©νλ κ²μ λλ€ μμ ν λ€λ₯Έ μΆλ‘ κ³Ό μμ ν λ€λ₯Έ νκ· μλ리μ€μ λΉν΄ μκ³ λ¦¬μ¦μ.
λ΅λ³
λΆλ₯κ° μ€μ λ‘ κΆκ·Ήμ μΈ λͺ©ν μΈ μλ₯Ό μκ°ν μ μμ΅λλ€. κ±°μ νμ μ€μ λͺ©νλ νλ₯ κ³Ό κ°μ μ νν μμΈ‘μνλ κ²μ λλ€. κ·Έ μ μ μμ (λ¬Όλ₯) νκ·λ λΉμ μ μΉκ΅¬μ λλ€.
λ΅λ³
μ μ¦κ±°λ₯Ό λ³΄μ§ μκ² μ΅λκΉ? λ§μ μ¬λλ€μ΄ μ ν νκ·κ° λΆλ₯μ μ ν© νμ§ μλ€κ³ μ£Όμ₯νμ§λ§ μ¬μ ν ν¨κ³Όκ°μμ μ μμ΅λλ€. μ§κ΄μ μ»κΈ° μν΄ scikit-learnμ λΆλ₯ μ λΉκ΅μ μ ν νκ· (λΆλ₯κΈ°λ‘ μ¬μ©)λ₯Ό ν¬ν¨ μμΌ°μ΅λλ€ . λ€μκ³Ό κ°μ μΌμ΄ λ°μν©λλ€.
μμ¬ κ²°μ κ²½κ³λ λ€λ₯Έ λΆλ₯ μλ³΄λ€ μ’μ§ λ§ μ νλλ λμΌν©λλ€. μ ν μ§μ λ²‘ν° λΆλ₯κΈ°μ λ§μ°¬κ°μ§λ‘ νκ· λͺ¨λΈμ νΌμ³ 곡κ°μμ ν΄λμ€λ₯Ό λΆλ¦¬νλ νμ΄νΌ νλ μΈμ μ 곡ν©λλ€.
보μλ€μνΌ, λΆλ₯ μλ‘ μ ν νκ·λ₯Ό μ¬μ©νλ©΄ ν¨κ³Όκ° μμ§λ§ νμ μμΈ‘μ κ΅μ°¨ κ²μ¦ν©λλ€.
λ μ½λμ κ²½μ° λΆλ₯κΈ° μ½λλ λ€μκ³Ό κ°μ΅λλ€.
class LinearRegressionClassifier():
def __init__(self):
self.reg = LinearRegression()
def fit(self, X, y):
self.reg.fit(X, y)
def predict(self, X):
return np.clip(self.reg.predict(X),0,1)
def decision_function(self, X):
return np.clip(self.reg.predict(X),0,1)
def score(self, X, y):
return accuracy_score(y,np.round(self.predict(X)))
λ΅λ³
λν μ΄λ³ λ λΆλ₯λ₯Ό λμ΄μ λΆλ₯ μμ μ λν΄ μ΄λ―Έ μ’μ λ΅λ³μ νμ₯νλ €λ©΄ νκ·λ₯Ό μ¬μ©νμ¬ ν΄λμ€ μ¬μ΄μ 거리μ μμλ₯Ό λΆκ³Όν΄μΌν©λλ€. μ¦, μ°λ¦¬λ λ¨μ§ ν΄λμ€μ λΌλ²¨μ μ ν λλ ν λΉ λ μ«μ κ°μ κ·λͺ¨λ₯Ό λ³κ²½νμ¬ λ€λ₯Έ κ²°κ³Όλ₯Ό μ»μ μ μμ΅λλ€ (μλ₯Ό λ€μ΄ ν΄λμ€ νμ λ± λ ) λΆλ₯ λ¬Έμ μ λͺ©μ μ 무ν¨νν©λλ€.
1,10,100,...1,2,3,...