카테고리 보관물: stats

stats

딥 러닝은 어디서 그리고 왜 빛을 발합니까? 방금 데이터에서 패턴을

요즘 모든 미디어가 딥 러닝에 대해 이야기하고 과대 광고를하면서 몇 가지 기본적인 내용을 읽었습니다. 방금 데이터에서 패턴을 배우는 것이 또 다른 기계 학습 방법이라는 것을 알았습니다. 그러나 내 질문은 :이 방법은 어디에서 왜 빛나는가? 왜 모든 얘기를 지금하는거야? 즉 소란은 무엇입니까?



답변

주요 취지 혜택 :

(1) 비선형 학습 문제에 대한 기능을 수동으로 엔지니어링 할 필요가 없습니다 (일부 엔지니어는 단기 반창고로 볼 수 있기 때문에 시간을 절약하고 향후 확장 가능)

(2) 학습 된 기능은 때로는 수작업으로 제작 된 최고의 기능보다 낫고 너무 복잡하여 (컴퓨터 비전 (예 : 얼굴 모양의 기능)) 엔지니어링하는 데 너무 많은 시간이 걸릴 수 있습니다.

(3) 레이블이없는 데이터를 사용하여 네트워크를 사전 훈련시킬 수 있습니다. 레이블이없는 1000000 개의 이미지와 1000 개의 레이블이있는 이미지가 있다고 가정합니다. 이제 딥 러닝을 사용하여 레이블이없는 1000000 개의 이미지를 사전 학습함으로써지도 학습 알고리즘을 획기적으로 개선 할 수 있습니다. 또한 일부 도메인에는 레이블이없는 데이터가 너무 많지만 레이블이 지정된 데이터를 찾기가 어렵습니다. 이 레이블이없는 데이터를 사용하여 분류를 개선 할 수있는 알고리즘이 중요합니다.

(4) 경험적으로, 딥 러닝 방법이 도입 될 때까지 점진적으로 개선 된 많은 벤치 마크를 습격했습니다.

(5) 동일한 알고리즘이 원시 (아마도 사전 처리) 입력이있는 여러 영역에서 작동합니다.

(6) 더 많은 데이터가 네트워크에 공급됨에 따라 계속 개선됩니다 (정적 분포 가정 등).


답변

위의 내용 외에도 또 다른 중요한 점은 (단지 의견으로 추가하기에 충분한 담당자가 없습니다) 생성 모델 (적어도 딥 네트)에서 배운 분포에서 샘플링 할 수 있다는 것입니다. 학습 된 클래스 / 클러스터에 해당하는 합성 데이터를 생성하려는 특정 애플리케이션에서 몇 가지 주요 이점이 있습니다.


답변