딥 러닝 및 의사 결정 트리 및 부스팅 방법 GentleBoost 와 같은

나는 경험적으로나 이론적으로 비교하고 토론하는 논문이나 텍스트를 찾고 있습니다.

보다 구체적으로, 속도, 정확성 또는 수렴 측면에서이 두 가지 ML 방법 블록을 논의하거나 비교하는 텍스트를 아는 사람이 있습니까? 또한 두 번째 블록의 모델 또는 방법의 차이점 (예 : 장단점)을 설명하거나 요약하는 텍스트를 찾고 있습니다.

그러한 비교를 직접 다루는 모든 포인터 나 답변은 크게 감사하겠습니다.



답변

보고있는 데이터 유형에 대해 더 구체적으로 설명 할 수 있습니까? 이것은 부분적으로 어떤 유형의 알고리즘이 가장 빠르게 수렴되는지를 결정합니다.

부스팅은 실제로 메서드 모음 일 뿐이므로 부스팅 및 DL과 같은 방법을 비교하는 방법을 잘 모르겠습니다. 증폭과 함께 사용하는 다른 알고리즘은 무엇입니까?

일반적으로, DL 기술은 인코더 / 디코더의 계층으로서 기술 될 수있다. 비지도 사전 훈련은 먼저 신호를 인코딩하고 신호를 해독 한 다음 재구성 오류를 측정하여 각 레이어를 사전 훈련합니다. 그런 다음 튜닝을 사용하여 더 나은 성능을 얻을 수 있습니다 (예 : 쌓인 자동 인코더를 잡음 제거하는 경우 역 전파를 사용할 수 있음).

DL 이론의 좋은 출발점은 다음과 같습니다.

http://citeseerx.ist.psu.edu/viewdoc/download?doi=10.1.1.73.795&rep=rep1&type=pdf

뿐만 아니라

http://portal.acm.org/citation.cfm?id=1756025

(죄송합니다. 스팸 필터링 시스템으로 인해 마지막 링크를 삭제해야했습니다)

RBM에 대한 정보는 포함하지 않았지만 밀접하게 관련되어 있습니다 (처음에는 개인적으로 이해하기가 조금 더 어렵습니다).


답변

좋은 질문입니다! 적응 형 부스팅과 딥 러닝은 모두 확률 적 학습 네트워크로 분류 될 수 있습니다. 차이점은 “딥 러닝”에는 구체적으로 하나 이상의 “신경망”이 포함되는 반면 “부스팅”은 “무엇”이 될 수있는 약한 학습자라고하는 하나 이상의 학습 네트워크를 필요로하는 “메타 학습 알고리즘”입니다. 신경망, 의사 결정 트리 등). 부스팅 알고리즘은 하나 이상의 약한 학습자 네트워크를 사용하여 소위 “강한 학습자”를 형성하여 전체 학습 네트워크 결과 (예 : Microsoft의 Viola 및 Jones Face Detector, OpenCV)를 크게 “증가”시킬 수 있습니다.