통계 학습 요소의 표 18.1은 14 개의 클래스 데이터 세트에서 여러 분류기의 성능을 요약합니다. 이러한 다중 클래스 분류 문제에 대해 새로운 알고리즘을 올가미 및 탄성 그물과 비교하고 있습니다.
사용 glmnet
버전 1.5.3 (R 2.13.0) I 포인트 제합니다 (재현 할 아니다 에 사용 된 유전자의 수 (269) 및 테스트 오차 것으로보고 테이블에 -penalized 다항식)은 13 밖으로 사용 된 데이터는이 14- 암 마이크로 어레이 데이터 세트 입니다. 내가 시도한 것이 무엇이든, 54에서 16의 테스트 오류가있는 170-180 유전자 근처에서 사용하는 최상의 성능 모델을 얻습니다.
654 페이지의 섹션 18.3의 시작 부분에서 데이터의 일부 전처리가 설명되어 있습니다.
나는 지금까지 응답없이 저자들에게 연락했으며, 누구든지 테이블을 재현하는 데 문제가 있음을 확인하거나 테이블을 재생산하는 방법에 대한 해결책을 제공 할 수 있는지 묻습니다.