답변함
빅분기 실기2유형 꼭 답변부탁합니다(교재 271, 292, 293, 296 관련)
빅분기 실기2유형 꼭 답변부탁합니다.
- 1. 교재 271페이지에서는 preProcess 들어간 train(Segmentattion~., data=train 을 사용하고, 같은 방법으로 시행하는 292, 293, 296페이지는 train(목표변수~., data=train이아닌 통합된(train, test이 모두 있는) 데이터셋을 사용하는데 왜 train 데이터셋을 사용하지 않은지요?
그 차이가 무엇인가요? 이해가 안되어서 너무 답답해요. 자세히 알려주시면 감사하겠습니다.
- 4분류하는 교재 271페이지 문제를 recipe로 전처리 하면, train(Segmentattion~., 문장애서 preProcess를 안하는 거랑 동일한 결과가 나오는 거 맞지요?
- 회귀모형인 289페이지에서 method=“lm” 대신 method=“rpart” 또는 method=“knn”을 해도 동일한 결과가 나오는 거 맞지요?
0
댓글
안녕하세요.
이패스비즈 ADsP / 빅데이터분석기사 강사 김계철 입니다.
답변 드립니다.!
1.교재 271페이지에서는 preProcess 들어간 train(Segmentattion~., data=train 을 사용하고, 같은 방법으로 시행하는 292, 293, 296페이지는 train(목표변수~., data=train이아닌 통합된(train, test이 모두 있는) 데이터셋을 사용하는데 왜 train 데이터셋을 사용하지 않은지요?
답변) 292, 293, 296페이지는 knn 알고리즘을 설명하기 위한 부분입니다. 그래서 별도로 train/test 분리하지 않고 실행을 했습니다.
2.교재 271페이지 문제를 recipe로 전처리 하면, train(Segmentattion~., 문장애서 preProcess를 안하는 거랑 동일한 결과가 나오는 거 맞지요?
답변) 맞습니다. 가능하면 caret 패키지 활용을 추천합니다.
3. 289페이지에서 method=“lm” 대신 method=“rpart” 또는 method=“knn”을 해도 동일한 결과가 나오는 거 맞지요?
답변) 알고리즘 마다 성능 지표는 차이가 발생할 수 있습니다. 따라서 주로 사용하는 분류 또는 회귀 알고리즘 하나씩 반복해서 연습하도록 합니다. 물론 어떤 알고리즘을 선택하든 시험에서 요구하는 평가지표는 충족할수 있습니다.
감사합니다.
댓글을 남기려면 로그인하세요.