답변함

빅분기 실기2유형 꼭 답변부탁합니다(교재 271, 292, 293, 296 관련)

leehanbit0324

2023년 06월 11일 07:46

빅분기 실기2유형 꼭 답변부탁합니다.

1. 교재 271페이지에서는 preProcess 들어간 train(Segmentattion~., data=train 을 사용하고, 같은 방법으로 시행하는 292, 293, 296페이지는 train(목표변수~., data=train이아닌 통합된(train, test이 모두 있는) 데이터셋을 사용하는데 왜 train 데이터셋을 사용하지 않은지요?

그 차이가 무엇인가요? 이해가 안되어서 너무 답답해요. 자세히 알려주시면 감사하겠습니다.

4분류하는 교재 271페이지 문제를 recipe로 전처리 하면, train(Segmentattion~., 문장애서 preProcess를 안하는 거랑 동일한 결과가 나오는 거 맞지요?

회귀모형인 289페이지에서 method=“lm” 대신 method=“rpart” 또는 method=“knn”을 해도 동일한 결과가 나오는 거 맞지요?

댓글 1개

emhu8640
2023년 06월 11일 11:19

교수님

안녕하세요.

이패스비즈 ADsP / 빅데이터분석기사 강사 김계철 입니다.

답변 드립니다.!

1.교재 271페이지에서는 preProcess 들어간 train(Segmentattion~., data=train 을 사용하고, 같은 방법으로 시행하는 292, 293, 296페이지는 train(목표변수~., data=train이아닌 통합된(train, test이 모두 있는) 데이터셋을 사용하는데 왜 train 데이터셋을 사용하지 않은지요?

답변) 292, 293, 296페이지는 knn 알고리즘을 설명하기 위한 부분입니다. 그래서 별도로 train/test 분리하지 않고 실행을 했습니다.

2.교재 271페이지 문제를 recipe로 전처리 하면, train(Segmentattion~., 문장애서 preProcess를 안하는 거랑 동일한 결과가 나오는 거 맞지요?

답변) 맞습니다. 가능하면 caret 패키지 활용을 추천합니다.

3. 289페이지에서 method=“lm” 대신 method=“rpart” 또는 method=“knn”을 해도 동일한 결과가 나오는 거 맞지요?

답변) 알고리즘 마다 성능 지표는 차이가 발생할 수 있습니다. 따라서 주로 사용하는 분류 또는 회귀 알고리즘 하나씩 반복해서 연습하도록 합니다. 물론 어떤 알고리즘을 선택하든 시험에서 요구하는 평가지표는 충족할수 있습니다.

감사합니다.

0

댓글을 남기려면 로그인하세요.

원하는 것을 찾지 못하셨나요?