답변함

빅분기 실기2유형 꼭 답변부탁합니다(교재 271, 292, 293, 296 관련)

빅분기 실기2유형 꼭 답변부탁합니다.

 

  • 1. 교재 271페이지에서는 preProcess 들어간 train(Segmentattion~., data=train 을 사용하고, 같은 방법으로 시행하는 292, 293, 296페이지는 train(목표변수~., data=train이아닌 통합된(train, test이 모두 있는) 데이터셋을 사용하는데 왜 train 데이터셋을 사용하지 않은지요?

그 차이가 무엇인가요? 이해가 안되어서 너무 답답해요. 자세히 알려주시면 감사하겠습니다.

  1. 4분류하는 교재 271페이지 문제를 recipe로 전처리 하면, train(Segmentattion~., 문장애서 preProcess를 안하는 거랑 동일한 결과가 나오는 거 맞지요?
  1. 회귀모형인 289페이지에서 method=“lm” 대신 method=“rpart” 또는 method=“knn”을 해도 동일한 결과가 나오는 거 맞지요?
0

댓글

댓글 1개
날짜 투표수
  • 안녕하세요.

    이패스비즈 ADsP / 빅데이터분석기사 강사 김계철 입니다.

     

    답변 드립니다.!

    1.교재 271페이지에서는 preProcess 들어간 train(Segmentattion~., data=train 을 사용하고, 같은 방법으로 시행하는 292, 293, 296페이지는 train(목표변수~., data=train이아닌 통합된(train, test이 모두 있는) 데이터셋을 사용하는데 왜 train 데이터셋을 사용하지 않은지요?

    답변)  292, 293, 296페이지는  knn 알고리즘을 설명하기 위한 부분입니다. 그래서 별도로 train/test 분리하지 않고 실행을 했습니다. 

    2.교재 271페이지 문제를 recipe로 전처리 하면, train(Segmentattion~., 문장애서 preProcess를 안하는 거랑 동일한 결과가 나오는 거 맞지요?

    답변) 맞습니다. 가능하면 caret 패키지 활용을 추천합니다.

    3. 289페이지에서 method=“lm” 대신 method=“rpart” 또는 method=“knn”을 해도 동일한 결과가 나오는 거 맞지요?

    답변) 알고리즘 마다 성능 지표는 차이가 발생할 수 있습니다. 따라서 주로 사용하는 분류 또는 회귀 알고리즘 하나씩 반복해서 연습하도록 합니다. 물론 어떤 알고리즘을 선택하든 시험에서 요구하는 평가지표는 충족할수 있습니다.

     

    감사합니다.

    0

댓글을 남기려면 로그인하세요.

 

원하는 것을 찾지 못하셨나요?

질문하기