빅분기 8회 시험 제2유형 관련 문의 올립니다.
교수님, 저는 교수님 강의를 듣고 이번에 8회 빅분기에 도전했습니다.
제2유형을 R로 knn 알고리즘을 이용해서 풀었는데 괜찮을지 모르겠습니다.
lm, rpart 알고리즘을 사용해서 돌려본 결과 MAE가 400 이상으로 높게 나왔고,
knn으로 돌려보니 300대 초반으로 나와서 knn으로 예측하고 결과값을 제출했습니다.
코딩은 아래와 같이 했는데 망친 것일까요?
colSums(is.na(train)) ; colSums(is.na(test)) # 모두 결측값은 없었습니다.
train<-train%>%select(-name) # name은 예측값에 영향을 주지 않을 것 같아 제외했습니다.
control<-trainControl(method='cv', number=10)
model_knn <-train(people_number~., data=train, method='knn',
preProcess=c('center', 'scale', 'nzv'), metric='MAE', trControl=control)
pred_knn<-predict(model_knn, test)
head(pred_knn) ; NROW(pred_knn) # 예측 데이터 갯수는 test와 동일
test$pred<-pred_knn
result<-test%>%select(pred) ; head(result) # 확인된 값은 소수점 2자리까지 나왔습니다.
write.csv(result, 'result.csv', row.names=FALSE)
50대 초보자가 걱정스러운 마음에 교수님의 평가를 부탁드립니다.
댓글
정말 고생 많으셨어요!
제가 보기엔 35점~40점 득점 충분히 가능하세요
그리고 대단하세요~
교수님, 감사합니다.
여러 사람들이 name 변수를 제외한 것이 좀 문제될 수 있다고들 하고 있어 걱정이 있습니다만
교수님의 말씀에 감사할 따름입니다. 이번에 합격한다면 모든 것이 교수님의 덕택입니다.
항상 건강 유의하시고 좋은 밤되세요. 다시한번 감사드립니다.
댓글을 남기려면 로그인하세요.