답변함

빅데이터분석기사 실기강의 p267 질문드립니다.

안녕하세요 

빅데이터분석기사 실기강의 p267 질문드립니다.

해당 문제에서는 train 데이터는 중심화, 척도화를 진행하였는데

test 데이터는 이러한 과정이 빠져있어서 

같은 과정을 거치지 않아도 되는지 궁금합니다.

그 이전까지 문제에서는 test데이터도 recipes 패키지를 통해

중심화, 척도화를 진행하는걸로 나와있어서요,,

 

 

0

댓글

댓글 1개
날짜 투표수
  • 안녕하십니까.

    이패스비즈 ADsP / 빅데이터분석기사 강사 김계철 입니다.

    문의하신 질문에 답변드립니다.

    test data에도 스케일링해주는것 맞습니다.  목표변수를 제외하고 전체를 스케일링(레시피) 또는 

    캐럿패키지를 통해  train/test 별도로 진행방법으로 할 수 있습니다.

    하지만 제가 강의시간에 말씀드려듯이 빅분기 실기 데이터셋이 특징이 명확하게 구분되어 있는

    데이터셋입니다.  train data set만 스케일링 후 모형 구축하고 스케일링 변환 처리 안한 test로 예측을

    해도 만점 득점이 가능한 실제 사례라 말씀드릴수 있습니다.  

    0

댓글을 남기려면 로그인하세요.

 

원하는 것을 찾지 못하셨나요?

질문하기