답변함 빅데이터분석기사 실기강의 p267 질문드립니다. kyh6423 2022년 11월 21일 11:49 공유 안녕하세요 빅데이터분석기사 실기강의 p267 질문드립니다. 해당 문제에서는 train 데이터는 중심화, 척도화를 진행하였는데 test 데이터는 이러한 과정이 빠져있어서 같은 과정을 거치지 않아도 되는지 궁금합니다. 그 이전까지 문제에서는 test데이터도 recipes 패키지를 통해 중심화, 척도화를 진행하는걸로 나와있어서요,, 0 댓글 댓글 1개 정렬 기준 날짜 투표수 emhu8640 2022년 11월 21일 13:53 교수님 안녕하십니까. 이패스비즈 ADsP / 빅데이터분석기사 강사 김계철 입니다. 문의하신 질문에 답변드립니다. test data에도 스케일링해주는것 맞습니다. 목표변수를 제외하고 전체를 스케일링(레시피) 또는 캐럿패키지를 통해 train/test 별도로 진행방법으로 할 수 있습니다. 하지만 제가 강의시간에 말씀드려듯이 빅분기 실기 데이터셋이 특징이 명확하게 구분되어 있는 데이터셋입니다. train data set만 스케일링 후 모형 구축하고 스케일링 변환 처리 안한 test로 예측을 해도 만점 득점이 가능한 실제 사례라 말씀드릴수 있습니다. 0 댓글을 남기려면 로그인하세요. 원하는 것을 찾지 못하셨나요? 질문하기
댓글
안녕하십니까.
이패스비즈 ADsP / 빅데이터분석기사 강사 김계철 입니다.
문의하신 질문에 답변드립니다.
test data에도 스케일링해주는것 맞습니다. 목표변수를 제외하고 전체를 스케일링(레시피) 또는
캐럿패키지를 통해 train/test 별도로 진행방법으로 할 수 있습니다.
하지만 제가 강의시간에 말씀드려듯이 빅분기 실기 데이터셋이 특징이 명확하게 구분되어 있는
데이터셋입니다. train data set만 스케일링 후 모형 구축하고 스케일링 변환 처리 안한 test로 예측을
해도 만점 득점이 가능한 실제 사례라 말씀드릴수 있습니다.
댓글을 남기려면 로그인하세요.