답변함

빅데이터 분석기사 김계철 교수님 (p277~)

책에 p277 예상문제에서 문제만 보고, p279 처럼 필요한 요소와 불필요한 요소를 구분하는 기준이 궁금합니다.

아무리 문제의 지문을 읽어봐도 boat, body, home.dest는 필요없고, 나머지는 필요한지 구분이 되지 않습니다. 또한, survived, pclass, sex, embarked만 as.factor로 범주형 자료로 바꾸는지도 의문입니다.

0

댓글

댓글 1개
날짜 투표수
  • 안녕하세요.

    이패스비즈 ADsP / 빅데이터분석기사 강사 김계철 입니다.

     

    답변드립니다.

     1) p279 처럼 필요한 요소와 불필요한 요소는 단순한 식별자 수준 변수인가 해당됩니다.

    예를 들면 고객 ID, Name,Ticket 등이 해당됩니다. 물론 이런 변수를 포함하고 분류 모형을 구축해도

    답안이 요구하는 평가 점수 이상 득점에는 전혀 문제됨이 없습니다.

    2) survived, pclass, sex, embarked만 as.factor로 범주형 자료 변환 이유

    척도는 4개로 구분 되죠. 언급한 데이터 유형은 모두 명목형 자료(범주형)입니다. 따라서 범주형 자료로변환을 해야 합니다. 또한 회귀모형에서는 범주형 자료로 변환하지 않으면 수치형 자료로 인식하게 되고 해석에 문제가 발생합니다.

    그리고 6월 15일에 6월 24일 빅분기 시험대비 실기 특강 촬영을 합니다. 이 영상 꼭 확인 부탁합니다.

     

    감사합니다.

    0

댓글을 남기려면 로그인하세요.

 

원하는 것을 찾지 못하셨나요?

질문하기