답변함

빅분기 제2유형 모형 변수 선택 문제

안녕하세요. 교수님, 또 궁금한 점이 있습니다.

모형에 필요한 변수는 최종적으로

1. 분류 모형일 때는 목표변수는 factor형 1개 변수(예. 성별, 가입여부)와 이를 설명하는 숫자형변수들만 

2. 회귀 모형일 때는 목표변수는 숫자형 1개변수와 이를 설명하는 숫자형 변수들만 

필요하다 라고 강의에서 이해되는데요,

그리고 모델에 불필요한 그외  factor형이나 문자형 변수들은 모델링전에 모두 데이터셋에 포함 안하고 train, test 데이터셋으로 트레이닝, 예측해도 되는 건지 확인부탁드립니다.(제가 그리 해보니 결과는 차이 없는듯합니다.)

굳이 모델에 불필요한 변수들을 as.factor처리하거나, 결측값을 대체하거나 하지말고 데이터셋에 넣지 않아도

된다고 생각되는데,  제 판단이 맞는지 정확히 알려주시면 정말 감사하겠습니다.

 

 

 

 

0

댓글

댓글 1개
날짜 투표수
  • 안녕하세요.

    이패스비즈 ADsP / 빅데이터분석기사 강사 김계철 입니다.

     

    답변드립니다.

    작업형 제2유형에서 분류모형일 때 타켓변수는 factor이고 그 외에 문자형 변수는 분류모형 성능 지표에 영향력이 거의 없습니다.

    문제는 회귀모형인 경우에는 데이터 타입에 맞게 변환 시켜주세요. factor와 integer는 경우에 따라서는 전혀 다른 해석이 될 수 있습니다.

     

    감사합니다.

    0

댓글을 남기려면 로그인하세요.

 

원하는 것을 찾지 못하셨나요?

질문하기