답변함

결측치 제거

안녕하세요 문제 풀다보면 

앞에 문제에서 결측치 제거하고 뒤에서 회귀 돌리려면 결측치 때문에 오류가 나더라고요 

앞에 문제에선 모든 컬럼의 결측치를 제거한 게 아니니까 그런건데 

그러면 제가 따로 추가적인 결측치 제거를 해야하나요? 

만약 제가 추가적으로 해야한다면 삭제나 최빈값으로 넣어야 하는데 그건 제 마음대로 하면 되는건가여??

그리고 이런식으로 시험 문제가 출제되는거면 교재에도 이런 추가적인 결측치에 대한 설명이 있어야 하는건 아닌가해서요. 

 

그리고 14번 예측문제를 풀때 시물레이션 데이터의 개수와 딥너링 모델의 개수가 달라서 오류가 생기던데 

이런 경우엔 어떻게 해야하는지 시험 문제에도 실제로 이렇게 출제되는지 궁금하네요

 

문제를 풀다가 이런식으로 결측치나 값의 개수때문에 생기는 오류가 시험에서도 이렇게 출제가 되는건지,

아니면 기출 문제의 오류인지 궁금하고 만약 이렇게 출제되면 교재에 설명이 왜 없는건지 그리고 어떻게 대처해야할지 설명해주세요.

 

그리고 기출문제 3회 3번은 문제 오류인건가요 ?

 

0

댓글

댓글 1개
날짜 투표수
  •  안녕하세요. 문의주신 내용 안내드립니다.

    먼저 학습 과정에 혼선을 드린 점 죄송합니다.

    문의하신 결측치 처리 및 예측 오류 부분은 데이터와 문항을 고도화하는 과정에서 일부 데이터가 잘못 전달되면서 발생한 사항입니다.
    이로 인해 문제를 푸는 과정에서 추가적인 결측치 처리나 데이터 개수 불일치 문제가 발생할 수 있었고, 해당 부분은 수험자가 임의로 판단해서 처리하도록 의도된 문제가 아니었습니다.

    따라서

    • 결측치가 남아 있어 추가 전처리가 필요했던 부분
    • 시뮬레이션 데이터 개수와 딥러닝 모델 입력 개수가 달라 오류가 발생했던 부분

    현재는 해당 데이터와 ipynb 파일을 수정하여 새로 업로드해두었습니다.

    번거로우시겠지만 사이트에서 수정된 파일을 다시 다운로드하신 뒤 진행해주시면 됩니다.

    추가로 말씀주신 것처럼, 실제 시험에서 이런 형태로 수험자가 임의로 결측치 처리 방식까지 결정해야 하는 방향으로 출제되는 것은 적절하지 않으며, 해당 부분 역시 함께 보완하였습니다.

    불편을 드린 점 다시 한번 죄송합니다.

     

    3번 문제

    해당 문항의 그래프 x축 변수는 experience_years가 아니라 performance_score가 맞습니다. 문제 안내 과정에서 변수명이 잘못 표기되어 혼선을 드린 점 양해 부탁드립니다. 따라서 3번 문항은 성과 점수(performance_score)와 연봉(salary_krw) 간의 관계를 그래프를 통해 해석하는 문제로 이해해주시면 됩니다.

    0

댓글을 남기려면 로그인하세요.

 

원하는 것을 찾지 못하셨나요?

질문하기