데이터분석 초보도 4주만에 합격하는 2026 이패스 AICE Associate(초록색 책 - 모의고사 4회 5번 문제)

모의고사 4회 5번 문제 질의

- 마력이 150이상이면서 연비가 50 초과하는 이상치를 제거하세요.

답지는 아래와 같습니다. 그러면 shape가 403개의 index 값이 나옵니다.

del_df.drop(del_df[(del_df['마력'] >= 150) & (del_df['연비'] > 50)].index, inplace=True)

 

그런데 여기서 이해가 안되는 부분이 생겼습니다.

만약 그런 논리라면 마력이 150 미만이면서 연비가 50 이하인 부분 값만 있으면 된다고 볼 수도 있습니다.

그럴 때, del_df = del_df[(del_df['마력'] < 150) & (del_df['연비'] <= 50)]
이것도 답이 될 수 있는데 이때는 shape가 329개의 index값이 나옵니다.

NaN값의 영향인지는 모르겠으나 이해가 되지 않습니다. 해당 부분이 왜 차이가 나는지 알려주세요

0

댓글

댓글 0개

댓글을 남기려면 로그인하세요.

 

원하는 것을 찾지 못하셨나요?

질문하기