25년도 빅분기 실기정규이론(파이썬) 파트3, 제2유형 기출예상문제 6번

5) 학습 & 검증 데이터 분할(80% 학습, 20% 검증)

X_train,X_val,y_train,y_val=train_test_split(X,Y,test_size=0.2,random_state=42)

검증 데이터테스트 데이터는 목적이 다른것으로 알고 있는데 위 코드에서 객체 생성시  X,y_val을 지정하고

실제 분할 코드에서는 test_size로 지정하니까 개념의 혼란이 일어납니다. 설명 부탁합니다.

 

0

댓글

댓글 1개
날짜 투표수
  • 안녕하세요 질문에 대한 답변을 드립니다.

    test_size는 "떼어낼 비율"을 뜻하는 인자 이름일 뿐, 그 조각이 '테스트셋'이라는 뜻이 아닙니다. 그래서 20%를 떼서 X_val이라 받는 건 모순이 아닙니다 — test_size을, X_val은 그 양의 용도(검증)를 지정한 것입니다.

    0

댓글을 남기려면 로그인하세요.

 

원하는 것을 찾지 못하셨나요?

질문하기