level2 quant 유oo 강사님 질문 드립니다.
안녕하세요 강사님
슈웨저 p.57에 보면 multicollinearity 관련하여
'If there are more than two independent variables, while individual variables may not be highly correlated, linear combinations might be, leading to multicollinearity." 라고 쓰여 있는데 independent variables끼리 not highly correlated인데 linear combination 이 존재하는게 가능한건가요?
이어서 "Low correlation among the independent variables doesn't necessarily indicate multicollinearity is not present" 라고 하는데 multicollinearity의 조건 자체가 independent variables끼리의 high correlation 아닌가요?
마지막으로 p. 60에 Misspecification #1 Omitting a variable 하단에 "If lnM is correlated with any of the remaining independent variables, then the error term is also correlated with the same independent variables and the resulting regression coefficients are biased and inconsistent" 라고 나와있는데 multicollinearity 자체가 multiple regression의 assumption#2 (no exact linear relationship among Xs) 을 위반하는건 아니라고 하셨는데 error term 이 correlated with the independent variables라면 또다른 assumption#2 (X is uncorrelated with e)는 항상 위반되는 것 아닌가요?
감사합니다
댓글
안녕하세요. 이패스코리아입니다.
강사님께 문의 후 답변 전달 드리겠습니다.
감사합니다.
안녕하세요. 이패스코리아입니다.
문의하신 강사님 답변입니다.
답변이 늦어 죄송합니다.
지난 3주간 외국에 있었습니다. 이제야 이 질문을 보게 되었습니다.
슈웨저 책은 제가 가지고 있지 않으므로, 님의 글을 읽고 답변 드리겠습니다.
첫번째 질문에 대해;
독립변수가 2개인 경우(X1과 X2인 경우):
X1과 X2의 muticoll~의 여부는 두 확률변수의 상관계수를 보면 알 수 있습니다.
독립변수가 3개인 경우(X1, X2와 X3인 경우):
X1과 X2, X2과 X3, X3과 X1의 상관계수만으로 muticoll~의 여부를 단정지을 수 없습니다.
이들의 상관계수가 작다 할 지라도 한 확률변수와 다른 확률변수의 선형결합과 상관관계가 있을 수 있기 때문입니다. 예를 들어, X1과 2X2+5X3간의 상관계수가 클 수 있습니다.
두번째 질문, "마지막으로~~"의 질문에 대해:
질문의 의도를 정확히 이해하지 못하고 있는데...
assumption #2의 전체가 muticorrelation가 아니냐는 질문으로 보입니다.
assumption #2는 두 부분으로 하나는 muticorrelation과 관련이 있고, 다른 하나는 X와 error term과의 상관관계에 관한 것입니다. 따라서 X와 error term과의 상관관계가 있다고 해서 muticorrelation이 존재한다고 얘기 할 수 없습니다.
이상입니다.
댓글을 남기려면 로그인하세요.