FRM PT1 Quantitative analysis 질문입니다.
- 과정명: FRM Part1 Quantitative analysis
- 강사명:
* 퀀트과목 전체 내용 중 모르는거 정리해서 질문합니다. 굵은 폰트를 위주로 상세한 답변 부탁드립니다.
1. 다중회귀분석
Omitted variable bias violates the assumptions of OLS regression when the omitted variable is in fact correlated with current independent (explanatory) variable(s). The reason for this violation is because omitted factors that partially describe the movement of the dependent variable will become part of the regression’s error term since they are not properly identified within the model
: 여기서 생략된 변수로 인해 위배된 OLS 회귀분석 가정이 뭔가요?
2. 추세모형의 적정성 (2019교재 172p 맨밑 문단 : pdf 기준)
Asymptotic efficiency is the property that chooses a regression model with one-step-ahead forecast error variances closest to the variance of the true model. Interestingly, the AIC is asymptotically efficient and the SIC is not asymptotically efficient.
: 이 부분 해석이 궁금합니다. 직역으로 했을 땐 SIC는 AIC보다 패널티 factor이 기하급수적으로 증가해서 점증적으로 효과적이지 않다는 건가요?
그리고 실제 회귀모형이 고려된 모형보다 복잡하면 AIC가 더 적합하다는데, 그 이유가 AIC가 모수나 변수가 많은 회귀모형을 선택하는 경향이 있어서 그런건가요?
3. 일관성(Consistency)과 Unbiased의 차이점이 뭔가요? 상세히 부탁드립니다
4. Covariance stationary (전체 문단에 대한 해석 바탕으로 설명 부탁드려요)
The covariance between the current value of a time series and its value τ period in the past is refered to as its autocavariance at displacement τ . Its autocovariances for all τ make up its autocovariance function. If a time series is covariance stationary, its autocovariance function is stable over time. That is, its autocovariance depends on the τ we choose, but does not depend on the time over which we observe the series.
As we often do when working with covariances, we can convert them to correlations to better interpret the strength of the relationships. To convert an autocovariance function to an autocorrelation function, we divide the autocovariance at each τ by the variance of the time series.
: 이 부분은 covariance stationary의 3번째 조건을 말하는거져? 'τ(전기)에 따라 공분산이 달라지지만 같은 기간차의 공분산은 동일하다'라고 해도 될까요? (2018 교재 topic26 215p)
5. Autocorelation vs, Serially corelation
The error term for one observation is not correlated with that of another observation [i.e., E(εiεj) = 0, j ≠ i].
위에 해당 회귀분석 가정에 대한 답변에서 이는 serially uncorrelated라고 얘기하고 autocorrelation이라고 표현하진 않는다 하셨는데
그럼 Estimating and Forecasting trend model 파트에서
when the residuals from a linear trend model are serially correlated (i.e., autocorrelated), a log-linear trend model may be more appropriate.
: 이렇게 설명한 부분은 trend에서 독립변수가 'time'으로 한개라서 autocorrelation이라 표현한 건가요? 동일한 독립변수에 대한 잔차 간의 상관관계여서요
댓글
1. FRM 책에서, 종속변수에 영향을 주는 독립변수를 omit하지 말아야 한다는 가정을 명시적으로 적시하지는 않았습니다. 어느 책이나 교과서도 명시적으로 이를 가정하지는 않습니다. 종속변수에 영향을 주는 독립변수는 모두 포함되어 있다고 전제하고 가정하는 것이 일반적입니다. 따라서 이 문장을 해석할 때 책에서 명시한 가정과 연결짓지 않는 것이 좋습니다.
2. AIC와 SIC에 대한 내용이 2020년에 빠졌기 때문에 자세한 설명은 생략합니다. 전통적인 통계학과 달리, 인공지능의 기계학습에서는 독립변수의 갯수가 아주 많습니다. 아주... 독립변수의 갯수를 줄이는 것이 기계학습에서 중요한 과제 입니다. 그래서 penalty를 크기를 어떻게 하는 게 좋은가에 대한 대안이 많이 제시되고 있습니다.
3. 이에 대한 설명은 게시판에서 하기엔 양이 많습니다. 간단히 설명하면, consistency는 소표본에서 추정량이 모수와 크게 다르더라고 대표본에서 유사하면 된다는 뜻입니다. 즉 이 조건이 만족하면 소표본에서는 제대로 추정하지 못했더라도 표본을 크게하면 정확하게 맞춘다는 뜻입니다. unbiased는 추정량이 평균적으로 모수를 정확하게 추정한다는 뜻입니다.
4. 굵은 글씨의 문장은 3번째 조건을 말하는 것입니다.
5. 회귀분석에서는 독립변수가 X이고 종속변수가 Y입니다. 이런 경우 autocorrelation라 부르지 않습니다.
그런데, 시계열분석에서는 독립변수와 종속변수가 모두 Y로 동일합니다. 이런 경우 serial correlation을 autocorrelation이라 부를 수 있습니다.
이상입니다.
댓글을 남기려면 로그인하세요.