유OO 강사님 질문 입니다. (여러 가지 묶어서 질문 드립니다..)
- 과정명: quantative analysis
- 강사명: 유OO
공부 하면서 궁금한 점 모아서 문의 드립니다...
1) Power law에서 K와 α 어떻게 정하나요? 임의로 정하면 되는건가요?
2) 선형 회귀 분석에서 가설을 β=0으로 설정하는 것은 Y에 대해 X 항의 영향이 있는가 없는가를 확인하는 것으로 이해가 됩니다. (영향이 있거나 없거나)
그럼 β=3으로 하면 무슨 의미가 되는건가요? Y에 X항이 3배만큼 영향을 준다/안준다를 보는 것인가요?
여기서 Ha가 채택 되면 X는 3보다 낮은 값(예를 들어 2)으로 영향을 주거나 3보다 높은 값(예를 들어 4)으로 영향을 준다로 해석 하면 되는건가요?
3) raw moment와 Central moment에서
1차 raw moment는 E(X)는 mean
2차 Central moment는 covariance
3차 Central moment는 skewness
4차 Central moment는 kurtosis
그럼
2차, 3차, 4차 raw moment는 뭔가요?
1차 Central moment도 있나요?
그리고 3차 Central moment와 4차 Central moment는 σ로 나눠서 skewness와 kurtosis를 정의하는 데
2차 Central moment는 σ로 안나누나요? (이거 나누면 상관계수 인가요?)
4) 부트 스트랩핑할 때, 샘플 하나를 뽑고 이것을 X바로 해도 되나요?
예를 들어 1~10까지 번호가 있는 공 10개를 통 속에 넣고 복원 추출로 10개 공을 뽑았는데,
이것을 10개의 X바를 추출한 것으로 보아도 되는건지 궁금 합니다.
5) 신뢰 구산을 설정할 때 아래 4가지는 다 같은 건가요?
-Z≤ Ho ≤Z
-Z< Ho ≤Z
-Z≤ Ho <Z
-Z< Ho <Z
6) T 검정은 샘플 집단과 모집단간 평균 비교, 카이 제곱 검정은 샘플 집단과 모집단의 분산 비교로 이해 됩니다.
그러면 샘플 집단이 모집단에 일치한다라고 보려면 T-검정과 카이 제곱 검정 어느 하나만 만족하는게 아니라
T-검정과 카이 제곱 검정 모두 다 해서 두 검정의 Ho=0가 모두 nor reject 되어 만족되어야 하나요?
7) F 분포에서 자유도가 커지면 정규 분포에 근사할 수 있다고 했는데...
F 분포에서 자유도가 분자와 분모 두가지중 하나만 자유도가 증가하고 다른 하나는 증가하지 않으면 정규 분포에 근사 되지 않는건가요?
F 분포를 정규 분포로 근사하려면 분자-분모 자유도가 모두 증가해야 하는건지 궁금 합니다.
8) F 검정에서 아래와 같이 가설이 설정되면,
Ho: σ1의제곱 ≤ σ2의제곱
Ha: σ1의제곱 > σ2의제곱
Ho는 σ2가 σ1보다 크다로 해석 해야 하는건가요? 아니면 가설이 σ2의 σ1 사이에 차이가 있다 없다가 되는건가요?
인강에서는 차이가 있다라고 해주셔서 궁금합니다.
차이 있다 없다는 ≠ , =로 표현하는데 부등호로 표현되어 있어서 이해가 좀 안됩니다.
9) time serises에서 MSE를 구할 때 T로 나누는데...
샘플 추출 할때 샘플의 자유도는 n-1로 합니다.
time serises에서도 T가 이 샘플의 자유도와 같은 역할인 것 같은데...T-1을 하지 않는 이유가 궁금 합니다.
샘플에서 n-1을 하는 이유가 unbiased 하기 때문이라고 했는데 T로 나누면 biased 한 거 아닌가요?
댓글
질문에 감사드립니다.
1) 임의로 정하면 안됩니다. 회귀분석 등의 방법으로 추정합니다.
2) 'beta=3'는 X가 한 단위 증가할 때 Y가 평균 3단위 증가한다고 해석합니다.
Ha가 채택되면, "X가 한 단위 증가할 때 Y가 평균 3단위 증가하지 않는다"라고 해석합니다.
(증가폭이 2단위인지, 4단위 인지는 모릅니다)
3) raw moment와 central moment라는 개념에 대해 많은 수강생들이 혼동하곤 합니다.
이 개념은 누군가가 도입해서, 이를 이용하면 확장성이 있어 사용할 뿐입니다.
2차, 3차, 4차,... raw moment는 쓸모가 없어 사용하지 않습니다.
1차 central moment의 값은 항상 0이므로 활용도가 없습니다.
2차 central moment를 sigma로 나누지 않아야 분산이 되므로, 나누지 않습니다. 그리고, 상관계수와는 아무런 관계가 없습니다.
상관계수는 X와 Y가 함께 있어야 합니다.
4)bootstrapping에 대한 질문입니다만, 이 용어는 여러군데에서 다양하게 사용됩니다. 어느 경우인지 몰라 답변드리기 힘듭니다.
"예를 들어 1~10까지 번호가 있는 ~~ X바를 추출한 것으로 보아도 되는건지"는 무슨 뜻인지 몰라 답변드리지 못합니다.
가능하면, 책의 페이지를 알려주셔야 정확한 답을 드릴 수 있습니다.
5) 신뢰구간에서 '=' 있으나 없으나 동일합니다. 왜냐하면 연속확률변수의 경우, 특정한 값을 취할 확률이 0이기 때문입니다.
'-Z≤ Ho ≤Z'에서 Ho이 있을 곳이 아닙니다.
6) "T 검정은 샘플 집단과 모집단간 평균 비교, 카이 제곱 검정은 샘플 집단과 모집단의 분산 비교"가 아니라
"T 검정은 샘플이 추출된 모집단의 평균에 대한 검정이고, 카이 제곱 검정은 샘플이 추출된 모집단의 분산에 대한 검정" 입니다.
"그러면 샘플 집단이 모집단에 일치한다"라는 말은 정확하지 않은 표현입니다.
7) 분자, 분모의 모든 자유도가 증가해야 정규분포에 근사해집니다.
8) "Ho는 σ2가 σ1보다 크다로 해석" 해야 합니다." σ2의 σ1 사이에 차이가 있다 없다"는 정확하지 않은 표현입니다.
만약 인강에서는" 차이가 있다"라고 했다면 틀렸습니다
9) 회귀분석이라면 MSE는 당연히 n-1로 나눠야 합니다. in-sample만 고려하기 때문입니다.
그런데, time series에서는 in-sample보다는 out-of-sample이 더 중요할 수도 있습니다.
out-of-sample에서 n-1로 나눈다고 해서 unbiased가 되는 것 아니므로 T로 나눕니다.
만약 in-sample만 감안했다면, T-1로 나눴을 텐데, out-of-sample도 고려하느라 T로 나눴습니다.
책에서 그렇게 정의한 것이라 따를 뿐 T-1로 정의해도 상관없습니다.
이상입니다.
댓글을 남기려면 로그인하세요.