2025/10 6

시계열_ch4_4.3 Autoregressive Processes

chapter4는 반복적으로 말하면 정상성 특징을 가진 데이터에 상대적으로 잘 적합한 모델들을 소개한다. 4.1절에 General Linear model은 이론적인 모델이고 4.2절에 Moving Average model은 실제 데이터분석에 사용되는 모델이다. 4.3절에서도 실제 데이터분석에 사용되는 모델 중 하나를 소개하고 있다. 4.3 Autoregressive Processes (복습) Processes : 앞에 Probability가 생략되어 확률과정이라고 불리며, 확률과정이란 확률변수들의 집합을 뜻한다. 그리고 더 앞에 수식어인 Autoregressive가 붙는데 한국말로 자기회귀라고 불리며 Autoregressive Processes(자기회귀과정)은 확률과정 중 하나이다. 자기회귀과정이..

시계열_ch4_4.2 Moving Average Processes

ch4_4.1에서 배운 선형모형(Linear model)은 실제로 쓰이는 모형이라기보단 이론적으로 쓰이는 모형이다. (실제로는 확률변수가 무한합으로 정의되지 않으므로) 그렇지만 선형모형을 배우고, 선형모형에서 나온 확률변수의 기대값, 분산, 공분산, 상관계수를 알게되면 이후에 배우는 시계열 모형들을 쉽게 배울 수 있다. 4.3절에서는 이동평균모형을 배우고 영어로 Moving Average Processes라고 한다. 이동평균모형을 줄여서 MA 모형이라고 한다. 이동평균모형으로부터 만들어진 확률변수들이 있을텐데 이 확률변수들의 집합 {Yt}를 이동평균 과정(Moving Average Processes)라고 한다. 모형을 잘보면, 선형과정과 달리 무한합으로 정의되지않음을 알 수 있다. 그러나 해당 모..

시계열_ch4_4.1 General Linear Processes

chapter 4장에선 정상성을 가진 시계열 자료에 적합한 모형들을 소개한다. 앞서 모형들이 만들어내는 확률과정이 정상성을 가진다면 그 모형을 stationary model이라고 불렀는다. 소개될 시계열 모형들이 과연 staionary model인지 확인해가면서 모형을 소개해보기로 한다. 우선 첫번째 모델은 선형 모형이다. 4.1 General Linear Processes 선형모형은 다음과 같이 표현한다. 위와 같이 white noise의 선형결합으로 정의되는 확률과정을 선형과정(Linear process)라고 한다. t시점의 확률변수 Yt는 t시점의 white noise, t시점 이전의 white noise 값들을 선형결합하여 만들어졌다. Yt는 random한데 , 그이유는 white ..

시계열_ch2_2.3(Stationarity)

2.3 Stationarity (정상성) 모형화를 할때, 데이터의 특성을 잘 파악하고 파악했다면 해당 특성을 잘 적용시키는 모형을 골라야한다고 배웠다. 데이터의 특성 중에 '정상성'이 있는데 정상성의 특징을 가지는 데이터들에 적용할 만한 모형들을 시계열 모형에서 배우게 된다. 그래서 먼저 정상성이 무엇인지 파악해본다. 정상성은 시간이 흘러도 어떠한 성질이 변하지 않는 특성을 가진다. 정확히 말하면 확률과정이 다음과 같은 3가지 조건을 만족한다면 그 확률과정을 정상확률과정(stationary process)라고 한다. ①과 ②는 개별 시점에 대해서만 얘기하는 특성이다. ①은 다른 시점간 확률변수의 기댓값이 일정하다는 내용이고 ②는 다른 시점간 확률변수의 분포가 일정하다(폭이 일정)는 내용이다..

시계열_ch2_2.1 , 2.2

회귀분석 수업에서 모형진단이라는 내용을 배웠는데 모형진단은 잔차분석을 통해 이루어진다. 잔차란 오차항에 대한 추정량(치)이다. 통계량 중 추정할 때 사용되는 통계량을 추정량이라고 하기 때문에 잔차는 오차를 추정하기 위해 사용되는 통계량이다. 오차를 추정하는 이유는 오차를 눈으로 볼 수 없기 때문이다. Y = f(X) + ε 에서 X가 설명할 수 없는 부분을 ε에 넣어주는 상황에서, Y, X는 관찰되는 반면, 아직 X와 Y의 관계를 파악하지 못한 상황에서 X의 함수값을 모르기 떄문에 ε는 관측할 수 없다. X와 Y의 관계를 파악하고자 하기로 생각했다고 가정하면, 회귀분석을 시행할텐데 회귀분석은 오차항( ε ~ iid N(0, σ^2) ) 에 대해서 가정을 둔다. 그런데 앞서 말했듯이 오차..

시계열_ch1_introduction_(2)

다음 그래프를 살펴보자 해당 그래프는 LA지역의 X축은 전년도 강수량, Y축은 전년도 기준 그 다음 강수량을 뜻한다. 이 그래프는 아마 다음과 같은 모델을 염두하고 그린 것이다라고 생각해볼 수 있다. 즉 전시점과 다음시점과 관계가 있지않을까라는 생각에서 출발해서 데이터를 통해 위와 같은 그래프를 그려본 것이다. 결국 시계열 데이터 사이는 독립이 아니라 종속관계를 가지고 있는지 확인하는 그래프이다. 이제 다음 시계열 데이터를 보고 다시한번 값과 값 사이에 관계가 있는지 관찰해보자. 이 그래프를 보았을땐 데이터 사이의 관계를 찾기 쉽지않아보인다. 그래서 같은 데이터를 가지고 이전시점과 다음시점에 대한 산점도 그래프를 그려보자 이전 사례와 비교했을땐, 상대적으로 더 뚜렷한 관계가 보이는것..