티스토리 뷰

시계열 데이터 time series data

  • 시간의 흐름에 따라 순서대로 관측된 데이터를 의미
  • 주 목적 : 시계열 데이터의 법칙을 모형화하고, 이 모형으로 미래 값을 예측하기 위함

 

지수화와 기하평균

지수화

시계열간 값의 단위와 크기를 통일하기 위함으로, 

관측치를 Y = Y0, Y1, Y2….Yt 라고 할 때 (t= 0, 1, 2, …..T)

공식 : 각 시점의 시계열 값 / 기준 시점의 시계열 값으로 나눈 값 (qt = Yt / Ys)

기하평균 (Geometric mean)

n개의 양수 값을 모두 곱한 것의 n제곱근으로, 어떤 지표의 평균 성장률 계산에 주로 사용됨

(예: 대한민국의 연평균성장률, 대한민국의 연평균부채증가율)

 

시계열데이터의 변동

변동

Yt = Tt + Ct + St + It

  • 경향 변동(=추세 변동) (T) : Trend Variation
    • ex) 국민 총 생산량
    • 데이터의 장기적 변화(증가/감소) 추세를 반영
  • 순환 변동(C): Cycle Variation
    • ex) 남극빙하의 변화, 경기 순환
    • 시장의 상황, 혹은 정치/경제, 사회적 이슈에 따른 순환적 변화로 하기 계절변동으로는 설명되지 않음

* 두 변동을 TC (Trend Cycle Variation)으로 묶기도 함

  • 계절변동(S) : Seasonality Variation
    • ex) 여름철 냉난방기의 판매량
    • 1년을 기준으로 계절에 따른 데이터의 변화를 반영하며, 일반적으로 경향변동과 함께 동반됨
  • 우연변동(I) : Irregular Variation
  • ex) 지진, 전쟁, 홍수
  • 설명될 수 없는 요인, 또는 돌발적인 상황으로 발생하는 변화

경향 변동과 순환 변동을 추출하기 위해 사용되는 방법으로는 이동평균이 있음

 

이동평균 移動平均, moving average (ma)

전체 데이터 집합의 여러 부분 집합에 대한 일련의 평균을 만들어 분석하는 계산

부분 집합은, 전체 데이터 집합을 연속적으로 이동시킴으로써 만들어지고

이 부분 집합의 평균을 통해 전체 데이터의 전반적 추세 파악이 가능해짐

  • 단순 이동 평균 Simple Moving Average (SMA)
    • n번째 데이터를 포함한 왼쪽  m개의 데이터의 산술평균
  • 누적이동평균 Cumulative Moving Average (CMA)
    • n번째 데이터를 포함한, 이전 모든 데이터의 평균
    • SMA와 달리 전체 데이터를 고려하고 싶을 때 사용됨
    • 다만 최신성 등 특정 부분집합의 중요성은 고려되지 않음
  • 선형가중이동평균 Weighted Moving Average (WMA)
    • n번째 데이터의 선형가중이동평균 = A / B
      • A = dot product( [m, m-1, m-2, ... , 1],  [n번째 데이터, n-1번째 데이터, ... , n-m+1번째 데이터] )
      • B = m + (m-1) + ... +1
    • 최신성을 반영하고 싶을 때 사용됨 -> 즉 최신 데이터에 더 큰 가중치를 곱함
    • SMA와 동일하게 몇일을 기준으로 구할 것인지 window의 크기 m을 지정
    • 오래된 데이터로 갈 수록 곱해지는 값이 선형적으로 감소하므로 선형가중이동평균이라 칭함
    • 다만 목적에 따라 비선형적인 방식으로 가중치를 곱해갈 수도 있음 → 지수가중이동평균
  • 지수가중이동평균 Exponentially Weighted Moving Average (EWMA)
    • n번째 데이터의 지수가중이동평균 = A / B
      • A = dot product( [ 1 , (1 - α) , (1 - α)^2 , ... , (1 - α)^(m-1) ],  [n번째 데이터, n-1번째 데이터, ... , n-m+1번째 데이터] )
      • B = 1 + (1 - α) + (1 - α)^2+ ... + (1 - α)^(m-1)
    • 지수적으로 감소하는 가중치를 곱해준다는 의미만 다르고, 선형가중이동평균과 본질 동일

 

자기상관 Autocorrelation

시계열 자료는 시간의 흐름에 영향을 받음

즉 현재의 상태가 과거의 영향을 받고 미래에 영향을 주는 자기상관관계를 가짐

  • ACF(Autocorrelation Function) : 시차 값(lagged values) 사이의 선형 관계를 측정

 

참고 사이트

https://otexts.com/fppkr/graphics-autocorrelation.html*

https://primestory.tistory.com/9*

https://modulabs.co.kr/blog/time-series-intro/

 

공지사항
최근에 올라온 글
최근에 달린 댓글
Total
Today
Yesterday
링크
«   2024/11   »
1 2
3 4 5 6 7 8 9
10 11 12 13 14 15 16
17 18 19 20 21 22 23
24 25 26 27 28 29 30
글 보관함