INFORMATION
탐색 건너뛰기 링크입니다.
RESEARCH
Y.J.KIM,  Dept. of  Computer Engineering, Hanbat National University
   Master Dissertation
 Attention Mechanism 기반 Bi-Directional LSTM을 이용한 주가예측
   김윤재
 

2016년 알파고가 이세돌과의 바둑대결에서 이기고 난 후 많은 사람들은 머신러닝의 위력을 더욱 인정하기 시작했고, 금융 투자 분야에서도 사람이 직접 하던 투자를 머신러닝기술을 적용하기 시작하였다. 그리고 경제학, 통계학, 컴퓨터 공학 등 관련 분야에서도 최신 지도 학습 딥러닝 기술에 의한 주가 예측이나 강화학습에 의한 주가 예측 연구들이 꾸준히 진행되고 있다.
하지만 미래의 주가 예측은 기업의 매출변동, 영업이익, 순이익 변동, 환율 변동, 원재료가격의 변화, 정부의 정책, 신기술 개발, 특허 등 다양한 주가 변동을 유발시키는 요인들로 인해 주가가 예상하지 못했던 방향으로 변동되어 버리는 경우가 있어서 여전히 어려움을 겪고 있다.
주가 데이터는 모두 숫자로 이루어져 있고, 숫자를 잘 계산하기 위한 수학적인 지식들도 잘 갖추어져 있기 때문에 딥 러닝(Deep Learning) 기술은 주가 예측에 적용하기 매우 용이하다. 다른 형태의 기계 학습과 달리 입력 데이터의 특징 패턴을 그대로 학습하기 때문에, 학습 이전에 입력 데이터의 특징 패턴에 따라 예측 결과가 큰 차이를 보이기 때문에 주가예측에 도움을 되는 다양한 지표들을 이용하여 시도하고 있다. 금융 투자를 할 때에도 주가 예측에 도움이 되는 데이터들을 수집한 후 딥러닝 기술로 예측 모델을 설계하고 그 예측 결과에 따라 투자를 진행하는 것이기 때문에 무엇보다도 정확도가 가장 우선시 되어야 한다.
따라서 본 논문에서는 주가예측의 정확도를 향상시키기 위해 무선 이동통신 3사의 2014년부터 2018년까지 5년간 주식 가격 데이터를 yahoo finance에서 수집하고, 주가의 기본 데이터인 시가, 고가, 저가, 종가, 수정종가, 거래량에 추가하여 주가예측에 도움을 줄 수 있도록 종가의 5일, 20일 이동평균, 거래량의 5일 이동평균, 20일 이동평균, 이동평균을 이용하여 볼린저 밴드 지표를 추가하고, 당일 종가 대비 당일 각 항목의 비율, 당일 종가 대비 전일 종가 비율, 당일 거래량 대비 전일 거래량 비율, 종가 이동평균 대비 당일 종가 비율, 거래량 이동평균 대비 당일 거래량 비율 등 17개 항목를 추가한 23개의 항목으로 정규화시켜서 TensorFlow를 이용하여 Attention Mechanism을 기반 양방향 LSTM 순환신경망 모델을 제안한다.
제안한 Attention Mechanism 기반 양방향 LSTM 순환신경망 모델의 세 가지 방법을 제안했는데 이 모델의 특징은 다음과 같다. 과거의 주식 가격의 변동 패턴을 학습시켜 미래의 주식 가격 예측에 적합한 순환신경망의 내부에 LSTM 메모리 셀로 장기 의존성 문제를 해결하고, 데이터 흐름의 역방향에 은닉계층이 추가된 구조를 가지고 있으며 주식 가격 입력 데이터에서 출력 결과에 가장 영향력을 주는 데이터에 집중하여 학습하는 모델이다.
첫 번째 실험은 Attention layer의 context vector만으로 그대로 사용하는 Att-Bi-LSTM-Only 모델이고, 두 번째 실험은 Attention의 context vector와 은닉계층의 마지막 시퀀스 벡터를 연결하여 더 많은 정보를 포함시켜 Att-Bi-LSTM-Concat 모델이고, 세 번째 실험 Attention의 context vector와 은닉계층의 마지막 시퀀스 벡터를 요소별 벡터 곱을 하여 데이터를 혼합하여 Att-Bi-LSTM-Dot 모델로 실험하였다.
그리고 정확도를 더욱 향상시키기 위해 각 종목코드에 맞게 학습 파라미터를 변화시키며 평균 제곱근 오차를 구해 실험을 하였다. 실험 결과 오차 향상률의 크기는 종목마다 주가 변동 패턴이 다르므로 종목코드마다 5회씩 반복 실행하여 최소값, 최대값, 평균을 구했다. 그 결과 기존의 Bi-LSTM 모델에 대비 Attention Bi-LSTM 모델들이 세 가지 모델 평균이 LG U+종목에서는 25.72%, KT종목에서는 10.23%, SK텔레콤 종목에서는 6.12%을 보여 주가 예측의 성능 면에서 전체 평균 14.02%의 오차가 향상되었다.

 
김윤재, 한밭대학교 정보통신전문대학원 컴퓨터공학과 석사논문 (2019.8.25)  
  2019-08-25/2019-12-24/김윤중