LSTMを使って、株価の予測を実装してみる。
やりたいこと
ノジマの株価を予測
ほしい結果
2022-03-01~2022-06-03の株価を予測
実装手順
- ライブラリの読み込み
- 株価を取得する
- 取得した株価を整形する
- 株価を正規化する
- 正規化した株価を訓練データと検証データに分割する
- 訓練データを学習用途に整形する
- 予測モデルを定義する
- 定義した予測モデルをコンパイルする
- 検証データでコンパイルした予測モデルの検証を行う
- 検証した結果を評価する
- 予測結果と評価結果を表示する
実装内容
# 警告を無視する
import warnings
warnings.filterwarnings('ignore')
# ライブラリを読み込む
import math
import pandas_datareader as web
import numpy as np
# kerasのライブラリを読み込む
from keras.models import Sequential
from keras.layers import Dense, LSTM
# scikit-learnの正規を行うライブラリを読み込む
from sklearn.preprocessing import MinMaxScaler
# scikit-learnで決定係数とRMSEの計算を行うライブラリを読み込む
from sklearn.metrics import r2_score, mean_squared_error
# グラフ表示のライブラリとグラフ表示で日本語を表示するためのライブラリを読み込む
import matplotlib.pyplot as plt
import matplotlib.gridspec as gridspec
import japanize_matplotlib
# トヨタ(証券コード:7203)の株価を取得する
df = web.DataReader('7203.JP', data_source='stooq', start='2020-01-01', end='2020-12-31')
# 取得した株価を日付で昇順に変換する
df = df[::-1]
# 取得した株価データを終値以外を除外する
data = df.filter(['Close'])
# 取得した株価データの終値をdatasetに代入する
dataset = data.values
# 取得した株価データの8割を訓練データとする
# math.ceil : 小数点以下を切り上げ
# traing_data_lenは194となる
training_data_len = math.ceil(len(dataset) * .8)
# 最小値:5839->0、最大値:8014->1となるように正規化する
scaler = MinMaxScaler(feature_range=(0, 1))
scaled_data = scaler.fit_transform(dataset)
# 正規化したデータから訓練で使用する行数分のデータを抽出する
# 0番から193番までが訓練で使用するデータとなる
train_data = scaled_data[0:training_data_len, :]
# 訓練データと正解データを保存する配列を用意する
# x_train:訓練データ
# y_train:正解データ
x_train = []
y_train = []
# 訓練データとして60日分のデータをx_train[]に追加する
# 正解データとして61日目のデータをy_train[]に追加する
for i in range(60, len(train_data)):
x_train.append(train_data[i - 60:i, 0])
y_train.append(train_data[i, 0])
# Convert the x_train and y_train to numpy arrays
# 訓練データと教師データをNumpy配列に変換する
x_train, y_train = np.array(x_train), np.array(y_train)
# 訓練データのNumpy配列について、奥行を訓練データの数、行を60日分のデータ、列を1、の3次元に変換する
x_train_3D = np.reshape(x_train, (x_train.shape[0], x_train.shape[1], 1))
# LSTMモデルを定義する
n_hidden = 50 # 隠れ層の数
units1 = 25 # 第1層の出力数
units2 = 1 # 第2層の出力数
model = Sequential()
model.add(LSTM(n_hidden, return_sequences=True, input_shape=(x_train_3D.shape[1], 1)))
model.add(LSTM(n_hidden, return_sequences=False))
model.add(Dense(units1))
model.add(Dense(units2))
# 定義したLSTMモデルをコンパイルする
# 最適化手法:adam
# 損失関数:最小2乗誤差
model.compile(optimizer='adam', loss='mean_squared_error')
# コンパイルしたモデルの学習を行う
batch_size = 1 # バッチサイズ
epochs = 1 # 訓練の回数
model.fit(x_train_3D, y_train, batch_size=batch_size, epochs=epochs)
# 検証データを用意する
# 194番から241番までをテストデータとする
# 最初の194番をテストするためには、134番~193番の終値の株価データが必要となる
# 検証データの最初の番は、訓練データの最後から60を引いた134番となる
# 検証データの総番数は108となる
test_data = scaled_data[training_data_len - 60:, :]
# x_test:検証データ
# y_test:正解データ
x_test = []
y_test = scaled_data[training_data_len:, :]
# 検証データをセットする
for i in range(60, len(test_data)):
x_test.append(test_data[i - 60:i, :])
# 検証データをNumpy配列に変換する
x_test = np.array(x_test)
# 検証データのNumpy配列について、奥行を訓練データの数、行を60日分のデータ、列を1、の3次元に変換する
x_test = np.reshape(x_test, (x_test.shape[0], x_test.shape[1], 1))
# モデルに検証データを代入して予測を行う
predictions = model(x_test)
# 予測データをNumpy配列に変換する
predictions = np.array(predictions)
# モデルの精度を評価する
# 決定係数とRMSEを計算する
# 決定係数は1.0に、RMSEは0.0に近いほど、モデルの精度は高い
r2_score = r2_score(y_test, predictions)
rmse = np.sqrt(mean_squared_error(y_test, predictions))
print(f'r2_score: {r2_score:.4f}')
print(f'rmse: {rmse:.4f}')
# 予測データは正規化されているので、元の株価に戻す
predictions = scaler.inverse_transform(predictions)
# 訓練の価格、実際の価格、予測の価格をグラフで表示する
train = data[:training_data_len]
valid = data[training_data_len:]
valid['Predictions'] = predictions
# グラフを表示する領域をfigとする
fig = plt.figure(figsize=(12, 6))
# グラフ間の余白を設定する
fig.subplots_adjust(wspace=0.6, hspace=0.2)
# GridSpecでfigを縦10、横15に分割する
gs = gridspec.GridSpec(9, 14)
# 分割した領域のどこを使用するかを設定する
# gs[a1:a2, b1:b2]は、縦の開始位置(a1)から終了位置(a2)、横の開始位置(b1)から終了位置(b2)
ax1 = plt.subplot(gs[0:8, 0:8])
ax2 = plt.subplot(gs[0:5, 9:14])
# 1番目のグラフを設定する
ax1.set_title('終値の履歴と予測結果', fontsize=16)
ax1.set_xlabel('日付', fontsize=12)
ax1.set_ylabel('終値 円', fontsize=12)
ax1.plot(df['Close'])
ax1.plot(valid[['Predictions']])
ax1.legend(['実際の価格', '予測の価格'], loc='lower right')
ax1.grid()
# 2番目のグラフを設定する
ax2.set_title('予測の価格と実際の価格の散布図表示', fontsize=16)
ax2.set_xlabel('予測の価格', fontsize=12)
ax2.set_ylabel('実際の価格', fontsize=12)
ax2.scatter(valid['Close'], valid['Predictions'], label=f'r2_score: {r2_score:.4f} \n rmse: {rmse:.4f}')
ax2.plot(valid['Close'], valid['Close'], 'k-')
ax2.legend()
ax2.grid()
fig.savefig('img.png')
plt.show()
ぼく的ポイント
df = df[::-1]
内容:日付の古い順に並び替えたものを新たにデータフレームとする
dataset = data.values
内容:値のみを変数に代入する(学習に列名やインデックスは不要だから)
scaler = MinMaxScaler(feature_range=(0, 1))
scaled_data = scaler.fit_transform(dataset)
内容:最大値を1、最小を0となるように正規化する
正規化とは
単位や桁の違うデータを扱うときに、データを整理したり加工したりすること
train_data = scaled_data[0:training_data_len, :]
内容:正規化したデータから訓練で使うデータの個数分スライスする
x_train, y_train = np.array(x_train), np.array(y_train)
内容:訓練データ、教師データを、Numpyの配列に転換する
x_train_3D = np.reshape(x_train, (x_train.shape[0], x_train.shape[1], 1))
内容:訓練データのNumpy配列を3次元に整形する
batch_size = 1 # バッチサイズ
epochs = 1 # 訓練の回数
model.fit(x_train_3D, y_train, batch_size=batch_size, epochs=epochs)
内容:コンパイルしたモデルの学習を行う
実行結果
実行結果からわかること
- 予測精度としては、かなり使えそう(r2_score: 0.8401 rmse: 0.1130)
まとめ
お手本にさせてもらったサイトは、解説つきでとてもわかりやすいはずなんだが、なにせ解説で使われている単語たちの意味がわからず、なんとなーくで進めて、なんとなーく結果を得られた。
後で調べること
- 予測モデルの層
- 最適化関数
- 損失関数
- モデル